Senior KI & ML Engineer (AI Expert) (m/w)

🚀 Über CTREAM

CTREAM ist ein technologiegetriebenes Start-up aus Mainz mit Fokus auf maßgeschneiderte KI-Lösungen für reale Herausforderungen. Wir entwickeln Produkte, bei denen Künstliche Intelligenz kein Gimmick, sondern das Herzstück ist – leistungsfähig, skalierbar und datengetrieben.

Unser aktuelles Projekt heißt LinguaAI – eine Plattform für synchronisierte Echtzeitübersetzung gesprochener Sprache. Unser Ziel: Zwei Menschen sprechen in unterschiedlichen Sprachen – und verstehen sich, als würden sie dieselbe sprechen. Keine Latenz, kein Verfremden – sondern natürliche, kontextbasierte Kommunikation in Echtzeit.
Dafür bauen wir unser Kernteam auf – und suchen Dich.

🎯 Deine Mission

Du entwickelst mit uns den technologischen Kern: ein Speech-to-Speech-System, das gesprochene Sprache erkennt, inhaltlich übersetzt und flüssig wieder ausgibt – idealerweise synchron, mit korrektem Timing, natürlicher Prosodie und minimaler Verzögerung.

🧩 Deine Aufgaben

  • Entwicklung eines Audio2Audio-Übersetzungsmodells in Echtzeit
  • Aufbau modularer Pipelines für:
    • Speech Recognition (z. B. Whisper, Vosk, Custom STT)
    • Machine Translation (LLM-basierte Übersetzung mit kontextueller Anpassung)
    • Speech Synthesis mit Timing- und Intonationssteuerung (z. B. VALL-E, Tortoise, Tacotron)

 

  • Experimentieren mit verschiedenen Architekturansätzen (End-to-End vs. modulare Systeme
  • Evaluation & Optimierung der Ergebnisqualität (MOS, BLEU, WER, etc.)

🛠️ Dein Profil

  • >5 Jahre praktische Erfahrung mit Speech AI oder verwandten Deep-Learning-Themen

  • Fundierte Kenntnisse in mindestens zwei dieser Bereiche:

    • Speech-to-Text (STT)

    • Neural Machine Translation (NMT)

    • Text-to-Speech (TTS) mit Fokus auf Ausdruck, Prosodie, Timing

  • Erfahrung mit Python, PyTorch oder TensorFlow, Hugging Face, Audio-Datenverarbeitung

  • Erfahrung mit Realtime-Anwendungen (z. B. Streaming, WebRTC, ASGI, Low Latency)

  • Hoher Anspruch an technische Qualität, schnelle Iterationen, Startup-Mindset

💡 Nice to have

  • Erfahrung mit Voice Cloning / Speaker Embeddings

  • Kenntnisse in multimodalen Architekturen

  • Forschung oder Projekte im Bereich prosodischer Sprachübertragung


💬 Was wir bieten

  • Mitarbeit an innovativen Projekten mit hohem Einfluss auf zukünftige Entwicklungen.
  • Direkte Zusammenarbeit mit Gründer & CTO
  • Fokus auf Technologie, nicht Meetings
  • Ein motiviertes und unterstützendes Teamumfeld.
  • Wettbewerbsfähiges Gehalt und flexible Arbeitsmöglichkeiten.

Bewerbungsprozess

Bist Du bereit, in einer Position mit erheblicher Verantwortung an der Zukunft der Technologie zu arbeiten? Dann sende uns Deine Bewerbung, bestehend aus Lebenslauf, Motivationsschreiben und Arbeitsproben, an info@ctream.de. Wir sind gespannt, Dich kennenzulernen und mehr über Deine Visionen zu erfahren!

Job Type: Vollzeit
Job Location: Mainz Remote

Apply for this position

Zulässige(r) Typ(en): .pdf, .doc, .docx