AI Engineer (w/m/d) – RAG, LLM & Retrieval-Systeme

Wir suchen eine:n AI Engineer für den Aufbau von RAG-Systemen und LLM-gestützten Anwendungen. Du entwickelst intelligente Retrieval-Pipelines, verbesserst Antwortqualität und arbeitest an skalierbaren AI-Features für ein modernes SaaS-Produkt.

Department: Engineering
Employment Type: Vollzeit
Remote Mode: Remote
Bewerberregion: Deutschland
Über die Rolle

Wir suchen eine:n AI Engineer mit Fokus auf RAG (Retrieval-Augmented Generation) zur Entwicklung intelligenter, kontextbasierter AI-Systeme.

Du arbeitest an der Schnittstelle von Daten, Retrieval und Large Language Models und entwickelst Systeme, die relevante Informationen effizient finden und in hochwertige Antworten umwandeln.

Die Position ist remote innerhalb Deutschlands möglich.

Deine Aufgaben
  • Aufbau und Optimierung von RAG-Systemen
  • Entwicklung von Retrieval-Pipelines (Embedding, Vector Search, Ranking)
  • Integration von LLMs (z. B. OpenAI, andere Modelle)
  • Verarbeitung und Strukturierung von Datenquellen (Dokumente, APIs, Datenbanken)
  • Verbesserung von Antwortqualität, Relevanz und Kontextverständnis
  • Entwicklung von Strategien für Chunking, Indexing und Query Optimization
  • Evaluierung und Testing von AI-Ergebnissen
  • Zusammenarbeit mit Backend- und Frontend-Teams zur Integration der AI-Features
Dein Profil
  • Erfahrung im Bereich AI, Machine Learning oder NLP
  • Erfahrung mit LLMs und API-basierten AI-Systemen
  • Verständnis von RAG-Architekturen
  • Erfahrung mit Vector Databases oder Similarity Search
  • Kenntnisse in Python oder TypeScript / Node.js
  • Erfahrung mit Datenverarbeitung und APIs
  • Analytische und strukturierte Arbeitsweise
Nice to Have
  • Erfahrung mit LangChain, LlamaIndex oder ähnlichen Frameworks
  • Erfahrung mit Embedding-Modellen
  • Erfahrung mit Ranking-Algorithmen oder Re-Ranking
  • Erfahrung mit großen Datensätzen oder Knowledge Bases
  • Erfahrung mit AI-Evaluation oder Prompt Engineering
  • Verständnis für skalierbare Systeme und Performance-Optimierung
Tech Stack
  • LLM APIs (z. B. OpenAI)
  • Vector Databases (z. B. Pinecone, Weaviate, Qdrant)
  • Node.js / TypeScript oder Python
  • APIs und Datenpipelines
  • Next.js (Integration)
  • AI / NLP Frameworks
Was wir bieten
  • Arbeit an einem innovativen AI-Produkt
  • Direkter Einfluss auf Kernfunktionen der Plattform
  • Remote-first Arbeitsweise
  • Flexible Arbeitszeiten
  • Kleine Teams mit hoher Verantwortung
  • Raum für Experimente, Optimierung und neue Ansätze

In 60 Sekunden bewerben

Sende dein Profil direkt für diese Stelle.

Keine Dateien ausgewählt

Erlaubt: PDF, JPG, PNG. Max 3 Dateien, max 20 MB je Datei.