AI Engineer (w/m/d) – RAG, LLM & Retrieval-Systeme
Wir suchen eine:n AI Engineer für den Aufbau von RAG-Systemen und LLM-gestützten Anwendungen. Du entwickelst intelligente Retrieval-Pipelines, verbesserst Antwortqualität und arbeitest an skalierbaren AI-Features für ein modernes SaaS-Produkt.
Department: Engineering
Employment Type: Vollzeit
Remote Mode: Remote
Bewerberregion: Deutschland
Wir suchen eine:n AI Engineer mit Fokus auf RAG (Retrieval-Augmented Generation) zur Entwicklung intelligenter, kontextbasierter AI-Systeme.
Du arbeitest an der Schnittstelle von Daten, Retrieval und Large Language Models und entwickelst Systeme, die relevante Informationen effizient finden und in hochwertige Antworten umwandeln.
Die Position ist remote innerhalb Deutschlands möglich.
Deine Aufgaben- Aufbau und Optimierung von RAG-Systemen
- Entwicklung von Retrieval-Pipelines (Embedding, Vector Search, Ranking)
- Integration von LLMs (z. B. OpenAI, andere Modelle)
- Verarbeitung und Strukturierung von Datenquellen (Dokumente, APIs, Datenbanken)
- Verbesserung von Antwortqualität, Relevanz und Kontextverständnis
- Entwicklung von Strategien für Chunking, Indexing und Query Optimization
- Evaluierung und Testing von AI-Ergebnissen
- Zusammenarbeit mit Backend- und Frontend-Teams zur Integration der AI-Features
- Erfahrung im Bereich AI, Machine Learning oder NLP
- Erfahrung mit LLMs und API-basierten AI-Systemen
- Verständnis von RAG-Architekturen
- Erfahrung mit Vector Databases oder Similarity Search
- Kenntnisse in Python oder TypeScript / Node.js
- Erfahrung mit Datenverarbeitung und APIs
- Analytische und strukturierte Arbeitsweise
- Erfahrung mit LangChain, LlamaIndex oder ähnlichen Frameworks
- Erfahrung mit Embedding-Modellen
- Erfahrung mit Ranking-Algorithmen oder Re-Ranking
- Erfahrung mit großen Datensätzen oder Knowledge Bases
- Erfahrung mit AI-Evaluation oder Prompt Engineering
- Verständnis für skalierbare Systeme und Performance-Optimierung
- LLM APIs (z. B. OpenAI)
- Vector Databases (z. B. Pinecone, Weaviate, Qdrant)
- Node.js / TypeScript oder Python
- APIs und Datenpipelines
- Next.js (Integration)
- AI / NLP Frameworks
- Arbeit an einem innovativen AI-Produkt
- Direkter Einfluss auf Kernfunktionen der Plattform
- Remote-first Arbeitsweise
- Flexible Arbeitszeiten
- Kleine Teams mit hoher Verantwortung
- Raum für Experimente, Optimierung und neue Ansätze
In 60 Sekunden bewerben
Sende dein Profil direkt für diese Stelle.