Über die Rolle

Wir suchen eine:n AI Engineer mit Fokus auf RAG (Retrieval-Augmented Generation) zur Entwicklung intelligenter, kontextbasierter AI-Systeme.

Du arbeitest an der Schnittstelle von Daten, Retrieval und Large Language Models und entwickelst Systeme, die relevante Informationen effizient finden und in hochwertige Antworten umwandeln.

Die Position ist remote innerhalb Deutschlands möglich.

Deine Aufgaben

Aufbau und Optimierung von RAG-Systemen
Entwicklung von Retrieval-Pipelines (Embedding, Vector Search, Ranking)
Integration von LLMs (z. B. OpenAI, andere Modelle)
Verarbeitung und Strukturierung von Datenquellen (Dokumente, APIs, Datenbanken)
Verbesserung von Antwortqualität, Relevanz und Kontextverständnis
Entwicklung von Strategien für Chunking, Indexing und Query Optimization
Evaluierung und Testing von AI-Ergebnissen
Zusammenarbeit mit Backend- und Frontend-Teams zur Integration der AI-Features

Dein Profil

Erfahrung im Bereich AI, Machine Learning oder NLP
Erfahrung mit LLMs und API-basierten AI-Systemen
Verständnis von RAG-Architekturen
Erfahrung mit Vector Databases oder Similarity Search
Kenntnisse in Python oder TypeScript / Node.js
Erfahrung mit Datenverarbeitung und APIs
Analytische und strukturierte Arbeitsweise

Nice to Have

Erfahrung mit LangChain, LlamaIndex oder ähnlichen Frameworks
Erfahrung mit Embedding-Modellen
Erfahrung mit Ranking-Algorithmen oder Re-Ranking
Erfahrung mit großen Datensätzen oder Knowledge Bases
Erfahrung mit AI-Evaluation oder Prompt Engineering
Verständnis für skalierbare Systeme und Performance-Optimierung

Tech Stack

LLM APIs (z. B. OpenAI)
Vector Databases (z. B. Pinecone, Weaviate, Qdrant)
Node.js / TypeScript oder Python
APIs und Datenpipelines
Next.js (Integration)
AI / NLP Frameworks

Was wir bieten

Arbeit an einem innovativen AI-Produkt
Direkter Einfluss auf Kernfunktionen der Plattform
Remote-first Arbeitsweise
Flexible Arbeitszeiten
Kleine Teams mit hoher Verantwortung
Raum für Experimente, Optimierung und neue Ansätze

AI Engineer (w/m/d) – RAG, LLM & Retrieval-Systeme

In 60 Sekunden bewerben