Standort: Remote (DACH-Zeitzone), Office Berlin optional
Anstellung: Vollzeit, unbefristet
Start: Ab sofort
Sprache: Deutsch C2, Englisch min. C1
───────────
ÜBER SANDAN AI
sandan AI ist ein in Berlin ansässiges AI-Native-Startup für Enterprise-Kunden im DACH-Raum. Wir prägen, wie Marketing in einer agentischen Wirtschaft aussieht – und bauen die Plattform, auf der diese neue Generation von Marketing-Workflows läuft. Unser Anspruch: Software so zu entwickeln, wie Software 2026 entwickelt werden sollte – agentisch, iterativ, mit AI als integralem Bestandteil des EngineeringWorkflows.
────────────
UNSERE ARBEITSWEISE
Wir entwickeln agentisch. Claude Code und Codex sind Kern unseres Engineering-Workflows – nicht Spielerei. Wer bei uns einsteigt, arbeitet entweder schon produktiv mit diesen Tools oder will sich aktiv und tief einarbeiten.
Aufgaben
Du baust die Intelligenz, die in ArcGEN läuft. Du verantwortest unsere LLM-Pipelines, Agenten-Architekturen und Eval-Frameworks - vom Prototypen im Notebook bis zur produktiven Pipeline mit nachweisbarer Qualität.
Design und Betrieb von RAG-Pipelines (Embeddings, Vector Stores, Re-Ranking)
Architektur agentischer Systeme – Tool-Calling, MCP, Sub-Agent-Orchestrierung
Aufbau und Pflege von LLM-Eval-Frameworks: Metriken, Benchmarks, A/B-Testing, Quality-Gates
Prompt-Engineering und systematische Prompt-Optimierung
Entwicklung ML-Modelle für Marketing-Use-Cases (Attribution, Targeting, Forecasting, Anomaly Detection)
Überführung von Notebook-Explorationen in produktionsreife Pipelines
Enge Zusammenarbeit mit unseren Full-Stack-Engineers an der Plattform-Integration
Qualifikation
Must-have:
Praxis mit modernen LLM-Workflows in Production: RAG, Embeddings, Vector Databases (Pinecone, Weaviate, pgvector)
Solide Python-Kenntnisse inkl. pandas, NumPy, scikit-learn sowie PyTorch oder TensorFlow
Erfahrung im End-to-End-ML-Lifecycle: Datenaufbereitung, Training, Evaluation, Deployment, Monitoring
Erfahrung mit systematischer Modell-Evaluation: Metriken, Benchmarks, Eval-Frameworks
Deutsch C2 und Englisch C1
Builder-Mentalität: Du lieferst Production-Systeme, nicht nur Notebooks
Pluspunkte:
Eigenentwicklung von Custom Agents, Sub-Agents oder spezialisierten Coding-Workflows
Erfahrung mit MCP (Model Context Protocol) und Tool-Calling-Architekturen
Praxis mit Agent-Frameworks (Mastra, LangGraph, Vercel AI SDK)
Erfahrung mit Fine-Tuning, LoRA-Adaptern oder Distillation
MLOps-Tools (MLflow, Weights & Biases, DVC)
Background in Marketing-Analytics, Attribution-Modellen oder Performance-Marketing-Daten
Kaggle, Open-Source-Beiträge oder Publikationen im ML-/AI-Bereich
Benefits
Wettbewerbsfähiges Gehalt mit jährlicher Anpassung
Vollständig finanzierter Zugang zu Claude Max, Codex, GitHub Copilot, OpenAI- und Anthropic-APIs sowie allen relevanten LLM-Tools
Compute-Budget für Experimente, Modell-Training und ML-Workloads
MacBook Pro nach Wahl
Remote-First, flexible Arbeitszeiten
Quartalsweise Team-Meetups in Berlin oder Dubai (DIFC AI Campus, optional)
Direkter Einfluss auf Produkt-Architektur in einer frühen Phase
Steile Lernkurve in Agentic AI, LLM-Orchestrierung und AI-Native-Engineering
Lebenslauf reicht. Wenn du GitHub, Portfolio, Kaggle oder ein
Open-Source-Projekt hast – sehr gerne mit dazu.
Wir freuen uns auf deine Bewerbung!