onsite
Machine Learning Engineer - Foundation Models - WeSort.AI GmbH
ML Engineer
Develop and train domain-specific vision models using state-of-the-art architectures, build end-to-end ML pipelines with distributed PyTorch training, mixed‑precision, and model versioning, and create evaluation suites for few‑shot and anomaly detection tasks.
About the role
Das ist deine neue Leidenschaft
- Du entwickelst und trainierst unsere domänenspezifischen Vision-Modelle auf Basis aktueller State-of-the-Art-Architekturen und nutzt unsere Abfallbild-Datenbasis für Pretraining und Continued Pretraining
- Du gestaltest unsere komplette ML-Trainings-Pipeline: von der Datenaufbereitung über verteiltes Training (PyTorch FSDP/DDP, Mixed Precision) bis zur Modell-Versionierung
- Du baust und pflegst unsere Eval Suite – die zentrale Infrastruktur, die misst, ob unsere Modelle wirklich besser werden: Linear Probing, k-NN-Probing, Few-Shot-Detection, Cross-Domain-Generalization, Anomalie-Detection
- Du finetunst und destillierst unsere Modelle für konkrete Downstream-Tasks und Edge-Hardware (Sortieranlagen, GPU-Inferenz)
- Du analysierst Trainings-Runs systematisch, identifizierst Probleme wie Feature Collapse oder Domain Shift und entwickelst nachhaltige Lösungen statt kurzfristiger Workarounds
- Du arbeitest eng mit dem Cloud-Backend-Team zusammen, um Modelle effizient ins Deployment zu bringen (ONNX, TensorRT, OpenVINO)
- Du verfolgst aktiv die Forschungsentwicklung im Bereich Computer Vision und übersetzt relevante Paper in produktive Lösungen
- Du denkst über das Modell hinaus und hast im Blick, wie deine Arbeit im realen Betrieb wirkt – für Sortieranlagen, Kunden und das Gesamtsystem
Damit begeisterst du uns
- Du bringst mehrjährige Erfahrung in der Entwicklung und im Training von Computer-Vision-Modellen mit, idealerweise mit modernen Vision-Transformer-Architekturen und Self-Supervised-Learning-Methoden
- Du beherrschst PyTorch sicher – inklusive verteiltem Training (DDP, FSDP), gemischter Präzision (bf16/fp16) und Performance-Optimierung (torch.compile, Profiling)
- Du verstehst nicht nur, wie man ein Modell trainiert, sondern auch wie man evaluiert. Du weißt, dass eine schwache Eval Suite jedes Pretraining wertlos macht
- Du hast Erfahrung mit modernen ML-Tooling-Stacks für Konfigurations-Management, Experiment-Tracking, Daten-Versionierung und Backbone-Bibliotheken
- Du nutzt moderne KI-Tools (z.B. Claude, Copilot), um Routine-Coding zu beschleunigen und dich auf die wirklich harten Forschungs- und Architekturfragen zu konzentrieren
- Du hast ein gutes Verständnis für Datenpipelines bei großen Datenmengen (Millionen Bilder): effiziente Datenformate, GPU-Augmentations, I/O-Bottlenecks
- Erfahrung mit gängigen Detection-/Segmentation- sowie Anomalie-Detection-Frameworks ist von Vorteil
- Du kennst dich mit Inferenz-Optimierung und Modell-Distillation aus und hast idealerweise schon Modelle auf Edge-Hardware deployed
- Ausgeprägte Problemlösefähigkeit, analytisches Denken und wissenschaftliche Sorgfalt – du arbeitest hypothesengetrieben und nicht nach dem Try-and-Error-Prinzip
- Sicherer Umgang mit Cloud-GPU-Infrastruktur (AWS, Azure, GCP oder On-Premi