AI Platform Engineer (w/m/d)
AI Platform Engineer (w/m/d)
Taufkirchen, DE, 82024 Ulm, DE, 89077
Über den Bereich
Der Bereich "Digital Office" sucht zum nächstmöglichen Zeitpunkt einen "AI Platform Engineer (w/m/d)" an unserem Standort in Taufkirchen oder Ulm.
Wir bauen eine Enterprise AI Plattform, auf der Large Language Models und andere AI-Services produktiv im Unternehmen eingesetzt werden können. Dafür betreiben wir eine GPU-basierte on-premise Infrastruktur auf Kubernetes, über die unsere internen Teams auf skalierbare ML und AI-Services zugreifen können.
Als "AI Platform Engineer (w/m/d)" arbeiten Sie an der technischen Grundlage dieser Plattform - von der Infrastruktur über Model- und LLM-Lifecycle bis hin zu stabilen AI-Services für interne Anwendungen.
Sie arbeiten eng mit dem Team rund um Enterprise AI, als auch Stakeholdern von Portfolio AI zusammen, um strategische AI-Konzepte in skalierbare, produktive Plattformlösungen zu überführen.
Der Fokus der Rolle liegt auf Platform Engineering an der Schnittstelle von DevOps, MLOps und LLMOps: Sie verbinden Build-&-Run (CI/CD, IaC, Kubernetes-Betrieb), Model-Lifecycle (Training/Pipelines, Versionierung, Promotion) und LLM-Lifecycle (Serving, Guardrails, Evaluierung, Monitoring) zu zuverlässigen, skalierbaren und sicher betreibbaren Services.
Ihre Aufgaben
- Aufbau und Weiterentwicklung unserer AI Plattform auf Kubernetes
- Deployment und Betrieb von Large Language Models (LLMs) auf GPU-Servern
- Aufbau und Betrieb performanter Model-Serving und Inference-Services
- Etablierung von MLOps-Standards und Betrieb und Weiterentwicklung der on-prem MLOps-Plattform (u.A. ClearML, OpenShift)
- Aufbau von LLMOps-Workflows für produktive GenAI-Services (Serving/Runtime-Konfiguration, Guardrails & Policies, Evaluierung/Regressionstests, Kosten- & Qualitäts-Monitoring)
- Containerisierung und Deployment von AI-Services mit Docker und Kubernetes
- Skalierung und Optimierung von GPU- und CPU-Workloads
- Entwicklung stabiler AI-APIs und Services für interne Anwendungen
- Aufbau von Monitoring, Logging und Observability für AI-Systeme
- Automatisierung von Infrastruktur-, Plattform- und Model-Releases (CI/CD, GitOps, Infrastructure-as-Code) inkl. sicherer Rollouts, Rollbacks und Standardisierung von Deployments
- Analyse und Optimierung von Performance, Skalierung und Stabilität
Ihr Profil
-
Abgeschlossenes Studium der Wirtschaftsinformatik, Informatik, Data Science oder eine vergleichbare Qualifikation
-
Erfahrung im Aufbau oder Betrieb von Cloud-, Plattform- oder Infrastruktur-Systemen
-
Gute Kenntnisse in Kubernetes und Container-Technologien
-
Erfahrung mit Microservices, APIs und verteilten Systemen
-
Erfahrung in MLOps/LLMOps (Model-/Prompt-Lifecycle, Serving, Evaluierung, Monitoring) sowie an produktiven AI-Systemen
-
Erfahrung mit DevOps-Praktiken wie CI/CD, GitOps, Infrastructure-as-Code und Betriebs-/Release-Prozessen von Vorteil
-
Erfahrung mit GPU-Workloads oder High-Performance-Systemen von Vorteil
-
Strukturierte, selbstständige Arbeitsweise und Freude daran, komplexe Systeme zu betreiben und zu verbessern
-
Kommunikations- und Moderationsstärke im Austausch mit Fachbereichen und IT
-
Gute Deutsch- und Englischkenntnisse
Sie wollen Teil eines zukunftsorientierten Unternehmens werden? Und sind bereit Verantwortung in spannenden internationalen und nationalen Projekten zu übernehmen? Dann sind Sie unser Kandidat!
Bewerben Sie sich bitte ausschließlich online über unser Karriereportal mit Ihrem Lebenslauf und Ihren Zeugnissen.
Sollten Sie weitere Fragen haben, können Sie gerne unser Recruiting Team kontaktieren: jobs@hensoldt.net
Erfahren Sie mehr über HENSOLDT und unsere Stellenangebote: www.hensoldt.net/karriere
Werden Sie unser nächster Pionier. Bewerben Sie sich jetzt und werden Sie Teil des HENSOLDT-Teams!
HENSOLDT setzt sich für Vielfalt und eine integrative Firmenkultur ein. Daher begrüßen wir alle Bewerbungen – unabhängig von Herkunft, Alter, Geschlecht, Behinderung, Identität oder Weltanschauung.