AI Platform Engineer (w/m/d)

Stellen-ID: 5331

Standort:

Taufkirchen, DE, 82024 Ulm, DE, 89077

Unternehmenseinheit: HENSOLDT Sensors GmbH

Über den Bereich

Der Bereich "Digital Office" sucht zum nächstmöglichen Zeitpunkt einen "AI Platform Engineer (w/m/d)" an unserem Standort in Taufkirchen oder Ulm.

Wir bauen eine Enterprise AI Plattform, auf der Large Language Models und andere AI-Services produktiv im Unternehmen eingesetzt werden können. Dafür betreiben wir eine GPU-basierte on-premise Infrastruktur auf Kubernetes, über die unsere internen Teams auf skalierbare ML und AI-Services zugreifen können.

Als "AI Platform Engineer (w/m/d)" arbeiten Sie an der technischen Grundlage dieser Plattform - von der Infrastruktur über Model- und LLM-Lifecycle bis hin zu stabilen AI-Services für interne Anwendungen.

Sie arbeiten eng mit dem Team rund um Enterprise AI, als auch Stakeholdern von Portfolio AI zusammen, um strategische AI-Konzepte in skalierbare, produktive Plattformlösungen zu überführen.

Der Fokus der Rolle liegt auf Platform Engineering an der Schnittstelle von DevOps, MLOps und LLMOps: Sie verbinden Build-&-Run (CI/CD, IaC, Kubernetes-Betrieb), Model-Lifecycle (Training/Pipelines, Versionierung, Promotion) und LLM-Lifecycle (Serving, Guardrails, Evaluierung, Monitoring) zu zuverlässigen, skalierbaren und sicher betreibbaren Services.

Ihre Aufgaben

Aufbau und Weiterentwicklung unserer AI Plattform auf Kubernetes
Deployment und Betrieb von Large Language Models (LLMs) auf GPU-Servern
Aufbau und Betrieb performanter Model-Serving und Inference-Services
Etablierung von MLOps-Standards und Betrieb und Weiterentwicklung der on-prem MLOps-Plattform (u.A. ClearML, OpenShift)
Aufbau von LLMOps-Workflows für produktive GenAI-Services (Serving/Runtime-Konfiguration, Guardrails & Policies, Evaluierung/Regressionstests, Kosten- & Qualitäts-Monitoring)
Containerisierung und Deployment von AI-Services mit Docker und Kubernetes
Skalierung und Optimierung von GPU- und CPU-Workloads
Entwicklung stabiler AI-APIs und Services für interne Anwendungen
Aufbau von Monitoring, Logging und Observability für AI-Systeme
Automatisierung von Infrastruktur-, Plattform- und Model-Releases (CI/CD, GitOps, Infrastructure-as-Code) inkl. sicherer Rollouts, Rollbacks und Standardisierung von Deployments
Analyse und Optimierung von Performance, Skalierung und Stabilität

Ihr Profil

Abgeschlossenes Studium der Wirtschaftsinformatik, Informatik, Data Science oder eine vergleichbare Qualifikation
Erfahrung im Aufbau oder Betrieb von Cloud-, Plattform- oder Infrastruktur-Systemen

Gute Kenntnisse in Kubernetes und Container-Technologien

Erfahrung mit Microservices, APIs und verteilten Systemen

Erfahrung in MLOps/LLMOps (Model-/Prompt-Lifecycle, Serving, Evaluierung, Monitoring) sowie an produktiven AI-Systemen

Erfahrung mit DevOps-Praktiken wie CI/CD, GitOps, Infrastructure-as-Code und Betriebs-/Release-Prozessen von Vorteil

Erfahrung mit GPU-Workloads oder High-Performance-Systemen von Vorteil

Strukturierte, selbstständige Arbeitsweise und Freude daran, komplexe Systeme zu betreiben und zu verbessern

Kommunikations- und Moderationsstärke im Austausch mit Fachbereichen und IT

Gute Deutsch- und Englischkenntnisse

Sie wollen Teil eines zukunftsorientierten Unternehmens werden? Und sind bereit Verantwortung in spannenden internationalen und nationalen Projekten zu übernehmen? Dann sind Sie unser Kandidat!
Bewerben Sie sich bitte ausschließlich online über unser Karriereportal mit Ihrem Lebenslauf und Ihren Zeugnissen.

Sollten Sie weitere Fragen haben, können Sie gerne unser Recruiting Team kontaktieren: jobs@hensoldt.net

Erfahren Sie mehr über HENSOLDT und unsere Stellenangebote: www.hensoldt.net/karriere

Werden Sie unser nächster Pionier. Bewerben Sie sich jetzt und werden Sie Teil des HENSOLDT-Teams!

HENSOLDT setzt sich für Vielfalt und eine integrative Firmenkultur ein. Daher begrüßen wir alle Bewerbungen – unabhängig von Herkunft, Alter, Geschlecht, Behinderung, Identität oder Weltanschauung.