Senior Site Reliability Engineer (m/w/d) - Kubernetes Plattform

Festanstellung, Voll- oder Teilzeit · Berlin / 100% remote möglich, Deutschland / remote

Lesen Sie die Stellenbeschreibung in:
Deine Mission
Als Senior Site Reliability Engineer (m/w/d) im MetaKube Accelerator Team nutzt du moderne Kubernetes- und Cloud-Native-Technologien, um die Zuverlässigkeit, Skalierbarkeit und operative Exzellenz der MKA-Plattform zu maximieren. Du löst komplexe Plattform-Herausforderungen, entwickelst produktionsreife Systeme und trägst zu Shared Ownership und kontinuierlicher Verbesserung bei. Damit gestaltest du aktiv die Weiterentwicklung des MetaKube Accelerators und erhöhst die Zuverlässigkeit unserer Managed Services.
Deine Aufgaben
  • Entwerfen und Implementieren von Observability-Lösungen mit Prometheus, Loki und Mimir, einschließlich der Definition sinnvoller Alerts sowie der kontinuierlichen Verbesserung der Monitoring-Abdeckung
  • Analyse, Troubleshooting und Weiterentwicklung eigener Kubernetes-Controller, um Zuverlässigkeit und Stabilität sicherzustellen
  • Entwicklung und Wartung von Produktionsanwendungen mit Fokus auf Codequalität, Skalierbarkeit und operativer Einsatzfähigkeit
  • Betrieb, Automatisierung und kontinuierliche Weiterentwicklung der MKA-Plattform mit Fokus auf Effizienz und Wartbarkeit
  • Weiterentwicklung interner Tooling-Lösungen, um Automatisierung zu fördern und manuellen Aufwand zu reduzieren
Das bringst Du mit
  • Erfahrung im Betrieb von hochverfügbaren, geschäftskritischen Anwendungen in Cloud- und On-Premises-Umgebungen, inklusive Incident Leadership
  • Sehr gute Kubernetes-Kenntnisse sowie Erfahrung im Cluster-Management
  • Erfahrung mit GitOps-Prinzipien und ArgoCD für Deployment- und Delivery-Workflows
  • Erfahrung mit Infrastructure as Code, insbesondere Terraform und Ansible
  • Gute Kenntnisse in Bash und/oder Python für Automatisierung und Tooling
  • Verständnis von CI/CD-Pipelines, idealerweise mit Tekton-basierten Workflows
  • Sehr gute Deutschkenntnisse sowie gute Englischkenntnisse (B2+) für die technische Zusammenarbeit

Nice to have
  • Erfahrung in der Go-Programmierung
  • Erfahrung mit Nix für Development-Tooling und Automatisierung
  • Erfahrung mit Helm, Make und Git
  • Weitere Erfahrung mit Cloud-Native-Plattformen, Observability oder Plattform-Automatisierung
Was Dich bei uns erwartet
Du erhältst tiefgehende praktische Kubernetes-Erfahrung und lernst die Internals auf einem Level kennen, das nur wenige haben. Du bekommst die Freiheit, Herausforderungen zu lösen, Wissen zu teilen und kontinuierlich zu lernen – sei es durch Team-Zusammenarbeit, interne Show-and-Tell-Sessions oder Konferenzen wie KubeCon oder Container Days.

Über uns
Bei SysEleven in Berlin realisieren wir erstklassige Cloud-Lösungen auf Basis von Kubernetes und OpenStack und stehen dabei konsequent für digitale Souveränität. 

Wir leben Diversität – auch im Denken und Handeln, denn nur unterschiedliche Blickwinkel finden am Ende die beste Lösung, die uns und unsere Kunden weiterbringt. Kurz gesagt: Wir achten aufeinander und hängen uns voll rein. Wenn du in diesem vertrauensvollen Umfeld wachsen und die Zukunft flexibler Infrastrukturen mitprägen willst, bist du bei uns genau richtig.


Your mission
As a Senior Site Reliability Engineer (m/f/x) on the MetaKube Accelerator team, you will leverage modern Kubernetes and cloud-native technologies to maximize reliability, scalability, and operational excellence of the MKA platform. You will solve complex platform challenges, build production-ready systems, and contribute to shared ownership and continuous improvement, shaping the evolution of MetaKube Accelerator and enhancing the reliability of our managed services.


Your tasks
  • Designing and implementing observability solutions using Prometheus, Loki, and Mimir, including defining meaningful alerts and improving monitoring coverage
  • Troubleshoot and improve custom Kubernetes controllers to ensure reliability and stability
  • Develop and maintain production applications, ensuring code quality, scalability, and operational readiness
  • Operate, automate, and continuously improve the MKA Platform with a focus on efficiency and maintainability
  • Enhance internal tooling to support automation and reduce manual effort
Requirements
  • Experience operating highly available, mission-critical applications in cloud and on-prem environments, including incident leadership
  • Strong Kubernetes expertise and cluster management experience
  • Experience with GitOps principles and ArgoCD for deployment and delivery workflows
  • Experience with Infrastructure as Code, specifically Terraform and Ansible
  • Proficiency in Bash and/or Python for automation and tooling
  • Understanding of CI/CD pipelines, ideally with Tekton-based workflows
  • Very Good German and good English skills (B2+) for technical collaboration

Nice to Have:
  • Go programming experience
  • Nix for development tooling and automation
  • Experience with Helm, Make, and Git
  • Additional experience with cloud-native platforms, observability, or platform automation
What you can expect
You will gain deep hands-on Kubernetes experience, exploring internals few others do. You’ll have freedom to solve challenges, share knowledge, and continuously learn through team collaboration, show-and-tell sessions, and conferences such as KubeCon or Container Days.


About us
We are your partner for managed cloud and Kubernetes services - Made in Germany!
We take responsibility and stand for security, reliability, and scalability in the operation of your business-critical applications in Germany. We provide you with a secure cloud and network infrastructure - made in Germany, consulting and efficient Kubernetes operating models.
Deine Bewerbung
Bitte lade hier Deine Bewerbungsunterlagen hoch (z. B. Lebenslauf, Anschreiben, Referenzen usw.)! Bei der Angabe von Deiner Gehaltsvorstellung trage ggf. bitte Dein gewünschtes Bruttojahresgehalt oder eine Gehaltsspanne für eine Vollzeitstelle ein. Willst Du uns noch was mitteilen, wie z. B. Deine beste Erreichbarkeit oder einen kurzen Hinweis zu Dir, schreib uns einfach eine Notiz. 
Dokument wird hochgeladen. Bitte warten Sie.
Fügen Sie alle erforderlichen (mit einem * gekennzeichneten) Angaben hinzu, um Ihre Bewerbung abzusenden.