Senior Site Reliability Engineer Managed Kubernetes (m/w/d)

Permanent employee, Full-time · Berlin

Read job description in:
Deine Mission
Als Teil unseres MetaKube-Teams prägst Du die technologische Vision und Skalierbarkeit unserer Managed-Kubernetes-Plattform. Dich treibt die Leidenschaft für modernes Platform Engineering an, bei dem Infrastruktur konsequent als Software-Engineering-Aufgabe verstanden wird von der Server-Provisionierung über K8s-Operatoren bis hin zur GPU-Integration. Als erfahrene Persönlichkeit übernimmst Du das Mentoring neuer Kolleg:innen und trägst Verantwortung. Mit technologischer Weitsicht und frischen Ideen inspirierst Du das Team, unsere Open-Source-basierte Plattform gemeinsam auf das nächste Level zu heben.
Deine Aufgaben
  • Sicherstellung des stabilen Betriebs unserer Kubernetes SaaS-Plattform mit hunderten aktiven Clustern
  • Übersetzung komplexer Systemarchitekturen in Code (30-40% Software-Entwicklung-Anteil) mit Go (Golang), Terraform, Ansible und Bash
  • Entwicklung und Automatisierung von Infrastrukturkomponenten von der Server-Provisionierung und K8s-Operatoren bis hin zur Integration von GPUs
  • Optimierung und strategische Erweiterung unserer Observability-Plattform basierend auf dem Prometheus-Stack
  • Durchführung von Releasemanagement, kontinuierliche Verbesserung der CI/CD-Pipelines, Testautomatisierung sowie Troubleshooting komplexer Kunden-Setups im 2nd und 3rd Level Support
  • Teilnahme an der Rufbereitschaft nach erfolgreicher Probezeit (extra vergütet)
Das bringst Du mit
  • Mehrjährige, praktische Erfahrung im Betrieb und der Skalierung hochverfügbarer Kubernetes-Cluster in Produktionsumgebungen

  • Tiefgehende Kenntnisse in der Linux-Systemadministration sowie ein fundiertes Verständnis von Netzwerk-Layer 3/4 und Layer 7-Protokollen

  • Fundierte Entwicklungserfahrung in Go (Golang), sichere Anwendung von Automatisierungstools (Ansible, Terraforrm)

  • Idealerweise fundiertes Wissen im Bereich von Observability-Stacks (Prometheus, Loki, Mimir) &  K8s-Operatoren

  • Ausgeprägter Teamgeist und die Fähigkeit,mit frischen Ideen zu inspirieren und fachliche Orientierung zu bieten

  • Gute Deutschkenntnisse (B2)  sehr gute Englischkenntnisse

Was Dich bei uns erwartet
Dich erwartet ein echtes Tech-Team mit tief verankerter Open-Source-DNA, in der die beste technische Lösung unabhängig von Hierarchien gewinnt. Wir legen wir größten Wert auf technologische Exzellenz, eine ausgeprägte Hands-on-Mentalität und den direkten, unkomplizierten Wissensaustausch auf Augenhöhe. Kurze Entscheidungswege geben dir den nötigen Freiraum, eigene Ideen einzubringen, Verantwortung zu übernehmen und Open-Source-Technologien biszur tiefen Plattformentwicklung aktiv einzusetzen.
Über uns
Bei SysEleven in Berlin realisieren wir erstklassige Cloud-Lösungen auf Basis von Kubernetes und OpenStack und stehen dabei konsequent für digitale Souveränität. 

Wir leben Diversität – auch im Denken und Handeln, denn nur unterschiedliche Blickwinkel finden am Ende die beste Lösung, die uns und unsere Kunden weiterbringt. Kurz gesagt: Wir achten aufeinander und hängen uns voll rein. Wenn du in diesem vertrauensvollen Umfeld wachsen und die Zukunft flexibler Infrastrukturen mitprägen willst, bist du bei uns genau richtig.


Your mission
As a valued member of our MetaKube team, you will help shape the technological vision and scalability of our managed Kubernetes platform. You bring a deep passion for modern platform engineering, treating infrastructure purely as a software engineering endeavor from server provisioning and K8s operators all the way to GPU integration. Drawing on your extensive experience, you will take ownership of your work and gladly mentor our newer colleagues. Armed with technological foresight and fresh perspectives, you will inspire the team as we work together to elevate our open source platform to the next level.
Your tasks
  • Ensuring the smooth and reliable operation of our Kubernetes SaaS platform across hundreds of active clusters
  • Translating complex system architectures into code, dedicating roughly 30 to 40 percent of your time to software development utilizing Go, Terraform, Ansible, and Bash
  • Developing and automating infrastructure components, covering everything from server provisioning and Kubernetes operators all the way to seamless GPU integration
  • Optimizing and strategically expanding our observability platform built around the Prometheus stack
  • Overseeing release management, continuously enhancing our CI/CD pipelines and test automation, and troubleshooting intricate customer setups as part of our second and third tier support
  • Participating in our on call rotation, which includes additional compensation once you have successfully completed your probationary period.
Requirements
  • Several years of hands on experience running and scaling highly available Kubernetes clusters in production environments
  • Extensive knowledge of Linux system administration coupled with a solid grasp of network Layer 3/4 and Layer 7 protocols
  • Substantial development experience using Go, alongside a strong command of automation tools like Ansible and Terraform.
  • Ideally, you bring a profound understanding of observability stacks such as Prometheus, Loki, and Mimir, as well as Kubernetes operators.
  • A strong collaborative spirit with the ability to inspire others through fresh ideas while providing reliable technical guidance
  • Good German language skills at a B2 level paired with excellent English proficiency
What you can expect
You can look forward to joining a genuine tech team with deeply rooted open source DNA, where the best technical solution always wins out, regardless of hierarchy. We place a premium on technological excellence and a strong hands on mindset, fostering an open and straightforward exchange of knowledge among peers. Our streamlined decision making processes give you the freedom to champion your own ideas, take real ownership, and actively leverage open source technologies all the way down to deep platform development.
About us
We are your partner for managed cloud and Kubernetes services - Made in Germany!
We take responsibility and stand for security, reliability, and scalability in the operation of your business-critical applications in Germany. We provide you with a secure cloud and network infrastructure - made in Germany, consulting and efficient Kubernetes operating models.
Your Application 
Please upload your application documents here (e.g., CV, cover letter, references, etc.)! If you like to, please enter your desired gross annual salary or a salary range for a full-time position. If there is anything else you would like to tell us, such as your best availability or a short note about yourself, just drop us a note. 
Uploading document. Please wait.
Please add all mandatory information with a * to send your application.