Senior Site Reliability Engineer (m/f/x)

Festanstellung, Vollzeit · Berlin, Deutschland / remote

Lesen Sie die Stellenbeschreibung in:
Your mission
As a Senior Site Reliability Engineer (m/f/x) at SysEleven, you design, build, and operate APIs that power the automation and reliability of our as-a-Service products, such as Database as a Service. You use Infrastructure as Code to standardize and scale our platforms, and you continuously improve CI/CD pipelines to ensure secure, resilient, and efficient delivery processes. With GitOps practices and Kubernetes orchestration, you reduce operational complexity and enable stable, predictable deployments that support our customers’ critical workloads. You take ownership of reliability end to end, contribute to a culture of continuous improvement, and lead by example in solving complex technical challenges that shape the future of our services.
Your tasks
  • Ensure the reliability, availability, and performance of our Database- and Observability-as-a-Service products
  • Manage container-based applications in Kubernetes with a strong focus on security and resilience
  • Lead incident response, root cause analysis, and sustainable remediation efforts
  • Apply GitOps principles using Helm and Argo CD
  • Develop API services and tooling in Go to deliver stable SaaS products
  • Build and optimize CI/CD pipelines to improve deployment safety and system stability
  • Design and manage scalable infrastructure using IaC tools (e.g., Terraform) in cloud environments

Our Technologies and Tech Stack:
  • Go, Python, Bash
  • OpenStack, Kubernetes, Cilium, Envoy, Kyverno
  • Terraform, Crossplane, Argo CD, GitLab CI
  • PostgreSQL, Grafana, Loki, Mimir
Requirements
  • Several years of experience operating highly available systems in Linux and Kubernetes environments
  • Strong understanding of observability concepts (monitoring, logging, tracing)
  • Practical development experience in Go (knowledge of Python or Rust is a plus)
  • Experience with Infrastructure-as-Code tools such as Terraform or OpenTofu
  • Hands-on experience in incident management and structured root cause analysis
  • Familiarity with CI systems, especially GitLab CI
  • Strong problem-solving skills and good communication skills in German and English (minimum B2 level)
What you can expect
At SysEleven, you take ownership of the reliability of customer-facing services such as Database as a Service and Observability as a Service, which are deeply integrated into our cloud and Kubernetes platforms.

You actively contribute to the daily operations and continuous improvement of these services, focusing on stability, performance, and automation maturity.

We value a blameless culture, open communication, and knowledge sharing — whether in day-to-day collaboration, internal “Show & Tell” sessions, or at external conferences. You will have the autonomy to drive reliability initiatives strategically and shape robust, sustainable platform solutions together with the team.
Contact


About us
We are your partner for managed cloud and Kubernetes services - Made in Germany!
We take responsibility and stand for security, reliability, and scalability in the operation of your business-critical applications in Germany. We provide you with a secure cloud and network infrastructure - made in Germany, consulting and efficient Kubernetes operating models.
Deine Mission
Als Senior Site Reliability Engineer (m/w/d) bei SysEleven entwickelst, implementierst und betreibst du APIs, die die Automatisierung und Zuverlässigkeit unserer as-a-Service-Produkte – beispielsweise Database as a Service – ermöglichen.

Du nutzt Infrastructure as Code, um unsere Plattformen zu standardisieren und skalierbar weiterzuentwickeln, und optimierst kontinuierlich unsere CI/CD-Pipelines, um sichere, resiliente und effiziente Delivery-Prozesse sicherzustellen.

Mit GitOps-Praktiken und Kubernetes-Orchestrierung reduzierst du operative Komplexität und ermöglichst stabile, planbare Deployments, die die geschäftskritischen Workloads unserer Kund*innen zuverlässig unterstützen.

Du übernimmst End-to-End-Verantwortung für Reliability, förderst eine Kultur der kontinuierlichen Verbesserung und gehst bei der Lösung komplexer technischer Herausforderungen mit gutem Beispiel voran.
Deine Aufgaben
  • Sicherstellung der Zuverlässigkeit, Verfügbarkeit und Performance unserer Database- und Observability-as-a-Service-Produkte
  • Betrieb containerbasierter Anwendungen in Kubernetes mit starkem Fokus auf Sicherheit und Resilienz
  • Leitung von Incident-Response-Maßnahmen, Root-Cause-Analysen sowie nachhaltiger Fehlerbehebung
  • Anwendung von GitOps-Prinzipien mit Helm und Argo CD
  • Entwicklung von API-Services und Tools in Go zur Bereitstellung stabiler SaaS-Produkte
  • Aufbau und Optimierung von CI/CD-Pipelines zur Erhöhung von Deployment-Sicherheit und Systemstabilität
  • Design und Verwaltung skalierbarer Infrastrukturen mit Infrastructure-as-Code-Tools (z. B. Terraform) in Cloud-Umgebungen

Unsere Technologien und Tech Stack:
  • Go, Python, Bash
  • OpenStack, Kubernetes, Cilium, Envoy, Kyverno
  • Terraform, Crossplane, Argo CD, GitLab CI
  • PostgreSQL, Grafana, Loki, Mimir
Das bringst Du mit
  • Mehrjährige Erfahrung im Betrieb hochverfügbarer Systeme in Linux- und Kubernetes-Umgebungen
  • Fundiertes Verständnis von Observability-Konzepten (Monitoring, Logging, Tracing) 
  • Praktische Entwicklungserfahrung in Go (Kenntnisse in Python oder Rust sind von Vorteil)
  • Erfahrung mit Infrastructure-as-Code-Tools wie Terraform oder OpenTofu
  • Praxiserfahrung im Incident Management sowie in strukturierten Root-Cause-Analysen
  • Vertrautheit mit CI-Systemen, insbesondere GitLab CI
  • Ausgeprägte Problemlösungskompetenz sowie gute Kommunikationsfähigkeiten in Deutsch und Englisch (mindestens B2-Niveau)
Was Dich bei uns erwartet
Bei SysEleven übernimmst du Verantwortung für die Zuverlässigkeit kundennaher Services wie Database as a Service und Observability as a Service, die tief in unsere Cloud- und Kubernetes-Plattform integriert sind.

Du arbeitest aktiv am täglichen Betrieb und an der kontinuierlichen Weiterentwicklung dieser Services mit – mit Fokus auf Stabilität, Performance und Automatisierungsreife.

Wir leben eine blameless Culture, offene Kommunikation und aktiven Wissensaustausch – im Arbeitsalltag, bei internen „Show & Tell“-Sessions oder auf externen Konferenzen. Du erhältst den Freiraum, Reliability-Themen strategisch voranzutreiben und gemeinsam mit dem Team nachhaltige, robuste Plattformlösungen zu gestalten.

Über uns
Bei SysEleven in Berlin realisieren wir erstklassige Cloud-Lösungen auf Basis von Kubernetes und OpenStack und stehen dabei konsequent für digitale Souveränität. 

Wir leben Diversität – auch im Denken und Handeln, denn nur unterschiedliche Blickwinkel finden am Ende die beste Lösung, die uns und unsere Kunden weiterbringt. Kurz gesagt: Wir achten aufeinander und hängen uns voll rein. Wenn du in diesem vertrauensvollen Umfeld wachsen und die Zukunft flexibler Infrastrukturen mitprägen willst, bist du bei uns genau richtig.


Deine Bewerbung
Bitte lade hier Deine Bewerbungsunterlagen hoch (z. B. Lebenslauf, Anschreiben, Referenzen usw.)! Bei der Angabe von Deiner Gehaltsvorstellung trage ggf. bitte Dein gewünschtes Bruttojahresgehalt oder eine Gehaltsspanne für eine Vollzeitstelle ein. Willst Du uns noch was mitteilen, wie z. B. Deine beste Erreichbarkeit oder einen kurzen Hinweis zu Dir, schreib uns einfach eine Notiz. 
Dokument wird hochgeladen. Bitte warten Sie.
Fügen Sie alle erforderlichen (mit einem * gekennzeichneten) Angaben hinzu, um Ihre Bewerbung abzusenden.