Senior Cloud-Infrastruktur-Ingenieur
Langfuse
- Anstellung
- Vollzeit
- Ort
- Zürich · Remote möglich
- Erstmals ausgeschrieben
ÜBER LANGFUSE
Open-Source-LLM-Engineering-Plattform, die Teams hilft, nützliche KI-Anwendungen über Nachverfolgung, Bewertung und Prompt-Management zu erstellen (Mission https://tracking.us.nylas.com/l/6d586a21a6fc4e1a8aacc7eb75882b72/0/82383757e54352130f65066e1b2fc4708aacab7897561bcb8000fe4c8a9c6a21?cache_buster=1761124921, Produkt https://tracking.us.nylas.com/l/6d586a21a6fc4e1a8aacc7eb75882b72/1/b9fba3a93b6ffcc0f99ecda62767a17cc437fe8fe0b16181d1c43c1391212e3d?cache_buster=1761124921). Wir sind jetzt Teil von ClickHouse.
Wir bauen das "Datadog" dieser Kategorie; die Fähigkeiten der Modelle verbessern sich kontinuierlich, aber der Bau nützlicher Anwendungen ist wirklich schwierig, sowohl in Start-ups als auch in Unternehmen.
Größte Open-Source-Lösung in dieser Kategorie: von 19 der Fortune 50 vertraut, >2k Kunden, >26M monatliche SDK-Downloads, >6M Docker-Pulls.
Wir haben uns ClickHouse im Januar 2026 angeschlossen, weil LLM-Beobachtbarkeit fundamental ein Datenproblem ist und Langfuse bereits auf ClickHouse lief. Zusammen können wir uns bei der Produktentwicklung beschleunigen, während wir gleichzeitig unserem Open-Source- und Selbst-Hosting-Prinzip treu bleiben und uns bei GTM und Vertrieb zusammenschließen, um den Umsatz zu beschleunigen.
Zuvor von Y Combinator, Lightspeed und General Catalyst unterstützt.
Wir sind ein kleines, ingenieurorientiertes und erfahrenes Team in Berlin und San Francisco. Wir suchen auch Ingenieure in EU-Zeitzonen und erwarten, dass man einmal im Monat ein Wochenende in unserem Berliner Büro verbringt (wie wir arbeiten https://langfuse.com/handbook/how-we-work/principles).
WARUM CLOUD-INFRASTRUKTUR BEI LANGFUSE
Ihre Arbeit wird Langfuse am Laufen halten — überall.
Langfuse verarbeitet über eine Milliarde Nachverfolgungsereignisse pro Monat. Wenn ein Fortune-50-Unternehmen auf Langfuse in der Produktion angewiesen ist, verlässt es sich auf die Infrastruktur, die Sie betreiben. Sie werden die Uptime, Leistung und Kosteneffizienz in unserem gesamten Cloud-Footprint besitzen — und Sie werden sicherstellen, dass jede selbst gehostete Bereitstellung genauso reibungslos läuft.
Sie werden Langfuse Cloud auf AWS ECS Fargate und ClickHouse Cloud betreiben, wobei Datadog als Beobachtbarkeits-Backbone dient. Sie werden auch unsere öffentliche Selbst-Hosting-Infrastruktur besitzen — einschließlich unserer Helm-Chart, Docker-Compose-Konfiguration und alles dazwischen — damit Teams von Start-ups bis hin zu Unternehmen Langfuse auf ihren eigenen Bedingungen ausführen können.
Dies ist keine "beibehalten, was existiert"-Rolle. Wir wachsen schnell, und Sie werden die Person sein, die sicherstellt, dass die Infrastruktur vor der Nachfrage wächst — nicht hinterher.
Langfuse ist jetzt Teil von ClickHouse, was bedeutet, dass das Team hinter der Datenbank im Kern unseres Stacks nur einen Kanal entfernt ist. Wenige Infrastruktur-Rollen bieten Ihnen diesen direkten Zugang zu den Personen, die Ihre kritischsten Abhängigkeiten erstellen.
SIE WERDEN BEI LANGFUSE WACHSEN, INDEM SIE
Langfuse-Cloud-Betrieb besitzen: Sie werden unsere Produktionsumgebungen auf AWS ECS Fargate und ClickHouse Cloud ausführen. Sie werden Bereitstellungen, Auto-Scaling, Kapazitätsplanung und Kostoptimierung verwalten — sicherstellen, dass wir schnell und erschwinglich bleiben, während der Traffic skaliert.
Eine weltklasse-Beobachtbarkeit aufbauen: Sie werden unsere Datadog-Konfiguration von Anfang bis Ende besitzen — Dashboards, Alerts und SLOs. Wenn etwas nachlässt, werden Sie sicherstellen, dass wir es vor unseren Kunden wissen. Sie werden die Überwachungskultur aufbauen, die es dem gesamten Team ermöglicht, mit Vertrauen zu verschiffen.
Selbst-Hosting mühelos machen: Tausende von Teams führen Langfuse auf ihrer eigenen Infrastruktur aus. Sie werden unsere Helm-Chart, Docker-Compose-Konfiguration und Bereitstellungs-Dokumentation besitzen und weiterentwickeln. Sie werden "funktioniert auf meinem Computer" in "funktioniert auf jedem Computer" umwandeln — von einer einzelnen Knoten-Konfiguration bis hin zu einer multi-regionalen Unternehmensbereitstellung.
Alles automatisieren: CI/CD-Pipelines, Infrastruktur-as-Code, automatisches Skalieren, zero-Downtime-Bereitstellungen. Sie werden manuelle Prozesse durch Automation ersetzen, die das Team schneller und die Plattform zuverlässiger macht.
Für das Skalieren des nächsten Schritts vorbereiten: Wir wachsen schnell und neue Produkt-Richtungen — wie komplexe, lang laufende Agenten-Beobachtbarkeit und Echtzeit-Bewertung — drücken die Infrastruktur in neue Wege. Sie werden vorausdenken, was bei 10x-Skalierung bricht, und die Grundlage schaffen, bevor wir dort ankommen. 10x ist hier bei Langfuse immer nur ein Quartal entfernt.
Sicherheit und Compliance stärken: Wenn mehr Unternehmen Langfuse adoptieren, werden Sie helfen, sicherzustellen, dass unsere Cloud- und Selbst-Hosting-Bereitstellungen den Sicherheits- und Compliance-Standard erfüllen, den große Organisationen erfordern.
WAS WIR SUCHEN
- Starker Infrastruktur- oder SRE-Ingenieur, der sich für das Betreiben von Systemen im großen Maßstab und deren Verbesserung jeden Tag begeistert
- Erfahrung bei der Betreibung von Produktions-Workloads auf AWS (ECS/Fargate, Networking, IAM, S3 usw.) oder auf vergleichbaren Hyperscale-Anbietern.
- Komfortabel mit Container-Orchestrierung — Kubernetes und/oder ECS, Helm-Chart, Docker
- Erfahrung mit Infrastruktur-as-Code (Terraform, Pulumi, CloudFormation oder ähnlich)
- Starke Überwachungs- und Beobachtbarkeits-Instinkte — Sie haben Dashboards und Alerts erstellt, die tatsächlich Probleme erkannt haben (Datadog-Erfahrung ist ein Plus)
- Sie organisieren sich selbst. Sie haben starke Meinungen über Zuverlässigkeit, Automation und wie man Infrastruktur-Änderungen sicher verschiffen kann
- Interesse an Open-Source-Software und echtes Vergnügen daran, Benutzern bei der Fehlersuche ihrer selbst gehosteten Bereitstellungen zu helfen
- Gedeiht
Automatisch aus dem Original übersetzt.
Ausgeschrieben heute