Unsere KI löst ihre eigenen GitHub-Probleme um 3 Uhr morgens.

Wie wir Claude eingerichtet haben, um automatisch Bugs zu beheben, PRs zu erstellen und seinen eigenen Code zu überprüfen — ohne dass ein Mensch die Tastatur berührt.

Weihnachtstag, 2025

Die meisten Teams nehmen am 25. Dezember frei. Wir auch — irgendwie. Aber unsere KI nicht.

Am Weihnachtstag haben wir einen Commit mit dem Titel “add claude auto issue resolver” gepusht. Es war ein GitHub Actions Workflow, der etwas Ungewöhnliches tat: Wenn ein neues Problem in unserem Repository gemeldet wurde, las Claude automatisch das Problem, analysierte den Code, schrieb einen Fix, erstellte einen Branch und öffnete einen Pull Request.

Kein Mensch im Loop. Die KI liest den Fehlerbericht. Die KI behebt den Fehler. Die KI reicht den Fix zur Überprüfung ein.

Als wir von den Feiertagen zurückkamen, fanden wir Pull Requests, die auf uns warteten. Verfasst von einer KI. Um 3 Uhr morgens.

Warum wir das gebaut haben

Wir sind ein kleines Team, das eine komplexe Plattform entwickelt. Mit 632 Commits in 84 Tagen sind wir schnell unterwegs. Aber Geschwindigkeit schafft eine Wartungsherausforderung: Fehler warten nicht auf Bürozeiten.

Ein Nutzer in Shanghai meldet um 14 Uhr seiner Zeit ein Problem. Das ist 1 Uhr morgens für uns. Mit einem traditionellen Workflow bleibt der Fehler 8 Stunden lang unbeachtet, bis jemand aufwacht, das Problem liest und anfängt, daran zu arbeiten.

Mit dem automatischen Problemlöser greift Claude das Problem innerhalb von Minuten auf. Bis wir aufwachen, gibt es einen Pull Request mit einem Fix, einer Beschreibung, was geändert wurde und warum, sowie einer automatisierten Codeüberprüfung.

Wir ersetzen keine Entwickler. Wir geben ihnen einen Vorsprung. Anstatt “Problem lesen, Fehler verstehen, Fix schreiben, PR erstellen” wird der Morgen-Workflow zu “PR überprüfen, genehmigen oder Änderungen anfordern, mergen.”

Die Evolution: vom Problemlöser zur vollständigen CI-Pipeline

Der Commit am Weihnachtstag war nur der Anfang. In den folgenden Wochen haben wir die gesamte autonome Entwicklungs-Pipeline aufgebaut:

Automatische Problemlösung. Claude liest neue Probleme, analysiert den relevanten Code, schreibt einen Fix und erstellt einen PR. Die Commit-Nachrichten beziehen sich auf die Problemanummer. Die PR-Beschreibung erklärt die Änderung.

Automatisierte Codeüberprüfung. Wenn ein PR erstellt wird — von einem Menschen oder von Claude — überprüft eine separate Claude-Instanz den Code. Sie prüft auf Fehler, Sicherheitsprobleme, Stilverstöße und Testabdeckung. Die Überprüfung erscheint als PR-Kommentare, genau wie bei einem menschlichen Prüfer.

Geschlossene Validierung. Claude schreibt nicht nur Code. Es führt die Tests aus. Wenn die Tests fehlschlagen, liest es den Fehler, behebt den Code und versucht es erneut. Der PR wird nur eingereicht, wenn die Tests bestehen.

Automatische PR-Erstellung. Wenn Claude einen Branch pusht, erstellt es automatisch einen PR mit einer Zusammenfassung der Änderungen. Kein manueller Schritt erforderlich.

Der Meta-Moment

Es ist zutiefst befriedigend, eine KI-Plattform zu haben, die KI nutzt, um sich selbst zu bauen.

Unser Produkt ermöglicht es Nutzern, KI-Agenten auszuführen, die Code ausführen, Dateien verwalten und Aufgaben automatisieren. Und unser Entwicklungsprozess nutzt KI-Agenten, die Code ausführen, Dateien verwalten und Aufgaben automatisieren.

Wir essen unser eigenes Essen. Jeden Tag.

Wenn Claude ein Problem in unserem Repository löst, verwendet es die gleichen Muster, die unsere Nutzer nutzen, wenn sie KI-Agenten auf LikeClaw ausführen. Sandbox-Ausführung. Dateisystemzugriff. Toolaufrufe. Der Unterschied ist, dass unsere benutzerseitigen Agenten in E2B-Sandboxes in der Cloud laufen, während unser CI-Agent in GitHub Actions läuft.

Die gleichen Prinzipien. Die gleichen Fähigkeiten. Das gleiche Vertrauensmodell: KI erledigt die Arbeit, Menschen überprüfen die Ergebnisse.

Was wir gelernt haben

Knappe PR-Zusammenfassungen sind wichtig. Früher schrieb Claude 2.000 Wörter lange PR-Beschreibungen für einen dreizeiligen Fix. Wir haben die Eingabeaufforderungen angepasst, um prägnante Zusammenfassungen durchzusetzen. “Was wurde geändert und warum” in zwei Sätzen, nicht zwei Seiten.

Die KI braucht Einschränkungen. Ohne Leitplanken würde Claude manchmal ein Problem “lösen”, indem es die Hälfte des Codes umschreibt. Wir haben Regeln hinzugefügt: Ändere nur Dateien, die direkt mit dem Problem zu tun haben. Nicht umschreiben. Keine Funktionen hinzufügen. Den Fehler beheben.

Codeüberprüfung erkennt echte Probleme. Die automatisierte Codeüberprüfung hat tatsächliche Fehler gefunden — Nullzeiger-Risiken, fehlende Fehlerbehandlung, potenzielle Sicherheitsprobleme. Es ist kein Ersatz für die menschliche Überprüfung, aber es ist ein sinnvoller erster Durchgang.

Der 3-Uhr-morgens-Fehlerfix ist real. Wir sind zu Pull Requests aufgewacht, die Probleme behoben haben, die über Nacht gemeldet wurden. Wir haben die Änderung überprüft. Sie zusammengeführt. Der Fehler war behoben, bevor unser Morgenkaffee kalt wurde. Das ist die Zukunft der Softwareentwicklung.

Dafür sind KI-Agenten da

Nicht um Lorem Ipsum zu generieren. Nicht um Bewerbungsschreiben zu schreiben. Nicht um Artikel zusammenzufassen, die man selbst lesen könnte.

KI-Agenten sind dafür da, echte Arbeit autonom, in großem Maßstab und rund um die Uhr zu erledigen. Fehler zu beheben, während das Team schläft. Code zu überprüfen, bevor der Autor mit dem Mittagessen fertig ist. Pull Requests aus Problembeschreibungen zu erstellen, ohne dass ein Mensch eine einzige Zeile tippt.

Wir haben das zuerst für uns selbst gebaut. Jetzt bauen wir es für alle.

Vorher

Traditionelles Bugfixing

Der Entwickler sieht das Problem am Morgen.
Verbringt 30 Minuten damit, den Fehler zu verstehen.
Schreibt einen Fix, erstellt einen PR
Wartet auf Code-Überprüfung
Fehler 4-8 Stunden nach Entdeckung behoben

Nach

KI-unterstützte Fehlerbehebung

Das Problem wurde (manuell oder automatisch) gemeldet.
Claude nimmt es innerhalb von Minuten auf.
Fix ist abgeschlossen, PR ist erstellt, Code wird überprüft.
Der Mensch überprüft das PR am Morgen.
Fehler behoben, bevor jemand aufwacht.

Fragen zur Entwicklung autonomer KI

Setzt die KI den Code automatisch in der Produktion ein?

Nein. Die KI erstellt Branches und Pull Requests. Ein Mensch überprüft und merged immer. Die KI beschleunigt den Fix-to-PR-Pipeline, aber das Deployment bleibt eine menschliche Entscheidung.

Wie oft liegt die KI falsch?

Es hängt von der Komplexität ab. Bei einfachen Bugs mit klaren Fehlermeldungen ist es überraschend genau. Bei komplexen architektonischen Problemen identifiziert es normalerweise den richtigen Bereich, benötigt aber möglicherweise menschliche Anleitung für den Ansatz.

Ist das nicht riskant?

Weniger, als du denkst. Die KI arbeitet auf Branches, niemals auf dem Main. Jede Änderung läuft über einen PR. Die KI überprüft sogar ihren eigenen Code auf offensichtliche Probleme, bevor sie ihn einreicht. Und ein Mensch hat immer das letzte Wort.