Nossa IA Resolve Seus Próprios Problemas no GitHub às 3 da Manhã

Como configuramos o Claude para corrigir bugs automaticamente, criar PRs e revisar seu próprio código — sem que um humano toque no teclado.

Dia de Natal, 2025

A maioria das equipes folga no dia 25 de dezembro. Nós também — mais ou menos. Mas nossa IA não.

No Dia de Natal, fizemos um commit intitulado “add claude auto issue resolver.” Era um fluxo de trabalho do GitHub Actions que fez algo incomum: quando um novo problema era registrado em nosso repositório, Claude automaticamente lia o problema, analisava a base de código, escrevia uma correção, criava um branch e abria um pull request.

Nenhum humano no processo. A IA lê o relatório de bug. A IA corrige o bug. A IA envia a correção para revisão.

Voltamos das férias e encontramos pull requests esperando por nós. Criadas por uma IA. Às 3 da manhã.

Por que construímos isso

Somos uma equipe pequena construindo uma plataforma complexa. Com 632 commits em 84 dias, estamos entregando rápido. Mas a velocidade cria um desafio de manutenção: os bugs não esperam o horário comercial.

Um usuário em Xangai relata um problema às 14h, horário deles. Isso é 1h da manhã para nós. Com um fluxo de trabalho tradicional, o bug fica sem ser tocado por 8 horas até que alguém acorde, leia o problema e comece a trabalhar nele.

Com o auto issue resolver, Claude pega o problema em minutos. Quando acordamos, há um pull request esperando com uma correção, uma descrição do que foi mudado e por quê, e uma revisão de código automatizada.

Não estamos substituindo desenvolvedores. Estamos dando a eles uma vantagem. Em vez de “ler problema, entender bug, escrever correção, criar PR,” o fluxo da manhã se torna “revisar PR, aprovar ou solicitar mudanças, mesclar.”

A evolução: de resolvedor de problemas a pipeline CI completo

O commit do Dia de Natal foi apenas o começo. Nas semanas seguintes, construímos toda a pipeline de desenvolvimento autônoma:

Resolução automática de problemas. Claude lê novos problemas, analisa o código relevante, escreve uma correção e cria um PR. As mensagens de commit fazem referência ao número do problema. A descrição do PR explica a mudança.

Revisão de código automatizada. Quando um PR é criado — por um humano ou por Claude — uma instância separada do Claude revisa o código. Ela verifica bugs, problemas de segurança, violações de estilo e cobertura de testes. A revisão aparece como comentários no PR, assim como a de um revisor humano.

Validação em loop fechado. Claude não apenas escreve código. Ele executa os testes. Se os testes falharem, ele lê o erro, corrige o código e tenta novamente. O PR só é enviado quando os testes passam.

Criação automática de PR. Quando Claude empurra um branch, ele automaticamente cria um PR com um resumo das mudanças. Nenhuma etapa manual necessária.

O momento meta

Há algo profundamente satisfatório em uma plataforma de IA que usa IA para se construir.

Nosso produto permite que os usuários executem agentes de IA que executam código, gerenciam arquivos e automatizam tarefas. E nosso processo de desenvolvimento usa agentes de IA que executam código, gerenciam arquivos e automatizam tarefas.

Nós consumimos o que produzimos. Todos os dias.

Quando Claude resolve um problema em nosso repositório, ele está usando os mesmos padrões que nossos usuários usam ao executar agentes de IA no LikeClaw. Execução em sandbox. Acesso ao sistema de arquivos. Chamada de ferramentas. A diferença é que nossos agentes voltados para o usuário rodam em sandboxes E2B na nuvem, enquanto nosso agente CI roda no GitHub Actions.

Mesmos princípios. Mesmas capacidades. Mesmo modelo de confiança: a IA faz o trabalho, os humanos revisam os resultados.

O que aprendemos

Resumos de PR concisos importam. No início, Claude escrevia descrições de PR de 2.000 palavras para uma correção de três linhas. Ajustamos os prompts para impor resumos concisos. “O que mudou e por quê” em duas frases, não em duas páginas.

A IA precisa de restrições. Sem limites, Claude às vezes “corrigia” um problema refatorando metade da base de código. Adicionamos regras: mude apenas arquivos diretamente relacionados ao problema. Não refatore. Não adicione recursos. Corrija o bug.

A revisão de código captura problemas reais. A revisão de código automatizada pegou bugs reais — riscos de ponteiro nulo, tratamento de erro ausente, potenciais problemas de segurança. Não é um substituto para a revisão humana, mas é uma primeira passada significativa.

A correção de bugs às 3 da manhã é real. Já acordamos com pull requests que corrigiram problemas relatados durante a noite. Revisamos a mudança. Mesclamos. O bug foi corrigido antes que nosso café da manhã esfriasse. Esse é o futuro do desenvolvimento de software.

Para que servem os agentes de IA

Não é para gerar lorem ipsum. Não é para escrever cartas de apresentação. Não é para resumir artigos que você poderia ler sozinho.

Agentes de IA são para fazer trabalho real, de forma autônoma, em escala, a qualquer hora. Corrigindo bugs enquanto a equipe dorme. Revisando código antes que o autor termine o almoço. Criando pull requests a partir de descrições de problemas sem que um humano digite uma única linha.

Construímos isso para nós mesmos primeiro. Agora estamos construindo para todos.

Antes

Correção de bugs tradicional

O desenvolvedor vê o problema pela manhã.
Gasta 30 min entendendo o bug
Escreve uma correção, cria um PR
Aguardando revisão de código
Bug corrigido de 4 a 8 horas após a descoberta

Após

Correção de bugs assistida por IA

Problema registrado (manualmente ou automaticamente)
Claude pega isso em minutos.
Fix está comprometido, PR foi criado, código foi revisado
O humano revisa o PR pela manhã.
Bug corrigido antes de alguém acordar.

Perguntas sobre o desenvolvimento de IA autônoma

A IA implanta o código em produção automaticamente?

Não. A IA cria branches e pull requests. Um humano sempre revisa e faz o merge. A IA acelera o pipeline de fix-to-PR, mas a implantação continua sendo uma decisão humana.

Com que frequência a IA erra?

Depende da complexidade. Para bugs simples com mensagens de erro claras, é surpreendentemente preciso. Para problemas arquitetônicos complexos, geralmente identifica a área certa, mas pode precisar de orientação humana sobre a abordagem.

Isso não é arriscado?

Menos do que você imagina. A IA trabalha em branches, nunca no main. Cada mudança passa por um PR. A IA até revisa seu próprio código em busca de problemas óbvios antes de enviar. E um humano sempre tem a palavra final.