Nuestra IA Resuelve Sus Propios Problemas de GitHub a las 3 AM

Cómo configuramos a Claude para que arregle automáticamente errores, cree PRs y revise su propio código — sin que un humano toque el teclado.

Día de Navidad, 2025

La mayoría de los equipos se toman el 25 de diciembre libre. Nosotros también — más o menos. Pero nuestra IA no.

El Día de Navidad, hicimos un commit titulado “add claude auto issue resolver.” Era un flujo de trabajo de GitHub Actions que hacía algo inusual: cuando se registraba un nuevo problema en nuestro repositorio, Claude leía automáticamente el problema, analizaba la base de código, escribía una solución, creaba una rama y abría una solicitud de extracción.

Sin humanos en el proceso. La IA lee el informe de error. La IA corrige el error. La IA envía la solución para revisión.

Regresamos de las vacaciones y encontramos solicitudes de extracción esperándonos. Autorizadas por una IA. A las 3 AM.

Por qué construimos esto

Somos un equipo pequeño construyendo una plataforma compleja. Con 632 commits en 84 días, estamos lanzando rápido. Pero la velocidad crea un desafío de mantenimiento: los errores no esperan a que sea horario laboral.

Un usuario en Shanghái reporta un problema a las 2 PM su hora. Eso son la 1 AM para nosotros. Con un flujo de trabajo tradicional, el error permanece sin tocar durante 8 horas hasta que alguien se despierta, lee el problema y comienza a trabajar en él.

Con el auto issue resolver, Claude se hace cargo del problema en minutos. Para cuando nos despertamos, hay una solicitud de extracción esperando con una solución, una descripción de lo que se cambió y por qué, y una revisión de código automatizada.

No estamos reemplazando a los desarrolladores. Les estamos dando una ventaja. En lugar de “leer el problema, entender el error, escribir la solución, crear PR,” el flujo de trabajo matutino se convierte en “revisar PR, aprobar o solicitar cambios, fusionar.”

La evolución: de resolutor de problemas a pipeline CI completo

El commit del Día de Navidad fue solo el comienzo. En las semanas siguientes, construimos toda la pipeline de desarrollo autónoma:

Resolución automática de problemas. Claude lee nuevos problemas, analiza el código relevante, escribe una solución y crea un PR. Los mensajes de commit hacen referencia al número del problema. La descripción del PR explica el cambio.

Revisión de código automatizada. Cuando se crea un PR — ya sea por un humano o por Claude — una instancia separada de Claude revisa el código. Verifica errores, problemas de seguridad, violaciones de estilo y cobertura de pruebas. La revisión aparece como comentarios en el PR, igual que los de un revisor humano.

Validación en bucle cerrado. Claude no solo escribe código. Ejecuta las pruebas. Si las pruebas fallan, lee el error, corrige el código y lo intenta de nuevo. El PR solo se envía cuando las pruebas pasan.

Creación automática de PR. Cuando Claude empuja una rama, automáticamente crea un PR con un resumen de los cambios. No se requiere ningún paso manual.

El momento meta

Hay algo profundamente satisfactorio en una plataforma de IA que usa IA para construirse a sí misma.

Nuestro producto permite a los usuarios ejecutar agentes de IA que ejecutan código, gestionan archivos y automatizan tareas. Y nuestro proceso de desarrollo utiliza agentes de IA que ejecutan código, gestionan archivos y automatizan tareas.

Nosotros mismos consumimos nuestra propia cocina. Todos los días.

Cuando Claude resuelve un problema en nuestro repositorio, está utilizando los mismos patrones que nuestros usuarios usan cuando ejecutan agentes de IA en LikeClaw. Ejecución en sandbox. Acceso al sistema de archivos. Llamadas a herramientas. La diferencia es que nuestros agentes orientados al usuario se ejecutan en sandboxes E2B en la nube, mientras que nuestro agente CI se ejecuta en GitHub Actions.

Mismos principios. Mismas capacidades. Mismo modelo de confianza: la IA hace el trabajo, los humanos revisan los resultados.

Lo que aprendimos

Los resúmenes de PR concisos importan. Al principio, Claude escribía descripciones de PR de 2,000 palabras para una solución de tres líneas. Ajustamos los prompts para imponer resúmenes concisos. “Qué cambió y por qué” en dos oraciones, no en dos páginas.

La IA necesita restricciones. Sin límites, Claude a veces “arreglaba” un problema refactorizando la mitad de la base de código. Agregamos reglas: solo cambiar archivos directamente relacionados con el problema. No refactorizar. No agregar características. Arreglar el error.

La revisión de código detecta problemas reales. La revisión de código automatizada ha detectado errores reales — riesgos de puntero nulo, falta de manejo de errores, problemas de seguridad potenciales. No es un reemplazo para la revisión humana, pero es un primer paso significativo.

La solución de errores a las 3 AM es real. Nos hemos despertado con solicitudes de extracción que solucionaron problemas reportados durante la noche. Revisamos el cambio. Lo fusionamos. El error se corrigió antes de que nuestro café de la mañana se enfriara. Ese es el futuro del desarrollo de software.

Para qué son los agentes de IA

No para generar lorem ipsum. No para escribir cartas de presentación. No para resumir artículos que podrías leer tú mismo.

Los agentes de IA son para hacer trabajo real, de forma autónoma, a gran escala, las 24 horas. Corrigiendo errores mientras el equipo duerme. Revisando código antes de que el autor termine el almuerzo. Creando solicitudes de extracción a partir de descripciones de problemas sin que un humano teclee una sola línea.

Construimos esto primero para nosotros. Ahora lo estamos construyendo para todos.

Antes

Corrección de errores tradicional

El desarrollador ve el problema por la mañana.
Pasa 30 min entendiendo el error.
Escribe una solución, crea un PR
Espera la revisión del código
Error corregido de 4 a 8 horas después de su descubrimiento

Después

Corrección de errores asistida por IA

Se ha registrado un problema (manualmente o automáticamente)
Claude lo recoge en minutos.
El fix está comprometido, el PR está creado, el código ha sido revisado.
El humano revisa el PR por la mañana.
Error corregido antes de que alguien se despierte.

Preguntas sobre el desarrollo de IA autónoma

¿La IA despliega código en producción automáticamente?

No. La IA crea ramas y pull requests. Un humano siempre revisa y fusiona. La IA acelera el pipeline de arreglo a PR, pero el despliegue sigue siendo una decisión humana.

¿Qué tan a menudo se equivoca la IA?

Depende de la complejidad. Para errores sencillos con mensajes de error claros, es sorprendentemente preciso. Para problemas arquitectónicos complejos, generalmente identifica la área correcta, pero puede necesitar orientación humana sobre el enfoque.

¿No es esto arriesgado?

Menos de lo que piensas. La IA trabaja en ramas, nunca en la principal. Cada cambio pasa por un PR. La IA incluso revisa su propio código en busca de problemas obvios antes de enviar. Y un humano siempre tiene la última palabra.