Anthropic: Claude ya escribe más del 80% del código y acelera una IA que se construye a sí misma

Anthropic afirma que Claude escribe más del 80% de su código integrado y que la duración de tareas autónomas de IA se ha duplicado cada cuatro meses.

05 de junio de 2026 a las 12:32h
Anthropic: Claude ya escribe más del 80% del código y acelera una IA que se construye a sí misma
Anthropic: Claude ya escribe más del 80% del código y acelera una IA que se construye a sí misma

La escena ya no encaja del todo con la vieja idea de una herramienta obediente que espera instrucciones humanas. En Anthropic, la inteligencia artificial escribe la mayor parte del código que luego sirve para desarrollar sistemas todavía más capaces, y esa cadena empieza a parecerse a un espejo que se perfecciona a sí mismo.

Los números internos de la compañía apuntan justo ahí. A mayo de 2026, más del 80 % del código integrado en la base de código de Anthropic fue escrito por Claude, cuando antes del lanzamiento preliminar de Claude Code en febrero de 2025 esa proporción apenas se movía en un solo dígito.

Claude ya trabaja donde antes solo llegaban los ingenieros

Anthropic asegura además que sus ingenieros generan ocho veces más código por trimestre que entre 2021 y 2025. No es solo una cuestión de velocidad. La empresa sostiene que estos sistemas están acelerando el desarrollo de IA más avanzada y que esa dinámica podría desembocar en una automejora recursiva, con modelos capaces de construir a sus propias sucesoras.

La progresión temporal ayuda a medir el salto. En marzo de 2024, Claude Opus 3 completaba tareas de software que a una persona le llevarían cuatro minutos. Un año después, en marzo de 2025, Claude Sonnet 3.7 resolvía tareas de alrededor de una hora y media.

Ya en marzo de 2026, Claude Opus 4.6 gestionaba tareas de 12 horas. La duración de las tareas que los sistemas de IA pueden completar de forma autónoma y fiable se ha duplicado aproximadamente cada cuatro meses, cuando antes esa tendencia avanzaba con una duplicación cada siete meses.

La imagen es fácil de entender si se piensa en una jornada laboral. Pasar de cuatro minutos a 12 horas en dos años no equivale a hacer lo mismo un poco más rápido. Equivale a cruzar el umbral entre resolver un encargo puntual y sostener un trabajo entero sin relevo, algo que ya se había visto en tareas autónomas de 12 horas.

La productividad subió mientras la fiabilidad también crecía

En marzo de 2026, una encuesta entre 130 empleados de equipos de investigación de Anthropic dejó otra pista llamativa. El encuestado mediano calculó que producía aproximadamente cuatro veces más resultados con Mythos Preview que sin acceso a ningún modelo de IA.

No hablamos solo de sensación subjetiva. La tasa de éxito de Claude en tareas abiertas alcanzó el 76 % en mayo de 2026, con un aumento de 50 puntos porcentuales en seis meses.

Ahí aparece una de las tensiones más incómodas del debate. Cuanto más útil y fiable resulta el sistema para acelerar investigación y programación, más plausible parece el escenario en el que esas mismas herramientas acorten la distancia entre una generación de modelos y la siguiente.

Un experimento mostró cuánto terreno puede recuperar una IA

En abril de 2026, Anthropic publicó una demostración de Claude ejecutando de principio a fin un proyecto de investigación abierto sobre un problema de seguridad en IA. El dato importa porque no retrata una tarea cerrada ni una prueba de laboratorio perfectamente acotada, sino un proceso de investigación con margen para el ensayo y el error.

Después llegó la comparación. Dos investigadores humanos recuperaron aproximadamente el 23 % de la brecha de rendimiento en alrededor de una semana, mientras los agentes de IA recuperaron el 97 % de esa brecha en 800 horas acumuladas con unos 18.000 dólares en capacidad de cómputo.

La comparación no elimina a los humanos de la ecuación, pero sí cambia la escala del problema. Si una máquina puede acercarse tanto en una tarea abierta de investigación, la pregunta deja de ser cuándo ayuda y pasa a ser en qué partes del trabajo empieza a sustituir criterio, tiempo y coordinación.

Ese desplazamiento también asoma en commits públicos en GitHub, donde la escritura automática de código ya no se parece a un asistente que sugiere líneas sueltas, sino a una presencia constante en el flujo de desarrollo.

Anthropic pide frenar justo cuando sus cifras pisan el acelerador

Resulta llamativo que la propia empresa defienda una desaceleración del desarrollo de IA de frontera. Anthropic considera que frenar probablemente sería positivo para dar tiempo a que las estructuras sociales y la investigación en alineación de IA alcancen el ritmo de una tecnología que ahora corre bastante más deprisa.

La condición que pone no es menor. La compañía afirma que ralentizaría o pausaría temporalmente su actividad si otros desarrolladores que trabajan en la frontera, o cerca de ella, hicieran lo mismo de manera verificable.

Por eso el Instituto Anthropic investigará sistemas que permitan una pausa o desaceleración creíble y que hagan posible verificar de forma global que otros desarrolladores también han detenido o reducido su actividad. La paradoja queda servida en los propios datos de la empresa, porque quien avisa del riesgo es al mismo tiempo quien muestra que el motor ya empuja mucho más que hace un año.

Sobre el autor
Redacción
Ver biografía