Inteligencia Artificial

Claude 4.8 Opus reduce 4 veces los errores de código y acelera su modo rápido 2,5 veces

Anthropic lanza Claude 4.8 Opus 41 días después de la 4.7: detecta más fallos de código, mejora en tests clave, acelera el modo rápido y baja su coste operativo.

Redacción

30 de mayo de 2026 a las 07:24h

Claude 4.8 Opus reduce 4 veces los errores de código y acelera su modo rápido 2,5 veces

Añadir Mangas Verdes como fuente preferida de Google de forma gratuita.

Mantente informado con las últimas noticias de actualidad.

Cuarenta y un días han bastado para que Anthropic vuelva a mover ficha en su línea más potente. Claude 4.8 Opus llega poco después de Claude Opus 4.7 con una promesa muy concreta, detectar muchos más fallos en código en lugar de dejarlos pasar como si nada.

Ahí está una de las claves más terrenales de esta actualización. En programación, un modelo no solo vale por lo que acierta, también por los errores que no detecta. En este caso, Claude 4.8 Opus es aproximadamente cuatro veces menos probable que deje pasar errores en código sin señalarlos frente a su predecesor.

El salto no está en una sola nota, aparece en casi todos los test

La mejora no descansa en una única métrica vistosa. Anthropic muestra avances en varias pruebas que miden desde generación de código con agentes hasta razonamiento con herramientas y resolución de tareas de ingeniería de software.

En Agentic code, orientado a crear código con agentes, la puntuación sube de 64.3 % a 69.2 %. En razonamiento multidisciplinar con herramientas pasa de 54.7 % a 57.9 %.

SWE-bench Verified, una referencia habitual para medir rendimiento en tareas reales de desarrollo, registra un avance de 87.6 % a 88.6 %.

Donde el cambio se nota más es en Terminal-Bench 2.1. Ahí el modelo pasa de 66.1 % a 74.6 %, un salto que sugiere mejor comportamiento en tareas más cercanas al trabajo práctico con terminal y automatización.

También corre más y abarata el modo rápido

No todo gira alrededor de la precisión. Anthropic asegura que el modo rápido de Opus 4.8 es aproximadamente 2,5 veces más veloz, una diferencia que importa cuando el usuario espera respuestas continuas mientras revisa código, prueba comandos o encadena tareas.

Además, el modo rápido mejorado cuesta tres veces menos que antes. La combinación resulta llamativa porque mezcla dos variables que rara vez avanzan al mismo ritmo, más velocidad y menos precio en un mismo ajuste operativo.

El precio base de la API, sin embargo, no cambia. Se mantiene en 5 dólares por millón de tokens de entrada y 25 dólares por millón de tokens de salida.

A partir de ahí entran en juego las palancas de uso. El prompt caching puede recortar hasta un 90 % del coste y el batch processing un 50 %, algo que pesa especialmente cuando un equipo repite contextos o lanza trabajos en lote.

Anthropic quiere que el modelo piense más cuando el usuario lo pida

Los usuarios pueden elegir entre niveles extra o max para que Claude consuma más tokens y busque mejores resultados. La idea recuerda una situación bastante cotidiana, dedicar más tiempo y más recursos a una tarea difícil porque resolverla a la primera sale más barato que corregirla tres veces.

Esa lógica encaja con un uso cada vez más orientado a desarrollo complejo, donde el problema no consiste solo en responder rápido. Muchas veces importa más mantener el hilo, repartir subtareas y volver con una solución coherente.

Dynamic Workflows multiplica el trabajo en paralelo dentro de una sola sesión

Ahí aparece Dynamic Workflows, una función que permite a Claude planificar trabajo y ejecutar cientos de subagentes en paralelo dentro de una sola sesión. El objetivo no es una demostración abstracta, sino completar migraciones a escala de bases de código con cientos de miles de líneas.

En la práctica, eso acerca el modelo a tareas que desbordan el típico asistente de chat. Ya no se trata solo de sugerir una función o corregir un bloque aislado, sino de coordinar muchas piezas de un mismo cambio sin perder el contexto global.

Dynamic Workflows está disponible para Claude Code en los planes Enterprise, Team y Max.

Mientras Opus acelera, Sonnet y Haiku permanecen quietos

El movimiento también dice algo por contraste. Sonnet sigue en la versión 4.6 desde febrero de 2026 y Haiku permanece en la 4.5 desde octubre de 2025, de modo que el empuje reciente de la familia Claude se concentra claramente en Opus.

No deja de ser una tensión interesante dentro del catálogo. Mientras una rama recibe una actualización a los 41 días y gana velocidad, precisión y funciones para orquestar subagentes, las otras dos permanecen donde estaban.

El dato que mejor resume esa diferencia quizá no sea una frase amplia, sino una cifra muy concreta. Opus 4.8 aparece 41 días después de la versión 4.7, pero Sonnet arrastra la misma versión desde febrero de 2026 y Haiku desde octubre de 2025.

Sobre el autor

Redacción

Ver biografía