Claude Opus 4.8 llega 41 días después y Anthropic dice que es una mejora “modesta pero tangible”

Anthropic lanza Claude Opus 4.8, que supera en pruebas internas a GPT 5.5 y Gemini 3.1 Pro, mientras prepara modelos Mythos con más capacidad.

30 de mayo de 2026 a las 11:31h
Claude Opus 4.8 llega 41 días después y Anthropic dice que es una mejora “modesta pero tangible”
Claude Opus 4.8 llega 41 días después y Anthropic dice que es una mejora “modesta pero tangible”

Cuarenta y un días después de publicar Claude Opus 4.7, Anthropic ha vuelto a mover ficha con Claude Opus 4.8. La rapidez del relevo dice bastante sobre el momento que vive la inteligencia artificial, donde el calendario empieza a parecerse más al de una carrera de velocidad que al de un producto madurado durante meses.

La propia empresa rebaja el tono triunfalista y habla de una mejora contenida. En su anuncio oficial afirma que los usuarios detectarán que Opus 4.8 es una mejora modesta pero tangible sobre su predecesor.

Anthropic acelera incluso cuando el salto parece pequeño

Esa combinación entre prisa y prudencia no resulta menor. Cuando dos compañías, OpenAI y Anthropic, concentran el 89% de los 80.000 millones que factura al año el sector, cada ajuste de modelo pesa mucho más que una simple actualización de versión.

En las pruebas internas de Anthropic, Claude Opus 4.8 supera a Claude Opus 4.7, a GPT 5.5 y a Gemini 3.1 Pro. Solo hay una excepción, porque en TerminalBench 2.1 GPT 5.5 logra un resultado ligeramente superior.

Ahí aparece una de las claves del lanzamiento. No se trata solo de correr más en tablas comparativas, también de comportarse de forma más fiable cuando el sistema trabaja y se equivoca.

"Es significativamente más honesto sobre su propio trabajo. Te dice cuándo no está seguro de algo y detecta sus propios fallos en lugar de declarar demasiado pronto la victoria" - Boris Cherny, máximo responsable de Claude Code en Anthropic

La frase de Boris Cherny apunta a un problema muy cotidiano en la IA generativa. Un modelo que responde con seguridad cuando falla puede ahorrar segundos en una demo, pero en programación o ciberseguridad puede multiplicar horas perdidas.

Claude Code ahora multiplica agentes dentro de una sola sesión

Junto al nuevo modelo, Anthropic ha presentado en versión preliminar los flujos de trabajo dinámicos para Claude Code. La función permite desplegar cientos de agentes paralelos en una única sesión para tareas como analizar o migrar repositorios de código de cientos de miles de líneas.

No es un detalle menor para quienes trabajan con software heredado, bases de código extensas o migraciones delicadas. En ese terreno, repartir el trabajo entre muchos agentes equivale menos a tener un ayudante rápido y más a coordinar un pequeño equipo dentro de la misma consola.

Mientras Opus recibe una revisión en poco más de un mes, la cadencia no ha sido igual para el resto de la familia. Claude Sonnet 4.6 llegó el 17 de febrero de 2026 y Claude Haiku 4.5 el 15 de octubre de 2025, sin actualizaciones publicadas desde entonces.

La siguiente clase de modelos ya asoma por detrás de Opus

Anthropic también ha anunciado que lanzará en las próximas semanas modelos de la clase Mythos para todos sus clientes, después de desarrollar medidas de ciberseguridad más sólidas. La empresa sitúa ese trabajo dentro del Proyecto Glasswing.

"Planeamos lanzar una nueva clase de modelo con una inteligencia aún mayor que la de Opus. Como parte del Proyecto Glasswing, un pequeño número de organizaciones está utilizando actualmente Claude Mythos Preview para trabajos de ciberseguridad. Los modelos con este nivel de capacidad requieren medidas de ciberseguridad más sólidas antes de su lanzamiento general. Estamos avanzando rápidamente en el desarrollo de estas medidas y esperamos poder ofrecer modelos de la clase Mythos a todos nuestros clientes en las próximas semanas" - Anthropic, comunicado oficial

Ese anuncio deja una imagen curiosa del mercado. Por un lado, Anthropic presenta una mejora “modesta pero tangible” en Opus 4.8. Por otro, ya describe una clase de modelos con una inteligencia aún mayor, aunque todavía bajo restricciones ligadas a la ciberseguridad.

La tensión real está ahí, entre lo que ya puede venderse y lo que todavía exige más barreras antes de abrirse al conjunto de clientes. En un negocio de 80.000 millones al año, dominado en un 89% por OpenAI y Anthropic, una diferencia de 41 días entre versiones convive con cautelas mucho más lentas cuando la capacidad del modelo sube demasiado.

Sobre el autor
Redacción
Ver biografía