Anthropic ha puesto negro sobre blanco una idea que hasta hace poco sonaba a ciencia ficción y hoy ya entra en los cálculos de la industria. La empresa cree posible que una inteligencia artificial llegue a construir por completo a su sucesora, un escenario que alteraría a la vez la velocidad del progreso y el modo de vigilarlo.
La advertencia no llega en un momento menor. Anthropic acaba de cerrar una ronda de financiación que la valoró en casi 1 billón de dólares, ha presentado documentación confidencial para salir a bolsa y su tasa anualizada de ingresos apunta a unos 50.000 millones de dólares al final de este mes, muy por encima de los 9.000 millones con que cerró 2025.
Anthropic sitúa el debate en un terreno mucho más incómodo
El jueves, Marina Favaro, directora del instituto de investigación interno de Anthropic, y Jack Clark, cofundador de la compañía, publicaron una reflexión que desplaza la conversación desde la potencia de los modelos hacia su capacidad para mejorarse a sí mismos.
"Una IA que pueda construirse a sí misma sería un hito en la historia de la tecnología—uno que podría aportar un bien enorme al mundo en la ciencia, la atención sanitaria y más allá". - Marina Favaro, directora del instituto de investigación interno, y Jack Clark, cofundador de Anthropic
Lo decisivo no es solo la promesa de utilidad, sino la clase de problema que aparece cuando un sistema deja de depender por completo de manos humanas para evolucionar. Favaro y Clark añaden que, si esos sistemas llegan a construir enteramente a sus sucesores, asegurar su comportamiento y mantenerlo bajo vigilancia pasa a ser una cuestión todavía más delicada.
Ahí entra una tensión política que ya no puede despacharse como un debate académico. En el mismo texto, ambos sostienen que el mundo debería conservar la opción de ralentizar o pausar temporalmente la IA de vanguardia para que las estructuras sociales y la investigación en alineamiento no queden atrás.
Hablar de pausa resulta más difícil cuando el negocio acelera
Jack Clark llevó esa preocupación a una conferencia en Londres el mes pasado. Allí dijo que una tecnología de este tipo no ha existido nunca antes y que podría llegar en los próximos dos años, quizá incluso antes.
Esa proximidad temporal vuelve más áspera la discusión regulatoria. OpenAI ha pedido acción del Congreso para crear un marco federal integral y ha precisado que dicho marco debería exigir a CAISI evaluaciones de los modelos de vanguardia, crear un ecosistema independiente de evaluación y priorizar la monitorización del progreso hacia la mejora recursiva.
Mientras unas compañías reclaman reglas, otras voces temen que la regulación termine sirviendo para cerrar el paso a los competidores incómodos. David Sacks, inversor y asesor informal del presidente Donald Trump, avisó en un podcast de que la agenda de captura regulatoria en Washington podría desembocar en una prohibición de los modelos de IA de código abierto.
En ese pulso entre control y carrera comercial ya asoma la IA que mejora su entrenamiento, una idea que deja de ser especulación cuando varias empresas empiezan a describir sistemas capaces de intervenir en su propia evolución.
La seguridad cambia cuando el modelo toca su propio código
Azizi Othman, de Asia e University, pone el foco en un riesgo menos visible y más técnico. Un sistema que modifica su propio código, advierte, podría ser manipulado para aceptar puertas traseras u órdenes ocultas mediante secuencias de ataque cuidadosamente diseñadas.
"Estas consideraciones abogan por tratar la seguridad de la RSI como una prioridad central de investigación, no como una preocupación secundaria". - Azizi Othman, de Asia e University
La frase importa porque desplaza la vieja imagen del fallo puntual hacia otra más difícil de detectar. Anthropic lo resume con una comparación incómoda cuando recuerda que las sesiones de entrenamiento son mucho más fáciles de ocultar que los silos de misiles.
Visto así, la vigilancia de esta tecnología se parece menos a inspeccionar una fábrica y más a seguir procesos opacos que pueden ejecutarse lejos del escaparate. También por eso la empresa ha decidido abrir debates con responsables políticos, investigadores y líderes del sector sobre la mejora recursiva y los mecanismos de desaceleración coordinada.
Mythos aparece justo cuando la ciberseguridad entra en el centro del debate
No es casual que Anthropic haya lanzado de forma limitada Mythos, un modelo centrado en ciberseguridad. La coincidencia resulta elocuente, porque la misma empresa que alerta sobre sistemas capaces de reescribirse prueba al mismo tiempo herramientas pensadas para un terreno donde el ataque y la defensa cambian de forma constante.
Esa relación entre modelos avanzados y seguridad digital ya había tomado forma en fallos de día cero detectados por Mythos, un contexto que ayuda a entender por qué la discusión sobre mejora recursiva no pertenece solo a los laboratorios.
Al final, la contradicción queda servida con cifras muy concretas. La compañía que pide conservar la opción de frenar temporalmente la IA de vanguardia es la misma que roza una valoración de casi 1 billón de dólares y que espera cerrar este mes con una tasa anualizada de ingresos de unos 50.000 millones, frente a los 9.000 millones de finales de 2025.