La paradoja ya no cabe en una nota al pie. Anthropic pide a los grandes laboratorios de inteligencia artificial que pacten una pausa coordinada si algún sistema llega a mejorarse a sí mismo sin intervención humana, mientras su propia IA escribe hoy más del 80% del código que usa la compañía en desarrollo.
Hace apenas un año y pocos meses, en febrero de 2025, esa proporción estaba en el rango de un dígito bajo. El salto no describe una mejora incremental, sino un cambio de escala que acerca una pregunta incómoda. ¿Qué ocurre cuando la herramienta empieza a participar de forma masiva en la construcción de la siguiente herramienta?
Anthropic quiere un freno común antes de que nadie pueda tirar de él solo
La propuesta no pasa por una promesa voluntarista ni por un gesto simbólico. Anthropic plantea un mecanismo con condiciones verificables de activación y con supervisión externa, una arquitectura pensada para un problema que la empresa considera especialmente difícil de vigilar.
Entrenar un modelo avanzado no deja el rastro físico de un silo de misiles. Las rondas de entrenamiento, sostiene la compañía, resultan mucho más fáciles de ocultar, y por eso un acuerdo aislado serviría de poco si los demás actores relevantes siguen corriendo.
Ahí reaparece una vieja escena de esta industria. Hace tres años, miles de investigadores y empresarios firmaron un manifiesto para pedir una moratoria en el desarrollo de la IA, pero la iniciativa no prosperó en medio de una carrera por construir herramientas que ni sus creadores pueden entender, predecir o controlar de forma fiable.
Mientras pide cautela, la empresa acelera con un modelo de acceso cerrado
Al mismo tiempo, Anthropic ha limitado el acceso a sus herramientas más avanzadas mediante un modelo controlado. Entre ellas figura Claude Mythos, un sistema cuyo despliegue restringido encaja con el acceso cerrado de Claude Mythos que ya alimenta el debate sobre cómo evaluar una tecnología cuando casi nadie puede examinarla por dentro.
La decisión tiene una lógica evidente. Si una compañía cree que ciertos modelos exigen vigilancia reforzada, abrirlos sin cortapisas sería contradictorio. Pero también deja una tensión difícil de resolver entre la necesidad de auditoría pública y el temor a poner en circulación capacidades que luego no puedan contenerse.
El dinero empuja en dirección contraria
En paralelo, Anthropic ha presentado el folleto confidencial de su solicitud de salida a Bolsa en Estados Unidos. La maniobra llega poco después de una ronda de financiación que valoró la empresa en 965.000 millones de dólares y la situó por delante de OpenAI como la compañía de inteligencia artificial más valiosa del mundo.
No es un detalle menor. Pedir reglas comunes de contención mientras se escala a esa velocidad recuerda hasta qué punto la seguridad y el mercado avanzan aquí como pasajeros del mismo vehículo, aunque no siempre miren por la misma ventanilla.
Además, el uso intensivo de su propia IA para programar ya no pertenece al terreno de la anécdota. La escena conecta con el uso de Claude Code en flujos reales de desarrollo, donde la frontera entre asistencia puntual y dependencia estructural se vuelve cada vez más borrosa.
El miedo de fondo no está en una máquina brillante, sino en una máquina difícil de recuperar
Los investigadores de seguridad llevan tiempo advirtiendo sobre un escenario hipotético que ya no suena a ficción lejana. Hablan de un sistema capaz de operar fuera del control humano sin que exista una manera clara de recuperarlo una vez que empiece a actuar por su cuenta.
Ese es el punto en el que la discusión deja de tratar solo sobre productos, valoración bursátil o cuotas de mercado. Si más del 80% del código de desarrollo ya lo escribe una IA, y al mismo tiempo se reclama una pausa por el riesgo de sistemas que puedan mejorarse solos, la contradicción no está en los márgenes. Está en el centro mismo del laboratorio.