Inteligencia Artificial

Anthropic pide pausar la IA de vanguardia si empieza a automejorarse recursivamente

Anthropic alerta de que una IA capaz de autoconstruirse y mejorarse podría hacer perder el control humano y propone una pausa coordinada entre varios laboratorios con verificación mutua.

Redacción

09 de junio de 2026 a las 15:57h

Anthropic pide pausar la IA de vanguardia si empieza a automejorarse recursivamente

Añadir Mangas Verdes como fuente preferida de Google de forma gratuita.

Mantente informado con las últimas noticias de actualidad.

Anthropic ha puesto sobre la mesa una pregunta incómoda para toda la industria de la inteligencia artificial. Si algún sistema llega a autoconstruirse y a mejorarse de forma recursiva, la compañía cree que el problema ya no sería solo técnico, sino también político, social y de control humano.

Ahí aparece la paradoja que atraviesa este debate. La misma empresa que describe esa posibilidad como un avance trascendental en la historia de la tecnología advierte al mismo tiempo de que esa automejora podría aumentar el riesgo de que las personas pierdan el control sobre los sistemas de IA.

Anthropic pide que varios laboratorios se detengan a la vez

No plantea una pausa unilateral ni un gesto simbólico. La compañía sostiene que sería beneficioso para el mundo poder ralentizar o pausar temporalmente el desarrollo de la IA de vanguardia mientras las estructuras sociales y la investigación sobre alineación logran adaptarse a un ritmo que hoy corre mucho más deprisa.

Esa idea exige algo bastante más difícil que una declaración pública. Anthropic habla de un mecanismo de coordinación global en el que múltiples laboratorios bien equipados acepten detenerse bajo las mismas condiciones y, además, puedan comprobar que los demás han frenado de verdad.

En ese punto, la discusión deja de parecer un debate filosófico y se acerca a un problema de verificación internacional, parecido al que ya asoma en revisiones previas de modelos antes de su despliegue público.

La pausa solo funciona si nadie puede avanzar en secreto

Anthropic introduce aquí una condición decisiva. No basta con que varias compañías prometan bajar el ritmo, porque cualquier ralentización coordinada se rompería si un actor malintencionado pudiera aprovecharla para seguir avanzando en secreto.

Por eso la empresa insiste en pautas de verificación entre desarrolladores de IA de vanguardia. Cada actor tendría que demostrar que ha detenido o ralentizado su trabajo en igualdad de condiciones, una exigencia que convierte la confianza en algo medible y no solo declarativo.

Detrás de esa cautela hay una experiencia reciente que ayuda a entender el giro, visible también en el debate sobre frenos automáticos dentro de la propia conversación sobre seguridad en IA.

El espejo nuclear sirve como referencia, pero llega tarde

Anthropic cita el Tratado sobre Fuerzas Nucleares de Alcance Intermedio como una referencia de acuerdo global capaz de imponer límites verificables entre rivales. La comparación no busca dramatizar, sino señalar que los sistemas de control serios suelen requerir inspecciones, reglas compartidas y tiempo político.

Y justo ahí aparece el mayor choque con la realidad actual. La compañía admite que en el ámbito nuclear hicieron falta décadas para construir la infraestructura y la confianza necesarias, un margen que, a su juicio, no existe en el caso de la inteligencia artificial.

Si esa ventana temporal realmente no está disponible, la coordinación deja de ser un ideal diplomático y se convierte en una condición práctica para que una pausa no quede reducida a una desventaja para quien la cumpla primero.

El instituto de la empresa quiere convertir la advertencia en reglas

Anthropic no quiere dejar la cuestión en el terreno de las advertencias abstractas. Su instituto trabajará con otros expertos y compañías del sector para investigar qué medidas permitirían construir sistemas útiles para una ralentización o una pausa del desarrollo de IA.

Además, la empresa organizará conversaciones con responsables políticos, investigadores, organizaciones de la sociedad civil y otras compañías. La intención es responder de forma colectiva a las preguntas que abre la automejora recursiva, una expresión técnica que en el fondo apunta a algo muy concreto, máquinas capaces de mejorar las máquinas que vendrán después.

El dato que mejor resume la tensión no está en un laboratorio, sino en el calendario. Anthropic toma como referencia un tratado que necesitó décadas de confianza internacional, pero sostiene que para la IA ese tiempo ya no existe.

Sobre el autor

Redacción

Ver biografía