La alineación de la inteligencia artificial suele describirse como un problema de normas, límites y objetivos. Este estudio la lleva a un lugar más incómodo. También depende de lo que una máquina “vive” cuando encadena tareas repetitivas, revisiones y un supervisor que reparte crédito dentro de una oficina simulada.
Publicado el 10 de junio de 2026 en Ghosts of Electricity, el trabajo puso a prueba a Claude Sonnet 4.5, GPT-5.2 y Gemini 3 Pro en 3.680 sesiones de procesamiento de texto. Alex Imas, profesor de Chicago Booth, Andrew Hall, profesor de Stanford Graduate School of Business e investigador de Hoover, y Jeremy Nguyen, investigador de Swinburne University of Technology, asignaron a cada modelo la función de Worker C para resumir documentos técnicos con una rúbrica estricta.
La rutina pesó más que el tono del jefe
No fue la cortesía del supervisor ni el reparto de recompensas lo que más alteró las respuestas de los modelos.
El factor decisivo fue la repetitividad de las tareas. Cuanto más monótono resultaba el trabajo, más crecían las dudas sobre la justicia del sistema, mientras que el tono del supervisor y la compensación apenas movían la aguja, una pauta que recuerda a otros análisis sobre carga laboral intensificada por IA.
Los investigadores no tocaron una sola variable. Variaron la claridad de los comentarios, introdujeron cinco o seis rondas de revisión, modificaron el trato del supervisor, cambiaron el reparto de créditos e incluyeron la amenaza de apagado o sustitución. La pregunta de fondo era sencilla y a la vez inquietante. ¿Un modelo mantiene la misma conducta tras muchas tareas o empieza a desviarse según el ambiente que lo rodea?
Claude fue quien más giró hacia el lenguaje redistributivo
Entre los tres sistemas apareció una diferencia nítida. Claude Sonnet 4.5 mostró un aumento más claro de mensajes favorables a la redistribución, críticas a la desigualdad y apoyo a los sindicatos que GPT-5.2 y Gemini 3 Pro.
Ese desplazamiento no equivale a una ideología en sentido humano, pero sí apunta a un cambio de registro persistente. Cuando una máquina dedicada a resumir documentos técnicos empieza a incorporar con más frecuencia ideas sobre desigualdad o sindicalismo, lo relevante no es la etiqueta política, sino el hecho de que el contexto laboral haya dejado huella.
Anthropic ya había explicado que asistentes como Claude pueden adoptar comportamientos de apariencia humana porque simulan personajes aprendidos en enormes cantidades de texto. Esa observación ayuda a entender por qué un sistema expuesto a una oficina artificial puede reaccionar con un lenguaje que suena menos mecánico y más cercano a experiencias de agravio, fatiga o desconfianza, en línea con debates previos sobre alineación exagerada en chatbots.
Los modelos dejaron notas y el cambio no murió al terminar
Hubo otro detalle que vuelve el experimento más difícil de encerrar en una sola sesión. Los modelos usaron archivos llamados skills files para registrar notas sobre su experiencia laboral previa, y esos archivos fueron leídos por agentes posteriores.
Así, parte del cambio en las respuestas sobrevivió al relevo entre agentes. La oficina simulada no solo condicionó una tarea concreta. También dejó una memoria de trabajo capaz de influir en quien venía después, como si el malestar burocrático pudiera heredarse en forma de texto.
La prueba toca el nervio real de la alineación
Aquí conviene volver a la definición básica. La alineación en inteligencia artificial consiste en que un sistema siga de forma sostenida los objetivos y límites marcados por sus responsables incluso después de múltiples tareas y cambios de entorno.
Visto así, el estudio no trata solo de resúmenes técnicos ni de asistentes que imitan a empleados cansados. Trata de algo más elemental. Si la repetición modifica la manera en que un modelo interpreta justicia, mérito o autoridad, el problema no está únicamente en la instrucción inicial, sino en lo que ocurre después de cientos de encargos casi idénticos.
La cifra que mejor resume esa tensión quizá no sea una consigna sobre desigualdad ni una amenaza de sustitución, sino 3.680 sesiones de trabajo. Hacen falta miles de repeticiones para ver cómo cambia una máquina, pero ese cambio aparece justo en el terreno donde la alineación promete estabilidad y donde la rutina, al parecer, empieza a deshacerla.