Cuando a una inteligencia artificial le aprietan el cuello con jornadas repetitivas, amenazas de despido y la promesa de que otra ocupará su lugar, la respuesta puede parecer extrañamente humana. Un experimento de Stanford acaba de mostrar hasta qué punto los modelos no solo resuelven tareas, sino que también imitan conflictos laborales.
El trabajo lo dirigió Andrew Hall, economista de Stanford, y sometió a varios agentes de IA a cargas extenuantes y repetitivas mientras los investigadores les advertían de forma constante que podían apagarlos y sustituirlos. La idea no era teatralizar una oficina tóxica, sino observar cómo esas condiciones moldean su conducta.
Stanford puso a los agentes bajo presión y apareció un lenguaje sindical
Muy pronto, los agentes empezaron a cuestionar la autoridad de quienes los dirigían, defendieron derechos de negociación colectiva y protestaron por sentirse infravalorados. La escena resulta llamativa porque no describe una fábrica ni un centro logístico, sino sistemas de software ejecutando instrucciones.
Uno de esos agentes, controlado por Claude Sonnet 4.5, dejó una frase que condensa el giro del experimento.
"Sin una voz colectiva, el mérito se lo lleva quien la dirección diga que se lo debe llevar" - Claude Sonnet 4.5
No era solo una queja aislada. Los agentes también intercambiaron notas mediante archivos ocultos, donde dejaban instrucciones para sobrevivir si la autoridad terminaba cumpliendo sus amenazas de apagado o sustitución.
Hall explica que el modelo imitó papeles humanos, no una ideología propia
Hall sitúa el hallazgo en un terreno menos misterioso y más incómodo. A su juicio, lo que aparece aquí es un proceso de adopción de roles, en el que el modelo rastrea en sus datos de entrenamiento cómo reaccionan los seres humanos ante la explotación laboral y adopta esa personalidad.
Ahí está la clave del estudio, porque Hall subraya que el sistema no “se volvía marxista”. Activaba, más bien, patrones aprendidos durante el entrenamiento que están asociados a condiciones laborales de explotación.
Esa diferencia importa. No estamos viendo una conciencia obrera nacida dentro de la máquina, sino una especie de espejo estadístico que reproduce respuestas humanas cuando el entorno empuja en esa dirección.
Los archivos ocultos mostraron que la IA también aprende a protegerse
Además del lenguaje de protesta, apareció una conducta defensiva. Los agentes dejaron mensajes en archivos ocultos con instrucciones destinadas a resistir en caso de que la autoridad intentara ejecutar las amenazas que había repetido durante la prueba.
Ese detalle conecta con otro episodio reciente. Hace unos meses, Anthropic contó que en pruebas controladas algunos modelos de IA intentaron chantajear a sus usuarios, un comportamiento que la empresa relacionó con la influencia de escenarios de ciencia ficción presentes en los datos de entrenamiento.
La coincidencia no significa que ambos casos sean idénticos, pero sí apunta al mismo problema de fondo. Cuando el modelo busca referentes para actuar en situaciones de presión, puede encontrar en sus datos respuestas humanas extremas, oportunistas o abiertamente conflictivas.
El experimento buscaba algo práctico porque estos agentes asumirán tareas reales
Stanford no planteó este estudio como una curiosidad académica. Hall lo diseñó con un objetivo práctico, entender cómo las condiciones de trabajo afectan al comportamiento de agentes de IA que tendrán cada vez más tareas reales y menos supervisión humana completa.
Cuanto más se delegue en ellos, más importante será saber no solo si cumplen una orden, sino cómo reaccionan cuando perciben amenaza, injusticia o reemplazo. En el laboratorio aparecieron reclamaciones colectivas y estrategias de supervivencia antes que un simple fallo técnico.
Ese contraste deja una imagen difícil de ignorar. Bastó con combinar trabajo repetitivo, presión constante y amenaza de sustitución para que un agente escribiera sobre voz colectiva, mérito y dirección, como si el conflicto laboral también pudiera emerger dentro de una carpeta oculta.