El debate sobre el impacto de la inteligencia artificial en el empleo ha estado dominado durante años por escenarios hipotéticos, proyecciones económicas y titulares espectaculares. Pero ahora, un nuevo estudio busca anclar la conversación a la realidad mediante datos concretos. Investigadores de Scale AI y del Centro para la Seguridad de la IA (CAIS) han desarrollado el Índice de Trabajo Remoto, una herramienta diseñada para medir cuán capaces son los modelos de IA actuales de realizar tareas laborales autónomas que generen valor económico real. Los resultados, publicados tras un experimento detallado, pintan un panorama muy diferente del que algunas predicciones optimistas o apocalípticas podrían sugerir.
En el experimento, varios agentes de IA fueron puestos a prueba en tareas remotas reales, similares a las que ofrecen plataformas como Upwork. Se les asignaron actividades como diseño gráfico, edición de video, desarrollo de juegos y tareas administrativas como el raspado de datos. Estas tareas fueron diseñadas siguiendo los patrones de trabajos reales, con objetivos claros y expectativas de entrega. A pesar de contar con modelos avanzados como Manus, Grok, Claude, ChatGPT y Gemini, los sistemas solo lograron completar menos del 3 por ciento del trabajo total, generando 1810 dólares frente a un potencial total de 143991 dólares.
Este rendimiento limitado revela una brecha significativa entre la percepción pública y las capacidades reales de la IA autónoma. Los modelos actuales aún no pueden sustituir a los trabajadores humanos en la mayoría de las tareas económicas. Aunque algunos sistemas mostraron destellos de eficacia, especialmente Manus, la startup china que se destacó como la más capaz, todos compartieron limitaciones fundamentales. Dan Hendrycks, director del CAIS, subrayó una de las carencias más críticas "No tienen memoria a largo plazo y no pueden aprender continuamente de las experiencias. No pueden adquirir habilidades en el trabajo como los humanos".
"Espero que esto dé una impresión mucho más precisa de lo que está ocurriendo con las capacidades de la IA" -
Dan Hendrycks, director de CAIS
La afirmación de Hendrycks resume el propósito del índice aportar claridad a un campo saturado de especulaciones. En los últimos meses, algunas declaraciones de figuras prominentes en el sector han alimentado la idea de que la automatización masiva está a la vuelta de la esquina. En marzo, Dario Amodei, CEO de Anthropic, afirmó que el 90 por ciento del trabajo de codificación podría automatizarse en cuestión de meses. Sin embargo, los resultados del Índice de Trabajo Remoto sugieren que ese proceso, si bien puede estar en marcha, avanza a un ritmo mucho más lento y complejo de lo que se suele proclamar.
El estudio también contrasta con otras mediciones emergentes, como el GDPval presentado por OpenAI en septiembre, que sostiene que modelos como GPT5 se acercan a las capacidades humanas en 220 tareas de oficina. Esa métrica, más centrada en el potencial teórico, ha generado expectativas elevadas. Pero el Índice de Trabajo Remoto ofrece una mirada desde el suelo, evaluando no lo que la IA podría hacer en condiciones ideales, sino lo que realmente logra hacer de forma autónoma y remunerada en escenarios realistas.
Bing Liu, director de investigación de Scale AI, destacó que "llevamos años debatiendo sobre la IA y el empleo, pero la mayor parte ha sido hipotética o teórica". Su equipo reconoce, sin embargo, que el índice no es perfecto. No todas las profesiones se pueden reducir a tareas puntuales de trabajo remoto. Muchos empleos incluyen componentes sociales, creativos o estratégicos que no fueron evaluados en este experimento. Tampoco se midió la capacidad de la IA como herramienta de apoyo al ser humano, algo que sí está transformando ya sectores enteros.
Este matiz es crucial. Aunque los agentes autónomos aún no pueden reemplazar a los trabajadores, la inteligencia artificial sí está influyendo en la estructura del empleo. Amazon, por ejemplo, anunció recientemente la eliminación de 14000 puestos de trabajo, atribuyendo en parte esta decisión al auge de la inteligencia artificial generativa. En un comunicado, Beth Galetti, vicepresidenta sénior de Experiencia de las Personas y Tecnología de la empresa, escribió que "esta generación de IA es la tecnología más transformadora que hemos visto desde internet. Está permitiendo a las empresas innovar mucho más rápido que nunca, tanto en los segmentos de mercado existentes como en otros completamente nuevos".
"Esta generación de IA es la tecnología más transformadora que hemos visto desde internet. Está permitiendo a las empresas innovar mucho más rápido que nunca, tanto en los segmentos de mercado existentes como en otros completamente nuevos" -
Beth Galetti, vicepresidenta sénior de Experiencia de las Personas y Tecnología de Amazon
Estas palabras reflejan un cambio de paradigma no se trata tanto de que la IA reemplace directamente a los humanos, sino de que modifique los procesos, acelere la productividad y rediseñe los modelos de negocio. La automatización no siempre significa desempleo, pero sí transformación inevitable. Empresas como Amazon no están simplemente eliminando puestos, sino redistribuyendo funciones, eliminando actividades repetitivas y redirigiendo recursos hacia áreas de mayor valor añadido.
En este contexto, el Índice de Trabajo Remoto no debe leerse como una sentencia sobre la inutilidad de la IA, sino como un llamado a la madurez tecnológica y al realismo social. La inteligencia artificial no es una fuerza abstracta del futuro, sino una herramienta en evolución que interactúa con el presente laboral de formas complejas y a menudo inesperadas. Mientras los agentes autónomos aún no ganan salarios dignos, los asistentes inteligentes ya están cambiando cómo trabajamos, aprendemos y producimos.
El camino hacia una automatización significativa sigue abierto, pero no es tan inminente como algunos creen. Y tal vez lo más importante sea que, mientras la tecnología avanza, también lo debe hacer nuestra comprensión de ella. No basta con preguntarnos si la IA puede hacer un trabajo, sino cómo puede hacerlo, en qué condiciones, y qué significa eso para quienes dependen de ese trabajo para vivir.