La factura de la inteligencia artificial ha dejado de ser una nota al pie y ha entrado en el despacho del director financiero.
Amazon, Walmart, Cisco, Uber y Meta han empezado a poner límites o a desincentivar usos ineficientes de estas herramientas. El giro dice mucho sobre el momento del sector, porque durante meses la conversación giró alrededor de la adopción y ahora gira alrededor del coste de cada consulta, de cada flujo automatizado y de cada agente que trabaja sin descanso.
Los tokens ya pesan en las cuentas
Costi Perricos, líder global de IA generativa en Deloitte, puso nombre al cambio con una frase que apunta al centro del problema.
"Los costes de computación están empezando a preocupar tanto a los directores financieros como a los consejos de administración. Se ha hecho creer a consumidores y empresas que la IA es barata o gratuita, y eso no es cierto". - Costi Perricos, líder global de IA generativa en Deloitte
Anthropic y OpenAI han empezado a mover algunos servicios desde suscripciones planas hacia facturación basada en tokens. Ese cambio expone de forma directa a las empresas al precio de cada solicitud y hace visible algo que antes quedaba diluido dentro de una tarifa fija, una lógica que ayuda a entender por qué el coste por token se ha vuelto una conversación diaria.
Sam Altman, CEO de OpenAI, admitió este mes que el año pasado ese problema no había aparecido y que la gente estaba satisfecha con lo que gastaba. Este año, en cambio, el gasto se ha convertido en una preocupación importante para los clientes.
Uber agotó en abril un presupuesto pensado para 2026
Uber limitó a 1500 dólares al mes el gasto en tokens de sus empleados para herramientas de IA individuales después de agotar en abril su presupuesto de IA para 2026.
Andrew Macdonald, director de operaciones de Uber, explicó la dificultad de justificar esa inversión con una frase poco cómoda para cualquier empresa. Dijo que resulta muy difícil relacionar esas estadísticas con el hecho de que ahora generan un 25% más de funciones útiles para el consumidor.
Ahí aparece una contradicción conocida en casi cualquier despliegue tecnológico. La productividad puede crecer, pero no siempre al mismo ritmo que la factura, y menos cuando los agentes multiplican llamadas, contexto y pasos intermedios para completar tareas que antes resolvía una persona con una sola herramienta.
Walmart y Amazon frenan el entusiasmo
Walmart también restringió la cantidad de tokens que pueden usar sus empleados en su agente interno de IA. Suresh Kumar, director global de tecnología de Walmart, definió ese momento como una pausa para reflexionar tras el aumento del uso de Code Puppy y la petición a la plantilla de identificar qué herramienta encaja mejor con cada tarea.
Desde Amazon llegó un aviso parecido el mes pasado. La compañía pidió a sus empleados que dejaran de usar la IA solo por usarla después de detectar que algunos ingenieros implementaban agentes para escalar posiciones en clasificaciones internas, y además cambió su forma de medir la adopción para controlar el gasto.
Meta tomó medidas similares en abril.
El problema crece cuando los agentes trabajan solos
Carter Busse, director de información de Workato, describió con una imagen muy concreta lo que ocurrió cuando sus 1300 empleados empezaron a usar agentes de IA el verano pasado. Contó que la adopción se extendió como la pólvora y que la gente comenzó a transformar sus trabajos con agentes.
El golpe económico llegó después. Busse relató que el gasto de Workato se multiplicó por siete el primer día cuando Anthropic cambió en mayo a un modelo de precios basado en tokens, una señal que encaja con el auge de los agentes de IA y con la facilidad con la que una automatización exitosa puede disparar el consumo sin que nadie lo note al principio.
Por eso Workato reorientó sus sesiones de formación, que celebra dos veces por semana, hacia ideas de ahorro como volver por defecto a modelos más antiguos y baratos de Anthropic. Busse lo resumió con otra prioridad menos glamourosa y mucho más contable, hablar de responsabilidad financiera en IA.
Más uso significa más chips y menos margen
Jeetu Patel, presidente y director de producto de Cisco, planteó el dilema sin rodeos al defender que las empresas deben equilibrar el deseo de desplegar agentes con el coste y la disponibilidad de los tokens. Al final del proceso, recordó algo muy simple y muy material, sus ingenieros quieren más tokens y alguien tiene que encontrar la forma de pagarlos.
Goldman Sachs predijo el mes pasado que el uso de agentes de IA elevará 24 veces el consumo de tokens para 2030. Sus analistas también anticiparon que esa presión sobre la demanda agravará la escasez de chips durante los próximos 12 a 18 meses.
Desde principios de año, además, los modelos chinos han superado a los estadounidenses en consumo de tokens según datos de OpenRouter. La combinación de energía más barata y modelos más eficientes les permite cobrar menos por token, un detalle que cambia la competencia cuando la pregunta ya no es solo qué modelo responde mejor, sino cuál cuesta menos mantener encendido.
Anthropic y OpenAI preparan su salida a Bolsa para finales de este año con valoraciones cercanas al billón de dólares. Ese tamaño convive con una escena bastante menos grandilocuente, empresas que revisan presupuestos, racionan tokens y descubren que un 25% más de funciones útiles no borra por sí solo una factura que ya llegó al consejo de administración.