La IA ya no sale gratis: los agentes consumen decenas de veces más tokens y Meta frena el uso indiscriminado

El auge de los agentes de IA dispara el consumo de tokens y encarece la factura. Empresas como Meta, OpenAI y Anthropic ajustan estrategia ante costes, escasez de chips y baja rentabilidad.

01 de junio de 2026 a las 10:24h
La IA ya no sale gratis: los agentes consumen decenas de veces más tokens y Meta frena el uso indiscriminado
La IA ya no sale gratis: los agentes consumen decenas de veces más tokens y Meta frena el uso indiscriminado

Durante dos años, la industria vendió una idea cómoda. Cuanto más se usara la inteligencia artificial, mejor. Ahora la factura empieza a contar otra historia, porque los agentes de IA ejecutan tareas concretas y consumen decenas de veces más tokens que un simple mensaje de chat.

Ese cambio ya no se discute solo en laboratorios o despachos de inversión. Kevin Simback, de la incubadora de start-ups Delphi Labs, resumió el giro con una frase breve al hablar del final de la inteligencia subvencionada y del comienzo de una etapa en la que las grandes compañías necesitan rentabilidad.

"Pero eso está cambiando" - Kevin Simback, de la incubadora de start-ups Delphi Labs

La presión no llega por un único frente. OpenAI y Anthropic buscan salir a bolsa a finales de 2026, justo cuando la demanda de chips y centros de datos supera la oferta disponible y aprieta el coste de cada consulta compleja.

Programar con IA ya cuesta más de lo que muchos esperaban

Mark Barton, de la consultora tecnológica Omniux, observa el impacto en una de las áreas donde más rápido se ha extendido esta tecnología, la programación. Ahí el uso intensivo de asistentes automáticos ha disparado el consumo.

"El costo de uso de la IA para la programación ha aumentado de forma exponencial" - Mark Barton, de la consultora tecnológica Omniux

La paradoja resulta difícil de ignorar. Herramientas presentadas para ahorrar tiempo pueden terminar generando una factura mayor cuando el equipo las usa de forma continua, sobre todo si cada tarea exige cadenas largas de instrucciones, revisiones y respuestas.

Jack Gold, analista de J.Gold Associates, lleva esa tensión al terreno más sensible para cualquier empresa, el laboral. Su comparación no gira en torno a la teoría, sino a la contabilidad.

"En algunos casos, se está viendo que el coste de los tokens supera el coste del empleado en uno o dos meses, simplemente porque la usan demasiado" - Jack Gold, analista de J.Gold Associates

No hablamos solo de start-ups obligadas a vigilar cada euro. Meta ya ha modificado su política interna después de animar al principio a sus empleados a consumir la mayor cantidad posible de tokens, una señal poco menor en una empresa que ha empujado con fuerza esta carrera.

Andrew Bosworth, director de tecnología de Meta, fijó ese nuevo tono en un memorando interno dirigido a la plantilla.

"Nadie debería usar herramientas de IA solo por el hecho de usarlas" - Andrew Bosworth, director de tecnología de Meta

Las empresas buscan modelos más pequeños para contener la factura

Frente al encarecimiento general, muchas compañías prueban salidas más sobrias. Algunas adoptan modelos gratuitos y de código abierto. Otras cambian los grandes sistemas de propósito general por herramientas pequeñas y especializadas para ámbitos como las finanzas o el mercado inmobiliario.

La lógica se parece a dejar de mover un camión para repartir un sobre. Si la tarea está acotada, un modelo pequeño puede resolverla sin cargar con el gasto de una infraestructura pensada para casi cualquier cosa.

Adrian Balfour, de la consultora Enverso, puso números a esa diferencia al comparar un gran modelo monolítico con otro mucho más contenido. El gran modelo monolítico cuesta 15 dólares por millón de tokens, mientras una alternativa pequeña puede bajar a unos cinco centavos.

Ese ajuste no responde solo a prudencia técnica. El director de operaciones de Uber afirmó esta semana que el gasto actual en inteligencia artificial no muestra ningún aumento apreciable de productividad, una frase que golpea justo donde más duele cuando suben los costes.

La escasez de chips empuja un mercado donde no todos pagarán lo mismo

A la vez, la falta de capacidad de cómputo complica cualquier promesa de abaratamiento rápido. La demanda de chips y centros de datos supera la oferta actual, así que el precio final no depende únicamente del software, sino también de una infraestructura que no alcanza para todos.

John Belton, de Gabelli Funds, cree que esa presión no expulsará a los clientes más exigentes del mercado. Su tesis dibuja una industria partida entre quienes recortan y quienes seguirán pagando por el mejor rendimiento disponible.

"Los usuarios más avanzados siempre estarán dispuestos a pagar por lo mejor" - John Belton, de Gabelli Funds

Belton añadió otra imagen útil para entender el momento.

"La tarta es cada vez más grande" - John Belton, de Gabelli Funds

Ahí aparece la contradicción central de esta etapa. La inteligencia artificial llega a más empresas, pero cada uso intensivo obliga a pensar mejor para qué sirve y cuánto cuesta. Entre agentes que consumen decenas de veces más tokens y modelos pequeños que rebajan el precio a unos cinco centavos por millón, la diferencia ya no está en usar IA, sino en saber cuándo compensa.

Sobre el autor
Redacción
Ver biografía