Pagaba 100 dólares al mes por Claude Max y su uso real llegó a 5.600 en un solo ciclo

"Eso no es una brecha. Es un cráter": así describen el coste real de usar agentes de IA

10 de abril de 2026 a las 08:47h
Pagaba 100 dólares al mes por Claude Max y su uso real llegó a 5.600 en un solo ciclo
Pagaba 100 dólares al mes por Claude Max y su uso real llegó a 5.600 en un solo ciclo

Cuando pagas 100 dólares al mes por un servicio, esperas un límite razonable de uso. Pero cuando ese servicio es una inteligencia artificial de última generación y lo usas para hacer que un agente autónomo escriba código, depure errores y ejecute pruebas durante horas, las cuentas pueden salirse de madre. Es exactamente lo que le ocurrió a un usuario de Claude Max en un solo ciclo de facturación, su consumo real alcanzó los 5.600 dólares. No fue un error. Fue el precio de dejar a un agente de IA correr libre por la red.

El colapso de la tarifa plana

Este caso no es una excepción, sino un síntoma. Otros análisis apuntan a brechas similares, con consumos reales entre 1.000 y 5.000 dólares por encima del coste de la suscripción. "Eso no es una brecha. Es un cráter", dijo Luo Fuli, responsable del equipo del modelo MiMo en Xiaomi y ex investigador de DeepSeek. Su frase no es solo una metáfora. Es un diagnóstico contundente de lo que ocurre cuando herramientas diseñadas para interacciones humanas se usan para alimentar agentes automatizados que no duermen, no descansan y no miden su consumo.

Anthropic, la empresa detrás de Claude, ha respondido cambiando las reglas del juego. Ya no permite que herramientas de terceros como OpenClaw accedan directamente a sus planes de suscripción bajo el modelo de tarifa plana. Pero no las ha bloqueado del todo ha trasladado su acceso a la API de pago por uso. Una distinción técnica, pero de enorme calado económico. Ahora, cada petición cuenta, y se paga. Para muchos desarrolladores independientes, este cambio podría multiplicar sus costes hasta por diez.

La era de los agentes

El detonante de esta crisis no es un fallo técnico, sino una evolución acelerada. "Desde diciembre estamos en la era de los agentes", afirma el análisis que subyace a estos cambios. Ya no se trata de que un humano escriba una consulta y espere una respuesta. Ahora, un agente autónomo puede lanzar decenas, cientos, incluso miles de llamadas encadenadas revisar código, probarlo, corregirlo, documentarlo, volver a probarlo. Cada uno de esos pasos consume tokens. Y cuando el contexto supera los 100.000 tokens, como ocurre en proyectos complejos, el coste se dispara.

El problema, según Luo Fuli, es que muchas de estas herramientas de terceros no están optimizadas para reutilizar el caché de contexto. Cada consulta puede regenerar ventanas enteras desde cero, multiplicando innecesariamente el número de peticiones. "Eso no es eficiencia. Es derroche", añade. Y ese derroche se traduce en facturas que ni los más entusiastas desarrolladores pueden asumir a largo plazo.

China, el termómetro del futuro

Mirar a China es, en muchos sentidos, mirar al futuro inmediato. Allí, los planes de programación con IA se han convertido en uno de los productos tecnológicos más demandados. Alibaba Cloud agota sus cupos en las primeras horas de la mañana. Los planes de Tencent aparecen como "no disponibles" de forma permanente. Desarrolladores programan alarmas matutinas y crean scripts de autocompra para asegurarse el acceso mensual. Es una carrera contrarreloj, donde quien llega tarde se queda sin modelo.

Este frenesí no es solo local. Es una señal de que la demanda por IA capaz de actuar, no solo responder, está creciendo a un ritmo que los modelos de negocio actuales no pueden soportar. Los planes de suscripción fueron diseñados para un mundo en el que cada interacción consumía unos pocos cientos de tokens. Hoy, un solo agente puede consumir entre 10 y 100 veces más en una sola sesión.

"Las herramientas de terceros como OpenClaw no están optimizadas para reutilizar el caché de contexto de Claude. Cada consulta puede regenerar ventanas de más de 100.000 tokens desde cero, lo que multiplica innecesariamente el coste" - Luo Fuli, responsable del equipo del modelo MiMo en Xiaomi y ex-DeepSeek

Anthropic, por su parte, no ha dejado a los usuarios en la calle. Ofrece ahora un crédito inicial equivalente al precio mensual del plan, y descuentos de hasta el 30% para quienes precomprenten paquetes de "uso extra". Es un intento de equilibrar acceso y sostenibilidad. Pero también es un mensaje claro el festín de la tarifa plana ha terminado. Quien quiera seguir usando agentes a gran escala tendrá que pagar por lo que consume.

La presión económica, según prevé Luo Fuli, terminará imponiéndose. Los desarrolladores de herramientas de terceros no tendrán más remedio que optimizar sus sistemas, reutilizar mejor el contexto, reducir las llamadas innecesarias. No será por conciencia técnica, sino por supervivencia económica. En este nuevo escenario, la eficiencia no es un lujo es la única forma de seguir en el juego. Y mientras tanto, millones de desarrolladores en todo el mundo miran sus facturas con una mezcla de asombro y preocupación la era de los agentes ha llegado, pero su precio todavía se está definiendo.

Sobre el autor
Redacción
Ver biografía