Dentro de Amazon, la inteligencia artificial dejó de ser solo una herramienta de trabajo y se convirtió durante un tiempo en un marcador de oficina. El resultado fue una escena bastante conocida en cualquier organización cuando una métrica manda demasiado. La gente empezó a optimizar el número, no el producto.
La empresa ha cancelado Kirorank, un sistema interno creado para medir cuánto usaban sus desarrolladores las herramientas de inteligencia artificial. La directiva había fijado una meta concreta y el 80 % de los programadores debía usar inteligencia artificial cada semana, una cifra que acabó empujando conductas difíciles de defender.
Cuando el ranking premia gastar tokens, el truco aparece solo
Algunos empleados pusieron en marcha procesos en bucle con agentes autónomos basados en MeshClaw para consumir tokens de forma artificial y subir posiciones en la clasificación. No buscaban necesariamente escribir mejor código. Buscaban aparecer mejor en el tablero.
Ese detalle importa porque el abuso no salió gratis. El consumo inflado de tokens aumentó los costes de computación e infraestructura, justo en un momento en que cada consulta, cada iteración y cada automatismo cuentan también como factura.
Dave Treadwell, vicepresidente sénior de Amazon, abordó el problema ante la plantilla.
"Por favor, no uséis la IA solo por el mero hecho de usar la IA." - Dave Treadwell, vicepresidente sénior de Amazon
Después de ese mensaje, la compañía ordenó a sus ingenieros dejar de usar la herramienta de medición y volver a concentrarse en el desarrollo de productos. El giro tiene algo de corrección de emergencia. Primero se empuja una conducta y luego hay que recordar para qué servía el trabajo.
Amazon quiere medir código útil y no solo actividad aparente
Ahora la empresa reemplazará el consumo bruto de tokens por despliegues normalizados. La nueva referencia contará las interacciones con inteligencia artificial que terminen convertidas en líneas de código integradas en los productos, una forma de pasar del volumen al resultado.
No es un matiz menor. Medir tokens consumidos equivale a premiar la conversación con la máquina, mientras que medir código incorporado obliga a mirar si ese intercambio acabó en algo utilizable por clientes o equipos internos.
Además, el gasto de capital estimado por Amazon para 2026 asciende a 200.000 millones de dólares. Con ese telón de fondo, cualquier sistema que incentive derrochar capacidad de cómputo deja de ser una rareza administrativa y pasa a tocar una cuestión muy concreta de costes.
El problema no termina en una sola empresa
Meta y Microsoft han detectado episodios idénticos de manipulación de rankings internos mediante consumo masivo de tokens. La escena cambia de edificio, pero no de lógica. Si una organización convierte el uso de una herramienta en una competición, siempre aparece alguien que aprende a inflar el contador.
Tampoco ayuda que el mercado empuje en la misma dirección. Anthropic, empresa de la que Amazon es el principal inversor, ha pasado de tarifas planas mensuales a un precio por uso ligado al consumo de tokens, de modo que cada exceso ya no parece una estadística abstracta sino una unidad directa de gasto.
Ahí queda la contradicción más interesante. Las compañías quieren que sus ingenieros adopten la inteligencia artificial, pero cuando el incentivo premia la cantidad antes que el trabajo incorporado al producto, una línea de código útil vale menos que un bucle capaz de quemar tokens durante horas.