¿Qué tan inteligente puede ser una máquina cuando tiene que razonar como un humano? No basta con saber datos de memoria. Se trata de conectar ideas, desmenuzar problemas complejos, imaginar escenarios y tomar decisiones. Ese es el nuevo campo de batalla de la inteligencia artificial no solo responder, sino pensar. Y en este duelo de gigantes, Alibaba acaba de lanzar a su campeón, Qwen3-Max-Thinking, para desafiar a Gemini 3 Pro de Google.
Qwen3-Max-Thinking vs a Gemini 3 Pro, un duelo de razonadores
El nuevo modelo de Alibaba no es solo más grande. Es más ambicioso. La empresa ha escalado agresivamente los parámetros y ha invertido fuertemente en computación de refuerzo para mejorar capacidades clave conocimiento factual, razonamiento complejo, seguimiento preciso de instrucciones, alineamiento con lo que los humanos valoran y habilidades de agente autónomo. En otras palabras, no quiere solo contestar bien. Quiere entender el contexto, anticipar necesidades y actuar con criterio.
La comparación se ha hecho en 19 benchmarks diferentes. Un escenario neutral, técnico, cuantificable. Y los resultados dibujan un empate técnico con matices Gemini 3 Pro lidera en 11 pruebas, Qwen3-Max-Thinking en 8. Pero en las pruebas más exigentes, donde el razonamiento profundo es clave, el modelo chino gana terreno.
En Arena-Hard v2, un benchmark que simula debates entre modelos, Qwen alcanza un 90,2 frente al 81,7 de Gemini. En IFBench, centrado en razonamiento intermedio, 70,9 contra 70,4. En las pruebas de matemáticas HMMT, tanto en febrero como en noviembre de 2025, Qwen supera ligeramente a su rival 98,0 frente a 97,5 y 94,7 frente a 93,3. En IMOAnswerBench, dedicado a problemas olímpicos de matemáticas, la ventaja es de 83,9 frente a 83,3.
En HLE, que evalúa el uso de herramientas externas como un agente inteligente, Qwen marca 49,8 frente al 45,8 de Gemini. Estos números no son triviales indican que, en tareas que requieren encadenar razonamientos y usar recursos externos, Qwen está mejor optimizado. Sin embargo, Google mantiene ventaja en otras áreas clave como MMLU-Pro, GPQA o SWE Verified, donde el modelo de Alibaba aún no alcanza el mismo nivel de dominio.
Funciones que van más allá del chat
Lo que Alibaba anuncia no es solo un modelo más potente, sino uno más hábil. Qwen3-Max-Thinking incorpora capacidades como el uso adaptativo de herramientas, la recuperación de información bajo demanda y la invocación de un intérprete de código. Esto significa que puede actuar como un asistente técnico real no solo explicar cómo resolver una ecuación, sino ejecutarla; no solo citar una fuente, sino buscarla en tiempo real.
Estas funciones marcan la diferencia entre un modelo que responde y uno que actúa. En un entorno profesional, donde el tiempo y la precisión son cruciales, esa capacidad de autonomía puede ser decisiva. Un ingeniero puede pedirle que revise un fragmento de código, lo ejecute, detecte errores y proponga correcciones sin salir de la conversación.
El precio como arma estratégica
Pero donde Alibaba golpea más fuerte es en el coste. Mientras Gemini 3 Pro cobra entre 2 y 4 dólares por cada millón de tokens de entrada y entre 12 y 18 por la salida, Qwen3-Max se posiciona claramente como la opción más económica 1,2 dólares de entrada y 6 dólares de salida. En uso estándar, esto significa que Gemini es aproximadamente 1,67 veces más caro en entrada y el doble en salida.
Y si el volumen supera los 200.000 tokens de entrada, la brecha se amplía hasta 3,33 veces más caro en entrada y 3 veces en salida. Para empresas o desarrolladores que consumen grandes volúmenes, esta diferencia no es un detalle es un factor determinante en la elección del modelo.
La sombra de la privacidad
Pero no todo se reduce al rendimiento o al precio. Hay una pregunta que flota en el aire ¿qué pasa con tus datos cuando los introduces en un modelo de IA?
En el caso del chat de consumo de Qwen, los términos de servicio indican que el contenido del usuario puede usarse para desarrollar y mejorar tecnologías de IA. Esto incluye el procesamiento de datos desidentificados y su uso en nuevos productos. Y no hay un mecanismo claro para desactivar este uso. En cambio, Google asegura que en su API de pago, los prompts y respuestas no se utilizan para entrenar modelos y se tratan como información confidencial.
La política de privacidad de Alibaba advierte sobre transferencias internacionales de datos. El servicio se presta principalmente desde Singapur y los datos pueden procesarse en Singapur, Indonesia o China. Esto no es solo un detalle técnico es una cuestión geopolítica.
"Las empresas chinas están sujetas a la Ley de Inteligencia Nacional, que obliga a colaborar con los servicios de inteligencia del Estado" - Analista de ciberseguridad, especialista en regulación de datos de Asia
El artículo 7 de esa ley exige a organizaciones y ciudadanos "apoyar, asistir y cooperar" con el trabajo de inteligencia nacional y guardar secreto sobre sus actividades. Esta norma ha generado preocupación en la Unión Europea y otros territorios con regulaciones estrictas como el RGPD. No hay mención explícita a la UE en los documentos revisados, lo que añade incertidumbre sobre el cumplimiento normativo.
En el entorno profesional de Alibaba Cloud, la compañía asegura que no utiliza los datos para entrenamiento, cifra la información con AES-256 y no almacena conversaciones en llamadas directas por API. Pero en otros modos, el historial puede conservarse. Una distinción fina, pero crucial.
El tablero global de la IA
Este enfrentamiento entre Alibaba y Google no es solo técnico. Es simbólico. Muestra cómo el liderazgo en inteligencia artificial ya no está centralizado en Silicon Valley. China está compitiendo en igualdad de condiciones, no solo con músculo económico, sino con modelos que desafían los estándares globales en eficiencia, costo y rendimiento.
Pero también plantea una disyuntiva ¿elegimos el modelo más potente, el más barato o el más transparente? En un mundo donde las decisiones de tecnología definen el futuro de las empresas, los gobiernos y los ciudadanos, esta no es una elección menor. La carrera de la IA ya no es solo por la inteligencia, sino por la confianza.