Google acaba de lanzar Gemini 3.1 Pro, una actualización que suena a advertencia. Tres meses apenas han pasado desde la versión anterior, Gemini 3 Pro, y ya tenemos esta nueva iteración. No es solo un ajuste menor. Es un salto técnico que, según los datos, deja en evidencia cómo la carrera por la inteligencia artificial ha dejado de ser una competición de resistencia para convertirse en una carrera de relevos con sprints cada vez más cortos.
Un salto que no parece de solo un punto
El nombre engaña. Gemini 3.1 Pro no suena a revolución. Pero los números cuentan otra historia. En el benchmark ARC-AGI-2, una prueba diseñada para medir el razonamiento visual y abstracto algo cercano a lo que entendemos como inteligencia fluida, el modelo anterior, Gemini 3 Pro, logró un 31.1%. La nueva versión llega al 77.1%. Casi el doble y medio. Y supera por amplio margen a Claude Sonnet 4.6, que se queda en 58.3%, y solo es superado por Claude Opus 4.6 con un 68.8%.
Este tipo de pruebas no miden el conocimiento acumulado, sino la capacidad de resolver problemas nuevos, sin haberlos visto antes. Es como si, de repente, un estudiante pasara de copiar en los exámenes a inventar sus propias soluciones. El salto de Gemini 3 a 3.1 en razonamiento es mayor que el que muchos rivales han logrado entre versiones completas.
La prueba del último examen
En Humanity's Last Exam, una evaluación extrema que simula escenarios complejos y poco estructurados, Gemini 3.1 Pro obtiene un 44.4% sin herramientas externas. No es el máximo, pero es un resultado sólido en un entorno donde incluso los mejores modelos tropiezan. Donde sí brilla es en GPQA Diamond, una prueba enfocada en conocimiento científico avanzado. Aquí, el modelo alcanza un 94.3%, lo que sugiere una comprensión profunda en áreas técnicas, desde biología molecular hasta física cuántica.
También destaca en APEX-Agents, que evalúa tareas de larga duración y seguimiento de instrucciones complejas. En este caso, Gemini 3.1 Pro dobla al modelo anterior, lo que indica una mejora notable en persistencia y coherencia. Esto no es trivial un agente que se pierde a las cinco instrucciones no sirve para automatizar procesos reales.
Dónde sigue perdiendo terreno
Pero no todo es dominio absoluto. En GDPval-AA Elo, una métrica que simula tareas de entornos laborales reales, Claude Sonnet 4.6 acumula 1.633 puntos frente a los 1.317 de Gemini 3.1 Pro. Y aunque en SWE-Bench Verified, la prueba de programación con agentes, ambos están casi empatados Claude Opus con 80.8% y Gemini 3.1 Pro con 80.6%, la diferencia es mínima.
Y en la Arena Leaderboard, donde los usuarios votan directamente los resultados de modelos anónimos, todavía sitúan a Claude Opus 4.6 por delante en texto y código. Esto es clave los benchmarks miden, pero las personas deciden. Y por ahora, en términos de experiencia subjetiva, el modelo de Anthropic mantiene una ventaja en percepción de calidad.
La ventaja real de Google no está en el modelo, sino en el ecosistema
Lo interesante de Google no es solo que mejore su modelo, sino que lo integra donde ya estamos. Mientras que para usar ChatGPT o Claude necesitas abrir una app específica, Google puede colocar su IA directamente en Search, Gmail, YouTube, Android, Docs, Drive, Fotos o Maps. Google mantiene la ventaja de ser la empresa que controla los puntos de entrada más relevantes a Internet.
Imagina que mientras escribes un correo, Gemini sugiere frases con contexto, o que al ver una foto en tu galería, el sistema te recuerda quién era ese amigo con el que estuviste en Cadaqués en 2019. No necesitas salir de la app. La IA no es un extra, es parte del flujo. Esa es la apuesta normalizar la inteligencia artificial hasta que ni siquiera notemos que está ahí.
Disponibilidad y modelo de negocio
Gemini 3.1 Pro ya está disponible desde hoy en la app de Gemini, en NotebookLM para suscriptores Pro y Ultra, en la API a través de AI Studio y en entornos empresariales mediante Vertex AI. Los usuarios con suscripción a Google AI Plus, Pro o Ultra tendrán acceso completo. Hay una versión limitada en el plan gratuito, pero el modelo sigue en versión preliminar.
Lo que sí llama la atención es el enfoque de precios para desarrolladores. La API para desarrolladores se ofrece a un precio muy competitivo, lo que podría acelerar su adopción en startups y empresas que buscan integrar IA sin costes excesivos.
Un año de redención
Google llegó tarde a la fiesta de la IA. Mientras OpenAI lanzaba ChatGPT y empezaba a cambiar el mundo, Google vivía un caos interno, con filtraciones, dimisiones y presentaciones fallidas. Pero en el último año ha reorganizado todo. Ha limpiado el desorden y ha puesto sus fichas en Gemini como eje central de su estrategia.
La carrera de la IA lleva meses con un ritmo frenético, pero Google parece haber encontrado el paso. No solo mejora su tecnología, sino que la conecta con lo que ya funciona. Aún queda ver cómo solucionan la monetización de su inteligencia artificial, pero desde luego se han puesto las pilas.