GPT-5.4 Pro resolvió el problema #1196 de Erdős en 80 minutos: Terence Tao confirmó la solución tras revisión

Un 23 años con poca formación copió el enunciado del #1196 de Erdős en una IA. GPT-5.4 Pro lo resolvió en 80 minutos y Terence Tao validó la solución.

28 de abril de 2026 a las 12:30h
GPT-5.4 Pro resolvió el problema #1196 de Erdős en 80 minutos: Terence Tao confirmó la solución tras revisión
GPT-5.4 Pro resolvió el problema #1196 de Erdős en 80 minutos: Terence Tao confirmó la solución tras revisión

En febrero de 2026, un joven de 23 años llamado Liam Price, sin formación matemática más allá del instituto, hizo algo que nadie esperaba. Tomó un problema matemático que encontró al azar en una página web, lo copió y pegó en una herramienta de inteligencia artificial, y esperó. No sabía que aquel enunciado formaba parte de una colección legendaria, que llevaba décadas desafiando a algunos de los mejores cerebros del planeta. Tampoco sabía que el problema #1196 de Erdős, planteado en 1966, se había resistido a generaciones de matemáticos. Pero la máquina sí lo supo. O al menos, supo cómo resolverlo.

El problema que la tradición no pudo vencer

El reto consistía en entender ciertas propiedades de los conjuntos primitivos colecciones de números enteros en las que ningún número divide a otro. Erdős, el excéntrico y prolífico matemático húngaro, los estudió extensamente y dejó tras de sí una serie de preguntas sin respuesta. Una de ellas la número 1196 giraba en torno a una conjetura sobre su densidad. Durante 60 años, los investigadores abordaron el problema desde ángulos similares, guiados por convenciones, herramientas clásicas y una especie de intuición matemática heredada. Estaban todos mirando en la misma dirección.

Hasta que llegó GPT-5.4 Pro. En solo 80 minutos, el modelo generó una solución que, tras revisión, Terence Tao uno de los matemáticos más respetados del mundo confirmó como correcta. No fue un golpe de suerte. El modelo empleó una aproximación aritmética poco convencional, recurriendo a la función de von Mangoldt, una herramienta del análisis de números primos que no era la primera opción habitual en este tipo de problemas. La IA no respetó el guion.

La ventaja de no saber lo que "debe hacerse"

Jared Lichtman, investigador de Stanford especializado en teoría de números, analizó el proceso. "El LLM tomó una ruta completamente diferente", afirmó. Aunque reconoció que la salida inicial de ChatGPT era "bastante pobre", con redacción confusa y presentación desordenada, el núcleo del razonamiento contenía una chispa válida, incluso elegante. Fue necesaria la intervención humana para pulirla, traducirla al lenguaje matemático riguroso y verificar cada paso. Pero la idea inicial, la semilla, venía de la máquina.

Este episodio no fue aislado. Sebastien Bubeck, investigador de OpenAI, publicó en una red social que GPT-5 había "resuelto" varios problemas de Erdős. La afirmación generó polémica. Demis Hassabis, CEO de DeepMind, no dudó en calificarla de "vergonzosa", argumentando que sin intervención humana, sin contexto, sin validación, decir que una IA "resuelve" un problema es una exageración peligrosa. La frontera entre colaboración y autonomía es más fina de lo que parece.

El semáforo de la inteligencia artificial matemática

En un repositorio de GitHub mantenido por Terence Tao y Nat Sothanaphan, se registra meticulosamente cada intento de IA en los problemas de Erdős. Cada entrada lleva un semáforo verde si hay solución completa, amarillo si hay progreso, rojo si fracasa. Hasta ahora, en la categoría de soluciones completamente generadas por IA sin que exista literatura previa conocida que las guíe hay tres verdes, catorce amarillos y ocho rojos. No es un mal balance, pero tampoco una revolución. El repositorio advierte que muchos fracasos no se reportan, porque simplemente no se publican. La estadística, entonces, podría estar sesgada.

Para poner a prueba de forma más rigurosa el potencial autónomo de la IA, en febrero de 2026, once matemáticos lanzaron la iniciativa "First Proof". Prepararon diez problemas surgidos de sus propios proyectos de investigación no problemas archivados o famosos, los cifraron y los subieron a un sitio de verificación. Luego dieron a las IAs una semana para resolverlos. Los resultados preliminares son reveladores hasta ahora, ningún modelo ha logrado resolver ninguno de los problemas de forma autónoma.

¿Ignorancia o libertad creativa?

¿Por qué entonces GPT-5.4 tuvo éxito en el problema #1196? Terence Tao tiene una hipótesis fascinante: "Lo que había ocurrido fue lo que yo llamaría un bloqueo colectivo de la comunidad matemática, porque todos partieron del mismo origen porque era 'el natural', el que la tradición marcaba". La IA, sin embargo, no conocía esa tradición. No sabía cuál era el enfoque "correcto". No tenía prejuicios formativos. La IA no sabía que esa era la forma "correcta" de empezar, y esa ignorancia resultó ser una ventaja.

Este caso no anuncia el fin de los matemáticos, ni siquiera su reemplazo. Pero sí señala un cambio de paradigma la IA no piensa como nosotros, pero a veces, pensar distinto es exactamente lo que se necesita. En matemáticas, como en el arte o en la ciencia, la innovación a menudo nace del error, del desvío, del intento descabellado. Tal vez, al no saber qué no se debe hacer, las máquinas estén descubriendo caminos que los humanos, por saber demasiado, dejaron de explorar. Y tal vez, en ese cruce entre ignorancia y creatividad, esté el futuro de la resolución de problemas no como una competencia entre hombre y máquina, sino como una colaboración donde cada uno aporta lo que el otro no tiene.

Sobre el autor
Redacción
Ver biografía