OpenAI o1 acertó el 78,3% en urgencias y superó a médicos en casos difíciles

Un estudio en Science comparó la IA o1 de OpenAI con médicos de urgencias y halló que acertó el 78,3% de los casos más difíciles.

01 de mayo de 2026 a las 20:23h
OpenAI o1 acertó el 78,3% en urgencias y superó a médicos en casos difíciles
OpenAI o1 acertó el 78,3% en urgencias y superó a médicos en casos difíciles

La escena es conocida para cualquiera que haya pasado por una sala de urgencias una avalancha de datos incompletos, pacientes nerviosos, decisiones rápidas y poco margen para el error. Ahora, una investigación publicada esta semana en Science pone a una IA en el centro de ese escenario, y el resultado obliga a mirar dos veces. La serie o1 de OpenAI, diseñada para "pensar" antes de responder, ha sido comparada con cientos de médicos de urgencias en situaciones de alta presión. Y en los casos más difíciles, la máquina salió mejor parada de lo que muchos habrían apostado.

El trabajo, impulsado por un equipo multidisciplinar de la Facultad de Medicina de Harvard y el Centro Médico Beth Israel Deaconess, evaluó el rendimiento del modelo frente a facultativos en escenarios reales de triaje, con datos tomados directamente de pacientes atendidos en urgencias en Massachusetts. Sin filtros ni ediciones. Nada de casos limpios de laboratorio. Aquí había notas de enfermería, constantes vitales y fragmentos de historia clínica, justo ese tipo de material desordenado que define buena parte de la medicina real.

Una IA en el ruido de la urgencia

En ese terreno tan poco amable, la serie o1 identificó el diagnóstico correcto en el 78,3% de los casos más desafiantes. Es una cifra que destaca todavía más si se compara con el 44,5% alcanzado por médicos con acceso a herramientas de búsqueda en estudios previos. La comparación no pretende convertir a la IA en una especie de oráculo clínico, pero sí deja una idea inquietante cuando el caso se complica y el tiempo aprieta, el software puede encontrar patrones donde el ojo humano tropieza con el ruido.

Los autores hablan de una fortaleza muy concreta. "El modelo demostró una fortaleza distintiva bajo condiciones de incertidumbre", incluso cuando trabajaba con datos fragmentados y no estructurados. Y eso importa porque la medicina no suele parecerse a una guía ordenada, sino a un rompecabezas con piezas mal impresas, bordes rotos y varias fichas que llegan tarde.

La serie o1 no es un modelo cualquiera. Está pensada precisamente para razonar antes de dar una respuesta, una idea que conecta con una tendencia más amplia en inteligencia artificial dejar atrás la simple predicción instantánea y avanzar hacia sistemas que desglosan problemas, comparan hipótesis y corrigen su propio camino. En una urgencia, donde cada minuto cuenta, esa capacidad puede convertirse en una ventaja poderosa. O en una fuente de nuevos dilemas.

Lo que no significa este resultado

Arjun Raj Manrai, uno de los investigadores, fue claro al matizar el alcance de los hallazgos.

"No creo que nuestros hallazgos signifiquen que la IA reemplace a los médicos. Lo que sí significa es que estamos presenciando un cambio profundo en la tecnología que remodelará la medicina" - Arjun Raj Manrai, investigador de la Facultad de Medicina de Harvard

La frase contiene el equilibrio que muchos buscan y pocos logran expresar sin caer en el entusiasmo fácil ni en el miedo automático. No se trata de imaginar un hospital sin médicos, sino un hospital donde el médico ya no trabaja solo. Donde una máquina vigila el expediente, cruza datos, detecta patrones y avisa antes de que el error se consolide. La medicina, al fin y al cabo, siempre ha incorporado herramientas para ampliar el juicio humano el estetoscopio, el análisis de sangre, el TAC, la resonancia. La novedad ahora es que la herramienta no solo observa, sino que interpreta.

Adam Rodman, internista y coautor del estudio, dibuja esa posibilidad con una imagen muy concreta

"Se puede imaginar fácilmente un sistema que se ejecute sobre el registro electrónico y que mejore la calidad al identificar errores diagnósticos u oportunidades perdidas antes de que ocurran" - Adam Rodman, internista y coautor de Harvard Medical School

Y añade otra idea que resume bien la ambición y el recelo de este momento

"No se trata de sustituir el estetoscopio por una pantalla, sino de dotar al médico de un segundo par de ojos infalibles." - Adam Rodman, internista y coautor de Harvard Medical School

La pregunta incómoda eficacia, pero también justicia

Que una IA acierte mucho no basta. En medicina, la pregunta de verdad empieza después ¿acierta igual con todos?, ¿se equivoca menos en unos pacientes que en otros?, ¿es segura cuando se despliega fuera del laboratorio?, ¿quién responde si falla? Ahí entra el análisis de Ashley Hopkins y Erik Cornelisse, que acompaña el trabajo y pone el freno donde hace falta.

"Sin una eficacia, equidad y seguridad robustas y demostradas, muchos sistemas de IA seguirán siendo insuficientes para el uso clínico" - Ashley Hopkins y Erik Cornelisse, analistas de salud

La advertencia no es un trámite académico. La historia de la tecnología médica está llena de herramientas prometedoras que mejoraban el rendimiento medio, pero dejaban sombras en los márgenes pacientes peor representados, diagnósticos menos precisos en grupos concretos, sesgos invisibles hasta que alguien pregunta lo suficiente. En sanidad, la velocidad de procesamiento no puede ser el premio mayor si el precio es una pérdida de control o una desigualdad nueva disfrazada de eficiencia.

Por eso el estudio abre una discusión más amplia que la pura comparación entre humanos y algoritmos. La integración de IA en hospitales plantea cuestiones de responsabilidad y transparencia, y obliga a pensar en quién supervisa, quién valida y quién decide cuándo una sugerencia automática merece confianza. La promesa es grande. También lo son las consecuencias si se acelera sin red.

Quizá ahí esté la verdadera noticia no que una máquina haya superado a varios médicos en un ejercicio concreto, sino que ese resultado ya no pertenece a la ciencia ficción ni a una demo pulida, sino al corazón áspero de la urgencia hospitalaria. Y eso cambia el escenario. No mañana, quizá. Pero sí lo suficiente como para que cada hospital, cada regulador y cada profesional tenga que hacerse una pregunta que ya no admite evasivas cómo aprovechar esta nueva inteligencia sin olvidar que, en medicina, la prioridad no es procesar más rápido, sino cuidar mejor y con más seguridad.

Sobre el autor
Redacción
Ver biografía