Meta gastó 14.300 millones y promete superar a Llama 4 con solo una décima parte del cómputo

"Sin pesos abiertos, es mucho más difícil predecir el valor de Spark"

10 de abril de 2026 a las 14:14h
Meta gastó 14.300 millones y promete superar a Llama 4 con solo una décima parte del cómputo
Meta gastó 14.300 millones y promete superar a Llama 4 con solo una décima parte del cómputo

Hace nueve meses, Meta dio un giro radical en su estrategia de inteligencia artificial. Con una inversión de 14.300 millones de dólares, la compañía fichó a Alexandr Wang, fundador de Scale AI, con una misión clara reconstruir desde cero su enfoque en IA. El resultado, nueve meses después, es Muse Spark, el primer modelo fundacional del nuevo Meta SuperIntelligence Labs y el primer gran lanzamiento de IA de la empresa desde Llama 4, en abril de 2025. El nombre suena a promesa una chispa que encienda algo más grande. Pero, ¿es realmente una revolución o solo una evolución cuidadosamente maquillada?

Un modelo que quiere cambiar las reglas del juego

Muse Spark ya está disponible para el público en meta.ai, y Meta no duda en presentarlo como un salto cualitativo. La empresa afirma que ha rediseñado "desde cero" la arquitectura de su sistema de IA, logrando un rendimiento "muy superior" al de Llama 4 Maverick usando solo una décima parte de la capacidad computacional. Eso, en el mundo de la IA, es como anunciar un coche que va más rápido, consume menos y no suena. Menos recursos, más eficiencia una fórmula tentadora en un sector donde los costes energéticos y de infraestructura amenazan con frenar el crecimiento.

Según los benchmarks internos de Meta, Muse Spark compite directamente con gigantes como Claude Opus 4.6, Gemini 3.1 Pro y GPT-5.4. En razonamiento multimodal la capacidad de entender texto, imágenes y contexto a la vez incluso los supera. También destaca en aplicaciones de salud, gracias al trabajo conjunto con 1.000 médicos para afinar su precisión. Pero no todo brilla con la misma intensidad. En pruebas de pensamiento abstracto, especialmente en ARC-AGI 2, el modelo cojea. Tampoco es un maestro en programación agéntica, una habilidad clave para que una IA actúe de forma autónoma en entornos complejos.

El "modo contemplativo" y la ilusión del pensamiento profundo

Uno de los avances más interesantes de Muse Spark es su "modo contemplativo", una arquitectura que no depende de alargar el tiempo de razonamiento de un solo agente, sino de orquestar múltiples agentes que piensan en paralelo. La idea es simple en lugar de hacer que una sola inteligencia piense más tiempo, haces que muchas piensen al mismo tiempo. La calidad sin sacrificar la velocidad. En el gráfico de latencia que Meta ha publicado, con 16 agentes en paralelo se alcanza casi el 59% de precisión en Humanity's Last Exam una prueba extrema de razonamiento con una latencia comparable a la de un solo agente extendido.

"orquesta múltiples agentes que razonan en paralelo y que está diseñado para peticiones complejas en el ámbito científico y de razonamiento. En nuestras pruebas descubrimos que compite con otros modelos de razonamiento extremo como Gemini Deep Think o GPT Pro" - Alexandr Wang, fundador de Scale AI y responsable de la nueva estrategia de IA de Meta

Suena impresionante, pero no es nuevo. Otros laboratorios ya exploran arquitecturas similares. La novedad está en cómo Meta lo integra como una herramienta para razonamientos complejos accesibles al usuario común, no solo al investigador especializado.

¿Inteligencia artificial o ingeniería de benchmarks?

No se puede hablar de Muse Spark sin recordar las sombras del pasado. El lanzamiento de Llama 4 fue salpicado por acusaciones de sobreajuste a benchmarks modelos que brillan en pruebas estandarizadas, pero fallan en tareas del mundo real. Y ahora, otra vez, aparece François Chollet creador del benchmark ARC-AGI, una de las pruebas en las que Muse Spark falla para lanzar una advertencia

"ya parece una decepción sobreoptimizado para números de benchmarks públicos en detrimento de todo lo demás. Saber cómo evaluar modelos de manera que se correlacione con la utilidad real es una competencia central para los laboratorios de IA, y cualquier laboratorio nuevo tiene pocas probabilidades de tener éxito sin resolver primero eso" - François Chollet, creador del benchmark ARC-AGI

La crítica es contundente. Muse Spark puede ganar en tablas, pero ¿resiste el escrutinio del uso cotidiano? Artificial Analysis, una plataforma independiente de evaluación de modelos, lo sitúa en cuarto lugar, por detrás de Gemini 3.1 Pro, GPT-5.4 y Claude Opus 4.6. No es el líder, pero está en la carrera.

El giro hacia la hiperpersonalización (y el cierre de la puerta)

Quizá el cambio más significativo no sea técnico, sino filosófico. Muse Spark es un modelo cerrado y propietario, rompiendo con la tradición de pesos abiertos de la familia Llama. Meta no descarta publicar versiones abiertas en el futuro, pero **no se compromete**. Para muchos en la comunidad de IA, eso es una traición a la apertura que antes promovía la compañía. Como dijo Ethan Mollick, divulgador de IA "sin pesos abiertos, es mucho más difícil predecir el valor de Spark".

El enfoque ahora es claro hiperpersonalización a escala masiva. Muse Spark aprende de los datos de WhatsApp, Instagram y Facebook para adaptarse a cada usuario. Mark Zuckerberg ya la usa en su día a día. La IA no solo responde, sino que anticipa analiza una foto de tu comida y te da detalles nutricionales, identifica músculos activos en un video de ejercicio, convierte una imagen de un videojuego en un minijuego interactivo o resuelve problemas domésticos combinando anotaciones visuales y de voz. En salud, promete mejorar diagnósticos y recomendaciones, aunque siempre bajo supervisión humana.

Meta no quiere solo que uses su IA. Quiere que no puedas vivir sin ella. Y su objetivo es ambicioso llevar esta IA personalizada a 3.000 millones de usuarios. Si lo consigue, no será solo una herramienta. Será un ecosistema invisible, omnipresente, que moldea tu experiencia digital en tiempo real.

Seguridad, acciones y las preguntas pendientes

En materia de seguridad, Meta afirma haber contratado una consultoría independiente que concluyó que Muse Spark tiene la tasa más alta de "conciencia de evaluación" entre los modelos analizados. En pruebas internas, rechaza ayudar a desarrollar armas bioquímicas en el 98% de los casos, superando a Opus 4.6 (95,4%), GPT-5.4 (74,7%) y Gemini 3.1 Pro (61,5%). Son cifras que suenan bien, pero también son internas, no auditadas externamente. La confianza, en este campo, no se mide en porcentajes, sino en transparencia.

El mercado, al menos, reaccionó con entusiasmo. Tras el anuncio, las acciones de Meta subieron un 6,5%. El mensaje es claro Wall Street valora la apuesta por la eficiencia y la personalización. Pero el verdadero juicio no vendrá de los inversores, sino de los usuarios. Muse Spark no supera globalmente a sus rivales más directos. Su ventaja no está en ser el más potente, sino en ser el más integrado, el más cercano, el más útil en el día a día.

La pregunta final no es si Muse Spark es el mejor modelo de IA del mundo. Es si una IA que conoce tus fotos, tus mensajes, tus hábitos y tus contactos puede convertirse en un aliado indispensable sin convertirse en un vigilante invisible. Meta apuesta a que sí. Que la eficiencia, la personalización y la integración en plataformas masivas son la clave. Pero en ese equilibrio, entre utilidad y control, entre innovación y ética, se juega el futuro no solo de un modelo, sino de cómo viviremos con la inteligencia artificial en los próximos años.

Sobre el autor
Redacción
Ver biografía