Microsoft aprovechó Build, celebrada el 03/06/2026 en San Francisco, para enseñar algo más que nuevos productos. La compañía presentó siete modelos propios de inteligencia artificial con una idea de fondo bastante clara, reducir su dependencia de OpenAI y plantar cara a Anthropic y Google.
Ahí aparece una tensión conocida en la industria. Durante años, las grandes tecnológicas han corrido apoyándose en alianzas externas, pero llega un momento en que la factura, el control del producto y la velocidad de despliegue empujan a construir tecnología propia.
"Lo que acaban de ver es un cambio bastante significativo" - Satya Nadella, CEO de Microsoft
Nadella enmarcó ese giro durante la conferencia con una visión más amplia sobre el papel de las empresas en la nueva carrera de la IA.
"Creemos que ha llegado el momento de que todas las empresas pasen de consumir un modelo de vanguardia a participar plenamente en la vanguardia del ecosistema de vanguardia" - Satya Nadella, CEO de Microsoft
Microsoft entrenó MAI-Thinking-1 desde cero
Entre los anuncios, el modelo que mejor retrata esa apuesta es MAI-Thinking-1. Tiene 35.000 millones de parámetros activos y una ventana de contexto de 256 KB, una combinación con la que Microsoft intenta ocupar el espacio intermedio entre potencia, coste y despliegue práctico.
Kyle Daigle, jefe de marketing para desarrolladores de la compañía y director de operaciones de GitHub, situó ahí el argumento comercial del modelo.
"MAI-Thinking-1 está entrenado desde cero, sin destilación, con datos limpios, de calidad empresarial y con licencia comercial, puede utilizarlo con total confianza. Se trata de un modelo de tamaño medio con 35.000 millones de parámetros activos y una ventana de contexto de 256 KB, diseñado para ofrecer alta eficiencia y rendimiento, pero, sobre todo, con un bajo coste de tokens" - Kyle Daigle, jefe de marketing para desarrolladores de Microsoft y director de operaciones de GitHub
El matiz importa porque no habla solo de capacidad técnica. También habla de licencias, de calidad del dato y de una promesa muy concreta para los clientes empresariales, usar el sistema con menos incertidumbre jurídica y con una factura más contenida.
Los modelos de imagen ya entraron en PowerPoint y OneDrive
Otra parte de la familia apunta al trabajo cotidiano, ese terreno donde la IA deja de parecer una demo y pasa a mezclarse con herramientas que millones de personas ya usan. MAI-Image-2.5 y su variante Flash permiten convertir texto en imagen y transformar una imagen en otra.
Daigle describió el lugar que ocupan dentro de esos flujos creativos y también dónde pueden usarse.
"Son especialmente útiles en flujos de trabajo creativos, cuando se necesita ayuda para plasmar un concepto o mejorar imágenes existentes. Estos modelos ya están disponibles en PowerPoint, se están implementando en OneDrive y, hoy mismo, llegan a Foundry con una excelente relación calidad-precio" - Kyle Daigle, jefe de marketing para desarrolladores de Microsoft y director de operaciones de GitHub
Visto en perspectiva, el movimiento tiene lógica. Si la generación visual vive dentro de PowerPoint o OneDrive, la barrera de entrada baja mucho más que en una plataforma aislada, porque el usuario no cambia de entorno y trabaja sobre archivos que ya forman parte de su rutina.
La voz, la transcripción y el código cubren 43 idiomas y más de 15 adicionales
No todo gira alrededor del texto o la imagen. MAI Transcribe 1.5 ofrece precisión en 43 idiomas y añadirá transmisión en tiempo real, mientras que MAI-Voice-2 y su versión Flash amplían la oferta con más de 15 idiomas adicionales y nuevas opciones de voz.
A la vez, MAI-Code-1 se orienta a un terreno donde Microsoft juega en casa. El modelo de codificación está optimizado para GitHub y ya funciona en Copilot y VS Code, dos piezas clave en la vida diaria de muchos desarrolladores.
La compañía presentó siete modelos propios para rebajar el coste de usar sistemas de terceros y reforzar sus servicios sobre Azure. Ese detalle económico explica casi todo el anuncio, porque en esta fase de la inteligencia artificial no solo cuenta quién tiene el modelo más capaz, sino quién puede integrarlo mejor y pagar menos por cada token.