Durante años, la IA que impulsaba Copilot, Teams y los productos de Microsoft era, en esencia, la IA de OpenAI. Eso acaba de cambiar. El 2 de abril de 2026, Microsoft anunció el lanzamiento de tres modelos de inteligencia artificial desarrollados íntegramente en sus propios laboratorios: MAI-Transcribe-1, MAI-Voice-1 y MAI-Image-2. Es la primera vez desde que comenzó su histórica asociación con OpenAI que la compañía de Redmond pone en producción modelos de IA que no deben nada al creador de ChatGPT. Y los precios con los que han llegado al mercado apuntan directamente a la competencia: por debajo de lo que cobran OpenAI, Google y ElevenLabs por servicios equivalentes.
Qué hace cada modelo y por qué importa
MAI-Transcribe-1 es un modelo de voz a texto que soporta 25 idiomas y logra una tasa de error por palabra inferior al 4%, según los propios benchmarks de Microsoft. Eso lo sitúa por encima de Whisper-large-v3 de OpenAI en los 25 idiomas evaluados y por delante de Gemini 3.1 Flash de Google en 22 de 25. La clave no es solo la precisión: el modelo consume aproximadamente la mitad de GPU que sus rivales comparables, lo que se traduce en un coste de inferencia notablemente más bajo. Ya está activo en el modo de voz de Copilot.
MAI-Voice-1 es un generador de audio expresivo capaz de producir 60 segundos de voz de alta calidad en menos de un segundo usando una sola GPU. Ya impulsa las funciones Copilot Daily y Podcast. MAI-Image-2, el tercer miembro de la suite, se sitúa entre los tres primeros puestos del ranking de Arena.ai para generación de imágenes. Los tres modelos están disponibles a través de Microsoft Foundry y una nueva plataforma de acceso llamada MAI Playground.
El equipo detrás de los modelos y la nueva estrategia
Los tres modelos son obra del equipo MAI Superintelligence, liderado por Mustafa Suleyman, CEO de Microsoft AI, y operativo desde noviembre de 2025. Lo más llamativo del enfoque es el tamaño de los equipos: MAI-Voice-1 fue construido por apenas 10 personas. Suleyman ha apostado por equipos pequeños y empoderados frente a la estrategia de cientos de investigadores que emplean sus competidores, con el argumento de que la mayor parte de las ganancias provienen de la arquitectura del modelo y la calidad de los datos, no del número de ingenieros.
El contexto en el que llegan estos modelos no es menor. Microsoft renegocio su acuerdo con OpenAI en septiembre de 2025, eliminando una cláusula de no competencia que hasta entonces le impedía desarrollar sus propios modelos de IA general. Esa renegociación fue el punto de partida oficial de la estrategia de autosuficiencia. Las acciones de Microsoft habían caído cerca de un 17% en lo que va de año antes del anuncio, bajo la presión de los inversores por demostrar retornos reales sobre los gigantescos gastos en infraestructura de IA.
El movimiento estratégico que nadie esperaba tan pronto
La pregunta que muchos analistas se hacen no es si Microsoft iba a lanzar modelos propios, sino por qué ahora y con esta contundencia. La respuesta más directa es económica: Microsoft paga miles de millones de dólares al año a OpenAI por uso de API, y ese coste crece con cada nuevo usuario de Copilot. Construir modelos propios para tareas específicas como transcripción, voz e imágenes, donde los modelos de OpenAI son excesivos en potencia y costosos en precio, es una decisión de eficiencia pura. Para los usuarios de Office, Teams y Azure, el impacto más tangible debería ser funciones más rápidas y baratas. Microsoft aclara que no abandona la relación con OpenAI, sino que la complementa con sus propios modelos donde el coste-rendimiento sea más favorable.
0 Comentarios