El nuevo modelo de inteligencia artificial de Microsoft, desarrollado desde cero para tareas de programación, se integra en GitHub Copilot y Visual Studio Code.
Microsoft anunció el lanzamiento de MAI-Code-1-Flash, su primer modelo de inteligencia artificial desarrollado desde cero y optimizado exclusivamente para la programación. El modelo se integra de forma nativa en GitHub Copilot y estará disponible para desarrolladores individuales a través de Visual Studio Code.
A diferencia de otros modelos de IA generalistas adaptados para código, MAI-Code-1-Flash fue diseñado utilizando los flujos de trabajo de GitHub Copilot. Según informó Microsoft, el entrenamiento se realizó con datos bajo licencias adecuadas y se evaluó el rendimiento en tareas como resolución de dudas sobre repositorios complejos, refactorización de código y tareas automatizadas basadas en telemetría.
El modelo incluye un sistema de control adaptativo de longitud de solución, que permite autorregular los recursos según la complejidad de la tarea. Según Microsoft, esta gestión permite resolver desafíos de ingeniería complejos utilizando hasta un 60% menos de tokens en comparación con otros modelos, lo que reduce la latencia y mejora la experiencia de autocompletado.
Microsoft comparó a MAI-Code-1-Flash con Claude Haiku 4.5 de Anthropic en entornos de producción reales, utilizando pruebas de referencia como SWE-Bench (Verified, Pro y Multilingual) y Terminal Bench 2. Según los resultados, el modelo de Microsoft superó a Claude en todos los frentes. En SWE-Bench Pro, MAI-Code-1-Flash obtuvo un 51,2% de efectividad frente al 35,2% de Anthropic. En seguimiento preciso de instrucciones (IF Bench), la ventaja fue de casi 29 puntos. En matemáticas y generación de código visual también destacó.
Para evaluar la capacidad de razonamiento lógico, Microsoft sometió al modelo a un examen de 186 preguntas con escenarios contradictorios o con información faltante. MAI-Code-1-Flash logró un 85,8% de precisión ajustada.
