Microsoft pose la première pierre de son indépendance vis-à-vis d'OpenAI en proposant enfin des modèles d'IA maison : MAI-Voice-1 et MAI-1-preview sont sous la bannière MAI (Microsoft AI)

Microsoft pose la première pierre de son indépendance vis-à-vis dOpenAI en proposant enfin des modèles d’IA maison :

MAI-Voice-1 et MAI-1-preview sont sous la bannière MAI (Microsoft AI)

Depuis la fin de lannée 2022, le duo MicrosoftOpenAI domine le paysage de lintelligence artificielle. Microsoft a massivement investi dans la start-up californienne, mettant sur la table plusieurs milliards de dollars et offrant son infrastructure Azure comme colonne vertébrale aux déploiements des modèles de la série GPT. Cest grâce à ce partenariat que les fameux Copilot ont vu le jour dans Word, Excel, Outlook et Teams, transformant le quotidien de millions dutilisateurs. Mais derrière cette réussite, un dilemme stratégique sest progressivement imposé. À force de dépendre dOpenAI, Microsoft se retrouvait dans une position inconfortable : incapable de maîtriser totalement la technologie qui alimente une bonne partie de sa stratégie produit et dépendant des orientations dune société tierce, parfois imprévisible.

En mars, un rapport indiquait que Microsoft était en train de développer ses propres modèles axés sur le raisonnement. Selon le rapport, Microsoft envisageait de rompre ses liens avec OpenAI et de se débarrasser de sa dépendance excessive aux technologies de la startup. Microsoft a déjà exprimé des plaintes concernant le modèle GPT-4 d’OpenAI, jugé trop coûteux et pas assez rapide pour répondre aux questions des utilisateurs. Microsoft semblait également vouloir se débarrasser de ce partenariat pour éviter des poursuites judiciaires.

Le virage vers des modèles maison

Cest dans ce contexte que Microsoft a décidé de tracer sa propre voie en dévoilant ses premiers modèles développés en interne, sous la bannière MAI (Microsoft AI). Deux dentre eux sont désormais connus : MAI-Voice-1, dédié à la synthèse vocale, et MAI-1-preview, un modèle de langage généraliste destiné à rivaliser, au moins partiellement, avec les grands modèles de la concurrence. Le premier impressionne par sa rapidité et son expressivité. Capable de générer une minute complète daudio en une fraction de seconde, il ouvre la voie à des applications immersives dans Copilot, que ce soit pour des podcasts générés automatiquement ou des assistants vocaux fluides. Le second, MAI-1-preview, constitue un pari plus audacieux. Conçu sur une base de 15 000 GPU NVIDIA H100, il na pas encore lambition dégaler GPT-4 ou Claude dans toutes leurs capacités, mais il démontre la volonté de Microsoft de bâtir son propre socle technologique, sans se limiter à être lintégrateur dOpenAI.

Voici l’annonce de Microsoft :

Envoyé par Microsoft

Chez Microsoft AI (MAI), nous pensons que l’IA doit être utilisée pour donner plus de moyens à chaque individu sur la planète. Nous créons une IA pour tous, une présence solidaire et utile, toujours au service de l’humanité. Elle sera la porte d’entrée vers un univers de connaissances et un ensemble de capacités qui permettront aux individus et aux organisations d’aller plus loin. Responsables, fiables, dotés de personnalité et d’expertise, nous nous concentrons sur la création d’une IA appliquée comme plateforme pour des produits de référence et profondément fiables qui comprennent chacun de nos besoins uniques.

Depuis l’année dernière, nous nous sommes attachés à poser les bases de cette vision, avec une équipe et une infrastructure de classe mondiale. Pour atteindre pleinement nos objectifs, MAI a besoin de modèles spécialement conçus. Aujourd’hui, nous sommes ravis de vous présenter les premières étapes pour que cela devienne réalité.

Tout d’abord, nous lançons MAI-Voice-1, notre premier modèle de génération de discours hautement expressif et naturel, disponible dans Copilot Daily et Podcasts, ainsi que dans une toute nouvelle expérience Copilot Labs à essayer ici. La voix est l’interface du futur pour les compagnons IA et MAI-Voice-1 offre un son haute fidélité et expressif dans des scénarios à un ou plusieurs locuteurs.Deuxièmement, nous avons commencé à tester publiquement MAI-1-preview sur LMArena, une plateforme populaire d’évaluation de modèles communautaires. Il s’agit du premier modèle de base de MAI formé de bout en bout, qui donne un aperçu des futures offres de Copilot. Nous travaillons activement à l’amélioration des modèles. Nous aurons beaucoup plus à partager dans les mois à venir. Restez à l’écoute !

Nous avons de grandes ambitions pour l’avenir. Non seulement nous poursuivrons nos progrès dans ce domaine, mais nous pensons également que la mise en place d’une gamme de modèles spécialisés répondant à différentes intentions et cas d’utilisation des utilisateurs permettra de dégager une valeur considérable. Cette équipe aura beaucoup à offrir dans ces deux domaines dans un avenir proche. Nous sommes enthousiasmés par le travail qui nous attend, car notre objectif est de fournir des modèles de pointe et de les mettre à la disposition des utilisateurs du monde entier.

Un choix pragmatique plutôt que mégalomaniaque

À ce jour, Copilot s’est principalement appuyé sur les modèles d’OpenAI. Microsoft a investi des sommes colossales dans OpenAI, et il est peu probable que les deux entreprises se séparent complètement dans un avenir proche. Cela dit, des tensions sont apparues ces derniers mois lorsque leurs motivations ou leurs objectifs se sont écartés.

Comme il est difficile de prédire où tout cela va mener, Microsoft a probablement tout intérêt à long terme à développer ses propres modèles.

Il est également possible que Microsoft ait introduit ces modèles pour répondre à des cas d’utilisation ou à des requêtes sur lesquels OpenAI ne se concentre pas. Nous assistons à une évolution progressive du paysage de l’IA vers des modèles plus spécialisés pour certaines tâches, plutôt que vers des modèles généraux et polyvalents destinés à répondre à tous les besoins de tous les utilisateurs.

La stratégie adoptée par Microsoft semble trancher avec la course effrénée à « lIA la plus puissante » que lon observe chez dautres acteurs. Mustafa Suleyman, lancien co-fondateur de DeepMind recruté par Microsoft pour piloter son département IA, lexplique clairement : il ne sagit pas de construire le modèle le plus gigantesque, mais de créer des systèmes plus efficaces, mieux calibrés et capables de répondre à des besoins concrets. Là où OpenAI ou Anthropic visent des architectures universelles, Microsoft semble plutôt vouloir assembler un écosystème de modèles spécialisés. Cette orientation pourrait séduire les professionnels qui cherchent moins lexpérimentation de pointe que la fiabilité, la scalabilité et une intégration fluide dans leurs outils quotidiens.

Il est donc logique que ces modèles soient déployés dans Copilot, le chatbot IA grand public de Microsoft. À propos de MAI-1-preview, le blog Microsoft AI précise que « ce modèle est conçu pour offrir des fonctionnalités puissantes aux consommateurs qui souhaitent bénéficier de modèles spécialisés dans le suivi d’instructions et la fourniture de réponses utiles aux questions quotidiennes ».

Copilot, laboratoire dune nouvelle hybridation

Lintégration de ces modèles maison au sein de Copilot marque le début dune nouvelle ère. Jusquici, lassistant intelligent reposait presque exclusivement sur GPT-4 dOpenAI. Désormais, certaines tâches sont traitées directement par MAI-Voice-1 ou MAI-1-preview, selon la pertinence du contexte. La promesse est double : réduire les coûts liés à la dépendance à OpenAI et offrir aux utilisateurs une réactivité accrue, puisque les modèles internes peuvent être optimisés pour les cas dusage précis de lécosystème Microsoft. À terme, il est probable que Copilot devienne un véritable orchestrateur de modèles, choisissant en temps réel lIA la plus adaptée à la demande, quelle vienne dOpenAI, de Microsoft ou même de partenaires tiers.

Des tensions avec OpenAI qui deviennent palpables

Cet élan vers lindépendance nest pas neutre pour le partenariat historique. Ces derniers mois, des signes de crispation sont apparus. Des dirigeants dOpenAI auraient évoqué lhypothèse daccuser Microsoft de pratiques anticoncurrentielles, notamment en raison de la manière dont les contrats de cloud et les intégrations logicielles sont structurés. De son côté, Microsoft consacre désormais plus de 80 milliards de dollars par an à ses initiatives liées à lintelligence artificielle, un signal clair quil ne souhaite pas rester prisonnier de la feuille de route dOpenAI. Le couple continue donc de fonctionner, mais la dynamique a changé : Microsoft nest plus seulement le bailleur et lhébergeur, il devient aussi un concurrent.

Les défis qui attendent Redmond

Rien nindique pour linstant que les modèles MAI pourront égaler les ténors de lindustrie dans les deux ou trois prochaines années. Le défi technique reste colossal. Entraîner des modèles performants exige des quantités astronomiques de données, une expertise rare et des ressources matérielles considérables. Mais Microsoft a un avantage déterminant : sa capacité dintégration. Là où OpenAI doit séduire les utilisateurs via des produits comme ChatGPT, léditeur de Redmond dispose déjà dun accès direct à une base dutilisateurs massive via Windows et la suite Microsoft 365. Autrement dit, même si ses modèles natteignent pas immédiatement le sommet de la hiérarchie, leur simple présence dans des outils utilisés quotidiennement par des centaines de millions de personnes peut suffire à les imposer comme une norme.

Pour les professionnels de linformatique, cette évolution marque un tournant. Il ne sagit plus seulement de choisir entre « utiliser GPT ou ne pas utiliser GPT », mais de naviguer dans un environnement où cohabitent des modèles multiples, parfois complémentaires, parfois concurrents. Cela soulève des questions stratégiques : quelle plateforme privilégier ? Faut-il adapter les architectures internes pour dialoguer avec plusieurs modèles à la fois ? Quelle sera la place du cloud Azure si Microsoft bascule progressivement vers ses propres briques IA ? Autant de décisions qui façonneront la manière dont les entreprises tireront profit de cette nouvelle génération de technologies.

Conclusion : vers une autonomie assumée

Le lancement de MAI-Voice-1 et de MAI-1-preview nest pas seulement une annonce produit de plus dans le flux incessant de lactualité technologique. Cest un signal politique envoyé par Microsoft. Après avoir fait de son partenariat avec OpenAI un accélérateur décisif, lentreprise veut désormais démontrer quelle est capable de tenir seule la barre. Et si OpenAI a permis à Microsoft de gagner une avance spectaculaire, cest bien Redmond qui entend écrire les chapitres suivants de son histoire dindépendance.

Source : Microsoft

Et vous ?

La recherche dindépendance de Microsoft vis-à-vis dOpenAI est-elle une nécessité stratégique ou une simple démonstration de force ?

Les modèles spécialisés, comme MAI-Voice-1, sont-ils lavenir face aux modèles universels comme GPT-5 ?

Copilot peut-il réellement devenir un orchestrateur neutre de modèles, ou sera-t-il dabord un outil pour imposer lécosystème maison ?

Cette émancipation pourrait-elle redéfinir léquilibre des forces dans lIA, au détriment dOpenAI ?

Pour les entreprises clientes, faut-il se préparer à une fragmentation des standards et à la nécessité de gérer plusieurs IA en parallèle ?
Vous avez lu gratuitement 0 articles depuis plus d’un an.
Soutenez le club developpez.com en souscrivant un abonnement pour que nous puissions continuer à vous proposer des publications.