Microsoft veut améliorer les performances des IA dans les langues européennes

10:5721/07/2025, lundi
AFP
Président et vice-président de Microsoft Corporation Brad Smith
Crédit Photo : CHIP SOMODEVILLA / GETTY IMAGES NORTH AMERICA / AFP
Président et vice-président de Microsoft Corporation Brad Smith

Microsoft prévoit d’investir plusieurs millions de dollars en Europe pour produire et mettre à disposition des données numériques destinées à l'entraînement des modèles d’intelligence artificielle (IA) dans une douzaine de langues européennes, a annoncé Brad Smith, président du groupe.

Alors que la majorité des modèles d’IA sont aujourd’hui entraînés quasi exclusivement en anglais, Microsoft entend combler ce déséquilibre
. "Un modèle est moins performant lorsqu’il est utilisé dans une langue pour laquelle les données sont insuffisantes"
, a souligné Brad Smith. Selon lui, cette carence linguistique pourrait inciter les utilisateurs à privilégier l’anglais, menaçant ainsi la diversité linguistique.
"La survie de ces langues est en jeu"
, a-t-il averti.

Strasbourg, futur hub européen des données linguistiques


Dès septembre, Microsoft implantera à Strasbourg, dans l’est de la France, des antennes de ses centres de recherche pour
"étendre la disponibilité des données"
dans au moins 10 des 24 langues officielles de l’Union européenne, parmi lesquelles l’estonien, le grec ou encore le slovène.

Le groupe basé à Redmond (État de Washington) prévoit notamment de participer à la numérisation de livres en langues non-anglaises et à l’enregistrement de centaines d’heures de contenus audio dans divers idiomes européens.
"Microsoft ne possédera aucune de ces données"
, a précisé Brad Smith.
"Elles seront accessibles au grand public et proposées en open source."

Vers une compatibilité renforcée avec le marché européen


Alors que la souveraineté numérique européenne fait l’objet d’intenses débats, Microsoft se positionne comme un acteur "compatible" avec les exigences européennes. En juin, l’entreprise avait déjà renforcé sa coopération avec les gouvernements de l’UE en matière de cybersécurité, et annoncé de nouvelles mesures de contrôle des données stockées sur le sol européen.

"Nous nous engageons sans réserve à défendre la souveraineté et les données européennes"
, a réaffirmé Brad Smith.

Si le marché mondial de l’IA est dominé par les géants américains et chinois, l’Europe compte plusieurs initiatives et acteurs notables, tels que la start-up française Mistral, la plateforme collaborative Hugging Face, ou encore le projet TildeLM, axé sur le développement de modèles IA pour les langues européennes.


Partenariats culturels et patrimoine numérique


En parallèle, Microsoft a également annoncé lundi la création d’une réplique numérique de la cathédrale Notre-Dame de Paris, réalisée en partenariat avec l’Institut du Patrimoine et l’entreprise française Iconem. Ce projet sera offert à l’État français.

Des collaborations ont aussi été lancées avec la Bibliothèque nationale de France (BNF) et le Musée des arts décoratifs, visant à numériser une partie de leurs collections et à en assurer la diffusion via des plateformes numériques ouvertes.


À lire également:




#technologies
#informatique
#cybersécurité
#IA
#USA
#entreprises
#langue
#Brad Smith
#Microsoft
#intelligence artificielle
#IA multilingue
#langues européennes
#Strasbourg
#open data
#souveraineté numérique
#Union européenne
#TildeLM
#Hugging Face
#Mistral AI
#Notre-Dame numérique
#patrimoine numérique
#BNF
#IA en Europe
#numérisation livres
#IA Microsoft