Les intelligences artificielles génératives s’entraînent sur des corpus dominés par des contenus anglophones : l’anglais, parlé par 5 % des locuteurs natifs, représente plus de la moitié du contenu des sites web. Des outils comme Compar:IA visent à réduire ces biais tandis que des formations accompagnent aussi les médiateurs numériques.
Les IA génératives sont entraînées à partir de données largement dominées par la langue anglaise, ce qui influence directement leurs réponses. Le français y occupe une place marginale, sans rapport avec son usage réel sur Internet. Selon Simon Zilinskas-Inta, chargé de déploiement de Compar:IA, un comparateur d’IA développé en 2024 par le ministère de la Culture, l’écart est important : « Le français représentait seulement 0,16 % des jeux de données d’entraînement, un chiffre qui met en évidence la distance entre la présence d’une langue dans le monde numérique et sa représentation dans les données mobilisées par les modèles d’IA », a-t-il expliqué à l’occasion d’un webinaire. Ce déséquilibre s’inscrit dans une domination massive de l’anglais dans les flux d’information en ligne, qui façonne indirectement les normes discursives des IA. La structure même du web produit un effet d’entraînement sur les modèles. « Bien que seulement 5 % de la population mondiale parle anglais à la maison, l’anglais représente 63 % de la communication totale sur Internet. La plupart des modèles sont donc surtout entraînés sur des données en anglais », explique-t-il.
Des modèles multilingues, mais pas multiculturels
Ces déséquilibres ne se limitent pas aux données brutes : ils influencent aussi les performances et les comportements des modèles selon les langues utilisées. Même lorsque les systèmes sont multilingues, leur niveau de précision varie en fonction de la qualité des données disponibles. « Même si un modèle peut fonctionner dans plusieurs langues et qu’il traduit bien l’anglais et le français, il ne comprend pas forcément de la même manière les contextes culturels. Le fait de poser une question en français plutôt qu’en anglais peut changer la qualité, la précision ou même la façon dont il répond, parce que le modèle n’a pas été entraîné de manière équilibrée sur toutes les langues et cultures », précise-t-il. Concrètement, la compétence linguistique ne garantit pas une équivalence culturelle. Et les méthodes actuelles d’évaluation des modèles peinent à intégrer ces dimensions culturelles de manière robuste.
La nécessité de comparer les modèles
Les réponses générées par les IA ne sont pas seulement différentes dans leur contenu, mais aussi dans leur ton et leur posture. « Le comportement d’un modèle peut changer selon la langue utilisée. En anglais, il a tendance à adopter un ton plus positif ou enthousiaste, comme dans certaines habitudes de communication anglophones. En français, la réponse peut être plus sobre et mesurée », observe-t-il. De ces constats sont nés des outils comme Compar:IA, qui cherchent à rendre visibles les différences entre modèles en les confrontant à des évaluations humaines à l’aveugle. Concrètement, l’outil permet de faire émerger des préférences implicites. « On pose une question à deux modèles sans révéler leur identité, puis on compare leurs réponses sans savoir qui a produit quoi. Ensuite, on choisit celle qu’on préfère ou on considère qu’elles sont équivalentes », décrit-il. Selon lui, cette logique de comparaison peut constituer un outil d’observation des biais.
Des formations ciblées
Du côté de la médiation numérique, la logique change de registre et se déplace vers la formation des professionnels chargés d’accompagner les publics. En coopération avec la Mednum, l’Agence Régionale du Numérique et de l’intelligence artificielle (ArnIA) a construit un programme de formation allant de la compréhension des mécanismes techniques à l’accompagnement des usages concrets. « Il est nécessaire de comprendre le fonctionnement des IA ainsi que leurs implications éthiques, environnementales et sociales. L’un des axes centraux de la formation concerne la maîtrise du prompt, qui est un élément déterminant dans la qualité des résultats obtenus et dans l’efficacité des interactions avec les modèles », souligne Corine Machuret, chargée de mission inclusion numérique.