Les IA de modération ignorent la plupart des langues africainesCEFR A2
20 avr. 2026
Adapté de Guest Contributor, Global Voices • CC BY 3.0
Photo de Zulfugar Karimov, Unsplash
Les systèmes d'IA chargés de modérer les contenus sur les réseaux sociaux comprennent mal la plupart des langues africaines. Ce problème provoque à la fois des suppressions injustifiées et le maintien de contenus nuisibles que l'algorithme ne reconnaît pas.
Une étude de 2025 montre que 42 langues africaines apparaissent dans les grands modèles, mais seules quatre langues sont traitées régulièrement : amharique, swahili, afrikaans et malgache.
Modérateurs, créateurs et chercheurs soulignent le décalage entre les langues utilisées et celles que peuvent traiter les outils. Des équipes comme AfricaNLP et des universités travaillent à créer des jeux de données pour améliorer la modération.
Mots difficiles
- modérer — vérifier et contrôler ce qui est publié
- suppression — action d'enlever un message ou un contenusuppressions
- algorithme — programme informatique qui prend des décisions
- nuisible — qui cause du mal ou des problèmesnuisibles
- reconnaître — identifier ou comprendre quelque chose déjà vureconnaît
- jeu de données — collection d'informations utilisée pour l'entraînement informatiquejeux de données
- langue — système de mots pour parler et écrirelangues
Astuce : survolez, mettez le focus ou touchez les mots en surbrillance dans l’article pour voir des définitions rapides pendant que vous lisez ou écoutez.
Questions de discussion
- Pensez-vous que les outils d'IA doivent mieux reconnaître toutes les langues ? Pourquoi ?
- Connaissez-vous ou parlez-vous une des langues citées dans le texte ? Laquelle ?
- Pourquoi, selon vous, est-il important de créer des jeux de données pour la modération ?
Articles liés
Une coque qui se referme comme un tatou
Des chercheurs de North Carolina State University ont créé un module protecteur qui se recroqueville en boule pour abriter des appareils fragiles et des robots souples. Le dispositif, appelé MIPM, se déclenche automatiquement quand il détecte un contact.
La conversation en face à face est en baisse
Une étude publiée dans Perspectives on Psychological Science montre que les personnes perdent en moyenne 338 mots parlés chaque année, un recul observé depuis au moins une décennie et demie. Les auteurs demandent d’autres recherches sur les effets sociaux.
Coupure d'internet et contrôle des récits sur les manifestations en Iran
Fin décembre 2025, des grèves au Grand Bazar de Téhéran ont mené à des manifestations dans de nombreuses provinces. Une coupure d'Internet en janvier 2026 a limité les témoignages; des enquêtes ont ensuite évoqué une répression massive.