Les IA de modération ignorent la plupart des langues africainesCEFR B2
20 avr. 2026
Adapté de Guest Contributor, Global Voices • CC BY 3.0
Photo de Zulfugar Karimov, Unsplash
Les systèmes d'IA chargés de modérer les contenus sur les réseaux sociaux comprennent mal la majorité des langues africaines, car ils reposent principalement sur des données en anglais. Cette réalité génère à la fois des suppressions injustifiées et l'inaction face à des publications nuisibles en langues peu dotées.
Des modérateurs et chercheurs observent un décalage entre les langues réellement utilisées et celles que peuvent traiter ces outils. Bereket Tsegay, ancien employé du hub kényan de TikTok, explique qu'il voyait fréquemment des vidéos en Luo, Dholuo, Kikuyu ou Dinka qu'il ne comprenait pas. Jackson Busolo, créateur kényan en swahili, a vu son compte supprimé en février 2025 avant d'être rétabli.
Une étude de 2025 relève que 42 langues africaines apparaissent dans les grands modèles, mais que seules quatre langues sont traitées de façon régulière :
- amharique
- swahili
- afrikaans
- malgache
Entre January et March 2025, TikTok a retiré plus de 450,000 vidéos du Kenya et banni plus de 43,000 comptes ; au Q2 les suppressions avaient grimpé à 592,000. En Ethiopia, de fausses allégations sur la saisie d'un port érythréen ont circulé sur Facebook avant d'être démenties.
Des initiatives comme AfricaNLP, des équipes universitaires à Pretoria, Nairobi et Addis Ababa, et des partenariats (Cohere avec HausaNLP pour le modèle Aya) visent à combler la lacune. L'UA a approuvé une Continental AI Strategy en July 2024 et des stratégies nationales ont suivi, dont celle du Nigeria en April 2025. L'EU AI Act (entré en vigueur en August 2024) et le Digital Services Act (February 2024) imposent des obligations de non‑discrimination et de transparence, mais constituer des données d'entraînement représentatives et assurer une couverture opérationnelle restent des défis concrets.
Mots difficiles
- modérer — surveiller et contrôler les contenus en ligne
- suppression — action de retirer du contenu publiésuppressions
- doté — qui dispose de ressources ou d'outilsdotées
- modèle — système informatique entraîné pour traiter le langagemodèles
- donnée — information utilisée pour entraîner un systèmedonnées
- couverture — portée ou capacité d'un service ou outil
- lacune — manque ou insuffisance dans un domaine
- représentatif — qui reflète fidèlement une réalité donnéereprésentatives
Astuce : survolez, mettez le focus ou touchez les mots en surbrillance dans l’article pour voir des définitions rapides pendant que vous lisez ou écoutez.
Questions de discussion
- Que pourraient faire les plateformes pour améliorer la modération dans les langues africaines ? Donnez des exemples concrets.
- Quels avantages et quelles limites voyez-vous aux initiatives locales (AfricaNLP, équipes universitaires, partenariats) citées dans le texte ?
- Comment, selon vous, les lois comme l'EU AI Act et le Digital Services Act peuvent aider à réduire les erreurs de modération linguistique ?
Articles liés
La connectivité significative reste hors de portée
Un rapport avertit qu'une connexion internet décente est hors de portée pour 90 % des personnes dans les pays à revenu faible et intermédiaire. Il définit la « connectivité significative » et demande plus de 4G, des données moins chères et des téléphones abordables.
Comment la biologie microscopique construit les réseaux cérébraux
Une étude publiée dans Nature Communications relie les cellules, les molécules et l’imagerie pour montrer comment la biologie microscopique sous-tend les réseaux observés en fMRI. Cela pourrait changer l’étude de la cognition et des troubles mentaux.
Une archive en ligne pour préserver l'histoire moderne de la Chine
Face à la censure, l'historien Ian Johnson et son équipe ont créé une archive en ligne pour conserver des documents modernes chinois interdits. Le site publie des notices en chinois et en anglais et vise les lecteurs en Chine et à l'étranger.