LingVo.club
📖+40 XP
🎧+25 XP
+45 XP
Les IA de modération ignorent la plupart des langues africaines — Niveau B2 — Tiktok logo on a dark keyboard background

Les IA de modération ignorent la plupart des langues africainesCEFR B2

20 avr. 2026

Adapté de Guest Contributor, Global Voices CC BY 3.0

Photo de Zulfugar Karimov, Unsplash

Niveau B2 – Intermédiaire supérieur
5 min
274 mots

Les systèmes d'IA chargés de modérer les contenus sur les réseaux sociaux comprennent mal la majorité des langues africaines, car ils reposent principalement sur des données en anglais. Cette réalité génère à la fois des suppressions injustifiées et l'inaction face à des publications nuisibles en langues peu dotées.

Des modérateurs et chercheurs observent un décalage entre les langues réellement utilisées et celles que peuvent traiter ces outils. Bereket Tsegay, ancien employé du hub kényan de TikTok, explique qu'il voyait fréquemment des vidéos en Luo, Dholuo, Kikuyu ou Dinka qu'il ne comprenait pas. Jackson Busolo, créateur kényan en swahili, a vu son compte supprimé en février 2025 avant d'être rétabli.

Une étude de 2025 relève que 42 langues africaines apparaissent dans les grands modèles, mais que seules quatre langues sont traitées de façon régulière :

  • amharique
  • swahili
  • afrikaans
  • malgache

Entre January et March 2025, TikTok a retiré plus de 450,000 vidéos du Kenya et banni plus de 43,000 comptes ; au Q2 les suppressions avaient grimpé à 592,000. En Ethiopia, de fausses allégations sur la saisie d'un port érythréen ont circulé sur Facebook avant d'être démenties.

Des initiatives comme AfricaNLP, des équipes universitaires à Pretoria, Nairobi et Addis Ababa, et des partenariats (Cohere avec HausaNLP pour le modèle Aya) visent à combler la lacune. L'UA a approuvé une Continental AI Strategy en July 2024 et des stratégies nationales ont suivi, dont celle du Nigeria en April 2025. L'EU AI Act (entré en vigueur en August 2024) et le Digital Services Act (February 2024) imposent des obligations de non‑discrimination et de transparence, mais constituer des données d'entraînement représentatives et assurer une couverture opérationnelle restent des défis concrets.

Mots difficiles

  • modérersurveiller et contrôler les contenus en ligne
  • suppressionaction de retirer du contenu publié
    suppressions
  • dotéqui dispose de ressources ou d'outils
    dotées
  • modèlesystème informatique entraîné pour traiter le langage
    modèles
  • donnéeinformation utilisée pour entraîner un système
    données
  • couvertureportée ou capacité d'un service ou outil
  • lacunemanque ou insuffisance dans un domaine
  • représentatifqui reflète fidèlement une réalité donnée
    représentatives

Astuce : survolez, mettez le focus ou touchez les mots en surbrillance dans l’article pour voir des définitions rapides pendant que vous lisez ou écoutez.

Questions de discussion

  • Que pourraient faire les plateformes pour améliorer la modération dans les langues africaines ? Donnez des exemples concrets.
  • Quels avantages et quelles limites voyez-vous aux initiatives locales (AfricaNLP, équipes universitaires, partenariats) citées dans le texte ?
  • Comment, selon vous, les lois comme l'EU AI Act et le Digital Services Act peuvent aider à réduire les erreurs de modération linguistique ?

Articles liés