Les IA de modération ignorent la plupart des langues africainesCEFR B1
20 avr. 2026
Adapté de Guest Contributor, Global Voices • CC BY 3.0
Photo de Zulfugar Karimov, Unsplash
Les outils d'IA qui retirent les contenus sur les réseaux sociaux peinent à comprendre la diversité linguistique en Afrique. Bereket Tsegay, qui a travaillé au hub kényan de TikTok, dit qu'il voyait souvent des vidéos qu'il ne comprenait pas parce qu'elles étaient en langues comme Luo, Dholuo, Kikuyu et Dinka.
Une étude de 2025 indique que 42 langues africaines figurent dans les grands modèles, mais seulement quatre sont traitées de façon régulière. La dépendance aux données majoritairement en anglais provoque des faux positifs et des faux négatifs.
Des cas concrets montrent l'impact. Jackson Busolo, créateur kényan, a vu son compte supprimé en février 2025 avant d'être rétabli. Entre January et March 2025, TikTok a retiré plus de 450,000 vidéos au Kenya et banni plus de 43,000 comptes ; au Q2 les suppressions avaient grimpé à 592,000. En Ethiopia, de fausses allégations sur Facebook ont circulé avant d'être démenties.
Des groupes comme AfricaNLP, des universités à Pretoria, Nairobi et Addis Ababa, et des partenariats industriels cherchent à construire des jeux de données. La réglementation européenne et des stratégies nationales tentent aussi de pousser à plus de transparence, mais la collecte de données représentatives reste un défi pratique.
Mots difficiles
- diversité — variation des langues et des cultures d'un groupe
- retirer — enlever ou supprimer quelque chose d'un endroitretirent, retiré
- faux positif — alerte incorrecte où un contenu est signaléfaux positifs
- faux négatif — absence d'alerte pour un contenu problématiquefaux négatifs
- dépendance — fait de dépendre fortement d'une chose
- représentatif — qui montre fidèlement la diversité d'un groupereprésentatives
- collecte — action de rassembler des informations ou données
- jeu de données — collection structurée d'exemples ou d'informationsjeux de données
- transparence — clarté sur les méthodes et données utilisées
Astuce : survolez, mettez le focus ou touchez les mots en surbrillance dans l’article pour voir des définitions rapides pendant que vous lisez ou écoutez.
Questions de discussion
- Que pourraient faire les plateformes pour mieux gérer la diversité linguistique en Afrique ?
- Pensez-vous qu'il est important d'avoir des jeux de données locaux pour l'IA ? Pourquoi ?
- Avez-vous déjà observé une suppression de contenu injuste sur un réseau social ? Que s'est-il passé ?
Articles liés
Plus de contrôle régional pour la recherche en santé en Afrique
La baisse de l'aide et les défis sanitaires poussent des responsables africains à réclamer un renforcement du contrôle régional de la recherche, de la production de vaccins et des politiques pour garantir l'accès aux médicaments.
Des capteurs bon marché pour surveiller la pollution en Afrique du Sud
Des scientifiques ont adapté des méthodes de physique des particules pour créer AI_r, un réseau de capteurs à faible coût qui mesure la qualité de l'air en temps réel. Le projet s'étend de Soweto à Sedibeng avec 500 capteurs prévus.
Test rapide d'anticorps sans prise de sang
Des chercheurs de la University of Pittsburgh ont créé un test d'anticorps qui prend dix minutes et ne demande pas de prélèvement sanguin. Le test utilise des capteurs sur nanotubes de carbone et détecte des anticorps comme ceux contre SARS-CoV-2 et H1N1.