AI begrijpt veel Afrikaanse talen nietCEFR B2
20 apr 2026
Gebaseerd op Guest Contributor, Global Voices • CC BY 3.0
Foto door Zulfugar Karimov, Unsplash
AI-systemen die schadelijke inhoud op sociale media verwijderen, begrijpen vaak niet de meeste talen van Afrika. Een studie uit 2025 concludeerde dat 42 Afrikaanse talen zinvol in grote taalmodellen voorkomen, maar dat slechts vier talen met enige consistentie worden behandeld: Amharic, Swahili, Afrikaans en Malagasy. Daardoor blijft meer dan 98 procent van Afrika’s talen grotendeels onzichtbaar voor moderatiesystemen.
De afhankelijkheid van voornamelijk Engelstalige trainingsdata veroorzaakt zowel fout-positieven als fout-negatieven: content kan zonder duidelijke uitleg worden verwijderd, terwijl schadelijke berichten in slecht ondersteunde talen online blijven omdat het systeem ze niet herkent. Moderators zoals Bereket Tsegay, die in TikTok's Kenia-hub werkte, melden dat zij vaak video’s niet begrijpen omdat ze in lokale talen zijn. Concrete gevallen illustreren het probleem: een Keniaanse maker verloor in februari 2025 tijdelijk zijn account; tussen januari en maart 2025 verwijderde TikTok meer dan 450,000 video’s uit Kenia en verbood meer dan 43,000 accounts, en tegen het tweede kwartaal waren de verwijderingen opgelopen tot 592,000. In Ethiopië verspreidden valse beweringen zich op Facebook voordat ze werden weerlegd door factcheckers.
Deskundigen benadrukken dat makers, journalisten en lokale gebruikers het meest de last dragen. Er zijn initiatieven om de kloof te dichten: onderzoeksgroepen zoals AfricaNLP en academische teams in Pretoria, Nairobi en Addis Ababa bouwen datasets, de AfricaNLP-workshop van 2025 behandelde taken in Hausa, Igbo en Swahili, en Cohere werkte met HausaNLP om data aan zijn Aya-model toe te voegen. Het Afrikaans Unie keurde in juli 2024 een Continental AI Strategy goed en enkele landen volgden met nationale strategieën, waaronder Nigeria in april 2025. Regelgeving kan verandering stimuleren — de EU AI Act trad in werking in augustus 2024 en de Digital Services Act in februari 2024 — maar representatieve trainingsdata en operationele dekking blijven een praktische uitdaging.