LingVo.club
📖+40 XP
🎧+25 XP
+45 XP
AI begrijpt veel Afrikaanse talen niet — Niveau B2 — Tiktok logo on a dark keyboard background

AI begrijpt veel Afrikaanse talen nietCEFR B2

20 apr 2026

Gebaseerd op Guest Contributor, Global Voices CC BY 3.0

Foto door Zulfugar Karimov, Unsplash

Niveau B2 – Hoger-midden
5 min
293 woorden

AI-systemen die schadelijke inhoud op sociale media verwijderen, begrijpen vaak niet de meeste talen van Afrika. Een studie uit 2025 concludeerde dat 42 Afrikaanse talen zinvol in grote taalmodellen voorkomen, maar dat slechts vier talen met enige consistentie worden behandeld: Amharic, Swahili, Afrikaans en Malagasy. Daardoor blijft meer dan 98 procent van Afrika’s talen grotendeels onzichtbaar voor moderatiesystemen.

De afhankelijkheid van voornamelijk Engelstalige trainingsdata veroorzaakt zowel fout-positieven als fout-negatieven: content kan zonder duidelijke uitleg worden verwijderd, terwijl schadelijke berichten in slecht ondersteunde talen online blijven omdat het systeem ze niet herkent. Moderators zoals Bereket Tsegay, die in TikTok's Kenia-hub werkte, melden dat zij vaak video’s niet begrijpen omdat ze in lokale talen zijn. Concrete gevallen illustreren het probleem: een Keniaanse maker verloor in februari 2025 tijdelijk zijn account; tussen januari en maart 2025 verwijderde TikTok meer dan 450,000 video’s uit Kenia en verbood meer dan 43,000 accounts, en tegen het tweede kwartaal waren de verwijderingen opgelopen tot 592,000. In Ethiopië verspreidden valse beweringen zich op Facebook voordat ze werden weerlegd door factcheckers.

Deskundigen benadrukken dat makers, journalisten en lokale gebruikers het meest de last dragen. Er zijn initiatieven om de kloof te dichten: onderzoeksgroepen zoals AfricaNLP en academische teams in Pretoria, Nairobi en Addis Ababa bouwen datasets, de AfricaNLP-workshop van 2025 behandelde taken in Hausa, Igbo en Swahili, en Cohere werkte met HausaNLP om data aan zijn Aya-model toe te voegen. Het Afrikaans Unie keurde in juli 2024 een Continental AI Strategy goed en enkele landen volgden met nationale strategieën, waaronder Nigeria in april 2025. Regelgeving kan verandering stimuleren — de EU AI Act trad in werking in augustus 2024 en de Digital Services Act in februari 2024 — maar representatieve trainingsdata en operationele dekking blijven een praktische uitdaging.

Moeilijke woorden

  • moderatiesysteemautomatische systemen voor inhoudscontrole op platforms
    moderatiesystemen
  • fout-positiefonterecht labelen van onschuldige inhoud als schadelijk
    fout-positieven
  • fout-negatiefschadelijke inhoud die niet wordt herkend
    fout-negatieven
  • trainingsdatadata gebruikt om taalmodellen te trainen
  • representatiefdat trouw verschillende groepen of voorbeelden toont
    representatieve
  • moderatorpersoon die online inhoud controleert en beoordeelt
    Moderators
  • datasetgestructureerde verzameling voorbeelden voor onderzoek
    datasets
  • factcheckeriemand die feiten in berichten controleert
    factcheckers
  • dekkinghoeveelheid bereik of ondersteuning van een systeem

Tip: beweeg de muisaanwijzer over gemarkeerde woorden in het artikel, of tik erop om snelle definities te zien terwijl je leest of luistert.

Discussievragen

  • Welke gevolgen kan het gebrek aan ondersteuning voor veel Afrikaanse talen hebben voor lokale makers en journalisten? Geef twee concrete voorbeelden.
  • Welke stappen zouden techbedrijven kunnen nemen om representatieve trainingsdata voor meer talen te verzamelen? Noem ten minste twee mogelijkheden.
  • Denk je dat wetgeving zoals de EU AI Act voldoende is om taalongelijkheid in moderatiesystemen te verminderen? Leg kort uit waarom wel of niet, en geef een alternatief of aanvullende maatregel.

Gerelateerde artikelen