AI begrijpt veel Afrikaanse talen niet — Nederlands Niveau B2

AI-systemen die schadelijke inhoud op sociale media verwijderen, begrijpen vaak niet de meeste talen van Afrika. Een studie uit 2025 concludeerde dat 42 Afrikaanse talen zinvol in grote taalmodellen voorkomen, maar dat slechts vier talen met enige consistentie worden behandeld: Amharic, Swahili, Afrikaans en Malagasy. Daardoor blijft meer dan 98 procent van Afrika’s talen grotendeels onzichtbaar voor moderatiesystemen.

De afhankelijkheid van voornamelijk Engelstalige trainingsdata veroorzaakt zowel fout-positieven als fout-negatieven: content kan zonder duidelijke uitleg worden verwijderd, terwijl schadelijke berichten in slecht ondersteunde talen online blijven omdat het systeem ze niet herkent. Moderators zoals Bereket Tsegay, die in TikTok's Kenia-hub werkte, melden dat zij vaak video’s niet begrijpen omdat ze in lokale talen zijn. Concrete gevallen illustreren het probleem: een Keniaanse maker verloor in februari 2025 tijdelijk zijn account; tussen januari en maart 2025 verwijderde TikTok meer dan 450,000 video’s uit Kenia en verbood meer dan 43,000 accounts, en tegen het tweede kwartaal waren de verwijderingen opgelopen tot 592,000. In Ethiopië verspreidden valse beweringen zich op Facebook voordat ze werden weerlegd door factcheckers.

Deskundigen benadrukken dat makers, journalisten en lokale gebruikers het meest de last dragen. Er zijn initiatieven om de kloof te dichten: onderzoeksgroepen zoals AfricaNLP en academische teams in Pretoria, Nairobi en Addis Ababa bouwen datasets, de AfricaNLP-workshop van 2025 behandelde taken in Hausa, Igbo en Swahili, en Cohere werkte met HausaNLP om data aan zijn Aya-model toe te voegen. Het Afrikaans Unie keurde in juli 2024 een Continental AI Strategy goed en enkele landen volgden met nationale strategieën, waaronder Nigeria in april 2025. Regelgeving kan verandering stimuleren — de EU AI Act trad in werking in augustus 2024 en de Digital Services Act in februari 2024 — maar representatieve trainingsdata en operationele dekking blijven een praktische uitdaging.

Moeilijke woorden

moderatiesysteem — automatische systemen voor inhoudscontrole op platforms

moderatiesystemen

fout-positief — onterecht labelen van onschuldige inhoud als schadelijk

fout-positieven

fout-negatief — schadelijke inhoud die niet wordt herkend

fout-negatieven

trainingsdata — data gebruikt om taalmodellen te trainen

representatief — dat trouw verschillende groepen of voorbeelden toont

representatieve

moderator — persoon die online inhoud controleert en beoordeelt

Moderators

dataset — gestructureerde verzameling voorbeelden voor onderzoek

datasets

factchecker — iemand die feiten in berichten controleert

factcheckers

dekking — hoeveelheid bereik of ondersteuning van een systeem

Tip: beweeg de muisaanwijzer over gemarkeerde woorden in het artikel, of tik erop om snelle definities te zien terwijl je leest of luistert.

Discussievragen

Welke gevolgen kan het gebrek aan ondersteuning voor veel Afrikaanse talen hebben voor lokale makers en journalisten? Geef twee concrete voorbeelden.

Welke stappen zouden techbedrijven kunnen nemen om representatieve trainingsdata voor meer talen te verzamelen? Noem ten minste twee mogelijkheden.

Denk je dat wetgeving zoals de EU AI Act voldoende is om taalongelijkheid in moderatiesystemen te verminderen? Leg kort uit waarom wel of niet, en geef een alternatief of aanvullende maatregel.

Waarom taalmodellen moeite hebben met vermenigvuldigen

Onderzoekers van de University of Chicago en partners onderzochten waarom grote taalmodellen twee viercijferige getallen slecht vermenigvuldigen. Een nieuwe trainingsmethode (ICoT) liet modellen tussentijdse waarden onthouden en verbeterde de nauwkeurigheid sterk.

Niveau

Lezen

16 dec 2025

AI-koptelefoon isoleert stemmen in lawaai

Onderzoekers ontwikkelden een prototype-koptelefoon die met kunstmatige intelligentie het beurtwisselingsritme van een gesprek volgt en zo stemmen van gesprekspartners isoleert. Het systeem werkt met korte audiofragmenten en de code is open-source.

Niveau

Lezen

5 dec 2025

AI en de moderne rechtbanken in India

India moderniseert rechtbanken met e-Courts Phase III en AI-tools voor transcriptie, vertaling en onderzoek. Kerala verplicht Adalat.AI vanaf 1 november 2025, maar er zijn zorgen over fouten, vooringenomenheid en privacy.

Niveau

Lezen

24 nov 2025

Online lessen verbeterden wiskundeprestaties tijdens lockdown

Onderzoek naar de plotselinge overstap naar online onderwijs tijdens de lockdown van 2020 in China vond dat studenten beter presteerden in kwantitatieve vakken zoals wiskunde, maar minder in discussiegerichte vakken. Effecten verschilden per vak en per lockdownmaatregel.

Niveau

Lezen

18 dec 2025

Lagere vruchtbaarheid hielp loonkloof in de VS verkleinen

Een studie vindt dat minder kinderen in de Verenigde Staten heeft bijgedragen aan een kleinere loonkloof tussen mannen en vrouwen. Onderzoekers noemen oorzaken en doen beleidsvoorstellen zoals betere kinderopvang en urenbeperkingen.

Niveau

Lezen

AI begrijpt veel Afrikaanse talen niet^{CEFR B2}

Moeilijke woorden

Discussievragen

Gerelateerde artikelen

Waarom taalmodellen moeite hebben met vermenigvuldigen

AI-koptelefoon isoleert stemmen in lawaai

AI en de moderne rechtbanken in India

Online lessen verbeterden wiskundeprestaties tijdens lockdown

Lagere vruchtbaarheid hielp loonkloof in de VS verkleinen

AI begrijpt veel Afrikaanse talen niet CEFR B2

Moeilijke woorden

Discussievragen

Gerelateerde artikelen

Waarom taalmodellen moeite hebben met vermenigvuldigen

AI-koptelefoon isoleert stemmen in lawaai

AI en de moderne rechtbanken in India

Online lessen verbeterden wiskundeprestaties tijdens lockdown

Lagere vruchtbaarheid hielp loonkloof in de VS verkleinen

AI begrijpt veel Afrikaanse talen niet^{CEFR B2}