AI begrijpt veel Afrikaanse talen nietCEFR B1
20 apr 2026
Gebaseerd op Guest Contributor, Global Voices • CC BY 3.0
Foto door Zulfugar Karimov, Unsplash
AI-systemen voor inhoudsmoderatie begrijpen veel Afrikaanse talen slecht. Een studie uit 2025 vond dat 42 Afrikaanse talen zinvol in grote taalmodellen voorkomen, maar dat slechts vier talen redelijk worden behandeld: Amharic, Swahili, Afrikaans en Malagasy. Daardoor blijft meer dan 98 procent van Afrika’s talen grotendeels onzichtbaar voor moderatiesystemen.
Moderators en makers merken de gevolgen. Bereket Tsegay, die in TikTok's Kenia-hub werkte, zei dat hij vaak video's zag die hij niet begreep omdat ze in lokale talen waren. In februari 2025 verloor een Keniaanse maker tijdelijk zijn account; tussen januari en maart 2025 verwijderde TikTok veel video's uit Kenia en verbood ook veel accounts, en tegen het tweede kwartaal waren de verwijderingen verder opgelopen. In Ethiopië verspreidden valse beweringen zich op Facebook voordat factcheckers ingrepen.
Experts waarschuwen dat makers, journalisten en gebruikers die lokale talen gebruiken het meest worden geraakt. Onderzoeksgroepen zoals AfricaNLP en academische teams in Pretoria, Nairobi en Addis Ababa bouwen datasets, en bedrijven als Cohere werkten samen met lokale groepen om data toe te voegen. Beleidsmaatregelen zoals de EU AI Act (augustus 2024) en de Digital Services Act (februari 2024) zetten druk op platforms, maar representatieve trainingsdata en operationele dekking blijven praktisch lastig.
Moeilijke woorden
- inhoudsmoderatie — controle van berichten en video's op internet
- taalmodel — computerprogramma dat taal begrijpt en genereerttaalmodellen
- moderatiesysteem — technisch systeem dat inhoud controleert op regelsmoderatiesystemen
- dataset — verzameling van gegevens voor onderzoek of trainingdatasets
- representatief — dat goed de hele groep of voorbeelden toontrepresentatieve
- operationeel — in de praktijk werkend of inzetbaaroperationele
Tip: beweeg de muisaanwijzer over gemarkeerde woorden in het artikel, of tik erop om snelle definities te zien terwijl je leest of luistert.
Discussievragen
- Waarom is het belangrijk dat moderatiesystemen lokale talen begrijpen? Geef twee redenen.
- Denk je dat het bouwen van datasets en samenwerking met lokale groepen genoeg is om moderatiesystemen te verbeteren? Waarom wel of niet?
Gerelateerde artikelen
Waarom taalmodellen moeite hebben met vermenigvuldigen
Onderzoekers van de University of Chicago en partners onderzochten waarom grote taalmodellen twee viercijferige getallen slecht vermenigvuldigen. Een nieuwe trainingsmethode (ICoT) liet modellen tussentijdse waarden onthouden en verbeterde de nauwkeurigheid sterk.
Afrikaanse digitale makers verdienen te weinig ondanks groei
Een nieuw rapport uit januari 2026 laat zien dat de digitale creatieve sector in Afrika snel groeit, maar veel makers weinig verdienen. Betaalsystemen, AI en beperkte koopkracht vergroten de problemen en onderzoekers noemen dringende maatregelen.
Schoon water vermindert groeiproblemen bij kinderen in Mozambique
Een studie uit 2022–23 toont dat betere toegang tot veilig drinkwater in Mozambique de kans op groeiremming bij jonge kinderen aanzienlijk kan verlagen. Sanitatie had geen onafhankelijk effect op stunting in deze analyse.
Burgerarchivarissen bewaren mondelinge tradities in Zuid-Azië
Burgerarchivarissen leggen volksliederen, mondelinge geschiedenissen, raadsels en traditionele geneeskunde vast. Het project ondersteunt moedertaalsprekers bij opnemen, uploaden en transcriberen voor Wikimedia Commons, Wikisource en Wikipedia (14 taalgemeenschappen, 227 opnamen).
Nanofiber luchtfilter vangt CO2 in gebouwen
Onderzoekers ontwikkelden een nieuw nanofiber luchtfilter dat CO2 binnen gebouwen opvangt en meer dan 92% efficiënt blijkt in een levenscyclusanalyse. Filters kunnen energie besparen, worden geregenereerd en mogelijk op grote schaal CO2 uit de lucht halen.