AI begrijpt veel Afrikaanse talen nietCEFR B1
20 apr 2026
Gebaseerd op Guest Contributor, Global Voices • CC BY 3.0
Foto door Zulfugar Karimov, Unsplash
AI-systemen voor inhoudsmoderatie begrijpen veel Afrikaanse talen slecht. Een studie uit 2025 vond dat 42 Afrikaanse talen zinvol in grote taalmodellen voorkomen, maar dat slechts vier talen redelijk worden behandeld: Amharic, Swahili, Afrikaans en Malagasy. Daardoor blijft meer dan 98 procent van Afrika’s talen grotendeels onzichtbaar voor moderatiesystemen.
Moderators en makers merken de gevolgen. Bereket Tsegay, die in TikTok's Kenia-hub werkte, zei dat hij vaak video's zag die hij niet begreep omdat ze in lokale talen waren. In februari 2025 verloor een Keniaanse maker tijdelijk zijn account; tussen januari en maart 2025 verwijderde TikTok veel video's uit Kenia en verbood ook veel accounts, en tegen het tweede kwartaal waren de verwijderingen verder opgelopen. In Ethiopië verspreidden valse beweringen zich op Facebook voordat factcheckers ingrepen.
Experts waarschuwen dat makers, journalisten en gebruikers die lokale talen gebruiken het meest worden geraakt. Onderzoeksgroepen zoals AfricaNLP en academische teams in Pretoria, Nairobi en Addis Ababa bouwen datasets, en bedrijven als Cohere werkten samen met lokale groepen om data toe te voegen. Beleidsmaatregelen zoals de EU AI Act (augustus 2024) en de Digital Services Act (februari 2024) zetten druk op platforms, maar representatieve trainingsdata en operationele dekking blijven praktisch lastig.
Moeilijke woorden
- inhoudsmoderatie — controle van berichten en video's op internet
- taalmodel — computerprogramma dat taal begrijpt en genereerttaalmodellen
- moderatiesysteem — technisch systeem dat inhoud controleert op regelsmoderatiesystemen
- dataset — verzameling van gegevens voor onderzoek of trainingdatasets
- representatief — dat goed de hele groep of voorbeelden toontrepresentatieve
- operationeel — in de praktijk werkend of inzetbaaroperationele
Tip: beweeg de muisaanwijzer over gemarkeerde woorden in het artikel, of tik erop om snelle definities te zien terwijl je leest of luistert.
Discussievragen
- Waarom is het belangrijk dat moderatiesystemen lokale talen begrijpen? Geef twee redenen.
- Denk je dat het bouwen van datasets en samenwerking met lokale groepen genoeg is om moderatiesystemen te verbeteren? Waarom wel of niet?
Gerelateerde artikelen
Kwantumcomputers mogelijk verbonden over 2,000 km
Onderzoekers van de University of Chicago laten zien dat kwantumcomputers theoretisch over 2,000 km met elkaar verbonden kunnen worden. Ze verbeterden de coherentie van atomen met MBE-materiaal en plannen nu experimentele tests met lange kabels.
Rapport: Oeganda moet wetenschap en innovatie hervormen
Een rapport gepresenteerd op 21 juni zegt dat Oeganda zijn systemen voor wetenschap, technologie en innovatie moet verbeteren. Het rapport noemt een genderkloof, zwakke STI-financiering en pleit voor meer samenwerking met het bedrijfsleven.
Romantische films en verwachtingen over liefde
Twee deskundigen van Virginia Tech zeggen dat romantische films, van Disney tot Hallmark, de kijkers beïnvloeden. Ze waarschuwen dat idealiseerde verhalen verwachtingen over relaties vormen en dat er weinig diversiteit in deze films is.