AI begrijpt veel Afrikaanse talen nietCEFR B1
20 apr 2026
Gebaseerd op Guest Contributor, Global Voices • CC BY 3.0
Foto door Zulfugar Karimov, Unsplash
AI-systemen voor inhoudsmoderatie begrijpen veel Afrikaanse talen slecht. Een studie uit 2025 vond dat 42 Afrikaanse talen zinvol in grote taalmodellen voorkomen, maar dat slechts vier talen redelijk worden behandeld: Amharic, Swahili, Afrikaans en Malagasy. Daardoor blijft meer dan 98 procent van Afrika’s talen grotendeels onzichtbaar voor moderatiesystemen.
Moderators en makers merken de gevolgen. Bereket Tsegay, die in TikTok's Kenia-hub werkte, zei dat hij vaak video's zag die hij niet begreep omdat ze in lokale talen waren. In februari 2025 verloor een Keniaanse maker tijdelijk zijn account; tussen januari en maart 2025 verwijderde TikTok veel video's uit Kenia en verbood ook veel accounts, en tegen het tweede kwartaal waren de verwijderingen verder opgelopen. In Ethiopië verspreidden valse beweringen zich op Facebook voordat factcheckers ingrepen.
Experts waarschuwen dat makers, journalisten en gebruikers die lokale talen gebruiken het meest worden geraakt. Onderzoeksgroepen zoals AfricaNLP en academische teams in Pretoria, Nairobi en Addis Ababa bouwen datasets, en bedrijven als Cohere werkten samen met lokale groepen om data toe te voegen. Beleidsmaatregelen zoals de EU AI Act (augustus 2024) en de Digital Services Act (februari 2024) zetten druk op platforms, maar representatieve trainingsdata en operationele dekking blijven praktisch lastig.
Moeilijke woorden
- inhoudsmoderatie — controle van berichten en video's op internet
- taalmodel — computerprogramma dat taal begrijpt en genereerttaalmodellen
- moderatiesysteem — technisch systeem dat inhoud controleert op regelsmoderatiesystemen
- dataset — verzameling van gegevens voor onderzoek of trainingdatasets
- representatief — dat goed de hele groep of voorbeelden toontrepresentatieve
- operationeel — in de praktijk werkend of inzetbaaroperationele
Tip: beweeg de muisaanwijzer over gemarkeerde woorden in het artikel, of tik erop om snelle definities te zien terwijl je leest of luistert.
Discussievragen
- Waarom is het belangrijk dat moderatiesystemen lokale talen begrijpen? Geef twee redenen.
- Denk je dat het bouwen van datasets en samenwerking met lokale groepen genoeg is om moderatiesystemen te verbeteren? Waarom wel of niet?
Gerelateerde artikelen
Nieuwe methode verlaagt CO2 en beschermt servers
Onderzoekers stellen Federated Carbon Intelligence (FCI) voor: een systeem dat realtime servergezondheid en milieugegevens koppelt om CO2-uitstoot te verminderen en hardware langer te laten werken. Simulaties tonen grote winst; testen in echte datacenters is de volgende stap.
Fatsoenlijke internetverbinding onbereikbaar voor veel mensen
Een nieuw rapport waarschuwt dat fatsoenlijke internetverbinding buiten bereik is voor 90 per cent van de mensen in lage- en middeninkomenslanden. Het rapport noemt 4G, smartphonebezit en dagelijks gebruik als voorwaarden voor echte toegang.
Nieuwe Amerikaanse strategie verandert mondiaal gezondheidsbeleid
Op 18 September presenteerden de Verenigde Staten de America First Global Health Strategy. De strategie wil uitbraken tegenhouden, bilaterale samenwerking versterken en vereist dat lage- en middeninkomenslanden meebetalen en prestatienormen halen.
Egypte ontwikkelt twee systemen tegen stof op zonnepanelen
Onderzoekers in Egypte maakten twee door de natuur geïnspireerde systemen om stof van zonnepanelen te verwijderen. Veldproeven tonen lagere opbrengstverliezen en het bedrijf van ingenieur Hossam Mohamed begint met commerciële plaatsingen in Caïro en Giza.