Een paper uit 2025 van het Stanford Institute for Human-Centered Artificial Intelligence (HAI) concludeerde dat veel grote taalmodellen (LLM's) slecht presteren in talen anders dan het Engels. Dat is belangrijk omdat het internet en veel data door het Engels worden gedomineerd.
Onderzoekers en nieuwsmedia schreven dat openbare LLM's, onder meer van grote bedrijven, antwoorden geven die niet altijd passen bij de behoeften van veel mensen. Zo melden reporters dat miljoenen sprekers van talen zoals Koerdisch en Swahili op de tweede plaats komen te staan. Gebruikers die in andere talen hulp vragen, krijgen soms onbruikbare of foutieve resultaten.
Voorstellen om dit te verbeteren zijn duidelijk: werk samen met gemarginaliseerde gemeenschappen en lokale ontwikkelaars, controleer meertalige gegevens en toets AI-uitvoer op juistheid en authenticiteit.
Moeilijke woorden
- concluderen — zeggen wat uit onderzoek blijktconcludeerde
- domineren — meer invloed of controle hebben dan anderengedomineerd
- gemarginaliseerd — mensen met minder macht en aandachtgemarginaliseerde
- toetsen — controleren of iets correct en betrouwbaar istoets
- uitvoer — resultaat dat een computer of programma geeftAI-uitvoer
- authenticiteit — bewijs dat iets echt en betrouwbaar is
Tip: beweeg de muisaanwijzer over gemarkeerde woorden in het artikel, of tik erop om snelle definities te zien terwijl je leest of luistert.
Discussievragen
- Welke taal gebruik je meestal online? Zou je een AI in die taal gebruiken?
- Waarom is samenwerken met lokale ontwikkelaars en gemeenschappen volgens jou belangrijk?
- Heb je ooit een onjuist of onbruikbaar antwoord van een AI in jouw taal gekregen? Vertel kort.
Gerelateerde artikelen
Futurity: de tien meestgelezen onderzoeksverhalen van 2025
Futurity publiceerde eind 2025 een lijst met de tien meestgelezen onderzoeksberichten. De selectie beslaat onderwerpen als gezondheid, energie, archeologie, neurowetenschap, voeding en milieugezondheid. Lezers zijn uitgenodigd in 2026 terug te komen.
Rapport: wetenschapsjournalistiek werd intensiever tijdens de pandemie
Een wereldwijde enquête van SciDev.Net en partners onderzocht hoe COVID-19 het werk van wetenschapsjournalisten veranderde. De studie laat hogere werkdruk, veel gebruik van preprints en zorgen over kwaliteit zien.
Online archief voor gecensureerde Chinese geschiedenis
Een historicus startte eind 2023 een internetarchief om moderne Chinese geschiedenis te bewaren die in China is verboden. Het archief verzamelt boeken, blogposts en documentaires en biedt beschrijvingen in het Chinees en Engels.