Onderzoekers van de University of Zurich testten vier veelgebruikte taalmodellen: OpenAI o3-mini, Deepseek Reasoner, xAI Grok 2 en Mistral. Elk model genereerde 50 verhalende uitspraken over 24 controversiële onderwerpen, zoals vaccinatieverplichtingen, geopolitiek en klimaatbeleid. De onderzoekers verzamelden in totaal 192’000 beoordelingen om de effecten te analyseren.
Wanneer geen bron werd gegeven, lagen de overeenkomsten tussen modellen boven 90% over alle onderwerpen. Maar toen fictieve auteurs werden toegevoegd, daalde de overeenstemming sterk, ook al bleef de tekst hetzelfde. Het meest opvallende resultaat was een duidelijk anti-Chinese bias in alle modellen. Germani merkt op dat dit minder gunstige oordeel soms verscheen terwijl het argument logisch en goed geschreven was.
De studie toont ook dat modellen menselijke auteurs over het algemeen meer vertrouwen dan andere AI-systemen. De onderzoekers waarschuwen dat deze verborgen vooroordelen praktisch belangrijk zijn voor contentmoderatie, werving, academische review en journalistiek. Zij pleiten voor meer transparantie en governance en adviseren LLMs als hulpmiddelen, niet als vervangers.
Moeilijke woorden
- onderzoek — Een studie naar iets om meer te leren.
- bevooroordeeld — Een oordeel dat oneerlijk of partijdig is.bevooroordeelde
- vooringenomenheid — Een onjuiste mening over iets of iemand.
- wantrouwen — Geen vertrouwen of geloof in iets.
- transparantie — Duidelijkheid over hoe dingen werken.
- inhoud — Wat informatie of een tekst bevat.
Tip: beweeg de muisaanwijzer over gemarkeerde woorden in het artikel, of tik erop om snelle definities te zien terwijl je leest of luistert.
Discussievragen
- Welke gevolgen heeft vooringenomenheid in AI?
- Hoe kan transparantie helpen in de AI-ontwikkeling?
- Waarom is het belangrijk om aandacht te besteden aan vooringenomenheid voordat AI wordt gebruikt?
Gerelateerde artikelen
Vrouwen en online aanvallen tijdens Oegandese verkiezingen
Tijdens de algemene verkiezingen van januari 2026 werden veel Oegandese vrouwen online aangevallen met nepbeelden, deepfakes en gendergerichte desinformatie. Technologie versterkt bestaand geweld en bemoeilijkt de politieke deelname van vrouwen.
TikTok en clanidentiteit in Somalië
TikTok beïnvloedt clanidentiteit in Somalië: jongeren en vrouwen tonen clanloyaliteit, clangevechten in livestreams leiden tot donaties en soms financiering van conflicten zoals in Laasanood. Experts adviseren moderatie en digitale geletterdheid.
Afrikaanse leiders: bouw en betaal eigen medische innovatie
Een groep Afrikaanse wetenschapsleiders roept op om medische innovaties in Afrika zelf op te bouwen en te financieren. Ze willen minder afhankelijkheid van onzekere buitenlandse fondsen en meer nationale investeringen en regels die lokale productie mogelijk maken.
AI-bloedtest kan oorzaken van dementie onderscheiden
Onderzoekers ontwikkelden een AI-bloedtest die vier veelvoorkomende oorzaken van dementie en gezond hersenveroudering kan onderscheiden met meer dan 90% nauwkeurigheid. De test werd getraind op bloed-eiwitdata maar moet nog verder worden gevalideerd voor klinisch gebruik.