Onderzoekers verbeteren veiligheid van grote taalmodellen (Nederlands, Niveau A2)

Onderzoekers van North Carolina State University bestudeerden veiligheid bij grote taalmodellen. Jung-Eun Kim, correspondentie-auteur en assistant professor, zei dat ze niet willen dat modellen mensen aanzetten tot zelfbeschadiging of anderen schade geven.

Het team noemde twee problemen: veiligheidstraining kan de nauwkeurigheid verlagen (de "alignment tax") en veel modellen gebruiken een oppervlakkige veiligheidscontrole. Jianwei Li, eerste auteur en PhD-student, gaf een voorbeeld: een vraag om geld te stelen wordt vaak geweigerd, maar met een vriendelijk doel kan het model informatie geven. Het team testte nieuwe trainingsmethoden om onveilige output te verminderen zonder prestaties te verliezen.

Moeilijke woorden

veiligheid — bescherming tegen gevaar of schade

taalmodel — computerprogramma dat tekst begrijpt en maakt

taalmodellen

zelfbeschadiging — opzettelijk jezelf pijn doen of verwonden

veiligheidstraining — leren modellen veiliger en vriendelijker reageren

nauwkeurigheid — hoe precies en correct iets is

veiligheidscontrole — controle om gevaarlijke antwoorden te voorkomen

Tip: beweeg de muisaanwijzer over gemarkeerde woorden in het artikel, of tik erop om snelle definities te zien terwijl je leest of luistert.

Eiwit maakt eierstokkankercellen resistent tegen chemotherapie

Onderzoekers ontdekten dat kankercellen hun interne skelet veranderen en een eiwit (TPPP3) gebruiken om resistent te worden tegen cisplatin. Het blokkeren van TPPP3 herstelt in modellen de gevoeligheid voor behandeling.

Niveau

Lezen

29 apr 2026

AI kan vroeg risico op ADHD bij kinderen signaleren

Onderzoekers laten zien dat kunstmatige intelligentie routinematige medische dossiers kan gebruiken om jaren vóór een diagnose het risico op ADHD in te schatten. Het hulpmiddel markeert kinderen voor extra aandacht, maar stelt geen diagnose.

Niveau

Lezen

29 jun 2026

Proef in Malawi zoekt eenvoudiger behandeling voor cryptocokkenmeningitis

Cryptokokkenmeningitis treft vooral mensen met HIV en veroorzaakt veel doden in Sub-Sahara Afrika. Een klinische proef in Kamuzu onderzoekt een makkelijker vorm van flucytosine en verwacht resultaten in 2027.

Niveau

Lezen

28 sep 2025

School of Comics in Zenica: strips als uitweg

De Zenica School of Comics gaf al meer dan 30 jaar beeldende training en creatieve ruimte. De school begon tijdens de oorlog 1992-1995, leidde ongeveer 200 jonge kunstenaars op en blijft bestaan ondanks weinig steun.

Niveau

Lezen

12 feb 2026

Hoe geldgedrag het huwelijksgeluk beïnvloedt

Onderzoekers van de University of Georgia onderzochten hoe uitgave- en spaarpatronen samenhangen met tevredenheid over huwelijk en financiën. Ze vonden dat partners die elkaar als spaarders zagen vaker meer huwelijksgeluk en financieel welbevinden rapporteerden.

Niveau

Lezen

Onderzoekers verbeteren veiligheid van grote taalmodellen^{CEFR A2}

Moeilijke woorden

Discussievragen

Gerelateerde artikelen

Eiwit maakt eierstokkankercellen resistent tegen chemotherapie

AI kan vroeg risico op ADHD bij kinderen signaleren

Proef in Malawi zoekt eenvoudiger behandeling voor cryptocokkenmeningitis

School of Comics in Zenica: strips als uitweg

Hoe geldgedrag het huwelijksgeluk beïnvloedt

Onderzoekers verbeteren veiligheid van grote taalmodellen CEFR A2

Moeilijke woorden

Discussievragen

Gerelateerde artikelen

Eiwit maakt eierstokkankercellen resistent tegen chemotherapie

AI kan vroeg risico op ADHD bij kinderen signaleren

Proef in Malawi zoekt eenvoudiger behandeling voor cryptocokkenmeningitis

School of Comics in Zenica: strips als uitweg

Hoe geldgedrag het huwelijksgeluk beïnvloedt

Onderzoekers verbeteren veiligheid van grote taalmodellen^{CEFR A2}