Wetenschappers van Brown University presenteerden op een conferentie in Rio de Janeiro een studie over hoe taalmodellen omgaan met plausibiliteit. Michael Lepori, promovendus aan Brown, zegt dat het werk aanwijzingen geeft dat modellen iets coderen wat lijkt op causale beperkingen uit de echte wereld.
Het team gebruikte zinnen zoals “Iemand koelde een drankje met ijs”, “…met sneeuw”, “…met vuur” en “…met gisteren” en analyseerde de interne wiskundige toestanden van verschillende open-source modellen, waaronder GPT-2, Llama 3.2 en Gemma 2. Ze vonden dat voldoende grote modellen afzonderlijke vectoren ontwikkelden die plausibiliteitscategorieën aangeven.
De onderzoekers rapporteerden dat die vectoren vergelijkbare categorieën konden onderscheiden met ongeveer 85% nauwkeurigheid en dat de vectoren beginnen te verschijnen in modellen met meer dan 2 miljard parameters. Dit kan de begrijpelijkheid en betrouwbaarheid van toekomstige modellen verbeteren.
Moeilijke woorden
- presenteren — aan het publiek iets laten zien of vertellenpresenteerden
- promovendus — iemand die aan een proefschrift werkt
- aanwijzing — bewijs of teken dat iets suggereertaanwijzingen
- causale beperking — regel die oorzaak en gevolg beschrijftcausale beperkingen
- plausibiliteit — hoe waarschijnlijk of logisch iets lijkt te zijn
- vector — rij van getallen die informatie voorsteltvectoren
- parameter — waarde die de werking van een model regeltparameters
- nauwkeurigheid — hoe dicht een resultaat bij het juiste ligt
Tip: beweeg de muisaanwijzer over gemarkeerde woorden in het artikel, of tik erop om snelle definities te zien terwijl je leest of luistert.
Discussievragen
- Denk je dat modellen die plausibiliteit herkennen veiliger zijn voor gebruikers? Waarom wel of niet?
- Hoe zou het verbeteren van nauwkeurigheid het dagelijks gebruik van taalmodellen kunnen beïnvloeden?
- Welke voorbeelden zou jij testen om te zien of een model plausibel reageert?
Gerelateerde artikelen
Boeren in Malawi testen organische mest van vlieg en rijstschillen
Onderzoekers en boeren in Mzimba maken een goedkope organische meststof van frass (vliegpoep), biochar van rijstschillen en koffiedik. Boeren die meedoen zien gezondere bananenplanten en verwachten lagere kosten en meer opbrengst.
AI kan persoonlijkheid voorspellen uit taal
Onderzoekers vonden dat algemene AI-modellen zoals ChatGPT, Claude en LLaMa persoonlijkheid en dagelijks gedrag kunnen voorspellen uit wat mensen zeggen. De AI-scores kwamen vaak overeen met zelfbeoordelingen en voorspelden ook emoties en stress.
UNESCO-rapport: tekort aan gegevens en risico's voor meisjes
Een UNESCO-rapport (gepubliceerd op 27 april) toont grote gaten in onderwijsgegevens uit armere landen en waarschuwt dat meisjes in sommige regio's nog steeds weinig toegang tot onderwijs hebben. Het pleit voor betere monitoring en meer rolmodellen.
Nieuwe methode voor recycling van lithium‑ionbatterijen
Onderzoekers van Rice University beschrijven het FJH‑ClO tweestapsproces om lithium en overgangsmetalen uit gebruikte lithium‑ionbatterijen terug te winnen. Het proces is zuurvrij, geeft minder afval en is aangetoond op laboratoriumschaal.