Onder leiding van Xiaoyan Bai en Chenhao Tan van de University of Chicago, met medewerking van MIT, Harvard University, University of Waterloo en Google DeepMind, onderzochten onderzoekers waarom taalmodellen moeite hebben met viercijferige vermenigvuldiging. Ze richtten zich op langeafstandsafhankelijkheden: het vasthouden van deelproducten en lopende totalen tijdens meerstapsberekeningen.
De studie vergeleek standaard fine-tuning met Implicit Chain of Thought (ICoT). Modellen met twee tot 12 lagen bereikten minder dan <1% nauwkeurigheid, terwijl het ICoT-model 100% behaalde. Analyse van de interne toestanden liet zien dat het ICoT-model tussentijdse waarden codeert en lopende totalen kon worden gedecodeerd uit verborgen toestanden.
Met een eenvoudig trainingsdoel dat het model leert lopende totalen bij te houden, steeg de nauwkeurigheid van een twee-laags model naar 99%. De onderzoekers concluderen dat gerichte architectuurkeuzes en trainingsdoelen meerstapsredenering mogelijk maken en dat dit belangrijk is voor betrouwbaar gebruik van AI.
Moeilijke woorden
- langeafstandsafhankelijkheid — verbinding tussen ver verwijderde delen in tekstlangeafstandsafhankelijkheden
- deelproduct — een tussenresultaat bij een vermenigvuldigingsstapdeelproducten
- meerstapsberekening — berekening met meerdere opeenvolgende stappenmeerstapsberekeningen
- lopend totaal — huidige som tijdens een berekeninglopende totalen
- nauwkeurigheid — hoe vaak het model het juiste antwoord geeft
- trainingsdoel — specifiek resultaat waar het model voor traint
- coderen — informatie intern opslaan in het modelcodeert
- decoderen — opnieuw aflezen van informatie uit verborgen toestandgedecodeerd
Tip: beweeg de muisaanwijzer over gemarkeerde woorden in het artikel, of tik erop om snelle definities te zien terwijl je leest of luistert.
Discussievragen
- Vind je het belangrijk dat modellen tussentijdse waarden bewaren tijdens berekeningen? Waarom?
- Wat lijkt jou moeilijker: gerichte architectuurkeuzes maken of een goed trainingsdoel bedenken? Leg kort uit.
- Hoe zou betrouwbare meerstapsredenering invloed kunnen hebben op dagelijks gebruik van AI?
Gerelateerde artikelen
Goedkope doekjes vinden lood in huis
Een nieuwe studie toont dat kleurveranderingen doekjes snel en goedkoop lood in huizen en auto’s kunnen aantonen. Onderzoekers testten de doekjes in woningen en voertuigen en vonden lood op veel oppervlakken; de methode is goedkoper dan laboratoriumtests.
Vetten in zuigelingenvoeding kunnen vroege leververvetting beïnvloeden
Een dierstudie met pasgeboren biggen toont dat het type vet in zuigelingenvoeding invloed kan hebben op vetophoping in de zich ontwikkelende lever. Voedingen met middellange-keten vetzuren leidden sneller tot tekenen van steatotische leverziekte.
Elektriciteit en internet blokkeren AI-toegang in Sub-Sahara Afrika
Onbetrouwbare elektriciteit en dure, trage internetverbindingen beperken het gebruik van kunstmatige intelligentie in Sub-Sahara Afrika. Daardoor hebben veel scholen, gezondheidscentra en startups weinig voordeel van AI.
Nieuwe AI-hulpmiddelen voor tuberculose getoond in Kopenhagen
Onderzoekers presenteerden op de Union World Conference on Lung Health (18-21 November) meerdere AI-hulpmiddelen voor opsporing en opvolging van tuberculose. De tools variëren van adem- en hoesttests tot kaarten en een röntgenhulpmiddel voor kinderen.