LingVo.club
Niveau
Waarom taalmodellen moeite hebben met vermenigvuldigen — Niveau B1 — brown wooden blocks on white surface

Waarom taalmodellen moeite hebben met vermenigvuldigenCEFR B1

29 dec 2025

Niveau B1 – Middenniveau
3 min
145 woorden

Onder leiding van Xiaoyan Bai en Chenhao Tan van de University of Chicago, met medewerking van MIT, Harvard University, University of Waterloo en Google DeepMind, onderzochten onderzoekers waarom taalmodellen moeite hebben met viercijferige vermenigvuldiging. Ze richtten zich op langeafstandsafhankelijkheden: het vasthouden van deelproducten en lopende totalen tijdens meerstapsberekeningen.

De studie vergeleek standaard fine-tuning met Implicit Chain of Thought (ICoT). Modellen met twee tot 12 lagen bereikten minder dan <1% nauwkeurigheid, terwijl het ICoT-model 100% behaalde. Analyse van de interne toestanden liet zien dat het ICoT-model tussentijdse waarden codeert en lopende totalen kon worden gedecodeerd uit verborgen toestanden.

Met een eenvoudig trainingsdoel dat het model leert lopende totalen bij te houden, steeg de nauwkeurigheid van een twee-laags model naar 99%. De onderzoekers concluderen dat gerichte architectuurkeuzes en trainingsdoelen meerstapsredenering mogelijk maken en dat dit belangrijk is voor betrouwbaar gebruik van AI.

Moeilijke woorden

  • langeafstandsafhankelijkheidverbinding tussen ver verwijderde delen in tekst
    langeafstandsafhankelijkheden
  • deelproducteen tussenresultaat bij een vermenigvuldigingsstap
    deelproducten
  • meerstapsberekeningberekening met meerdere opeenvolgende stappen
    meerstapsberekeningen
  • lopend totaalhuidige som tijdens een berekening
    lopende totalen
  • nauwkeurigheidhoe vaak het model het juiste antwoord geeft
  • trainingsdoelspecifiek resultaat waar het model voor traint
  • codereninformatie intern opslaan in het model
    codeert
  • decoderenopnieuw aflezen van informatie uit verborgen toestand
    gedecodeerd

Tip: beweeg de muisaanwijzer over gemarkeerde woorden in het artikel, of tik erop om snelle definities te zien terwijl je leest of luistert.

Discussievragen

  • Vind je het belangrijk dat modellen tussentijdse waarden bewaren tijdens berekeningen? Waarom?
  • Wat lijkt jou moeilijker: gerichte architectuurkeuzes maken of een goed trainingsdoel bedenken? Leg kort uit.
  • Hoe zou betrouwbare meerstapsredenering invloed kunnen hebben op dagelijks gebruik van AI?

Gerelateerde artikelen