LingVo.club
Livello
Perché i modelli faticano a moltiplicare numeri a quattro cifre — Livello B1 — brown wooden blocks on white surface

Perché i modelli faticano a moltiplicare numeri a quattro cifreCEFR B1

29 dic 2025

Livello B1 – Intermedio
3 min
166 parole

Un gruppo guidato da Xiaoyan Bai e Chenhao Tan dell'University of Chicago, con collaboratori del MIT, Harvard, University of Waterloo e Google DeepMind, ha analizzato perché i modelli linguistici non riescono a moltiplicare numeri a quattro cifre. Il problema principale sono le dipendenze a lungo raggio: i modelli devono mantenere prodotti parziali e somme progressive per completare i calcoli multi-step.

Con la messa a punto standard, modelli con 2–12 livelli hanno raggiunto meno dell'1% di accuratezza. Al contrario, il modello addestrato con Implicit Chain of Thought (ICoT) ha ottenuto il 100% di accuratezza. Analizzando gli stati interni, i ricercatori hanno potuto decodificare le somme progressive negli stati nascosti del modello ICoT, prova che memorizzava i valori intermedi.

Inoltre, aggiungere un obiettivo di addestramento che insegna a tracciare le somme progressive ha portato un modello a 2 livelli al 99% di accuratezza, senza supervisione esplicita di chain-of-thought. Lo studio conclude che obiettivi mirati e segnali architetturali possono abilitare il ragionamento multi-step.

Parole difficili

  • dipendenzarelazione che richiede informazioni distanti nel testo
    dipendenze
  • prodottorisultato della moltiplicazione tra numeri
    prodotti
  • sommatotale ottenuto aggiungendo numeri uno dopo l'altro
    somme
  • messa a puntoprocesso di migliorare o adattare un modello
  • accuratezzapercentuale di risposte corrette del modello
  • obiettivoscopo o risultato che il modello deve raggiungere
    obiettivo di addestramento

Suggerimento: passa il mouse o tocca le parole evidenziate nell’articolo per vedere definizioni rapide mentre leggi o ascolti.

Domande di discussione

  • Perché è importante che un modello memorizzi valori intermedi nei calcoli a più passaggi? Spiega brevemente.
  • Credi che obiettivi mirati e segnali architetturali possano migliorare altri compiti oltre la matematica? Perché sì o no?

Articoli correlati