Perché i modelli faticano a moltiplicare numeri a quattro cifre — Italiano Livello B1

Un gruppo guidato da Xiaoyan Bai e Chenhao Tan dell'University of Chicago, con collaboratori del MIT, Harvard, University of Waterloo e Google DeepMind, ha analizzato perché i modelli linguistici non riescono a moltiplicare numeri a quattro cifre. Il problema principale sono le dipendenze a lungo raggio: i modelli devono mantenere prodotti parziali e somme progressive per completare i calcoli multi-step.

Con la messa a punto standard, modelli con 2–12 livelli hanno raggiunto meno dell'1% di accuratezza. Al contrario, il modello addestrato con Implicit Chain of Thought (ICoT) ha ottenuto il 100% di accuratezza. Analizzando gli stati interni, i ricercatori hanno potuto decodificare le somme progressive negli stati nascosti del modello ICoT, prova che memorizzava i valori intermedi.

Inoltre, aggiungere un obiettivo di addestramento che insegna a tracciare le somme progressive ha portato un modello a 2 livelli al 99% di accuratezza, senza supervisione esplicita di chain-of-thought. Lo studio conclude che obiettivi mirati e segnali architetturali possono abilitare il ragionamento multi-step.

Parole difficili

dipendenza — relazione che richiede informazioni distanti nel testo

dipendenze

prodotto — risultato della moltiplicazione tra numeri

prodotti

somma — totale ottenuto aggiungendo numeri uno dopo l'altro

somme

messa a punto — processo di migliorare o adattare un modello

accuratezza — percentuale di risposte corrette del modello

obiettivo — scopo o risultato che il modello deve raggiungere

obiettivo di addestramento

Suggerimento: passa il mouse o tocca le parole evidenziate nell’articolo per vedere definizioni rapide mentre leggi o ascolti.

Tofersen rallenta la forma genetica di SLA

Uno studio a lungo termine mostra che tofersen, un farmaco per la forma genetica SOD1 della sclerosi laterale amiotrofica, può rallentare la progressione e in alcuni pazienti portare a miglioramenti duraturi.

Livello

Leggi

8 dic 2025

OLED nanometrici all'ETH Zurich

Ricercatori dell'ETH Zurich hanno creato pixel OLED su scala nanometrica, molto più piccoli dei pixel attuali. I dispositivi possono servire per occhiali ad altissima risoluzione e per microscopi, e lo studio è pubblicato su Nature Photonics.

Livello

Leggi

26 gen 2026

Il grasso beige regola la pressione sanguigna

Una ricerca su topi mostra che il grasso beige aiuta a mantenere i vasi flessibili e la pressione bassa. La perdita dell'identità beige attiva l'enzima QSOX1 e porta a vasi rigidi e ipertensione.

Livello

Leggi

19 nov 2025

AI e foto di cittadini identificano Anopheles stephensi a Madagascar

Ricercatori hanno usato l'intelligenza artificiale e foto inviate da cittadini per identificare quello che ritengono sia il primo Anopheles stephensi a Madagascar. L'OMS avverte che questa specie rappresenta una minaccia per il controllo della malaria in Africa.

Livello

Leggi

8 lug 2025

Bambini in Camerun imparano programmazione e robotica

Durante le vacanze estive molte famiglie in Camerun iscrivono i figli a corsi di programmazione, robotica e intelligenza artificiale. I campi estivi includono dimostrazioni, progetti pratici e avviano club tecnologici nelle scuole.

Livello

Leggi

Perché i modelli faticano a moltiplicare numeri a quattro cifre^{CEFR B1}

Parole difficili

Domande di discussione

Articoli correlati

Tofersen rallenta la forma genetica di SLA

OLED nanometrici all'ETH Zurich

Il grasso beige regola la pressione sanguigna

AI e foto di cittadini identificano Anopheles stephensi a Madagascar

Bambini in Camerun imparano programmazione e robotica

Perché i modelli faticano a moltiplicare numeri a quattro cifre CEFR B1

Parole difficili

Domande di discussione

Articoli correlati

Tofersen rallenta la forma genetica di SLA

OLED nanometrici all'ETH Zurich

Il grasso beige regola la pressione sanguigna

AI e foto di cittadini identificano Anopheles stephensi a Madagascar

Bambini in Camerun imparano programmazione e robotica

Perché i modelli faticano a moltiplicare numeri a quattro cifre^{CEFR B1}