Uno studio mostra perché i modelli linguistici falliscono sulla moltiplicazione a quattro cifre. I ricercatori hanno confrontato la messa a punto standard con un metodo chiamato Implicit Chain of Thought (ICoT). Hanno studiato il problema delle dipendenze a lungo raggio, cioè la necessità di mantenere prodotti parziali e somme progressive.
Sotto la messa a punto standard, modelli con 2–12 livelli hanno ottenuto meno dell'1% di accuratezza. Invece il modello addestrato con ICoT ha risolto il compito. I ricercatori hanno poi aggiunto un obiettivo che insegna a tracciare le somme progressive e hanno migliorato molto anche i modelli semplici.
Parole difficili
- modello — programma che usa dati per fare previsionimodelli
- messa a punto — procedura per adattare o migliorare un sistema
- moltiplicazione — operazione matematica per calcolare prodotti
- dipendenza — relazione dove una parte dipende da un'altradipendenze
- prodotti parziali — risultati intermedi durante un calcolo più grande
- accuratezza — misura di quanto una risposta è corretta
Suggerimento: passa il mouse o tocca le parole evidenziate nell’articolo per vedere definizioni rapide mentre leggi o ascolti.
Domande di discussione
- Perché secondo te una moltiplicazione a quattro cifre è difficile per un modello?
- Hai mai fatto moltiplicazioni lunghe a mano o con la calcolatrice? Come ti senti quando le fai?
- Preferiresti un modello che spiega i passaggi (come tracciare somme progressive)? Perché?
Articoli correlati
Gli USA presentano la "America First Global Health Strategy"
Il 18 settembre gli Stati Uniti hanno lanciato la America First Global Health Strategy, che punta a contenere epidemie, rafforzare relazioni bilaterali e promuovere innovazione. Richiede co-investimenti dai paesi a basso e medio reddito e suscita allarme tra gli esperti.
Nuovo strumento a luce per misurare le cellule cerebrali
Ricercatori hanno sviluppato CaBLAM, uno strumento che usa la bioluminescenza per registrare l'attività dentro cellule cerebrali viventi. Permette registrazioni di ore senza luce esterna e funziona in modelli animali come topi e zebrafish.