Uno studio mostra perché i modelli linguistici falliscono sulla moltiplicazione a quattro cifre. I ricercatori hanno confrontato la messa a punto standard con un metodo chiamato Implicit Chain of Thought (ICoT). Hanno studiato il problema delle dipendenze a lungo raggio, cioè la necessità di mantenere prodotti parziali e somme progressive.
Sotto la messa a punto standard, modelli con 2–12 livelli hanno ottenuto meno dell'1% di accuratezza. Invece il modello addestrato con ICoT ha risolto il compito. I ricercatori hanno poi aggiunto un obiettivo che insegna a tracciare le somme progressive e hanno migliorato molto anche i modelli semplici.
Parole difficili
- modello — programma che usa dati per fare previsionimodelli
- messa a punto — procedura per adattare o migliorare un sistema
- moltiplicazione — operazione matematica per calcolare prodotti
- dipendenza — relazione dove una parte dipende da un'altradipendenze
- prodotti parziali — risultati intermedi durante un calcolo più grande
- accuratezza — misura di quanto una risposta è corretta
Suggerimento: passa il mouse o tocca le parole evidenziate nell’articolo per vedere definizioni rapide mentre leggi o ascolti.
Domande di discussione
- Perché secondo te una moltiplicazione a quattro cifre è difficile per un modello?
- Hai mai fatto moltiplicazioni lunghe a mano o con la calcolatrice? Come ti senti quando le fai?
- Preferiresti un modello che spiega i passaggi (come tracciare somme progressive)? Perché?
Articoli correlati
L'intelligenza artificiale può stimare il rischio di ADHD nei bambini
Uno studio mostra che l’intelligenza artificiale può usare dati clinici di routine per stimare il rischio di ADHD anni prima della diagnosi. Lo strumento segnala bambini che meritano attenzione e chiede altri studi prima dell'uso routinario.
Un semplice tampone nasale per rilevare l’Alzheimer precoce
Uno studio su Nature Communications mostra che un tampone nasale può individuare cambi biologici legati all’Alzheimer prima che compaiano problemi di memoria. I ricercatori hanno raccolto cellule del naso e analizzato l’attività dei geni.
Persone con degenerazione maculare stimano l'arrivo delle auto
Uno studio con realtà virtuale ha confrontato adulti con degenerazione maculare legata all'età e adulti con visione normale nella stima del tempo di arrivo di un veicolo. I risultati mostrano performance simili e nessun vantaggio aggiuntivo dalla combinazione vista+suono.
Studio mostra come cambia l'attività del cervello durante il giorno
Nuovi metodi sperimentali e computazionali usati su topi rivelano, a singola cellula, uno spostamento dell'attività dal centro del cervello verso la corteccia nel corso del ciclo quotidiano. I ricercatori sperano di trovare firme della fatica adattabili anche a dati umani.