Uno studio mostra perché i modelli linguistici falliscono sulla moltiplicazione a quattro cifre. I ricercatori hanno confrontato la messa a punto standard con un metodo chiamato Implicit Chain of Thought (ICoT). Hanno studiato il problema delle dipendenze a lungo raggio, cioè la necessità di mantenere prodotti parziali e somme progressive.
Sotto la messa a punto standard, modelli con 2–12 livelli hanno ottenuto meno dell'1% di accuratezza. Invece il modello addestrato con ICoT ha risolto il compito. I ricercatori hanno poi aggiunto un obiettivo che insegna a tracciare le somme progressive e hanno migliorato molto anche i modelli semplici.
Parole difficili
- modello — programma che usa dati per fare previsionimodelli
- messa a punto — procedura per adattare o migliorare un sistema
- moltiplicazione — operazione matematica per calcolare prodotti
- dipendenza — relazione dove una parte dipende da un'altradipendenze
- prodotti parziali — risultati intermedi durante un calcolo più grande
- accuratezza — misura di quanto una risposta è corretta
Suggerimento: passa il mouse o tocca le parole evidenziate nell’articolo per vedere definizioni rapide mentre leggi o ascolti.
Domande di discussione
- Perché secondo te una moltiplicazione a quattro cifre è difficile per un modello?
- Hai mai fatto moltiplicazioni lunghe a mano o con la calcolatrice? Come ti senti quando le fai?
- Preferiresti un modello che spiega i passaggi (come tracciare somme progressive)? Perché?
Articoli correlati
Antocianine delle ciliegie rallentano il cancro al seno
Ricercatori hanno trovato che composti naturali delle ciliegie dolci scure possono rallentare la crescita e la diffusione del carcinoma mammario triplo negativo in topi da laboratorio. I risultati mostrano effetti sulle metastasi e sui geni legati alla resistenza, ma servono altre ricerche.
Un metodo per rendere l'AI più sostenibile
Ricercatori propongono Federated Carbon Intelligence (FCI) per ridurre le emissioni dei data center e proteggere i server, collegando dati ambientali e stato delle macchine. Simulazioni mostrano riduzioni importanti e ora si punta a test reali.