Uno studio mostra perché i modelli linguistici falliscono sulla moltiplicazione a quattro cifre. I ricercatori hanno confrontato la messa a punto standard con un metodo chiamato Implicit Chain of Thought (ICoT). Hanno studiato il problema delle dipendenze a lungo raggio, cioè la necessità di mantenere prodotti parziali e somme progressive.
Sotto la messa a punto standard, modelli con 2–12 livelli hanno ottenuto meno dell'1% di accuratezza. Invece il modello addestrato con ICoT ha risolto il compito. I ricercatori hanno poi aggiunto un obiettivo che insegna a tracciare le somme progressive e hanno migliorato molto anche i modelli semplici.
Parole difficili
- modello — programma che usa dati per fare previsionimodelli
- messa a punto — procedura per adattare o migliorare un sistema
- moltiplicazione — operazione matematica per calcolare prodotti
- dipendenza — relazione dove una parte dipende da un'altradipendenze
- prodotti parziali — risultati intermedi durante un calcolo più grande
- accuratezza — misura di quanto una risposta è corretta
Suggerimento: passa il mouse o tocca le parole evidenziate nell’articolo per vedere definizioni rapide mentre leggi o ascolti.
Domande di discussione
- Perché secondo te una moltiplicazione a quattro cifre è difficile per un modello?
- Hai mai fatto moltiplicazioni lunghe a mano o con la calcolatrice? Come ti senti quando le fai?
- Preferiresti un modello che spiega i passaggi (come tracciare somme progressive)? Perché?
Articoli correlati
AI per addestrare studenti di chirurgia alle suture
Ricercatori della Johns Hopkins hanno creato uno strumento di intelligenza artificiale che allena gli studenti di medicina nelle suture. L'AI fornisce feedback immediato confrontando i movimenti degli studenti con quelli degli esperti.
L'IA può apprendere valori culturali osservando le persone
Uno studio della University of Washington ha testato se l'intelligenza artificiale può imparare valori culturali osservando il comportamento umano. Agenti addestrati su dati di due gruppi hanno mostrato differenze nel comportamento altruistico.
Nuovo strumento a luce per misurare le cellule cerebrali
Ricercatori hanno sviluppato CaBLAM, uno strumento che usa la bioluminescenza per registrare l'attività dentro cellule cerebrali viventi. Permette registrazioni di ore senza luce esterna e funziona in modelli animali come topi e zebrafish.
Metodo ispirato agli stormi migliora i riassunti dell'AI
Ricercatori della New York University hanno creato un metodo che usa principi degli stormi di uccelli per scegliere frasi importanti e fornire input migliori ai modelli linguistici. Il sistema riduce le "allucinazioni" e migliora l'accuratezza dei riassunti.