Un team della New York University, guidato da Anasse Bari con il coautore Binxu Huang, ha presentato un quadro algoritmico pubblicato su Frontiers in Artificial Intelligence. Il sistema è una fase di pre-elaborazione pensata per fornire ai modelli linguistici di grandi dimensioni (LLM) un input più conciso e rappresentativo, così da ridurre le informazioni false dette "allucinazioni".
Nel primo stadio le frasi del documento vengono pulite e mantenute nei termini essenziali; inoltre i termini composti restano uniti. Ogni frase è convertita in un vettore numerico che fonde caratteristiche lessicali, semantiche e tematiche. Le frasi ricevono punteggi per centralità a livello di documento, importanza nella sezione e allineamento con l'abstract; il metodo aumenta il punteggio per sezioni chiave come Introduction, Results e Conclusion.
Nella fase successiva si applicano i principi degli stormi: coesione, allineamento e separazione. Leader e follower emergono nei gruppi e da ogni stormo si selezionano le frasi con punteggio più alto. Le frasi scelte vengono riordinate e passate a un LLM che sintetizza un riassunto fedele al materiale sorgente. I test su oltre 9,000 documenti hanno mostrato una maggiore accuratezza fattuale rispetto agli LLM senza il quadro. Bari sottolinea che il sistema è una pre-elaborazione e non un concorrente degli LLM, e che il metodo può ridurre il rischio di allucinazioni ma non lo elimina.
Parole difficili
- quadro — sistema o insieme organizzato di elementi
- pre-elaborazione — lavoro fatto prima per preparare dati
- allucinazione — informazione falsa prodotta da un modelloallucinazioni
- vettore — sequenza numerica che rappresenta una frase
- centralità — importanza di una frase nel documento
- coesione — grado di unione tra elementi di un gruppo
- stormo — gruppo di elementi che si muove insiemestormi
- sintetizzare — riassumere informazioni principali in forma brevesintetizza
Suggerimento: passa il mouse o tocca le parole evidenziate nell’articolo per vedere definizioni rapide mentre leggi o ascolti.
Domande di discussione
- Pensi che una fase di pre-elaborazione come questa potrebbe aiutare quando scrivi riassunti o ricerche? Perché?
- Quale dei principi degli stormi (coesione, allineamento, separazione) ti sembra più utile per scegliere frasi importanti? Spiega brevemente.
- Il testo dice che il metodo può ridurre le allucinazioni ma non eliminarle. Quali limiti o problemi prevedi per questo approccio?
Articoli correlati
Rappresentanza nella scienza e fiducia pubblica
Uno studio pubblicato su Nature Human Behaviour mostra che la rappresentazione demografica degli scienziati influisce sulla fiducia del pubblico negli Stati Uniti. Gli autori suggeriscono che più inclusione potrebbe rafforzare la fiducia tra diversi gruppi sociali.