Un team della New York University, guidato da Anasse Bari con il coautore Binxu Huang, ha presentato un quadro algoritmico pubblicato su Frontiers in Artificial Intelligence. Il sistema è una fase di pre-elaborazione pensata per fornire ai modelli linguistici di grandi dimensioni (LLM) un input più conciso e rappresentativo, così da ridurre le informazioni false dette "allucinazioni".
Nel primo stadio le frasi del documento vengono pulite e mantenute nei termini essenziali; inoltre i termini composti restano uniti. Ogni frase è convertita in un vettore numerico che fonde caratteristiche lessicali, semantiche e tematiche. Le frasi ricevono punteggi per centralità a livello di documento, importanza nella sezione e allineamento con l'abstract; il metodo aumenta il punteggio per sezioni chiave come Introduction, Results e Conclusion.
Nella fase successiva si applicano i principi degli stormi: coesione, allineamento e separazione. Leader e follower emergono nei gruppi e da ogni stormo si selezionano le frasi con punteggio più alto. Le frasi scelte vengono riordinate e passate a un LLM che sintetizza un riassunto fedele al materiale sorgente. I test su oltre 9,000 documenti hanno mostrato una maggiore accuratezza fattuale rispetto agli LLM senza il quadro. Bari sottolinea che il sistema è una pre-elaborazione e non un concorrente degli LLM, e che il metodo può ridurre il rischio di allucinazioni ma non lo elimina.
Parole difficili
- quadro — sistema o insieme organizzato di elementi
- pre-elaborazione — lavoro fatto prima per preparare dati
- allucinazione — informazione falsa prodotta da un modelloallucinazioni
- vettore — sequenza numerica che rappresenta una frase
- centralità — importanza di una frase nel documento
- coesione — grado di unione tra elementi di un gruppo
- stormo — gruppo di elementi che si muove insiemestormi
- sintetizzare — riassumere informazioni principali in forma brevesintetizza
Suggerimento: passa il mouse o tocca le parole evidenziate nell’articolo per vedere definizioni rapide mentre leggi o ascolti.
Domande di discussione
- Pensi che una fase di pre-elaborazione come questa potrebbe aiutare quando scrivi riassunti o ricerche? Perché?
- Quale dei principi degli stormi (coesione, allineamento, separazione) ti sembra più utile per scegliere frasi importanti? Spiega brevemente.
- Il testo dice che il metodo può ridurre le allucinazioni ma non eliminarle. Quali limiti o problemi prevedi per questo approccio?
Articoli correlati
Due tipi di microglia controllano l'ansia nei topi
Ricercatori della University of Utah hanno scoperto due popolazioni di microglia che nei topi hanno effetti opposti sull'ansia. I risultati, pubblicati su Molecular Psychiatry, suggeriscono nuove possibili vie terapeutiche, ma le cure cliniche non sono imminenti.
L'ora del giorno può influenzare la chemioterapia per il glioblastoma
Ricerca mostra che il momento della somministrazione del farmaco temozolomide può cambiare la risposta nel glioblastoma. L'attività dell'enzima MGMT e la metilazione variano durante la giornata e possono influenzare diagnosi e trattamento.