Un gruppo della New York University guidato da Anasse Bari e con il coautore Binxu Huang ha creato un metodo che prepara il testo prima dei modelli linguistici di grandi dimensioni (LLM). L'obiettivo è dare agli LLM input più concisi, diversificati e rappresentativi, così i riassunti sono più vicini al testo originale.
Nel primo passo le frasi si puliscono: si mantengono nomi, verbi e aggettivi e si uniscono termini composti. Ogni frase viene poi trasformata in un vettore numerico, cioè in un numero che rappresenta il significato della frase.
Nella seconda fase si applicano i principi degli stormi: coesione, allineamento e separazione. Si formano gruppi con leader e follower, si scelgono le frasi migliori e si passa il risultato a un LLM per creare il riassunto finale.
Parole difficili
- metodo — procedura o modo per fare qualcosa
- conciso — breve e chiaro, senza parole extraconcisi
- diversificato — con varietà, non tutti ugualidiversificati
- rappresentativo — che mostra bene le caratteristiche principalirappresentativi
- vettore numerico — serie di numeri che rappresentano significato
- coesione — forza che mantiene insieme parti diverse
- allineamento — azione di mettere in fila o accordo
Suggerimento: passa il mouse o tocca le parole evidenziate nell’articolo per vedere definizioni rapide mentre leggi o ascolti.
Domande di discussione
- Ti sembra utile avere riassunti più vicini al testo originale? Perché?
- Provi a mantenere solo nomi, verbi e aggettivi quando riassumi? Perché sì o no?
- Preferisci riassunti brevi o dettagliati? Spiega brevemente.
Articoli correlati
Dubioza Kolektiv pubblica «Yebiga», critica l'intelligenza artificiale
La band bosniaca Dubioza Koleektiv ha pubblicato la canzone «Yebiga», che critica la dipendenza dall'intelligenza artificiale e avverte del rischio di una tecnocrazia. Il video usa immagini satiriche e richiama il personaggio HEPEK.