Onderzoekers van New York University, onder leiding van Anasse Bari met coauteur Binxu Huang, publiceerden de aanpak in Frontiers in Artificial Intelligence. Ze maakten een algoritmisch raamwerk dat als voorbewerkingsstap voor LLM's fungeert. Het doel is om LLM's een beknoptere en representatievere invoer te geven zodat de uiteindelijke samenvatting dichter bij de bron blijft.
In de eerste fase worden zinnen opgeschoond: alleen zelfstandige naamwoorden, werkwoorden en bijvoeglijke naamwoorden blijven over en samenhangende woordgroepen worden samengevoegd. Elke zin wordt omgezet in een vector die lexicale, semantische en thematische kenmerken combineert. Zinnen krijgen scores voor documentbrede centraliteit, sectieniveaubelang en afstemming op de samenvatting, en belangrijke delen krijgen extra gewicht.
In de tweede fase worden principes van vogelzwermgedrag toegepast zodat zinnen met vergelijkbare betekenis samenklonteren. Uit elke groep worden de hoogst scorende zinnen gekozen en herschikt. De onderzoekers testten de methode op meer dan 9,000 documenten en vonden een grotere feitelijke nauwkeurigheid dan bij LLM's zonder het raamwerk. Bari zegt: "Het doel is om de AI te helpen samenvattingen te maken die dichter bij het bronmateriaal blijven."
Moeilijke woorden
- algoritmisch — Op basis van een computerprogramma of algoritme werken
- raamwerk — Een set regels of structuur voor een systeem
- voorbewerkingsstap — Een bewerking die plaatsvindt vóór hoofdverwerking
- vector — Getallenrij die een tekst of zin representeert
- semantisch — Gaat over de betekenis van woorden of zinnensemantische
- centraliteit — Mate waarin iets belangrijk of centraal is
- vogelzwermgedrag — Bewegingen van groepen dieren die samenwerken
Tip: beweeg de muisaanwijzer over gemarkeerde woorden in het artikel, of tik erop om snelle definities te zien terwijl je leest of luistert.
Discussievragen
- Denk je dat een voorbewerkingsstap ook jouw werk of studie kan helpen? Waarom?
- Welke voordelen zie je van zinnen clusteren met vergelijkbare betekenis?
- Zou je vertrouwen op samenvattingen van AI die deze methode gebruiken? Leg kort uit.
Gerelateerde artikelen
Positieve emoties stimuleren dagelijkse creativiteit
Een studie van de University of Georgia onderzocht dagelijkse rapporten van meer dan 100 studenten. Positieve emoties hangen samen met meer creatieve activiteiten vandaag en morgen; autonomie, competentie en omgeving spelen ook een rol.
Monte Sierpe: kuilen in Peru mogelijk oud boekhoudsysteem
Een internationaal team stelt dat de 'Band of Holes' bij Monte Sierpe in zuidelijk Peru waarschijnlijk deel was van een inheems systeem voor boekhouding en handel. Onderzoekers gebruikten sedimentanalyse en dronefoto's en vonden sporen van mais en andere planten.
Hersenachtig weefsel gekweekt zonder dierlijke materialen
Wetenschappers kweekten functioneel hersenachtig weefsel zonder dierlijke materialen of biologische lagen. Het nieuwe PEG-scaffold ondersteunt gedoneerde cellen en maakt betrouwbare tests voor neurologische ziekten mogelijk.
Batterij uit de bodem voedt landbouwsensoren
Een spin-off van de University of Bath ontwikkelde Bactery, een batterij die energie oogst uit bodembacteriën om sensoren en IoT-apparaten op landbouwgrond van stroom te voorzien. Het apparaat is getest in Brazilië en de makers willen opschalen.