Onderzoekers van New York University, onder leiding van Anasse Bari met coauteur Binxu Huang, publiceerden de aanpak in Frontiers in Artificial Intelligence. Ze maakten een algoritmisch raamwerk dat als voorbewerkingsstap voor LLM's fungeert. Het doel is om LLM's een beknoptere en representatievere invoer te geven zodat de uiteindelijke samenvatting dichter bij de bron blijft.
In de eerste fase worden zinnen opgeschoond: alleen zelfstandige naamwoorden, werkwoorden en bijvoeglijke naamwoorden blijven over en samenhangende woordgroepen worden samengevoegd. Elke zin wordt omgezet in een vector die lexicale, semantische en thematische kenmerken combineert. Zinnen krijgen scores voor documentbrede centraliteit, sectieniveaubelang en afstemming op de samenvatting, en belangrijke delen krijgen extra gewicht.
In de tweede fase worden principes van vogelzwermgedrag toegepast zodat zinnen met vergelijkbare betekenis samenklonteren. Uit elke groep worden de hoogst scorende zinnen gekozen en herschikt. De onderzoekers testten de methode op meer dan 9,000 documenten en vonden een grotere feitelijke nauwkeurigheid dan bij LLM's zonder het raamwerk. Bari zegt: "Het doel is om de AI te helpen samenvattingen te maken die dichter bij het bronmateriaal blijven."
Moeilijke woorden
- algoritmisch — Op basis van een computerprogramma of algoritme werken
- raamwerk — Een set regels of structuur voor een systeem
- voorbewerkingsstap — Een bewerking die plaatsvindt vóór hoofdverwerking
- vector — Getallenrij die een tekst of zin representeert
- semantisch — Gaat over de betekenis van woorden of zinnensemantische
- centraliteit — Mate waarin iets belangrijk of centraal is
- vogelzwermgedrag — Bewegingen van groepen dieren die samenwerken
Tip: beweeg de muisaanwijzer over gemarkeerde woorden in het artikel, of tik erop om snelle definities te zien terwijl je leest of luistert.
Discussievragen
- Denk je dat een voorbewerkingsstap ook jouw werk of studie kan helpen? Waarom?
- Welke voordelen zie je van zinnen clusteren met vergelijkbare betekenis?
- Zou je vertrouwen op samenvattingen van AI die deze methode gebruiken? Leg kort uit.
Gerelateerde artikelen
Egypte ontwikkelt twee systemen tegen stof op zonnepanelen
Onderzoekers in Egypte maakten twee door de natuur geïnspireerde systemen om stof van zonnepanelen te verwijderen. Veldproeven tonen lagere opbrengstverliezen en het bedrijf van ingenieur Hossam Mohamed begint met commerciële plaatsingen in Caïro en Giza.
AI helpt tabaksmarketing tegen jongeren tegengaan
Tijdens een conferentie in Dublin zeiden experts dat AI kan helpen voorkomen dat tabaksbedrijven jongeren online gericht benaderen. Voorbeelden uit Indonesië, India en Mexico laten zien hoe AI marketing opspoort en beleidsmakers informeert.
Fluorescentie helpt celcyclus van Toxoplasma te begrijpen
Onderzoekers volgden met een aangepast fluorescerend afbeeldingssysteem de groei van Toxoplasma gondii in realtime. Ze vonden een eiwit, PCNA1, waarmee ze de celcyclus in kaart brachten en zoeken nu naar zwakke plekken voor medicijnen.