Teamo ĉe New York University, gvidata de Anasse Bari kun kunautoro Binxu Huang, kreis algoritman kadron por helpi grandajn lingvajn modelojn (LLM-oj). La kadro funkcias kiel antaŭpretiga paŝo por longaj dokumentoj.
En la unua fazo frazoj estas purigitaj: oni konservas substantivojn, verboj kaj adjektivon kaj kunfandas multvortajn terminojn. Poste ĉiu frazo estas konvertita al numerika vektoro kun leksikaj kaj semantikaj trajtoj.
En la dua fazo la kadro uzas principojn de bird‑floka konduto por grupigi similajn frazojn kaj elekti la plej gravajn. Fine la elektitaj frazoj estas donitaj al LLM por generi resumon.
Malfacilaj vortoj
- kadro — strukturita metodo aŭ sistemo por laborokadron
- antaŭpretiga paŝo — paŝo antaŭ ol trakti grandajn dokumentojn
- purigi — forigi malutilajn aŭ nesencajn partojnpurigitaj
- vektoro — nombroserio por reprezenti datenojn aŭ informon
- trajto — karakterizaĵo aŭ kvalito de vorto aŭ tekstotrajtoj
- grupigi — meti frazojn aŭ objektojn en similajn grupojn
- resumo — mallonga priskribo de la ĉefaj punktojresumon
Konsilo: ŝovu la musmontrilon, fokusu aŭ tuŝu la reliefigitajn vortojn en la artikolo por vidi rapidajn difinojn dum legado aŭ aŭskultado.
Diskutaj demandoj
- Ĉu vi uzus automatan resumon por longaj dokumentoj? Kial aŭ kial ne?
- Kiu el la paŝoj ŝajnas al vi plej utila: purigado, konvertado aŭ grupigo? Mallonge klarigu.