Tim dari New York University, dipimpin oleh Anasse Bari dengan rekan penulis Binxu Huang, mengembangkan kerangka algoritmik sebagai langkah pra-proses untuk model bahasa besar (LLM). Tujuannya memberi LLM masukan yang lebih ringkas, beragam, dan representatif sebelum menghasilkan ringkasan akhir.
Metode ini memandang setiap kalimat sebagai "burung virtual." Kalimat dibersihkan dengan mempertahankan kata benda, kata kerja, dan kata sifat, lalu diubah menjadi vektor numerik yang menggabungkan fitur leksikal, semantik, dan topikal. Kalimat diberi skor untuk sentralitas, pentingnya pada bagian, dan keselarasan dengan abstrak. Bagian penting seperti pendahuluan, hasil, dan kesimpulan mendapat dorongan khusus.
Setelah itu diterapkan pengelompokan berdasarkan kohesi, keselarasan, dan pemisahan. Dari setiap klaster dipilih kalimat dengan skor tertinggi sehingga redundansi berkurang namun cakupan materi tetap terjaga. Pengujian pada lebih dari 9,000 dokumen menunjukkan ringkasan lebih akurat bila kerangka ini digabungkan dengan LLM. Bari menegaskan kerangka ini dimaksudkan sebagai pra-proses, bukan pesaing LLM, dan penulis mencatat metode ini mengurangi risiko halusinasi tetapi tidak menghilangkannya.
Kata-kata sulit
- kerangka — struktur atau rancangan kerja untuk suatu metodekerangka algoritmik
- pra-proses — langkah awal sebelum proses utama dijalankan
- vektor — representasi angka dari informasi teksvektor numerik
- sentralitas — ukur seberapa penting suatu kalimat
- keselarasan — kecocokan antara kalimat dengan abstrak
- pengelompokan — pengaturan item ke dalam kelompok berdasarkan kesamaan
- redundansi — pengulangan informasi yang tidak perlu
- halusinasi — informasi palsu yang dibuat model
Tips: arahkan kursor, fokus, atau ketuk kata yang disorot di dalam teks untuk melihat definisi singkat sambil membaca atau mendengarkan.
Pertanyaan diskusi
- Apakah menurut Anda pra-proses seperti ini penting saat membuat ringkasan? Jelaskan pendapat singkat Anda.
- Bagian mana (pendahuluan, hasil, kesimpulan) yang menurut Anda paling penting untuk dimasukkan ke ringkasan, dan mengapa?
- Apa masalah yang mungkin muncul jika redundansi dikurangi terlalu banyak dalam sebuah ringkasan?
Artikel terkait
Bonobo Dapat Berpura-pura dan Membayangkan Benda
Peneliti melaporkan kera besar bisa berimajinasi dan berpura-pura. Temuan dari tiga percobaan terkontrol dengan bonobo Kanzi, dipublikasikan di Science, menunjukkan kemampuan ini mungkin berasal dari leluhur bersama 6–9 juta tahun lalu.
Alat untuk Mengurangi Kebencian Partisan di Linimasa X
Peneliti membuat ekstensi yang menata ulang linimasa X untuk menurunkan unggahan bermusuhan tanpa menghapusnya atau bekerjasama langsung dengan platform. Percobaan menunjukkan pengurangan rasa permusuhan dan peningkatan rasa hangat antarpendukung partai.
Peneliti Mengamati Virus Flu Masuk ke Sel Hidup
Peneliti dari Swiss dan Jepang mengembangkan metode mikroskopi baru, ViViD-AFM, untuk melihat bagaimana virus influenza masuk ke sel manusia hidup. Mereka menemukan sel aktif menangkap virus dan metode ini berguna untuk riset obat dan vaksin.