Para peneliti mempublikasikan kerangka baru di jurnal Frontiers in Artificial Intelligence yang menggunakan pola perilaku kelompok burung untuk memperbaiki proses ringkasan oleh model bahasa besar (LLM). Tim di New York University, dipimpin Anasse Bari bersama Binxu Huang, merancang langkah pra-proses yang membuat masukan untuk LLM lebih ringkas, beragam, dan representatif.
Pertama, setiap kalimat dibersihkan dengan mempertahankan elemen penting dan menyatukan istilah multi-kata. Kalimat lalu diubah menjadi vektor numerik yang menggabungkan fitur leksikal, semantik, dan topikal. Kalimat diberi skor untuk sentralitas di seluruh dokumen, pentingnya pada tingkat bagian, dan keselarasan dengan abstrak. Bagian kunci diberi dorongan numerik, misalnya:
- Pendahuluan
- Hasil
- Kesimpulan
Kedua, diterapkan prinsip pengelompokan: kohesi, keselarasan, dan pemisahan. Dalam tiap klaster muncul pemimpin dan pengikut; hanya kalimat dengan skor tertinggi dari tiap kelompok yang dipilih. Kalimat terpilih disusun ulang lalu diserahkan ke LLM yang mensintesis ringkasan akhir. Pengujian pada lebih dari 9,000 dokumen menunjukkan kombinasi kerangka dan LLM menghasilkan ringkasan dengan akurasi faktual lebih tinggi dibandingkan LLM sendiri. Bari menekankan kerangka ini adalah pra-proses untuk membantu AI mendekati materi sumber, dan para penulis mencatat bahwa metode ini mengurangi risiko halusinasi tetapi tidak menghilangkannya.
Kata-kata sulit
- kerangka — susunan atau rencana kerja untuk suatu metode
- pra-proses — tindakan yang dilakukan sebelum tahap utama
- model bahasa besar — sistem AI yang memproses bahasa teksLLM
- vektor numerik — representasi angka untuk menggambarkan kalimat
- sentralitas — ukuran seberapa sentral suatu kalimat
- keselarasan — tingkat kesesuaian antara dua teks atau bagian
- halusinasi — informasi salah yang dibuat oleh model AI
Tips: arahkan kursor, fokus, atau ketuk kata yang disorot di dalam teks untuk melihat definisi singkat sambil membaca atau mendengarkan.
Pertanyaan diskusi
- Bagaimana menurut Anda langkah pra-proses dapat mengurangi risiko halusinasi pada LLM? Beri contoh singkat.
- Apakah ada potensi kelemahan jika hanya memilih satu kalimat terbaik dari tiap klaster? Jelaskan alasan Anda.
- Bagaimana pola perilaku kelompok burung bisa menginspirasi strategi pengelompokan teks dalam ringkasan otomatis?
Artikel terkait
Bonobo Dapat Berpura-pura dan Membayangkan Benda
Peneliti melaporkan kera besar bisa berimajinasi dan berpura-pura. Temuan dari tiga percobaan terkontrol dengan bonobo Kanzi, dipublikasikan di Science, menunjukkan kemampuan ini mungkin berasal dari leluhur bersama 6–9 juta tahun lalu.
Alat untuk Mengurangi Kebencian Partisan di Linimasa X
Peneliti membuat ekstensi yang menata ulang linimasa X untuk menurunkan unggahan bermusuhan tanpa menghapusnya atau bekerjasama langsung dengan platform. Percobaan menunjukkan pengurangan rasa permusuhan dan peningkatan rasa hangat antarpendukung partai.
Peneliti Mengamati Virus Flu Masuk ke Sel Hidup
Peneliti dari Swiss dan Jepang mengembangkan metode mikroskopi baru, ViViD-AFM, untuk melihat bagaimana virus influenza masuk ke sel manusia hidup. Mereka menemukan sel aktif menangkap virus dan metode ini berguna untuk riset obat dan vaksin.