Para peneliti mempublikasikan kerangka baru di jurnal Frontiers in Artificial Intelligence yang menggunakan pola perilaku kelompok burung untuk memperbaiki proses ringkasan oleh model bahasa besar (LLM). Tim di New York University, dipimpin Anasse Bari bersama Binxu Huang, merancang langkah pra-proses yang membuat masukan untuk LLM lebih ringkas, beragam, dan representatif.
Pertama, setiap kalimat dibersihkan dengan mempertahankan elemen penting dan menyatukan istilah multi-kata. Kalimat lalu diubah menjadi vektor numerik yang menggabungkan fitur leksikal, semantik, dan topikal. Kalimat diberi skor untuk sentralitas di seluruh dokumen, pentingnya pada tingkat bagian, dan keselarasan dengan abstrak. Bagian kunci diberi dorongan numerik, misalnya:
- Pendahuluan
- Hasil
- Kesimpulan
Kedua, diterapkan prinsip pengelompokan: kohesi, keselarasan, dan pemisahan. Dalam tiap klaster muncul pemimpin dan pengikut; hanya kalimat dengan skor tertinggi dari tiap kelompok yang dipilih. Kalimat terpilih disusun ulang lalu diserahkan ke LLM yang mensintesis ringkasan akhir. Pengujian pada lebih dari 9,000 dokumen menunjukkan kombinasi kerangka dan LLM menghasilkan ringkasan dengan akurasi faktual lebih tinggi dibandingkan LLM sendiri. Bari menekankan kerangka ini adalah pra-proses untuk membantu AI mendekati materi sumber, dan para penulis mencatat bahwa metode ini mengurangi risiko halusinasi tetapi tidak menghilangkannya.
Kata-kata sulit
- kerangka — susunan atau rencana kerja untuk suatu metode
- pra-proses — tindakan yang dilakukan sebelum tahap utama
- model bahasa besar — sistem AI yang memproses bahasa teksLLM
- vektor numerik — representasi angka untuk menggambarkan kalimat
- sentralitas — ukuran seberapa sentral suatu kalimat
- keselarasan — tingkat kesesuaian antara dua teks atau bagian
- halusinasi — informasi salah yang dibuat oleh model AI
Tips: arahkan kursor, fokus, atau ketuk kata yang disorot di dalam teks untuk melihat definisi singkat sambil membaca atau mendengarkan.
Pertanyaan diskusi
- Bagaimana menurut Anda langkah pra-proses dapat mengurangi risiko halusinasi pada LLM? Beri contoh singkat.
- Apakah ada potensi kelemahan jika hanya memilih satu kalimat terbaik dari tiap klaster? Jelaskan alasan Anda.
- Bagaimana pola perilaku kelompok burung bisa menginspirasi strategi pengelompokan teks dalam ringkasan otomatis?
Artikel terkait
Tangan bionik dengan kecerdasan buatan untuk genggaman alami
Peneliti University of Utah memasang sensor dan kecerdasan buatan pada prostesis sehingga tangan bionik berperilaku lebih mirip tangan asli. Hasilnya genggaman lebih aman, presisi bertambah, dan banyak tugas sehari-hari bisa dilakukan tanpa latihan lama.
Pemotongan Bantuan Global Mengguncang Layanan Kesehatan
Pada 2025, pemotongan besar bantuan internasional mulai Januari mengganggu layanan kesehatan dan bantuan kemanusiaan di banyak negara berpenghasilan rendah dan menengah. Dampak meliputi penutupan proyek, kekurangan obat, dan risiko peningkatan infeksi penyakit.
Unggahan Media Sosial sebagai Peringatan Awal Perpindahan Penduduk
Analisis unggahan media sosial dapat memberi peringatan dini tentang pergerakan penduduk saat krisis. Studi di EPJ Data Science menguji alat prediksi yang memakai data digital untuk menambah informasi saat survei sulit dikumpulkan.