Tim dari New York University, dipimpin oleh Anasse Bari dengan rekan penulis Binxu Huang, mengembangkan kerangka algoritmik sebagai langkah pra-proses untuk model bahasa besar (LLM). Tujuannya memberi LLM masukan yang lebih ringkas, beragam, dan representatif sebelum menghasilkan ringkasan akhir.
Metode ini memandang setiap kalimat sebagai "burung virtual." Kalimat dibersihkan dengan mempertahankan kata benda, kata kerja, dan kata sifat, lalu diubah menjadi vektor numerik yang menggabungkan fitur leksikal, semantik, dan topikal. Kalimat diberi skor untuk sentralitas, pentingnya pada bagian, dan keselarasan dengan abstrak. Bagian penting seperti pendahuluan, hasil, dan kesimpulan mendapat dorongan khusus.
Setelah itu diterapkan pengelompokan berdasarkan kohesi, keselarasan, dan pemisahan. Dari setiap klaster dipilih kalimat dengan skor tertinggi sehingga redundansi berkurang namun cakupan materi tetap terjaga. Pengujian pada lebih dari 9,000 dokumen menunjukkan ringkasan lebih akurat bila kerangka ini digabungkan dengan LLM. Bari menegaskan kerangka ini dimaksudkan sebagai pra-proses, bukan pesaing LLM, dan penulis mencatat metode ini mengurangi risiko halusinasi tetapi tidak menghilangkannya.
Kata-kata sulit
- kerangka — struktur atau rancangan kerja untuk suatu metodekerangka algoritmik
- pra-proses — langkah awal sebelum proses utama dijalankan
- vektor — representasi angka dari informasi teksvektor numerik
- sentralitas — ukur seberapa penting suatu kalimat
- keselarasan — kecocokan antara kalimat dengan abstrak
- pengelompokan — pengaturan item ke dalam kelompok berdasarkan kesamaan
- redundansi — pengulangan informasi yang tidak perlu
- halusinasi — informasi palsu yang dibuat model
Tips: arahkan kursor, fokus, atau ketuk kata yang disorot di dalam teks untuk melihat definisi singkat sambil membaca atau mendengarkan.
Pertanyaan diskusi
- Apakah menurut Anda pra-proses seperti ini penting saat membuat ringkasan? Jelaskan pendapat singkat Anda.
- Bagian mana (pendahuluan, hasil, kesimpulan) yang menurut Anda paling penting untuk dimasukkan ke ringkasan, dan mengapa?
- Apa masalah yang mungkin muncul jika redundansi dikurangi terlalu banyak dalam sebuah ringkasan?
Artikel terkait
Metode Ultrasound Baru Bantu Bedakan Kista dan Massa
Peneliti mengembangkan pemrosesan sinyal ultrasound yang membedakan massa berisi cairan dan massa padat lebih akurat. Uji awal menunjukkan deteksi benar 96% dibanding 67% dengan alat konvensional; penelitian dari Johns Hopkins ini didanai federal.
Calon Perempuan di Uganda Diserang Secara Daring
Dalam pemilu Januari 2026 beberapa calon perempuan Uganda menghadapi serangan online seperti gambar AI, deepfake, disinformasi, dan hinaan seksual. Teknologi memperkuat kekerasan yang sudah ada dan tidak ada undang-undang khusus untuk itu.
Peneliti Temukan Kerentanan di Pengelola Kata Sandi Cloud
Peneliti ETH Zurich menguji tiga pengelola kata sandi berbasis cloud dan menemukan beberapa serangan yang dapat mengakses atau mengubah kata sandi pengguna. Mereka memberi penyedia waktu untuk memperbaiki dan memberi rekomendasi keamanan.
Ilmuwan Afrika Selatan Pantau Kualitas Udara Waktu Nyata dengan Metode Fisika Partikel
Ilmuwan di Afrika Selatan mengadaptasi metode fisika partikel untuk sistem AI_r yang memantau kualitas udara waktu nyata menggunakan sensor murah, IoT, dan kecerdasan buatan. Proyek memasang 500 sensor di Sedibeng tahun depan dan mendapat dukungan internasional.