Sejumlah peneliti di North Carolina State University meneliti cara membuat model bahasa besar (LLM) lebih aman. Mereka ingin mengurangi keluaran yang tidak aman tanpa merusak kinerja model.
Tim menemukan dua tantangan utama: pelatihan keamanan bisa menurunkan akurasi, dan pemeriksaan keamanan yang sederhana kadang dapat dilewati oleh pengguna. Mereka mengusulkan ide baru dan menguji teknik pelatihan yang menahan bagian tertentu dari model saat fine-tuning.
Hasil awal menunjukkan pendekatan ini dapat mengurangi biaya penyelarasan dan tetap mempertahankan perilaku aman. Kode dan informasi tersedia secara daring.
Kata-kata sulit
- peneliti — orang yang melakukan studi atau penelitian ilmiah
- pelatihan — proses melatih model agar melakukan tugas tertentu
- akurasi — tingkat kebenaran atau ketepatan hasil model
- pemeriksaan — proses memeriksa sesuatu untuk menemukan masalah
- fine-tuning — penyesuaian tambahan pada model setelah pelatihan awal
- penyelarasan — proses membuat model mengikuti aturan atau tujuan
Tips: arahkan kursor, fokus, atau ketuk kata yang disorot di dalam teks untuk melihat definisi singkat sambil membaca atau mendengarkan.
Pertanyaan diskusi
- Apakah menurutmu penting mengurangi keluaran yang tidak aman? Mengapa?
- Bagaimana pelatihan keamanan bisa menjadi masalah menurut artikel?
- Pernahkah Anda melihat kode penelitian tersedia secara daring? Ceritakan singkat.
Artikel terkait
Peta Biologis Menghubungkan Sel dan Jaringan Otak
Sebuah studi di Nature Communications menggabungkan pemindaian otak, data genetik, dan pencitraan molekuler untuk menunjukkan bagaimana organisasi seluler dan molekuler membentuk jaringan otak besar. Temuan berpotensi mengubah studi kognisi dan gangguan mental.
Alat AI OSIA untuk Bimbingan Sekolah Menengah di Kamerun
OSIA adalah platform kecerdasan buatan yang dibuat oleh Frédéric Ngaba untuk membantu siswa sekolah menengah di Kamerun memilih jalur akademik dan karier. Platform ini menawarkan tutor virtual dalam 20 bahasa dan bank lebih dari 400 tes.
Sensor Rumah dan AI Pantau Perubahan Kesehatan pada Pasien ALS
Tim di University of Missouri menguji sistem yang menggabungkan sensor rumah dan kecerdasan buatan untuk melacak perubahan fungsi sehari-hari pada pasien ALS. Tujuannya mendeteksi masalah lebih awal dan membantu tindakan klinis cepat.