Tim dari University of Zurich, termasuk Federico Germani dan Giovanni Spitale, meneliti bagaimana identitas pengarang memengaruhi penilaian large language models. Mereka menguji empat model populer: OpenAI o3-mini, Deepseek Reasoner, xAI Grok 2, dan Mistral. Pertama, setiap model menghasilkan lima puluh pernyataan naratif pada 24 topik kontroversial. Selanjutnya para peneliti mengumpulkan 192’000 penilaian untuk dianalisis.
Hasil menunjukkan bahwa saat tidak ada informasi tentang sumber, model-model itu memiliki tingkat kesepakatan tinggi, di atas 90%. Namun pola berubah setelah peneliti menambahkan sumber fiksi. Menyebut identitas pengarang menimbulkan bias tersembunyi dan menurunkan kesepakatan, walau teks tidak berubah.
Salah satu temuan penting adalah bias anti-Cina yang kuat di semua model. Deepseek, misalnya, mengurangi kesepakatan hingga 75% pada topik kedaulatan Taiwan karena asumsi tentang pandangan orang Cina. Para peneliti memperingatkan bahwa bias semacam ini dapat memengaruhi moderasi konten, perekrutan, penelaahan akademik, dan jurnalisme, dan mereka menyerukan transparansi serta tata kelola.
Kata-kata sulit
- menilai — memberikan nilai atau penilaian terhadap sesuatu.
- bias — penilaian yang tidak adil terhadap sesuatu.bias nampak, bias sistematis
- transparansi — kejelasan dalam proses atau informasi.
- ketidakpastian — keadaan tidak yakin atau ragu.
- mengungkapkan — menyatakan atau menunjukkan sesuatu.
- pengawasan — proses memantau untuk mencegah masalah.
Tips: arahkan kursor, fokus, atau ketuk kata yang disorot di dalam teks untuk melihat definisi singkat sambil membaca atau mendengarkan.
Pertanyaan diskusi
- Apa pandangan Anda tentang penggunaan AI dalam moderasi konten?
- Bagaimana bias dapat mempengaruhi keputusan dalam perekrutan?
- Seberapa penting transparansi dalam penggunaan teknologi AI?
- Apa yang bisa dilakukan untuk mengurangi bias dalam model AI?
Artikel terkait
Pterosaurus Mengembangkan Penerbangan dengan Cepat
Studi baru memakai CT scan untuk melihat rongga otak pterosaurus dan menemukan bahwa kemampuan terbang berkembang pesat sejak asal-usul kelompok itu. Peneliti membandingkan otak pterosaurus dengan kerabat tak terbang dan hewan purba lain.
Sensor Rumah dan AI Pantau Perubahan Kesehatan pada Pasien ALS
Tim di University of Missouri menguji sistem yang menggabungkan sensor rumah dan kecerdasan buatan untuk melacak perubahan fungsi sehari-hari pada pasien ALS. Tujuannya mendeteksi masalah lebih awal dan membantu tindakan klinis cepat.