Tim dari University of Zurich, termasuk Federico Germani dan Giovanni Spitale, meneliti bagaimana identitas pengarang memengaruhi penilaian large language models. Mereka menguji empat model populer: OpenAI o3-mini, Deepseek Reasoner, xAI Grok 2, dan Mistral. Pertama, setiap model menghasilkan lima puluh pernyataan naratif pada 24 topik kontroversial. Selanjutnya para peneliti mengumpulkan 192’000 penilaian untuk dianalisis.
Hasil menunjukkan bahwa saat tidak ada informasi tentang sumber, model-model itu memiliki tingkat kesepakatan tinggi, di atas 90%. Namun pola berubah setelah peneliti menambahkan sumber fiksi. Menyebut identitas pengarang menimbulkan bias tersembunyi dan menurunkan kesepakatan, walau teks tidak berubah.
Salah satu temuan penting adalah bias anti-Cina yang kuat di semua model. Deepseek, misalnya, mengurangi kesepakatan hingga 75% pada topik kedaulatan Taiwan karena asumsi tentang pandangan orang Cina. Para peneliti memperingatkan bahwa bias semacam ini dapat memengaruhi moderasi konten, perekrutan, penelaahan akademik, dan jurnalisme, dan mereka menyerukan transparansi serta tata kelola.
Kata-kata sulit
- menilai — memberikan nilai atau penilaian terhadap sesuatu.
- bias — penilaian yang tidak adil terhadap sesuatu.bias nampak, bias sistematis
- transparansi — kejelasan dalam proses atau informasi.
- ketidakpastian — keadaan tidak yakin atau ragu.
- mengungkapkan — menyatakan atau menunjukkan sesuatu.
- pengawasan — proses memantau untuk mencegah masalah.
Tips: arahkan kursor, fokus, atau ketuk kata yang disorot di dalam teks untuk melihat definisi singkat sambil membaca atau mendengarkan.
Pertanyaan diskusi
- Apa pandangan Anda tentang penggunaan AI dalam moderasi konten?
- Bagaimana bias dapat mempengaruhi keputusan dalam perekrutan?
- Seberapa penting transparansi dalam penggunaan teknologi AI?
- Apa yang bisa dilakukan untuk mengurangi bias dalam model AI?
Artikel terkait
AI Mengubah Saran Setelah Pengungkapan Autisme
Studi Virginia Tech menemukan bahwa menyebut autisme mengubah nasihat model bahasa besar dan sering mengikuti stereotip umum. Peneliti memperingatkan bias dan mendorong pengembang membuat sistem lebih transparan agar pengguna dapat mengendalikan pengaruh identitas.
AI Mempercepat Diagnostik Medis di Sub-Sahara Afrika
Kecerdasan buatan kini dipakai untuk diagnosis cepat di beberapa bagian sub-Sahara Afrika, termasuk deteksi malaria dan interpretasi rontgen. Proyek awal menunjukkan pengurangan pemberian antibiotik tidak tepat dan komplikasi malaria, namun regulasi dan privasi tetap penting.
AI melawan pemasaran tembakau yang menargetkan anak muda
Di konferensi tentang pengendalian tembakau para ahli mengatakan AI bisa membantu menghentikan perusahaan tembakau yang menargetkan anak muda secara daring. Media sosial dan produk baru dianggap menarik generasi muda, dan negara miskin menanggung beban terbesar.
Peneliti Mengamati Virus Flu Masuk ke Sel Hidup
Peneliti dari Swiss dan Jepang mengembangkan metode mikroskopi baru, ViViD-AFM, untuk melihat bagaimana virus influenza masuk ke sel manusia hidup. Mereka menemukan sel aktif menangkap virus dan metode ini berguna untuk riset obat dan vaksin.