Penelitian yang dipublikasikan di Nature Human Behavior mengevaluasi kemampuan model generatif AI—termasuk ChatGPT, Claude, dan LLaMa—untuk menilai kepribadian dan aspek sehari-hari dari bahasa yang dibuat orang. Para peneliti meminta sistem membaca catatan video singkat harian atau rekaman yang lebih panjang tentang isi pikiran peserta, lalu menyusun jawaban kepribadian seolah mewakili tiap individu.
Data dikumpulkan dari lebih dari 160 orang di pengaturan kehidupan nyata dan di laboratorium. Hasil menunjukkan skor kepribadian yang diberikan AI sangat mirip dengan penilaian diri, dan seringkali lebih sesuai dengan penilaian diri dibanding penilaian teman atau keluarga. Metode analisis teks lama tidak mencapai performa yang sama.
Penilaian AI juga mampu memprediksi emosi harian, tingkat stres, perilaku sosial, serta apakah seseorang pernah didiagnosis dengan kondisi kesehatan mental atau mencari perawatan. Aidan Wright, penulis pertama studi dan profesor psikologi serta psikiatri di University of Michigan, menyatakan keterkejutan atas kekuatan asosiasi itu mengingat perbedaan sumber data.
Beberapa akademisi menyambut temuan ini: Chandra Sripada dan rekan menekankan bahwa bahasa membawa petunjuk psikologis, sementara peneliti lain melihat pembukaan perbatasan baru dalam pemahaman psikologi sehari-hari. Namun pertanyaan penting tetap ada, termasuk keterbatasan studi yang bergantung pada penilaian diri dan belum menguji langsung perbandingan AI dengan penilaian teman atau keluarga, serta perbedaan menurut kelompok demografis dan kemampuan AI dalam memprediksi hasil hidup utama.
- Publikasi: Nature Human Behavior
- Sumber penelitian: University of Michigan
Kata-kata sulit
- mengevaluasi — menilai atau menaksir kualitas dan kemampuan
- generatif — bersifat mampu menghasilkan konten atau keluaran baru
- kepribadian — cara khas seseorang berpikir dan berperilaku
- penilaian diri — penilaian seseorang tentang dirinya sendiri
- asosiasi — hubungan atau korelasi antara dua hal
- performa — tingkat hasil atau kinerja suatu sistem
- keterbatasan — batasan atau kekurangan dalam suatu studi
- demografis — berkaitan dengan karakteristik penduduk atau kelompok
- memprediksi — menebak atau memperkirakan kejadian di masa depan
Tips: arahkan kursor, fokus, atau ketuk kata yang disorot di dalam teks untuk melihat definisi singkat sambil membaca atau mendengarkan.
Pertanyaan diskusi
- Apa keuntungan dan risiko penggunaan model generatif AI untuk menilai kepribadian orang sehari-hari?
- Bagaimana ketergantungan studi pada penilaian diri bisa mempengaruhi keandalan hasil penelitian?
- Menurut Anda, aspek demografis apa yang penting untuk diuji lebih lanjut sebelum menerapkan penilaian AI secara luas?
Artikel terkait
AI dan risiko bagi komunitas LGBTQ+
Kecerdasan buatan semakin hadir, tetapi data dan desain model dapat menghasilkan bias terhadap orang LGBTQ+. Advokat meminta perlindungan lebih kuat, kerja sama dengan pengembang, dan larangan pada sistem yang mendeteksi atau mengklasifikasi gender.
AI bantu layanan kesehatan di Sudan
Sistem kesehatan Sudan tertekan setelah hampir dua tahun perang. WHO memperingatkan kekurangan staf dan obat. Pejabat kesehatan mengatakan Sudan mulai memakai kecerdasan buatan untuk membantu perawatan di tempat layanan tradisional tidak lagi menjangkau.
AI Mempercepat Diagnostik Medis di Sub-Sahara Afrika
Kecerdasan buatan kini dipakai untuk diagnosis cepat di beberapa bagian sub-Sahara Afrika, termasuk deteksi malaria dan interpretasi rontgen. Proyek awal menunjukkan pengurangan pemberian antibiotik tidak tepat dan komplikasi malaria, namun regulasi dan privasi tetap penting.