Penelitian yang dipublikasikan di Nature Human Behavior mengevaluasi kemampuan model generatif AI—termasuk ChatGPT, Claude, dan LLaMa—untuk menilai kepribadian dan aspek sehari-hari dari bahasa yang dibuat orang. Para peneliti meminta sistem membaca catatan video singkat harian atau rekaman yang lebih panjang tentang isi pikiran peserta, lalu menyusun jawaban kepribadian seolah mewakili tiap individu.
Data dikumpulkan dari lebih dari 160 orang di pengaturan kehidupan nyata dan di laboratorium. Hasil menunjukkan skor kepribadian yang diberikan AI sangat mirip dengan penilaian diri, dan seringkali lebih sesuai dengan penilaian diri dibanding penilaian teman atau keluarga. Metode analisis teks lama tidak mencapai performa yang sama.
Penilaian AI juga mampu memprediksi emosi harian, tingkat stres, perilaku sosial, serta apakah seseorang pernah didiagnosis dengan kondisi kesehatan mental atau mencari perawatan. Aidan Wright, penulis pertama studi dan profesor psikologi serta psikiatri di University of Michigan, menyatakan keterkejutan atas kekuatan asosiasi itu mengingat perbedaan sumber data.
Beberapa akademisi menyambut temuan ini: Chandra Sripada dan rekan menekankan bahwa bahasa membawa petunjuk psikologis, sementara peneliti lain melihat pembukaan perbatasan baru dalam pemahaman psikologi sehari-hari. Namun pertanyaan penting tetap ada, termasuk keterbatasan studi yang bergantung pada penilaian diri dan belum menguji langsung perbandingan AI dengan penilaian teman atau keluarga, serta perbedaan menurut kelompok demografis dan kemampuan AI dalam memprediksi hasil hidup utama.
- Publikasi: Nature Human Behavior
- Sumber penelitian: University of Michigan
Kata-kata sulit
- mengevaluasi — menilai atau menaksir kualitas dan kemampuan
- generatif — bersifat mampu menghasilkan konten atau keluaran baru
- kepribadian — cara khas seseorang berpikir dan berperilaku
- penilaian diri — penilaian seseorang tentang dirinya sendiri
- asosiasi — hubungan atau korelasi antara dua hal
- performa — tingkat hasil atau kinerja suatu sistem
- keterbatasan — batasan atau kekurangan dalam suatu studi
- demografis — berkaitan dengan karakteristik penduduk atau kelompok
- memprediksi — menebak atau memperkirakan kejadian di masa depan
Tips: arahkan kursor, fokus, atau ketuk kata yang disorot di dalam teks untuk melihat definisi singkat sambil membaca atau mendengarkan.
Pertanyaan diskusi
- Apa keuntungan dan risiko penggunaan model generatif AI untuk menilai kepribadian orang sehari-hari?
- Bagaimana ketergantungan studi pada penilaian diri bisa mempengaruhi keandalan hasil penelitian?
- Menurut Anda, aspek demografis apa yang penting untuk diuji lebih lanjut sebelum menerapkan penilaian AI secara luas?
Artikel terkait
Ringkasan Audio AI untuk Makalah Mars: Menarik tapi Rentan Salah
NotebookLM Google mengubah makalah penelitian tentang vulkanisme Mars menjadi ringkasan audio bergaya podcast yang mudah diikuti. Peneliti menemukan hasil yang menarik namun berisi kesalahan, sehingga pembacaan sumber asli tetap diperlukan.
Model Bahasa AI dan Pemahaman Dunia Nyata
Peneliti dari Brown University menguji apakah model bahasa AI bisa membedakan peristiwa yang umum, tidak mungkin, mustahil, atau tidak masuk akal. Mereka menggunakan metode untuk melihat keadaan internal model dan menemukan vektor plausibilitas yang sesuai dengan penilaian manusia.
Musik Langsung dan Kesejahteraan: Peran Efervescensi Kolektif
Sebuah studi menemukan bahwa menghadiri acara musik langsung meningkatkan kesejahteraan karena efervescensi kolektif—perasaan kebersamaan dan kesakralan dalam kerumunan. Temuan ini didukung oleh empat studi dan data dari peserta festival musik.