Penelitian di University of Washington menguji apakah agen kecerdasan buatan dapat mempelajari nilai budaya dengan mengamati perilaku manusia, sebagaimana anak belajar dari contoh. Penulis menyebutkan pekerjaan sebelumnya yang menemukan anak usia 19 bulan dari rumah tangga Latino dan Asia lebih cenderung bersikap altruistik dibanding kelompok lain. Hasil penelitian ini dipublikasikan di PLOS One.
Peneliti merekrut 190 orang dewasa yang mengidentifikasi sebagai putih dan 110 yang mengidentifikasi sebagai Latino, lalu menggunakan data setiap kelompok untuk melatih agen AI terpisah. Agen dilatih dengan metode inverse reinforcement learning (IRL), di mana AI mengamati tindakan manusia dan menafsirkan tujuan serta penghargaan yang mendasari tindakan tersebut. Menurut Andrew Meltzoff (I‑LABS, UW), pendekatan ini mirip dengan cara orang tua memberi contoh perilaku kepada anak.
Dalam eksperimen utama, partisipan memainkan versi modifikasi permainan Overcooked. Pemain menyiapkan dan mengantarkan sup bawang sambil dapat melihat dapur lain; memberi bawang kepada pemain lain membantu mereka tetapi mengurangi jumlah sup yang dikirim sendiri. Kelompok Latino secara keseluruhan lebih sering menolong, dan agen yang dilatih pada data Latino menunjukkan perilaku lebih altruistik, termasuk dalam uji donasi. Rajesh Rao dari Paul G. Allen School menyoroti bahwa tidak tepat memprogram satu set nilai universal ke dalam AI. Para penulis menambahkan bahwa pendekatan ini mungkin dapat diskalakan jika pengembang menambah jumlah dan variasi data khusus budaya untuk penyetelan akhir, namun diperlukan penelitian lebih lanjut untuk menguji lebih banyak kelompok budaya, nilai yang saling bersaing, dan masalah dunia nyata. Penulis tambahan berasal dari UW dan San Diego State University; sumbernya University of Washington.
Kata-kata sulit
- altruistik — suka menolong orang lain tanpa mengharapkan balasanlebih altruistik
- menafsirkan — memberi makna atau menjelaskan sesuatu
- penghargaan — nilai atau imbalan yang diperoleh atas tindakan
- penyetelan — proses menyesuaikan model atau sistempenyetelan akhir
- merekrut — mengajak orang untuk bergabung menjadi peserta
- mengamati — melihat atau memperhatikan sesuatu dengan cermat
Tips: arahkan kursor, fokus, atau ketuk kata yang disorot di dalam teks untuk melihat definisi singkat sambil membaca atau mendengarkan.
Pertanyaan diskusi
- Apakah menurut Anda aman atau berisiko membiarkan AI mempelajari nilai budaya dari data manusia? Jelaskan alasanmu.
- Bagaimana pengembang bisa memastikan data budaya cukup beragam untuk penyetelan akhir AI? Beri contoh langkah praktis.
- Sebutkan contoh nilai yang mungkin saling bersaing dan sulit diajarkan pada AI; bagaimana seharusnya peneliti menanganinya?