Sebuah makalah dari Stanford Institute for Human-Centered Artificial Intelligence (HAI) menemukan bahwa banyak model bahasa besar populer berkinerja buruk dalam bahasa selain Inggris. Dunia daring yang didominasi bahasa Inggris dan ketergantungan pengembang pada data berbahasa Inggris memperlebar ketimpangan ini.
Peneliti dan media melaporkan bahwa model publik, termasuk beberapa yang dikembangkan sebagian oleh perusahaan besar, dapat menghasilkan jawaban yang tidak sesuai bagi mayoritas global. Konsentrasi perusahaan AI dan data di wilayah kaya seperti Silicon Valley semakin memperlebar jurang tersebut, dan jutaan penutur bahasa seperti Kurdi dan Swahili praktis menjadi tidak diprioritaskan.
Studi lain menunjukkan bahwa teks multibahasa yang diambil dari web sering mengandung kesalahan terjemahan mesin, dan kontributor yang berniat baik kadang tidak memiliki keterampilan untuk memeriksa keakuratan. Para pengamat dan ahli mengusulkan langkah konkret: bekerja dengan komunitas yang tersisih, memvalidasi data multibahasa, dan bermitra dengan pengembang akar rumput untuk meninjau keluaran dan menjaga otentisitas budaya.
Kata-kata sulit
- ketimpangan — perbedaan besar dalam kesempatan atau hasil
- berkinerja — menghasilkan hasil atau menjalankan tugas tertentu
- konsentrasi — kumpulan atau penumpukan orang dan sumber daya
- jurang — jarak besar atau perbedaan yang memisahkan kelompok
- memvalidasi — memeriksa dan memastikan kebenaran atau keakuratan data
- tersisih — terpinggirkan atau tidak termasuk dalam kelompok utama
- otentisitas — keaslian atau kesesuaian dengan tradisi budaya
- multibahasa — menggunakan atau melibatkan lebih dari satu bahasa
Tips: arahkan kursor, fokus, atau ketuk kata yang disorot di dalam teks untuk melihat definisi singkat sambil membaca atau mendengarkan.
Pertanyaan diskusi
- Apakah menurut Anda penting bekerja dengan komunitas yang tersisih saat mengembangkan model bahasa? Jelaskan alasan singkat Anda.
- Bagaimana memvalidasi data multibahasa dapat membantu memperbaiki keluaran model menurut teks?
- Apa pengalaman Anda dengan terjemahan mesin yang salah, dan bagaimana itu memengaruhi pemahaman Anda terhadap teks atau budaya?
Artikel terkait
Peradangan Kaitan dengan Pilihan Bersosialisasi di Media Sosial
Studi menemukan orang dengan peradangan lebih tinggi cenderung berinteraksi lewat media sosial daripada bertemu langsung. Penelitian dipimpin oleh David Lee dari University at Buffalo dan dipublikasikan di Scientific Reports.
AI Mengubah Saran Setelah Pengungkapan Autisme
Studi Virginia Tech menemukan bahwa menyebut autisme mengubah nasihat model bahasa besar dan sering mengikuti stereotip umum. Peneliti memperingatkan bias dan mendorong pengembang membuat sistem lebih transparan agar pengguna dapat mengendalikan pengaruh identitas.