Sebuah makalah dari Stanford Institute for Human-Centered Artificial Intelligence (HAI) menemukan bahwa banyak model bahasa besar populer berkinerja buruk dalam bahasa selain Inggris. Dunia daring yang didominasi bahasa Inggris dan ketergantungan pengembang pada data berbahasa Inggris memperlebar ketimpangan ini.
Peneliti dan media melaporkan bahwa model publik, termasuk beberapa yang dikembangkan sebagian oleh perusahaan besar, dapat menghasilkan jawaban yang tidak sesuai bagi mayoritas global. Konsentrasi perusahaan AI dan data di wilayah kaya seperti Silicon Valley semakin memperlebar jurang tersebut, dan jutaan penutur bahasa seperti Kurdi dan Swahili praktis menjadi tidak diprioritaskan.
Studi lain menunjukkan bahwa teks multibahasa yang diambil dari web sering mengandung kesalahan terjemahan mesin, dan kontributor yang berniat baik kadang tidak memiliki keterampilan untuk memeriksa keakuratan. Para pengamat dan ahli mengusulkan langkah konkret: bekerja dengan komunitas yang tersisih, memvalidasi data multibahasa, dan bermitra dengan pengembang akar rumput untuk meninjau keluaran dan menjaga otentisitas budaya.
Kata-kata sulit
- ketimpangan — perbedaan besar dalam kesempatan atau hasil
- berkinerja — menghasilkan hasil atau menjalankan tugas tertentu
- konsentrasi — kumpulan atau penumpukan orang dan sumber daya
- jurang — jarak besar atau perbedaan yang memisahkan kelompok
- memvalidasi — memeriksa dan memastikan kebenaran atau keakuratan data
- tersisih — terpinggirkan atau tidak termasuk dalam kelompok utama
- otentisitas — keaslian atau kesesuaian dengan tradisi budaya
- multibahasa — menggunakan atau melibatkan lebih dari satu bahasa
Tips: arahkan kursor, fokus, atau ketuk kata yang disorot di dalam teks untuk melihat definisi singkat sambil membaca atau mendengarkan.
Pertanyaan diskusi
- Apakah menurut Anda penting bekerja dengan komunitas yang tersisih saat mengembangkan model bahasa? Jelaskan alasan singkat Anda.
- Bagaimana memvalidasi data multibahasa dapat membantu memperbaiki keluaran model menurut teks?
- Apa pengalaman Anda dengan terjemahan mesin yang salah, dan bagaimana itu memengaruhi pemahaman Anda terhadap teks atau budaya?
Artikel terkait
SEWA: Sistem Peringatan Dini Satelit untuk Afrika
SEWA, sistem peringatan dini berbasis satelit, diluncurkan pada forum tingkat tinggi di Windhoek untuk memperkuat peringatan cuaca dan iklim. Sistem ini meningkatkan akses data dan membangun kapasitas untuk pemerintah, masyarakat sipil, dan komunitas rentan.
AI dan Foto Warga Temukan Nyamuk Anopheles stephensi di Madagaskar
Peneliti menggunakan kecerdasan buatan dan foto dari warga untuk mengidentifikasi apa yang mereka anggap sebagai deteksi pertama Anopheles stephensi di Madagaskar. Foto close-up diambil pada 2020 dan ditemukan kembali dua tahun kemudian.
Media Sosial: Manfaat dan Risiko Informasi
Media sosial memberi dukungan dan informasi, tetapi juga menyebarkan ujaran kebencian, kebohongan, dan bahaya nyata. Perubahan kebijakan dan teknologi—termasuk keputusan Meta Januari 2025 dan AI generatif—memperbesar manfaat sekaligus risiko.