Sistem AI Sulit Mengenal Bahasa AfrikaCEFR B1
20 Apr 2026
Diadaptasi dari Guest Contributor, Global Voices • CC BY 3.0
Foto oleh Zulfugar Karimov, Unsplash
Sistem AI yang digunakan untuk moderasi konten sering tidak memahami banyak bahasa yang dipakai di Afrika. Seorang pekerja di pusat TikTok di Kenya mengatakan ia sering menonton video yang tidak dimengerti karena memakai bahasa seperti Luo, Dholuo, Kikuyu, dan Dinka. Sebuah studi 2025 menemukan hanya 42 bahasa Afrika muncul secara berarti dalam model besar, dan hanya empat bahasa—Amharic, Swahili, Afrikaans, dan Malagasy—yang ditangani secara konsisten.
Ketergantungan pada data berbahasa Inggris menyebabkan kesalahan positif dan negatif. Contohnya, seorang kreator Kenya, Jackson Busolo, menemukan akunnya dihapus pada Februari 2025 dan kemudian dikembalikan. Antara Januari dan Maret 2025 TikTok menghapus lebih dari 450,000 video dari Kenya dan melarang lebih dari 43,000 akun; pada kuartal kedua penghapusan meningkat menjadi 592,000.
Ada upaya memperbaiki situasi: kelompok seperti AfricaNLP dan tim di Pretoria, Nairobi, serta Addis Ababa membangun kumpulan data. Workshop AfricaNLP 2025 membahas tugas dalam Hausa, Igbo, dan Swahili, dan beberapa perusahaan bermitra dengan komunitas lokal untuk menambah data ke model.
Kata-kata sulit
- moderasi — proses meninjau dan mengendalikan isi unggahan
- gunakan — memakai sesuatu untuk tujuan tertentudigunakan
- ketergantungan — keadaan bergantung pada sesuatu, seperti data bahasa
- hapus — menghilangkan atau memindahkan sesuatu dari sistemdihapus, menghapus
- kumpulan data — sekumpulan contoh teks atau informasi untuk model
- model besar — sistem pembelajaran mesin yang dilatih dengan banyak data
Tips: arahkan kursor, fokus, atau ketuk kata yang disorot di dalam teks untuk melihat definisi singkat sambil membaca atau mendengarkan.
Pertanyaan diskusi
- Apakah menurut Anda penting bagi platform seperti TikTok untuk mendukung bahasa lokal? Mengapa?
- Bagaimana komunitas lokal bisa membantu membuat kumpulan data yang lebih baik untuk moderasi?
- Apa tantangan yang mungkin muncul saat membuat data untuk bahasa yang jarang ditulis?
Artikel terkait
Masalah Operasi Menghambat Energi Terbarukan di Republik Dominika
Republik Dominika menambah energi terbarukan namun masalah operasi jaringan menyebabkan pemborosan dan meningkatkan penggunaan bahan bakar fosil. Pemerintah menyatakan darurat dan ada pembatasan produksi yang besar pada 2025.
Web3 dan kendali data bagi petani
Forum ICTforAg (9-10 Maret) membahas bagaimana teknologi informasi dan Web3 bisa memberi petani lebih banyak kendali atas data mereka. Digital Green dan alat seperti FarmStack ditonjolkan, serta layanan video yang menjangkau petani di beberapa negara.
Seniman dan Jurnalis Australia Menentang Penggunaan AI atas Karya Mereka
Seniman, jurnalis, dan pekerja kebudayaan Aborigin di Australia meluncurkan kampanye "Stop AI Theft" dan tagar #PayUp. Mereka menuntut hukum yang memberi kontrol, kompensasi, dan transparansi atas penggunaan karya oleh alat AI generatif.