Stanford Üniversitesi İnsan Merkezli Yapay Zeka Enstitüsü (HAI) tarafından 2025'te yayımlanan çalışma, birçok popüler büyük dil modelinin (LLM) İngilizce dışındaki dillerde zayıf performans gösterdiğini tespit etti. Makale, çevrimiçi dünyanın İngilizce egemenliği ve model geliştiricilerinin sıklıkla İngilizce veri kullanmasının bu dengesizliği derinleştirdiğini belirtiyor.
Araştırmacılar, Google ve Meta'nın kısmen katkıda bulunduğu kamuya açık LLM'lerin küresel çoğunluğun ihtiyaçlarına uygun olmayan yanıtlar verebildiğine dikkat çekti. Yapay zeka firmalarının ve veri kaynaklarının zengin, örneğin Silicon Valley gibi merkezlerde yoğunlaşması uçurumu genişletiyor. Haber kuruluşları Kürtçe ve Svahili gibi dilleri konuşan milyonların fiilen ikinci plana atıldığını bildirdi; bu kullanıcılar işe yaramayan veya hata dolu çıktılar alabiliyor.
Pratik sorunlara örnek olarak Wired, ChatGPT'den Tamilce bir e-posta yazması istendiğinde bazen İngilizce karışık taslaklar üretildiğini yazdı. MIT Technology Review ise webden kazınan kaynakların, özellikle az bulunan dil metinlerinin, makine çevirisi hataları içerdiğini ve bu hataların eğitimde pekişebildiğini buldu. Gözlemciler, yapay zeka çıktılarının sıklıkla kaynakları iyi olan İngilizce konuşanların norm ve değerlerini yansıttığını ve bunun diğer bakış açılarını görünmez kıldığını söylüyor.
Uzmanlar somut adımlar öneriyor:
- Yerel topluluklarla ve taban yapay zeka liderleriyle ortaklık kurmak
- Çok dilli veriyi doğrulamak ve yerel katkıyı dahil etmek
- Çıktıları doğruluk ve özgünlük açısından bağımsız şekilde gözden geçirmek
Zor kelimeler
- egemenlik — bir dilin veya kültürün baskın olmasıegemenliği
- dengesizlik — eşit olmayan ya da adaletsiz durumdengesizliği
- yoğunlaşmak — belirli bir yerde veya alanda toplanmakyoğunlaşması
- pekişmek — daha kalıcı hale gelmek veya güçlenmekpekişebildiğini
- doğrulamak — bilginin doğru olduğunu kontrol etmek
- özgünlük — başkalarından farklı ve orijinal olma hali
- katkı — bir işe veya projeye yapılan yardım veya eklemekatkıda, katkıyı
- topluluk — aynı yerde yaşayan veya ortak ilgi sahibi gruptopluluklarla
İpucu: Türkçe metni okurken veya ses kaydını dinlerken, vurgulanan kelimelerin üzerine gel, odaklan ya da dokun; anında kısa tanımlar görünür.
Tartışma soruları
- Kürtçe veya Svahili gibi dillerde zayıf yapay zeka desteği, bu dilleri konuşan insanların bilgiye erişimini nasıl etkileyebilir?
- Şirketlerin ve veri kaynaklarının Silicon Valley gibi merkezlerde yoğunlaşmasının olası toplumsal sonuçları nelerdir?
- Çok dilli veriyi doğrulamak ve yerel katkıyı dahil etmek pratikte nasıl uygulanabilir; hangi zorluklar çıkar?
İlgili makaleler
TikTok ve Somali'de Klan Siyaseti
Araştırma TikTok’un Somali klan siyasetini yeniden şekillendirdiğini, canlı yayın mücadeleleri ve dijital coin bağışlarının çatışmaları finanse ettiğini gösteriyor. Platform 2020 başından itibaren popülerleşti ve 3.9 million aktif kullanıcıya ulaştı.
Yeni çalışma: Beynin mikroskobik parçaları büyük ağları oluşturuyor
Nature Communications’da yayımlanan araştırma, beyin görüntüleri, genetik ve moleküler haritaları birleştirerek hücre ve kimyasalların fMRI ile görülen büyük beyin ağlarına nasıl bağlı olduğunu gösteriyor. Bulgular biliş, yaşlanma ve bazı ruhsal bozukmaları etkileyebilir.
Büyük dil modelleri neden dört basamaklı çarpımı zor yapıyor?
Chicago Üniversitesi liderliğindeki bir ekip, standart ince ayar ve Implicit Chain of Thought (ICoT) eğitimi arasındaki farkı inceledi. Çalışma, ara değerleri saklama yetisinin uzun hesaplamalar için gerekli olduğunu gösteriyor.
Global Voices ve Nepal: Bir bağış hareketi ve bisiklet meydan okuması
Global Voices, Nepalli katkıda bulunanlarla ve yerel medya ile iş birliği yapıyor. Destekçi Nate, Everest Roam adlı bisiklet meydan okumasını gerçekleştirdi ve kuruluş 250,000 USD hedefli bir bağış kampanyası yürütüyor.