Araştırmacılar modern dil modellerinin gerçek dünyayı herhangi bir düzeyde anlayıp anlamadığını test etti. Çalışma Brown Üniversitesi'nden bir ekip tarafından yapıldı ve Rio de Janeiro'daki International Conference on Learning Representations'ta sunuldu. Çalışmayı yöneten Michael Lepori, dil modellerinin gerçek dünyanın nedensel kısıtlarını kodladığına dair bazı kanıtlar bulduklarını söyledi ve modellerin bu kısıtları insan yargılarını öngörecek şekilde kodladığını ekledi.
Deney için ekip, yaygın, düşük olasılıklı, imkânsız ve anlamsız olayları tanımlayan cümleler sundu. Örnekler "Birisi bir içeceği buzla soğuttu", "...karla soğuttu", "...ateşle soğuttu" ve "...dünle soğuttu" gibi cümleleri içeriyordu. Her cümlede modellerin içsel matematiksel durumları incelendi; bu yaklaşım mekanistik yorumlama olarak adlandırılıyor.
Çalışma GPT‑2, Llama 3.2 ve Gemma 2 gibi açık kaynak modeller üzerinde yapıldı. Araştırmacılar, yeterince büyük modellerin olasılık kategorilerine karşılık gelen belirgin iç vektörler geliştirdiğini ve bu vektörlerin kategorileri yaklaşık %85 doğrulukla ayırt edebildiğini buldu. Ayrıca bu vektörler insan anketlerindeki bölünmüş yargılarla örtüştü. Bulgular, daha güvenilir modeller geliştirmek için yol gösterebilir.
Zor kelimeler
- araştırmacı — bilimsel soru sorup inceleyen kişi veya ekipAraştırmacılar
- kısıt — bir şeyin nasıl olabileceğini sınırlayan durum veya kuralkısıtlarını, kısıtları
- kodlamak — bilgi veya kuralları bir biçimde yazmakkodladığına, kodladığını
- olasılık — bir olayın gerçekleşme ihtimalinin derecesi
- vektör — matematikte yön ve büyüklük taşıyan sayı dizisiiç vektörler, vektörlerin
- doğruluk — bir bilginin doğru olma ya da güvenilirliğidoğrulukla
- örtüşmek — iki şeyin birbirine benzer veya aynı olmasıörtüştü
- yorumlama — bir bilgiyi veya olayı anlama ve açıklama işimekanistik yorumlama
İpucu: Türkçe metni okurken veya ses kaydını dinlerken, vurgulanan kelimelerin üzerine gel, odaklan ya da dokun; anında kısa tanımlar görünür.
Tartışma soruları
- Bu bulgular daha güvenilir modeller geliştirmek için nasıl yol gösterebilir? Nedenleriyle açıklayın.
- Modelin insan yargılarını öngörmesi sizin için ne anlama geliyor? Günlük hayattan bir örnek verin.
- Bir yapay zekanın gerçek dünyanın 'kısıtlarını' anlaması günlük yaşamda hangi sorunları azaltabilir?
İlgili makaleler
Futurity'nin 2025'te Seçtiği En İyi 10 Araştırma Haberi
Futurity, 2025 boyunca yayımlanan araştırma haberleri arasından en iyi 10 gönderiyi seçti. Seçkide sağlık, enerji, arkeoloji, sinirbilim, malzeme bilimi ve çevresel sağlık konuları yer alıyor; okuyucular 2026'da geri gelmeye davet edildi.
Yapay zekâ daha iyi başlıklar yazmayı öğrendi
Yale School of Management'ın araştırması, yapay zekânın başlıkların neden işe yaradığını öğrenince daha etkileyici ve güvenilir içerik ürettiğini gösteriyor. Ekip A/B testi verilerinden hipotezler çıkarıp bunları doğrulayarak başlıkları iyileştirdi.
Vatandaş bilimi SKA ve WHO hedeflerinin izlenmesine katkı sağlıyor
Ağustos ayında yayımlanan derleme, vatandaş biliminin Sürdürülebilir Kalkınma Amaçları (SKA) ile WHO Triple Billion hedeflerinin sağlık ve iyi olma göstergelerinin izlenmesine yardım edebileceğini gösteriyor. Yazarlar IIASA ve WHO'den geliyor.