Araştırmacılar modern dil modellerinin gerçek dünyayı herhangi bir düzeyde anlayıp anlamadığını test etti. Çalışma Brown Üniversitesi'nden bir ekip tarafından yapıldı ve Rio de Janeiro'daki International Conference on Learning Representations'ta sunuldu. Çalışmayı yöneten Michael Lepori, dil modellerinin gerçek dünyanın nedensel kısıtlarını kodladığına dair bazı kanıtlar bulduklarını söyledi ve modellerin bu kısıtları insan yargılarını öngörecek şekilde kodladığını ekledi.
Deney için ekip, yaygın, düşük olasılıklı, imkânsız ve anlamsız olayları tanımlayan cümleler sundu. Örnekler "Birisi bir içeceği buzla soğuttu", "...karla soğuttu", "...ateşle soğuttu" ve "...dünle soğuttu" gibi cümleleri içeriyordu. Her cümlede modellerin içsel matematiksel durumları incelendi; bu yaklaşım mekanistik yorumlama olarak adlandırılıyor.
Çalışma GPT‑2, Llama 3.2 ve Gemma 2 gibi açık kaynak modeller üzerinde yapıldı. Araştırmacılar, yeterince büyük modellerin olasılık kategorilerine karşılık gelen belirgin iç vektörler geliştirdiğini ve bu vektörlerin kategorileri yaklaşık %85 doğrulukla ayırt edebildiğini buldu. Ayrıca bu vektörler insan anketlerindeki bölünmüş yargılarla örtüştü. Bulgular, daha güvenilir modeller geliştirmek için yol gösterebilir.
Zor kelimeler
- araştırmacı — bilimsel soru sorup inceleyen kişi veya ekipAraştırmacılar
- kısıt — bir şeyin nasıl olabileceğini sınırlayan durum veya kuralkısıtlarını, kısıtları
- kodlamak — bilgi veya kuralları bir biçimde yazmakkodladığına, kodladığını
- olasılık — bir olayın gerçekleşme ihtimalinin derecesi
- vektör — matematikte yön ve büyüklük taşıyan sayı dizisiiç vektörler, vektörlerin
- doğruluk — bir bilginin doğru olma ya da güvenilirliğidoğrulukla
- örtüşmek — iki şeyin birbirine benzer veya aynı olmasıörtüştü
- yorumlama — bir bilgiyi veya olayı anlama ve açıklama işimekanistik yorumlama
İpucu: Türkçe metni okurken veya ses kaydını dinlerken, vurgulanan kelimelerin üzerine gel, odaklan ya da dokun; anında kısa tanımlar görünür.
Tartışma soruları
- Bu bulgular daha güvenilir modeller geliştirmek için nasıl yol gösterebilir? Nedenleriyle açıklayın.
- Modelin insan yargılarını öngörmesi sizin için ne anlama geliyor? Günlük hayattan bir örnek verin.
- Bir yapay zekanın gerçek dünyanın 'kısıtlarını' anlaması günlük yaşamda hangi sorunları azaltabilir?
İlgili makaleler
Lesitin ve Arap sakızı tilapiayı soğuğa karşı güçlendiriyor
Araştırmacılar lesitin ve Arap sakızını tilapia yemine ekleyerek soğuk stresine karşı balıkların büyüme, hayatta kalma ve antioksidan tepkilerinde iyileşme olduğunu buldu. Çalışma özellikle daha soğuk bölgelerdeki çiftliklere pratik çözüm sunabilir.
Hindistan’da siyah akrep için panzehir çalışmaları ilerliyor
Hindistanlı araştırmacılar Heterometrus bengalensis adlı siyah akrebin zehirini inceledi ve bu türe yönelik panzehir geliştirme yönünde ilerleme bildirdi. Çalışma zehir bileşenlerini haritaladı ve laboratuvarda üretim çalışmaları sürüyor.