LingVo.club
📖+20 XP
🎧+15 XP
+25 XP
Büyük dil modelleri neden dört basamaklı çarpımı zor yapıyor? — Seviye A2 — brown wooden blocks on white surface

Büyük dil modelleri neden dört basamaklı çarpımı zor yapıyor?CEFR A2

29 Ara 2025

Uyarlanmıştır: U. Chicago, Futurity CC BY 4.0

Fotoğraf: Brett Jordan, Unsplash

Seviye A2 – Temel
2 dk
88 kelime

Chicago Üniversitesi'nden Xiaoyan Bai ve Chenhao Tan liderliğindeki bir ekip, MIT, Harvard, Waterloo ve Google DeepMind iş birlikçileriyle çalıştı. Ekip, iki dört basamaklı sayının çarpımını hesaplama görevine odaklandı çünkü bu görev uzun hesaplamada ara sonuçların saklanmasını gerektiriyor.

Ekip standart ince ayar ile ICoT adlı başka bir eğitim yöntemini karşılaştırdı. Standart ince ayar altında modeller çok düşük doğruluk gösterdi. ICoT ile eğitilen model ise ara değerleri kodladı ve sonuçları doğru üretti. Araştırmacılar ayrıca modele ara toplamları takip etmeyi öğreten bir hedef eklediler ve basit modellerde doğruluk önemli ölçüde yükseldi.

Zor kelimeler

  • ekipbir ortak çalışma yapan kişi grubu
  • odaklanmakbir işe dikkatle ve sabırla yönelmek
    odaklandı
  • ara sonuçhesaplama sırasında oluşan ara değer veya sonuç
    ara sonuçların
  • ince ayarönceden eğitilmiş modelin küçük ayarlarla geliştirilmesi
  • doğrulukbir şeyin doğru olma veya doğru sonuç verme seviyesi
  • kodlamakbilgi veya değerleri belirli biçime dönüştürmek
    kodladı
  • hedefyapılacak işi veya amacı gösteren nesne

İpucu: Türkçe metni okurken veya ses kaydını dinlerken, vurgulanan kelimelerin üzerine gel, odaklan ya da dokun; anında kısa tanımlar görünür.

Tartışma soruları

  • Bu makaleye göre neden ara sonuçlar saklanmalı?
  • Araştırmacıların eklediği hedefin doğruluk üzerindeki etkisini kısaca açıklayın.
  • Sen olsaydın bir hesaplama görevinde ara sonuçları takip eder miydin? Neden?

İlgili makaleler

Yapay zeka destekli daha doğal biyonik el — Seviye A2
9 Ara 2025

Yapay zeka destekli daha doğal biyonik el

University of Utah araştırmacıları, sensörler ve yapay zeka kullanarak protez elin kavrama yeteneğini geliştirdi. Kullanıcılar daha güvenli ve hassas tutuş yaptı, zihinsel çaba azaldı ve günlük işleri daha kolay gerçekleştirdiler.