New York University'den Anasse Bari liderliğindeki ekip, büyük dil modellerinin (LLM'ler) uzun belgeleri özetlerken yaptığı hataları azaltmak için algoritmik bir ön işleme çerçevesi geliştirdi. Çalışma Frontiers in Artificial Intelligence dergisinde yayımlandı ve Binxu Huang ortak yazarlardan biri olarak yer aldı.
Çerçeve, belgedeki her cümleyi sanal bir kuş gibi ele alıyor. İlk aşamada cümleler isim, fiil ve sıfatlar korunarak temizleniyor; çok kelimeli terimler birleştirilip her cümle sözlüksel, anlamsal ve konu özelliklerini içeren sayısal vektörlere dönüştürülüyor. Cümlelere merkezilik, bölüm düzeyi önem ve özetle hizalanma puanları atanıyor; Giriş, Bulgular ve Sonuç gibi ana bölümlere ekstra öncelik veriliyor.
İkinci aşamada çerçeve, bağlılık, hizalanma ve ayrışma ilkelerini uygulayarak benzer cümleleri kümeliyor. Her kümede lider cümleler ortaya çıkıyor ve takipçiler yakın liderlere bağlanıyor. Son sürüden yalnızca en yüksek puanlı cümleler seçilip yeniden sıralanıyor; LLM bu seçilen cümlelerden kaynak materyale dayanan akıcı bir özet üretiyor. Ekip yöntemi 9.000'den fazla belgede test etti ve LLM'lerle birlikte kullanıldığında daha yüksek gerçeklik doğruluğu sağladığını gördü; yazarlar halüsinasyon riskinin azaldığını ancak tamamen ortadan kalkmadığını not ediyor.
Zor kelimeler
- çerçeve — bir çalışmada kullanılan genel plan veya sistemçerçevesi
- ön işleme — veri veya metin üzerinde yapılan ilk hazırlık işlemi
- kümelemek — benzer öğeleri gruplar hâline getirmekkümeliyor
- merkezilik — bir öğenin diğerlerine göre önemini gösterme
- hizalanma — iki veya daha fazla şeyin uyumlu olması
- halüsinasyon — modelin gerçeğe dayanmayan yanlış bilgi üretmesi
İpucu: Türkçe metni okurken veya ses kaydını dinlerken, vurgulanan kelimelerin üzerine gel, odaklan ya da dokun; anında kısa tanımlar görünür.
Tartışma soruları
- Bu yöntemin haber veya rapor özetlerinde hangi avantajları olabilir? İki kısa neden söyle.
- Halüsinasyon riskinin azalması neden önemli? Kısa bir açıklama yap.
- Sence Giriş, Bulgular ve Sonuç bölümlerinden hangisine daha fazla öncelik verilmeli? Neden?
İlgili makaleler
Africa Wiki Women: Afrikalı kadınların görünürlüğünü artırmak
Africa Wiki Women, Afrikalı kadınların Vikipedi ve diğer Wikimedia platformlarındaki görünürlüğünü artırmak için eğitim, katkı kampanyaları ve mentorluk yürütür. Girişim üç kurucu tarafından başlatıldı ve kıta genelinde yüzlerce kadına eğitim verdi.
Yapay zekâ melanomu tespit etmek için test ediliyor
University of Missouri araştırmacıları, 400.000 görüntüyle yapay zekânın melanomu tanıyıp şüpheli vakaları hızla belirlemesini test etti. Sistem uzmanların yerine geçmek için değil, doktorlara karar desteği sağlamak için tasarlandı.
Bamenda'da Uzun Elektrik Kesintileri ve Güneş Enerjisi Çözümleri
Bamenda’nın Mile Four mahallesinde uzun süredir öngörülemeyen elektrik kesintileri yaşanıyor. Resmi yetkililer üretimde azalma ve teknik sorunlar olduğunu söylüyor; halk topluluk trafosu aldı ve birçok hane güneş sistemi kurdu.