New York University'den Anasse Bari liderliğindeki ekip, büyük dil modellerinin (LLM'ler) uzun belgeleri özetlerken yaptığı hataları azaltmak için algoritmik bir ön işleme çerçevesi geliştirdi. Çalışma Frontiers in Artificial Intelligence dergisinde yayımlandı ve Binxu Huang ortak yazarlardan biri olarak yer aldı.
Çerçeve, belgedeki her cümleyi sanal bir kuş gibi ele alıyor. İlk aşamada cümleler isim, fiil ve sıfatlar korunarak temizleniyor; çok kelimeli terimler birleştirilip her cümle sözlüksel, anlamsal ve konu özelliklerini içeren sayısal vektörlere dönüştürülüyor. Cümlelere merkezilik, bölüm düzeyi önem ve özetle hizalanma puanları atanıyor; Giriş, Bulgular ve Sonuç gibi ana bölümlere ekstra öncelik veriliyor.
İkinci aşamada çerçeve, bağlılık, hizalanma ve ayrışma ilkelerini uygulayarak benzer cümleleri kümeliyor. Her kümede lider cümleler ortaya çıkıyor ve takipçiler yakın liderlere bağlanıyor. Son sürüden yalnızca en yüksek puanlı cümleler seçilip yeniden sıralanıyor; LLM bu seçilen cümlelerden kaynak materyale dayanan akıcı bir özet üretiyor. Ekip yöntemi 9.000'den fazla belgede test etti ve LLM'lerle birlikte kullanıldığında daha yüksek gerçeklik doğruluğu sağladığını gördü; yazarlar halüsinasyon riskinin azaldığını ancak tamamen ortadan kalkmadığını not ediyor.
Zor kelimeler
- çerçeve — bir çalışmada kullanılan genel plan veya sistemçerçevesi
- ön işleme — veri veya metin üzerinde yapılan ilk hazırlık işlemi
- kümelemek — benzer öğeleri gruplar hâline getirmekkümeliyor
- merkezilik — bir öğenin diğerlerine göre önemini gösterme
- hizalanma — iki veya daha fazla şeyin uyumlu olması
- halüsinasyon — modelin gerçeğe dayanmayan yanlış bilgi üretmesi
İpucu: Türkçe metni okurken veya ses kaydını dinlerken, vurgulanan kelimelerin üzerine gel, odaklan ya da dokun; anında kısa tanımlar görünür.
Tartışma soruları
- Bu yöntemin haber veya rapor özetlerinde hangi avantajları olabilir? İki kısa neden söyle.
- Halüsinasyon riskinin azalması neden önemli? Kısa bir açıklama yap.
- Sence Giriş, Bulgular ve Sonuç bölümlerinden hangisine daha fazla öncelik verilmeli? Neden?
İlgili makaleler
Yapay zekâ sosyal medyada çoğu Afrika dilini anlamıyor
Sosyal medyadaki içerikleri kaldıran yapay zekâ sistemleri Afrika dillerinin büyük kısmını anlamıyor. Bu durum içeriklerin yanlış kaldırılmasına veya zararlı paylaşımların kalmasına yol açıyor; araştırmacılar ve platformlar çözüm arıyor.