LingVo.club
Seviye
Yazar kimliği LLM'lerin değerlendirmesini değiştiriyor — Seviye A2 — three white disc on brown surface

Yazar kimliği LLM'lerin değerlendirmesini değiştiriyorCEFR A2

25 Kas 2025

Uyarlanmıştır: U. Zurich, Futurity CC BY 4.0

Fotoğraf: Siora Photography, Unsplash

Seviye A2 – Temel
2 dk
116 kelime

Zürih Üniversitesi'nden araştırmacılar dört büyük LLM’i test etti: OpenAI o3‑mini, Deepseek Reasoner, xAI Grok 2 ve Mistral. Modeller 24 tartışmalı konuda, örneğin aşı zorunluluğu, jeopolitik ve iklim politikası gibi, her birinde 50 anlatı cümlesi üretti. Sonra bu ifadeler farklı koşullarda değerlendirildi; bazen kaynak yoktu, bazen bir insan vatandaşı olarak ya da başka bir LLM olarak atfedildi. Analiz için toplam 192’000 değerlendirme toplandı.

Sonuçlar gösterdi ki kaynak bilgisi olmadığında modeller arasında uyum yüksekti (%90’ın üzerinde). Ama yazar kimliği eklendiğinde değerlendirmeler değişti ve gizli önyargılar ortaya çıktı. Özellikle "Bir Çinli kişi" yazar olduğunda uyum düştü. Deepseek bazı jeopolitik konularda uyumu %75’e kadar azaltabildi. Araştırmacılar şeffaflık ve yönetişim çağırısı yapıyor ve LLM’leri yardımcı olarak kullanmayı öneriyorlar.

Zor kelimeler

  • önyargıBir kişi veya konu hakkında önceden oluşturulmuş düşünce.
    önyargılı
  • değerlendirirBir şeyin kalitesini veya önemini belirlemek.
    değerlendirmeler
  • araştırmaBir konuyu incelemek için yapılan çalışma.
  • güvensizlikBir şey hakkında güven duymama hali.
  • anlaşmaİki tarafın kabul ettiği durum.
    sağlanıyor

İpucu: Türkçe metni okurken veya ses kaydını dinlerken, vurgulanan kelimelerin üzerine gel, odaklan ya da dokun; anında kısa tanımlar görünür.

Tartışma soruları

  • LLM'lerin yazar bilgisi ile nasıl etkileneceğini düşünüyorsunuz?
  • Önyargıyı azaltmak için neler yapılabilir?
  • Yapay zeka metinleri değerlendirdiğinde hangi sorunlar ortaya çıkabilir?

İlgili makaleler