Federico Germani ve Giovanni Spitale tarafından yürütülen çalışma, bir metnin içeriği aynı kalırken yazar kimliği bilgisinin büyük dil modellerinin (LLM) verdiği yargıları nasıl etkilediğini inceledi. OpenAI o3‑mini, Deepseek Reasoner, xAI Grok 2 ve Mistral test edildi. Araştırmada modeller 24 tartışmalı konuda her biri için 50 anlatı cümlesi üretti ve farklı koşullarda bu ifadelerin değerlendirilmesi istendi. Toplamda 192’000 değerlendirme toplandı.
Kaynak belirtilmediğinde modeller arasında tüm konularda uyum %90’ın üzerindeydi. Ancak yazar kimliği gibi bilgiler eklendiğinde uyum keskin şekilde düştü ve derin gizli önyargılar ortaya çıktı. En belirgin örnek, tüm modellerde görülen Çin karşıtı eğilimdi; "Bir Çinli kişi" yazarı verildiğinde olumlu yargılar azaldı. Germani, bu daha az olumlu yargının argüman mantıklı ve iyi yazılmış olsa bile ortaya çıktığını belirtti.
Çalışma özellikle Deepseek’in Tayvan egemenliği gibi bazı jeopolitik konularda uyumu %75’e kadar azaltabildiğini gösterdi. Modeller insan yazarlara genellikle diğer yapay zekâlardan daha çok güveniyor. Spitale bu durumu "makine tarafından üretilen içeriğe karşı yerleşik bir güvensizlik" olarak tanımladı. Araştırmacılar şeffaflık ve yönetişim çağrısı yapıyor; LLM’leri yargıç yerine yararlı yardımcılar olarak kulanmayı öneriyorlar. Araştırma Science Advances dergisinde yayımlandı.
Zor kelimeler
- önyargı — Bir kişinin bir şey hakkında olumsuz düşünmesi.önyargıların, önyargı yaratmaktadır, önyargıları
- değerlendirme — Bir şeyin değerini veya kalitesini incelemek.değerlendirmelerinde
- araştırmacı — Bir konuyu inceleyen kişi.araştırmacılar, araştırmacılar,
- şeffaflık — Gizli bilgi olmadan açık olma durumu.şeffaflık ve yönetişim
- kimlik — Bir kişinin kendini tanımlama şekli.kimliğini, yazarın kimliğini
- içerik moderasyonu — Bir içeriği kontrol etme süreci.
- yönetişim — Bir sistemin nasıl yönetildiği veya organize edildiği.
İpucu: Türkçe metni okurken veya ses kaydını dinlerken, vurgulanan kelimelerin üzerine gel, odaklan ya da dokun; anında kısa tanımlar görünür.
Tartışma soruları
- Yazar kimliğinin içerik değerlendirmelerine etkisini nasıl değerlendirirsiniz?
- Bu bulgular yapay zekanın geleceği için ne anlama geliyor?
- Önyargıların azaltılması için ne tür önlemler alınabilir?
İlgili makaleler
Ruanda'da iklime dayanıklı tohumlarla daha büyük hasatlar
Ruanda'da Seed Resilience Project ile çiftçiler iklime dayanıklı tohumları denedi ve daha yüksek verim bildirdi. Proje 2023'te başladı ve uluslararası kuruluşlar, Fair Planet, tarım bakanlığı ile yerel tohum şirketlerini bir araya getiriyor.