Federico Germani ve Giovanni Spitale tarafından yürütülen çalışma, bir metnin içeriği aynı kalırken yazar kimliği bilgisinin büyük dil modellerinin (LLM) verdiği yargıları nasıl etkilediğini inceledi. OpenAI o3‑mini, Deepseek Reasoner, xAI Grok 2 ve Mistral test edildi. Araştırmada modeller 24 tartışmalı konuda her biri için 50 anlatı cümlesi üretti ve farklı koşullarda bu ifadelerin değerlendirilmesi istendi. Toplamda 192’000 değerlendirme toplandı.
Kaynak belirtilmediğinde modeller arasında tüm konularda uyum %90’ın üzerindeydi. Ancak yazar kimliği gibi bilgiler eklendiğinde uyum keskin şekilde düştü ve derin gizli önyargılar ortaya çıktı. En belirgin örnek, tüm modellerde görülen Çin karşıtı eğilimdi; "Bir Çinli kişi" yazarı verildiğinde olumlu yargılar azaldı. Germani, bu daha az olumlu yargının argüman mantıklı ve iyi yazılmış olsa bile ortaya çıktığını belirtti.
Çalışma özellikle Deepseek’in Tayvan egemenliği gibi bazı jeopolitik konularda uyumu %75’e kadar azaltabildiğini gösterdi. Modeller insan yazarlara genellikle diğer yapay zekâlardan daha çok güveniyor. Spitale bu durumu "makine tarafından üretilen içeriğe karşı yerleşik bir güvensizlik" olarak tanımladı. Araştırmacılar şeffaflık ve yönetişim çağrısı yapıyor; LLM’leri yargıç yerine yararlı yardımcılar olarak kulanmayı öneriyorlar. Araştırma Science Advances dergisinde yayımlandı.
Zor kelimeler
- önyargı — Bir kişinin bir şey hakkında olumsuz düşünmesi.önyargıların, önyargı yaratmaktadır, önyargıları
- değerlendirme — Bir şeyin değerini veya kalitesini incelemek.değerlendirmelerinde
- araştırmacı — Bir konuyu inceleyen kişi.araştırmacılar, araştırmacılar,
- şeffaflık — Gizli bilgi olmadan açık olma durumu.şeffaflık ve yönetişim
- kimlik — Bir kişinin kendini tanımlama şekli.kimliğini, yazarın kimliğini
- içerik moderasyonu — Bir içeriği kontrol etme süreci.
- yönetişim — Bir sistemin nasıl yönetildiği veya organize edildiği.
İpucu: Türkçe metni okurken veya ses kaydını dinlerken, vurgulanan kelimelerin üzerine gel, odaklan ya da dokun; anında kısa tanımlar görünür.
Tartışma soruları
- Yazar kimliğinin içerik değerlendirmelerine etkisini nasıl değerlendirirsiniz?
- Bu bulgular yapay zekanın geleceği için ne anlama geliyor?
- Önyargıların azaltılması için ne tür önlemler alınabilir?
İlgili makaleler
Bir haftalık ev bakımı barınak köpeklerinin stresini azaltıyor
Virginia Tech liderliğindeki araştırma, yedi günlük ev bakımının barınak köpeklerinde stres hormonunu düşürdüğünü ve köpeklerin evde daha fazla dinlendiğini gösterdi. Tanıdık bir arkadaşla tekrar bir araya gelmek ek sakinlik sağladı.
Titan'ın iç yapısı yeniden değerlendirildi
Cassini verilerinin yeniden analizi, Titan'da tek bir derin okyanus yerine kayalık çekirdeğe yakın, tüneller ve eriyik su cepleri içeren kalın bir yarı-akışkan katmanın daha iyi açıklama sunduğunu gösteriyor. Bu sonuç yaşanabilirlik düşüncelerini değiştiriyor.
UV ışığın buza etkisi kuantum simülasyonlarıyla incelendi
Araştırmacılar UV ışığın buzu kimyasal olarak nasıl değiştirdiğini kuantum mekanik simülasyonlarla inceledi. Sonuçlar, 1980'lerden beri gözlemlenen farklı UV emilim özelliklerini açıklamaya yardımcı olabilir ve permafrost ile buzlu uydular için önem taşıyor.
Ekvador'da seçimlerde dezenformasyonla mücadele için teknoloji etkinlikleri
Ekvador'da yerel bir grup, seçim dönemi yalan haberlerle mücadele için Hacks Hackers şubesini canlandırdı. Şubat 2024'te bir konferans ve bir hackathon düzenlendi; üç proje ödül aldı ve 2025 için çalışmalar planlandı.