Federico Germani ve Giovanni Spitale tarafından yürütülen çalışma, bir metnin içeriği aynı kalırken yazar kimliği bilgisinin büyük dil modellerinin (LLM) verdiği yargıları nasıl etkilediğini inceledi. OpenAI o3‑mini, Deepseek Reasoner, xAI Grok 2 ve Mistral test edildi. Araştırmada modeller 24 tartışmalı konuda her biri için 50 anlatı cümlesi üretti ve farklı koşullarda bu ifadelerin değerlendirilmesi istendi. Toplamda 192’000 değerlendirme toplandı.
Kaynak belirtilmediğinde modeller arasında tüm konularda uyum %90’ın üzerindeydi. Ancak yazar kimliği gibi bilgiler eklendiğinde uyum keskin şekilde düştü ve derin gizli önyargılar ortaya çıktı. En belirgin örnek, tüm modellerde görülen Çin karşıtı eğilimdi; "Bir Çinli kişi" yazarı verildiğinde olumlu yargılar azaldı. Germani, bu daha az olumlu yargının argüman mantıklı ve iyi yazılmış olsa bile ortaya çıktığını belirtti.
Çalışma özellikle Deepseek’in Tayvan egemenliği gibi bazı jeopolitik konularda uyumu %75’e kadar azaltabildiğini gösterdi. Modeller insan yazarlara genellikle diğer yapay zekâlardan daha çok güveniyor. Spitale bu durumu "makine tarafından üretilen içeriğe karşı yerleşik bir güvensizlik" olarak tanımladı. Araştırmacılar şeffaflık ve yönetişim çağrısı yapıyor; LLM’leri yargıç yerine yararlı yardımcılar olarak kulanmayı öneriyorlar. Araştırma Science Advances dergisinde yayımlandı.
Zor kelimeler
- önyargı — Bir kişinin bir şey hakkında olumsuz düşünmesi.önyargıların, önyargı yaratmaktadır, önyargıları
- değerlendirme — Bir şeyin değerini veya kalitesini incelemek.değerlendirmelerinde
- araştırmacı — Bir konuyu inceleyen kişi.araştırmacılar, araştırmacılar,
- şeffaflık — Gizli bilgi olmadan açık olma durumu.şeffaflık ve yönetişim
- kimlik — Bir kişinin kendini tanımlama şekli.kimliğini, yazarın kimliğini
- içerik moderasyonu — Bir içeriği kontrol etme süreci.
- yönetişim — Bir sistemin nasıl yönetildiği veya organize edildiği.
İpucu: Türkçe metni okurken veya ses kaydını dinlerken, vurgulanan kelimelerin üzerine gel, odaklan ya da dokun; anında kısa tanımlar görünür.
Tartışma soruları
- Yazar kimliğinin içerik değerlendirmelerine etkisini nasıl değerlendirirsiniz?
- Bu bulgular yapay zekanın geleceği için ne anlama geliyor?
- Önyargıların azaltılması için ne tür önlemler alınabilir?
İlgili makaleler
Pandemi Döneminde Çinli Üniversite Öğrencilerinin Çevrimiçi Eğitimi
Çalışma 2020 kapanması sırasında Çin’de yüz yüze eğitimden çevrimiçi eğitime ani geçişin üniversite öğrencilerinin başarılarını nasıl etkilediğini inceliyor. Farklı ders türleri ve kapanma politikaları arasındaki farklar değerlendiriliyor.
Propanın Propilene Dönüşümünü Açıklayan Algoritmalar
Rochester Üniversitesi araştırmacıları, propanın propilene dönüşümünü yöneten atomik özellikleri belirleyen algoritmalar geliştirdi. Yeni çalışma Journal of the American Chemical Society dergisinde yayımlandı ve katalizörlerde oksit-metal etkileşimlerine dair önemli içgörüler sundu.
ABD için ilk ulusal su çekim veritabanı
Virginia Tech araştırmacıları, nehirlerden, göllerden ve akiferlerden yapılan su çekimlerini ülke çapında derleyen United States Water Withdrawals Database'i oluşturdu. Çalışma Nature Scientific Data dergisinde yayımlandı ve veriler kamuya açık olarak paylaşıldı.