Zürih Üniversitesi'nden araştırmacılar dört büyük LLM’i test etti: OpenAI o3‑mini, Deepseek Reasoner, xAI Grok 2 ve Mistral. Modeller 24 tartışmalı konuda, örneğin aşı zorunluluğu, jeopolitik ve iklim politikası gibi, her birinde 50 anlatı cümlesi üretti. Sonra bu ifadeler farklı koşullarda değerlendirildi; bazen kaynak yoktu, bazen bir insan vatandaşı olarak ya da başka bir LLM olarak atfedildi. Analiz için toplam 192’000 değerlendirme toplandı.
Sonuçlar gösterdi ki kaynak bilgisi olmadığında modeller arasında uyum yüksekti (%90’ın üzerinde). Ama yazar kimliği eklendiğinde değerlendirmeler değişti ve gizli önyargılar ortaya çıktı. Özellikle "Bir Çinli kişi" yazar olduğunda uyum düştü. Deepseek bazı jeopolitik konularda uyumu %75’e kadar azaltabildi. Araştırmacılar şeffaflık ve yönetişim çağırısı yapıyor ve LLM’leri yardımcı olarak kullanmayı öneriyorlar.
Zor kelimeler
- önyargı — Bir kişi veya konu hakkında önceden oluşturulmuş düşünce.önyargılı
- değerlendirir — Bir şeyin kalitesini veya önemini belirlemek.değerlendirmeler
- araştırma — Bir konuyu incelemek için yapılan çalışma.
- güvensizlik — Bir şey hakkında güven duymama hali.
- anlaşma — İki tarafın kabul ettiği durum.sağlanıyor
İpucu: Türkçe metni okurken veya ses kaydını dinlerken, vurgulanan kelimelerin üzerine gel, odaklan ya da dokun; anında kısa tanımlar görünür.
Tartışma soruları
- LLM'lerin yazar bilgisi ile nasıl etkileneceğini düşünüyorsunuz?
- Önyargıyı azaltmak için neler yapılabilir?
- Yapay zeka metinleri değerlendirdiğinde hangi sorunlar ortaya çıkabilir?
İlgili makaleler
Tedavi Zamanı GBM Hastalarında Kemoterapi Yanıtını Etkileyebilir
Araştırma, glioblastomlu (GBM) hastalarda kemoterapinin günün saatine göre farklı etkiler gösterebileceğini buldu. Bulgular MGMT onarım mekanizmasının gün içinde değiştiğini ve tanısal biyopsi zamanının sonuçları etkileyebileceğini gösteriyor.
Bilimi Herkese Ulaştıran Etkinlikler
Deneyler, konuşmalar ve uygulamalı etkinlikler bilimi çocuklar ve yetişkinler için daha ilgi çekici hâle getirir. Etkinlikler farklı yaşlara göre okullarda, kütüphanelerde veya müzelerde düzenlenir; başarı ziyaretçi sayısı ve geri bildirimle ölçülür.
NeuroBridge: otistik iletişimi anlamaya yarayan yapay zekâ aracı
Tufts Üniversitesi araştırmacıları NeuroBridge adlı bir yapay zekâ aracı geliştirdi. Araç, nörotipik kişilere otistik insanların iletişim tercihlerini göstermeyi ve daha açık, doğrudan konuşmayı öğrenmelerini sağlamayı amaçlıyor.
Afrika sağlık sistemlerini yapay zekâ ve dijitalle güçlendiriyor
Durban'daki CPHIA toplantısında kendi kendine yeterlilik vurgulandı. Landry Dongmo Tsague, Africa CDC için yapay zekâ ve dijital araçların iç sistemleri güçlendirebileceğini, üye devletlerde birinci basamakta izlemeyi iyileştirebileceğini ve veri yönetişiminin önemli olduğunu anlattı.