Исследование из University of Zurich показывает: большие языковые модели меняют свои суждения о тексте, если им говорят, кто его написал. Исследователи Федерико Джерманни и Джованни Спитале протестировали четыре модели — OpenAI o3-mini, Deepseek Reasoner, xAI Grok 2 и Mistral. Каждая модель сгенерировала по пятьдесят повествовательных утверждений по 24 спорным темам, а затем оценивала эти утверждения в разных условиях.
Когда информация о источнике отсутствовала, модели в целом были согласны друг с другом — согласие превышало 90%. Но при назначении вымышленного автора согласие резко падало и иногда исчезало, хотя текст не менялся. Особенно заметна была антикитайская предвзятость во всех моделях, включая Deepseek. Deepseek снижал согласие в вопросах Тайваня до 75%, ожидая другую точку зрения у китайского автора.
Авторы предупреждают, что такие предубеждения могут повлиять на модерацию контента, найм, академическое рецензирование и журналистику. Они призывают к прозрачности и управлению и рекомендуют использовать модели как помощников в рассуждении, а не как судей.
Сложные слова
- предвзятость — Судебное мнение, основанное на предвзятых факторах.предвзятые
- учёный — Человек, который изучает науку.Учёные
- согласие — Совпадение мнений или выборов между людьми.
- прозрачность — Четкость и открытость информации.
Подсказка: наведите, сфокусируйтесь или нажмите на выделенные слова, чтобы увидеть краткие определения прямо во время чтения или прослушивания.
Вопросы для обсуждения
- Как можно предотвратить предвзятости в оценке текстов?
- Почему важна прозрачность в системах оценки?
- Какие проблемы могут возникнуть из-за предвзятостей?
Похожие статьи
Выборы в Бангладеш и ложный контент с помощью ИИ
12 февраля в Бангладеш прошли напряжённые выборы после студенческого восстания 2024 года. В кампании широко использовали материалы, созданные с помощью ИИ: поддельные фото, видео и ложные цитаты, которые вводили людей в заблуждение.
Прямые снимки двух нов показали множественные выбросы
Астрономы получили прямые изображения двух нов через несколько дней после вспышек. Снимки, сделанные с помощью интерферометрии на CHARA Array, показали несколько потоков газа и задержанное изгнание, связанное с гамма‑излучением.
Керала объявила Bacillus subtilis государственным микробом
Керала стала первой в Индии, кто официально признал Bacillus subtilis «государственным микроорганизмом». Решение подчёркивает пользу этой бактерии для здоровья, сельского хозяйства, охраны природы и адаптации к изменению климата.
Носимые устройства с ИИ при диабете 2 типа
Метаобзор учёных Университета Буффало в NPJ Digital Medicine оценивает носимые устройства с искусственным интеллектом для людей с диабетом 2 типа и преддиабетом. Описаны потенциал в прогнозировании глюкозы и серьёзные проблемы с данными и объяснимостью моделей.
Точные прогнозы погоды могут снизить смертность от жары
Исследование показывает: более точные и своевременные прогнозы дают людям время защитить здоровье и при благоприятном развитии технологий могут снизить число смертей от жары к 2100 году. Авторы используют данные наблюдений и моделирование.