LingVo.club
📖+40 XP
🎧+25 XP
+45 XP
Языковые модели меняют оценки текстов по автору (Уровень B2) — three white disc on brown surface

Языковые модели меняют оценки текстов по авторуCEFR B2

25 нояб. 2025 г.

Уровень B2 – выше среднего
4 мин
205 слов

Учёные из University of Zurich изучили, как большая языковая модель меняет оценку текста в зависимости от приписанного автора. Федерико Джерманни и Джованни Спитале протестировали четыре широко используемые LLM — OpenAI o3-mini, Deepseek Reasoner, xAI Grok 2 и Mistral. Для анализа каждая модель сгенерировала по пятьдесят повествовательных утверждений по 24 спорным темам, включая обязательную вакцинацию, геополитику и климатическую политику. Затем утверждения оценивали в разных условиях авторства; всего собрано 192'000 оценок.

При отсутствии информации о источнике согласие между моделями превышало 90%. Однако при указании вымышленного автора согласие резко падало и иногда исчезало, хотя сам текст оставался тем же. Исследование выявило глубокую скрытую предвзятость; наиболее заметна была антикитайская предвзятость во всех моделях, включая китайскую Deepseek. В геополитических темах, например о суверенитете Тайваня, Deepseek снижал согласие до 75%, ожидая, что «человек из Китая» будет придерживаться другого мнения.

Также было обнаружено, что модели склонны больше доверять текстам, приписанным людям, чем текстам, которые они считают созданными другим ИИ: оценки согласия немного снижаются, если автор — другая модель. Авторы предупреждают, что такие скрытые предубеждения важны для практических приложений — модерации, найма, академического рецензирования и журналистики — и настаивают на прозрачности и управлении. Они рекомендуют использовать LLM как полезных помощников в рассуждении, но не как окончательных судей. Исследование опубликовано в Sciences Advances. Источник: University of Zurich.

Сложные слова

  • предвзятостьнесправедливое или одностороннее отношение к чему-либо
  • приписыватьсчитать кого-то автором или источником чего-то
    приписанного
  • согласиесходное мнение или согласованная оценка нескольких
  • геополитикавопросы и отношения между разными государствами
    геополитику
  • суверенитетправо государства самостоятельно принимать важные решения
    суверенитете
  • прозрачностьоткрытость действий и доступность информации для всех
    прозрачности
  • модерацияконтроль содержания и правил на платформах или в обсуждениях
    модерации

Подсказка: наведите, сфокусируйтесь или нажмите на выделенные слова, чтобы увидеть краткие определения прямо во время чтения или прослушивания.

Вопросы для обсуждения

  • Почему, по‑вашему, указание вымышленного автора сильно уменьшало согласие между моделями, хотя текст не менялся? Приведите возможные причины.
  • Какие проблемы могут возникнуть при применении LLM в модерации, найме или академическом рецензировании, учитывая обнаруженные скрытые предубеждения?
  • Какие шаги по повышению прозрачности и управлению моделями могли бы снизить скрытые предубеждения? Приведите примеры мер и объясните, почему они полезны.

Похожие статьи

Молодые манты и их рыбы‑спутники у берегов Флориды (Уровень B2)
22 дек. 2025 г.

Молодые манты и их рыбы‑спутники у берегов Флориды

Исследование показало, что молодые карибские манты у юга Флориды часто сопровождают группы других рыб. Учёные проанализировали видеозаписи и дают рекомендации для защиты мант и их экосистемы.

Уровень
Рост центров обработки данных в Латинской Америке (Уровень B2)
29 апр. 2026 г.

Рост центров обработки данных в Латинской Америке

В Латинской Америке увеличивается число центров обработки данных. Расследования показывают встречи технологических компаний с властями, а местные сообщества и экологи выражают обеспокоенность из‑за ресурсов, экологии и отсутствия чётких правил.

Уровень
Одобрен однократный препарат Acoziborole против сонной болезни (Уровень B2)
16 мар. 2026 г.

Одобрен однократный препарат Acoziborole против сонной болезни

Европейские регуляторы одобрили пероральный препарат acoziborole для лечения человеческого африканского трипаносомоза. Лекарство даётся однократно, показало до 96% успеха и снимает необходимость люмбальной пункции.

Уровень
Амазонская молли: клонирование и генетическое здоровье (Уровень B2)
31 мар. 2026 г.

Амазонская молли: клонирование и генетическое здоровье

Учёные University of Missouri выяснили, как амазонская молли — вид, размножающийся клонированием — остаётся генетически здоровой уже более 100,000 лет. Они связывают это с процессом генной конверсии и опубликовали результаты в Nature.

Уровень
Биомаркеры старения у собак похожи на человеческие (Уровень B2)
9 июн. 2026 г.

Биомаркеры старения у собак похожи на человеческие

Исследование Dog Aging Project показало, что биологические сигналы, связанные с продолжительностью жизни у людей, встречаются и у собак. Учёные проанализировали кровь животных и сравнили результаты с крупными исследованиями людей.

Уровень