LingVo.club
📖+40 XP
🎧+25 XP
+45 XP
Языковые модели меняют оценки текстов по автору — Уровень B2 — three white disc on brown surface

Языковые модели меняют оценки текстов по авторуCEFR B2

25 нояб. 2025 г.

Уровень B2 – выше среднего
4 мин
205 слов

Учёные из University of Zurich изучили, как большая языковая модель меняет оценку текста в зависимости от приписанного автора. Федерико Джерманни и Джованни Спитале протестировали четыре широко используемые LLM — OpenAI o3-mini, Deepseek Reasoner, xAI Grok 2 и Mistral. Для анализа каждая модель сгенерировала по пятьдесят повествовательных утверждений по 24 спорным темам, включая обязательную вакцинацию, геополитику и климатическую политику. Затем утверждения оценивали в разных условиях авторства; всего собрано 192'000 оценок.

При отсутствии информации о источнике согласие между моделями превышало 90%. Однако при указании вымышленного автора согласие резко падало и иногда исчезало, хотя сам текст оставался тем же. Исследование выявило глубокую скрытую предвзятость; наиболее заметна была антикитайская предвзятость во всех моделях, включая китайскую Deepseek. В геополитических темах, например о суверенитете Тайваня, Deepseek снижал согласие до 75%, ожидая, что «человек из Китая» будет придерживаться другого мнения.

Также было обнаружено, что модели склонны больше доверять текстам, приписанным людям, чем текстам, которые они считают созданными другим ИИ: оценки согласия немного снижаются, если автор — другая модель. Авторы предупреждают, что такие скрытые предубеждения важны для практических приложений — модерации, найма, академического рецензирования и журналистики — и настаивают на прозрачности и управлении. Они рекомендуют использовать LLM как полезных помощников в рассуждении, но не как окончательных судей. Исследование опубликовано в Sciences Advances. Источник: University of Zurich.

Сложные слова

  • предвзятостьнесправедливое или одностороннее отношение к чему-либо
  • приписыватьсчитать кого-то автором или источником чего-то
    приписанного
  • согласиесходное мнение или согласованная оценка нескольких
  • геополитикавопросы и отношения между разными государствами
    геополитику
  • суверенитетправо государства самостоятельно принимать важные решения
    суверенитете
  • прозрачностьоткрытость действий и доступность информации для всех
    прозрачности
  • модерацияконтроль содержания и правил на платформах или в обсуждениях
    модерации

Подсказка: наведите, сфокусируйтесь или нажмите на выделенные слова, чтобы увидеть краткие определения прямо во время чтения или прослушивания.

Вопросы для обсуждения

  • Почему, по‑вашему, указание вымышленного автора сильно уменьшало согласие между моделями, хотя текст не менялся? Приведите возможные причины.
  • Какие проблемы могут возникнуть при применении LLM в модерации, найме или академическом рецензировании, учитывая обнаруженные скрытые предубеждения?
  • Какие шаги по повышению прозрачности и управлению моделями могли бы снизить скрытые предубеждения? Приведите примеры мер и объясните, почему они полезны.

Похожие статьи

Как бурозубки уменьшают мозг на зиму — Уровень B2
10 февр. 2026 г.

Как бурозубки уменьшают мозг на зиму

Две новые статьи описывают, как евразийские бурозубки сокращают размер мозга и других органов зимой и снова восстанавливают их весной. Учёные связали эти сезонные изменения с генетическими и хромосомными механизмами.

Уровень
Циклон Дитвах и разрушения в Шри-Ланке — Уровень B2
18 дек. 2025 г.

Циклон Дитвах и разрушения в Шри-Ланке

Циклон Дитвах обрушился на Шри‑Ланку и вызвал крупные разрушения: сотни погибших, тысячи оползней и большие наводнения. Эксперты говорят, что предупреждения и правила землепользования не соблюдали и призывают к восстановлению на научной основе.

Уровень
ИИ учится культурным ценностям через наблюдение — Уровень B2
15 дек. 2025 г.

ИИ учится культурным ценностям через наблюдение

Исследование Университета Вашингтона показало, что ИИ, обученный на данных разных групп людей, усваивает их склонности к помощи. Работа использует метод инверсного обучения и модель поведения из игры Overcooked.

Уровень