LingVo.club
📖+40 XP
🎧+25 XP
+45 XP
Языковые модели меняют оценки текстов по автору — Уровень B2 — three white disc on brown surface

Языковые модели меняют оценки текстов по авторуCEFR B2

25 нояб. 2025 г.

Уровень B2 – выше среднего
4 мин
205 слов

Учёные из University of Zurich изучили, как большая языковая модель меняет оценку текста в зависимости от приписанного автора. Федерико Джерманни и Джованни Спитале протестировали четыре широко используемые LLM — OpenAI o3-mini, Deepseek Reasoner, xAI Grok 2 и Mistral. Для анализа каждая модель сгенерировала по пятьдесят повествовательных утверждений по 24 спорным темам, включая обязательную вакцинацию, геополитику и климатическую политику. Затем утверждения оценивали в разных условиях авторства; всего собрано 192'000 оценок.

При отсутствии информации о источнике согласие между моделями превышало 90%. Однако при указании вымышленного автора согласие резко падало и иногда исчезало, хотя сам текст оставался тем же. Исследование выявило глубокую скрытую предвзятость; наиболее заметна была антикитайская предвзятость во всех моделях, включая китайскую Deepseek. В геополитических темах, например о суверенитете Тайваня, Deepseek снижал согласие до 75%, ожидая, что «человек из Китая» будет придерживаться другого мнения.

Также было обнаружено, что модели склонны больше доверять текстам, приписанным людям, чем текстам, которые они считают созданными другим ИИ: оценки согласия немного снижаются, если автор — другая модель. Авторы предупреждают, что такие скрытые предубеждения важны для практических приложений — модерации, найма, академического рецензирования и журналистики — и настаивают на прозрачности и управлении. Они рекомендуют использовать LLM как полезных помощников в рассуждении, но не как окончательных судей. Исследование опубликовано в Sciences Advances. Источник: University of Zurich.

Сложные слова

  • предвзятостьнесправедливое или одностороннее отношение к чему-либо
  • приписыватьсчитать кого-то автором или источником чего-то
    приписанного
  • согласиесходное мнение или согласованная оценка нескольких
  • геополитикавопросы и отношения между разными государствами
    геополитику
  • суверенитетправо государства самостоятельно принимать важные решения
    суверенитете
  • прозрачностьоткрытость действий и доступность информации для всех
    прозрачности
  • модерацияконтроль содержания и правил на платформах или в обсуждениях
    модерации

Подсказка: наведите, сфокусируйтесь или нажмите на выделенные слова, чтобы увидеть краткие определения прямо во время чтения или прослушивания.

Вопросы для обсуждения

  • Почему, по‑вашему, указание вымышленного автора сильно уменьшало согласие между моделями, хотя текст не менялся? Приведите возможные причины.
  • Какие проблемы могут возникнуть при применении LLM в модерации, найме или академическом рецензировании, учитывая обнаруженные скрытые предубеждения?
  • Какие шаги по повышению прозрачности и управлению моделями могли бы снизить скрытые предубеждения? Приведите примеры мер и объясните, почему они полезны.

Похожие статьи

Замедлить репосты, чтобы уменьшить дезинформацию — Уровень B2
6 дек. 2025 г.

Замедлить репосты, чтобы уменьшить дезинформацию

Исследователи из Университета Копенгагена предлагают сделать репосты чуть сложнее: добавить небольшую паузу и элемент обучения. Модель показывает, что пауза снижает репосты, а пауза вместе с обучением повышает качество распространяемых постов.

Уровень
Отключение интернета в Иране во время протестов — Уровень B2
27 февр. 2026 г.

Отключение интернета в Иране во время протестов

Во время крупных протестов в Иране в декабре 2025 — январе 2026 года власти почти полностью отключили интернет. Ограничения связаны с новой моделью цензуры и применением систем глубокого анализа трафика (DPI).

Уровень
Уганда призывает реформировать науку и инновации — Уровень B2
4 июл. 2023 г.

Уганда призывает реформировать науку и инновации

Национальный доклад, представленный 21 июня, говорит, что Уганда должна реформировать системы науки, технологий и инноваций, чтобы ускорить развитие. Отчёт отмечает гендерные пробелы и предлагает усилить финансирование и связи с бизнесом.

Уровень
Наука на африканских языках — Уровень B2
4 авг. 2021 г.

Наука на африканских языках

Репортаж рассказывает о попытках «деколонизировать» науку и переводить научные термины на африканские языки. Журналисты обсуждают сложности перевода, сохранение местных знаний и практические шаги для расширения доступа к науке.

Уровень
Как в мозге устанавливают время: роль супрахиазматического ядра — Уровень B2
24 дек. 2025 г.

Как в мозге устанавливают время: роль супрахиазматического ядра

Учёные разработали инструмент MITE, чтобы изучить, как клетки супрахиазматического ядра (SCN) обмениваются сигналами. Они нашли небольшую группу высокосвязанных «хаб»-клеток, которые критически важны для синхронизации биологических часов.

Уровень