Языковые модели меняют оценки текстов по автору^{CEFR B2}

25 нояб. 2025 г.

УровеньA1

Адаптировано по материалам U. Zurich, Futurity • CC BY 4.0

Фото: Siora Photography, Unsplash

Уровень B2 – выше среднегоCEFR B2

4 мин

205 слов

Учёные из University of Zurich изучили, как большая языковая модель меняет оценку текста в зависимости от приписанного автора. Федерико Джерманни и Джованни Спитале протестировали четыре широко используемые LLM — OpenAI o3-mini, Deepseek Reasoner, xAI Grok 2 и Mistral. Для анализа каждая модель сгенерировала по пятьдесят повествовательных утверждений по 24 спорным темам, включая обязательную вакцинацию, геополитику и климатическую политику. Затем утверждения оценивали в разных условиях авторства; всего собрано 192'000 оценок.

При отсутствии информации о источнике согласие между моделями превышало 90%. Однако при указании вымышленного автора согласие резко падало и иногда исчезало, хотя сам текст оставался тем же. Исследование выявило глубокую скрытую предвзятость; наиболее заметна была антикитайская предвзятость во всех моделях, включая китайскую Deepseek. В геополитических темах, например о суверенитете Тайваня, Deepseek снижал согласие до 75%, ожидая, что «человек из Китая» будет придерживаться другого мнения.

Также было обнаружено, что модели склонны больше доверять текстам, приписанным людям, чем текстам, которые они считают созданными другим ИИ: оценки согласия немного снижаются, если автор — другая модель. Авторы предупреждают, что такие скрытые предубеждения важны для практических приложений — модерации, найма, академического рецензирования и журналистики — и настаивают на прозрачности и управлении. Они рекомендуют использовать LLM как полезных помощников в рассуждении, но не как окончательных судей. Исследование опубликовано в Sciences Advances. Источник: University of Zurich.

Сложные слова

предвзятость — несправедливое или одностороннее отношение к чему-либо
приписывать — считать кого-то автором или источником чего-то
приписанного
согласие — сходное мнение или согласованная оценка нескольких
геополитика — вопросы и отношения между разными государствами
геополитику
суверенитет — право государства самостоятельно принимать важные решения
суверенитете
прозрачность — открытость действий и доступность информации для всех
прозрачности
модерация — контроль содержания и правил на платформах или в обсуждениях
модерации

Подсказка: наведите, сфокусируйтесь или нажмите на выделенные слова, чтобы увидеть краткие определения прямо во время чтения или прослушивания.

1. Что изучили учёные из University of Zurich?
2. Что произошло при отсутствии информации о источнике текста?
3. Какая предвзятость была наиболее заметна во всех моделях?
4. Как авторы исследования рекомендуют использовать LLM?

Вопросы для обсуждения

Почему, по‑вашему, указание вымышленного автора сильно уменьшало согласие между моделями, хотя текст не менялся? Приведите возможные причины.
Какие проблемы могут возникнуть при применении LLM в модерации, найме или академическом рецензировании, учитывая обнаруженные скрытые предубеждения?
Какие шаги по повышению прозрачности и управлению моделями могли бы снизить скрытые предубеждения? Приведите примеры мер и объясните, почему они полезны.

Читать

Языковые модели меняют оценки текстов по автору CEFR B2

Сложные слова

Вопросы для обсуждения

Похожие статьи

Замедлить репосты, чтобы уменьшить дезинформацию

Отключение интернета в Иране во время протестов

Уганда призывает реформировать науку и инновации

Наука на африканских языках

Как в мозге устанавливают время: роль супрахиазматического ядра

Языковые модели меняют оценки текстов по автору^{CEFR B2}