LingVo.club
Уровень
Языковые модели меняют оценки текстов по автору — Уровень B2 — three white disc on brown surface

Языковые модели меняют оценки текстов по авторуCEFR B2

25 нояб. 2025 г.

Уровень B2 – выше среднего
4 мин
205 слов

Учёные из University of Zurich изучили, как большая языковая модель меняет оценку текста в зависимости от приписанного автора. Федерико Джерманни и Джованни Спитале протестировали четыре широко используемые LLM — OpenAI o3-mini, Deepseek Reasoner, xAI Grok 2 и Mistral. Для анализа каждая модель сгенерировала по пятьдесят повествовательных утверждений по 24 спорным темам, включая обязательную вакцинацию, геополитику и климатическую политику. Затем утверждения оценивали в разных условиях авторства; всего собрано 192'000 оценок.

При отсутствии информации о источнике согласие между моделями превышало 90%. Однако при указании вымышленного автора согласие резко падало и иногда исчезало, хотя сам текст оставался тем же. Исследование выявило глубокую скрытую предвзятость; наиболее заметна была антикитайская предвзятость во всех моделях, включая китайскую Deepseek. В геополитических темах, например о суверенитете Тайваня, Deepseek снижал согласие до 75%, ожидая, что «человек из Китая» будет придерживаться другого мнения.

Также было обнаружено, что модели склонны больше доверять текстам, приписанным людям, чем текстам, которые они считают созданными другим ИИ: оценки согласия немного снижаются, если автор — другая модель. Авторы предупреждают, что такие скрытые предубеждения важны для практических приложений — модерации, найма, академического рецензирования и журналистики — и настаивают на прозрачности и управлении. Они рекомендуют использовать LLM как полезных помощников в рассуждении, но не как окончательных судей. Исследование опубликовано в Sciences Advances. Источник: University of Zurich.

Сложные слова

  • предвзятостьнесправедливое или одностороннее отношение к чему-либо
  • приписыватьсчитать кого-то автором или источником чего-то
    приписанного
  • согласиесходное мнение или согласованная оценка нескольких
  • геополитикавопросы и отношения между разными государствами
    геополитику
  • суверенитетправо государства самостоятельно принимать важные решения
    суверенитете
  • прозрачностьоткрытость действий и доступность информации для всех
    прозрачности
  • модерацияконтроль содержания и правил на платформах или в обсуждениях
    модерации

Подсказка: наведите, сфокусируйтесь или нажмите на выделенные слова, чтобы увидеть краткие определения прямо во время чтения или прослушивания.

Вопросы для обсуждения

  • Почему, по‑вашему, указание вымышленного автора сильно уменьшало согласие между моделями, хотя текст не менялся? Приведите возможные причины.
  • Какие проблемы могут возникнуть при применении LLM в модерации, найме или академическом рецензировании, учитывая обнаруженные скрытые предубеждения?
  • Какие шаги по повышению прозрачности и управлению моделями могли бы снизить скрытые предубеждения? Приведите примеры мер и объясните, почему они полезны.

Похожие статьи

Рост счетов за электроэнергию на Ямайке после Beryl — Уровень B2
10 янв. 2025 г.

Рост счетов за электроэнергию на Ямайке после Beryl

После урагана Beryl многие ямайцы пожаловались на резкий рост счетов за электроэнергию. Министр энергетики обратился в OUR, и регулятор рекомендовал снизить расхождения в августовских платёжках; обсуждают переход на возобновляемые источники.

Уровень
Системы против пыли для солнечных панелей в Египте — Уровень B2
21 окт. 2025 г.

Системы против пыли для солнечных панелей в Египте

Египетские учёные создали две природоподобные системы для очистки солнечных панелей от пустынной пыли. Одна версия вибрирует с мотором, другая работает на ветре; первые коммерческие установки показали обнадёживающие результаты.

Уровень
Нанофибровый фильтр улавливает CO2 в зданиях — Уровень B2
16 дек. 2025 г.

Нанофибровый фильтр улавливает CO2 в зданиях

Учёные описали многоразовый фильтр из углеродных нанофибр с полиэтиленимином для вентиляции. Он улавливает CO2 внутри помещений, снижает потребление энергии и по расчётам может удалить большие объёмы углекислого газа из воздуха.

Уровень
В Бангладеш создали цифровой архив коренных языков — Уровень B2
24 авг. 2025 г.

В Бангладеш создали цифровой архив коренных языков

В Бангладеш запущен сайт Multilingual Cloud для сохранения коренных языков. Платформа собрала материалы и аудиозаписи для десятков языков и даёт инструменты для документирования произношения и словарного запаса.

Уровень