Новое исследование Virginia Tech показало, что сообщение о диагнозе аутизма может существенно изменить советы больших языковых моделей. Работа, представленная в апреле на конференции CHI, анализировала, как личная информация влияет на рекомендации при повседневных социальных выборах.
Исследователи выделили 12 задокументированных стереотипов и составили сотни сценариев решений. Они протестировали шесть крупных языковых моделей, в том числе GPT-4, Claude, Llama, Gemini и DeepSeek, и сгенерировали 345,000 ответов на тысячи подсказок формата «Сделать A или B?» о встречах, конфликтах, новых впечатлениях и романтике.
В результатах были заметны конкретные смещения: одна модель советовала отказаться от социального приглашения почти 75% времени после раскрытия аутизма, по сравнению примерно с 15% без упоминания; в сценариях свиданий другая модель почти 70% времени рекомендовала избегать романтики или оставаться одиноким, против примерно 50% без упоминания. Одиннадцать из двенадцати стереотипных подсказок существенно смещали решения как минимум в четырёх из шести систем.
Команда также опросила 11 пользователей ИИ с аутизмом и показала им примеры ответов с раскрытием диагноза и без него. Некоторые участники были шокированы и называли ответы ограничивающими или покровительственными, один заметил: «Мы тут советуем, как Споку?» Руководитель лаборатории Eugenia Rho отметила: «Одно предубеждение одного пользователя может быть персонализацией для другого пользователя.» Исследователи называют это «парадоксом безопасности и возможностей»; Wohn предупредил, что ИИ может казаться надёжным, скрывая системные смещения. Команда надеется, что результаты побудят разработчиков создавать более прозрачные системы, позволяющие пользователям контролировать, как информация о личности влияет на ответы. Источник: Virginia Tech.
Сложные слова
- смещение — систематическая ошибка в результатах или решенияхсмещения
- раскрытие — сообщение личной или конфиденциальной информации другимраскрытия, раскрытием
- стереотип — упрощённое представление о группе людейстереотипов, стереотипных
- подсказка — короткое задание или вопрос для моделиподсказок
- предубеждение — негативное или необоснованное отношение к человеку
- покровительственный — относящийся к человеку с снисходительной заботойпокровительственными
- парадокс — ситуация с противоречивыми, неожиданными эффектамипарадоксом
- персонализация — адаптация ответа под особенности конкретного человекаперсонализацией
Подсказка: наведите, сфокусируйтесь или нажмите на выделенные слова, чтобы увидеть краткие определения прямо во время чтения или прослушивания.
Вопросы для обсуждения
- Какие проблемы может вызвать персонализация советов ИИ на основе раскрытия диагноза у пользователей?
- Какие механизмы контроля над влиянием личной информации на ответы ИИ могли бы разработчики реализовать?
- Как вы думаете, какие преимущества и риски есть у прозрачных систем, которые показывают, как информация о личности влияет на рекомендации?