Исследование Университета Вашингтона, опубликованное в PLOS One, показало, что ИИ может усваивать культурные ценности, наблюдая за человеческим поведением. Авторы ссылаются на ранние результаты, где 19‑месячные дети из латиноамериканских и азиатских семей оказывались более склонны к альтруизму, чем дети из других культур.
В эксперименте взрослые участники, назвавшие себя белыми (190 человек) или латиноамериканцами (110 человек), играли в модифицированную версию видеоигры Overcooked. Игроки могли отдавать лук другому игроку, что помогало тому, но снижало личный итог. Данные каждой группы использовали для обучения отдельного ИИ‑агента методом инверсного обучения с подкреплением (IRL). В отличие от классического обучения с подкреплением, IRL восстанавливает цели и награды, которые, предположительно, стояли за наблюдаемым поведением.
Исследователи обнаружили, что агент, обученный на Latino‑данных, чаще отдавал лук и в дополнительном тесте чаще жертвовал часть денег нуждающемуся. По словам соавтора Эндрю Мелтцоффа из I‑LABS, такой подход ближе к тому, как дети учатся у взрослых: родители подают пример и общий стиль поведения. Старший автор Раджеш Рао из Школы компьютерных наук имени Пола Г. Аллена отмечает, что не стоит жёстко прописывать единый набор ценностей для всех ИИ, и что демонстрации можно масштабировать с ростом объёма и разнообразия культурных данных.
- Публикация: PLOS One.
- Авторы из UW и San Diego State University.
- Исследование показывает важность культурной настройки ИИ.
Сложные слова
- усваивать — принимать и делать своим знания или привычки
- альтруизм — поведение ради пользы других людейальтруизму
- жертвовать — отдавать что-то своё ради другого человекажертвовал
- обучение с подкреплением — метод, где действие связано с наградой или штрафомобучения с подкреплением
- восстанавливать — выявлять или возвращать скрытую информацию о мотивахвосстанавливает
- демонстрация — показ примера действия для обучения другихдемонстрации
- масштабировать — увеличивать что-то по размерам или объёму
- культурная настройка — адаптация продукта к особенностям разных культуркультурной настройки
Подсказка: наведите, сфокусируйтесь или нажмите на выделенные слова, чтобы увидеть краткие определения прямо во время чтения или прослушивания.
Вопросы для обсуждения
- Какие преимущества и риски вы видите в том, что ИИ усваивает культурные ценности через наблюдение за людьми?
- Как можно собрать или организовать демонстрации из разных культур, чтобы улучшить поведение ИИ?
- Должны ли разработчики ИИ явно прописывать ценности или лучше полагаться на примеры человеческого поведения? Почему?
Похожие статьи
Пожилые реже видят мир как «нулевую сумму»
Исследование показывает, что пожилые люди реже воспринимают ситуации как «нулевая сумма», чем молодые. Учёные сравнили данные World Values Survey и четыре эксперимента с участниками разных возрастов и обсуждают последствия для политики и работы.