Исследование Университета Вашингтона, опубликованное в PLOS One, показало, что ИИ может усваивать культурные ценности, наблюдая за человеческим поведением. Авторы ссылаются на ранние результаты, где 19‑месячные дети из латиноамериканских и азиатских семей оказывались более склонны к альтруизму, чем дети из других культур.
В эксперименте взрослые участники, назвавшие себя белыми (190 человек) или латиноамериканцами (110 человек), играли в модифицированную версию видеоигры Overcooked. Игроки могли отдавать лук другому игроку, что помогало тому, но снижало личный итог. Данные каждой группы использовали для обучения отдельного ИИ‑агента методом инверсного обучения с подкреплением (IRL). В отличие от классического обучения с подкреплением, IRL восстанавливает цели и награды, которые, предположительно, стояли за наблюдаемым поведением.
Исследователи обнаружили, что агент, обученный на Latino‑данных, чаще отдавал лук и в дополнительном тесте чаще жертвовал часть денег нуждающемуся. По словам соавтора Эндрю Мелтцоффа из I‑LABS, такой подход ближе к тому, как дети учатся у взрослых: родители подают пример и общий стиль поведения. Старший автор Раджеш Рао из Школы компьютерных наук имени Пола Г. Аллена отмечает, что не стоит жёстко прописывать единый набор ценностей для всех ИИ, и что демонстрации можно масштабировать с ростом объёма и разнообразия культурных данных.
- Публикация: PLOS One.
- Авторы из UW и San Diego State University.
- Исследование показывает важность культурной настройки ИИ.
Сложные слова
- усваивать — принимать и делать своим знания или привычки
- альтруизм — поведение ради пользы других людейальтруизму
- жертвовать — отдавать что-то своё ради другого человекажертвовал
- обучение с подкреплением — метод, где действие связано с наградой или штрафомобучения с подкреплением
- восстанавливать — выявлять или возвращать скрытую информацию о мотивахвосстанавливает
- демонстрация — показ примера действия для обучения другихдемонстрации
- масштабировать — увеличивать что-то по размерам или объёму
- культурная настройка — адаптация продукта к особенностям разных культуркультурной настройки
Подсказка: наведите, сфокусируйтесь или нажмите на выделенные слова, чтобы увидеть краткие определения прямо во время чтения или прослушивания.
Вопросы для обсуждения
- Какие преимущества и риски вы видите в том, что ИИ усваивает культурные ценности через наблюдение за людьми?
- Как можно собрать или организовать демонстрации из разных культур, чтобы улучшить поведение ИИ?
- Должны ли разработчики ИИ явно прописывать ценности или лучше полагаться на примеры человеческого поведения? Почему?