Новое исследование Университета Вашингтона проверяет, может ли ИИ перенимать культурные ценности так же, как учатся дети. Авторы опираются на ранние работы, где показано, что 19‑месячные дети из латиноамериканских и азиатских семей проявляли больше альтруизма.
Для эксперимента исследователи набрали взрослых, которые назвали себя белыми (190 человек) и латиноамериканцами (110 человек). Данные каждой группы использовали для обучения отдельного ИИ‑агента с помощью инверсного обучения с подкреплением (IRL). В отличие от классического обучения с подкреплением, IRL не задаёт цель явно, а выводит её из наблюдаемого поведения.
В основной задаче участники готовили суп в игре, где передача лука помогала другому игроку, но уменьшала собственный результат. Представители латиноамериканской группы чаще выбирали помощь, и соответствующий агент тоже был более альтруистичен. В дополнительном тесте агент на Latino‑данных чаще жертвовал часть денег нуждающемуся.
Сложные слова
- перенимать — принимать поведение или привычки других людей
- культурные ценности — идеи и нормы в жизни одной культуры
- альтруизм — поведение, когда помогают другим без выгодыальтруизма
- инверсное обучение — метод, который выводит цель из поведенияинверсного обучения
- обучение с подкреплением — метод, где система учится по награде и штрафуобучения с подкреплением
- жертвовать — отдавать что-то важное ради другого человекажертвовал
Подсказка: наведите, сфокусируйтесь или нажмите на выделенные слова, чтобы увидеть краткие определения прямо во время чтения или прослушивания.
Вопросы для обсуждения
- Согласны ли вы, что ИИ может перенимать культурные ценности людей? Почему?
- Как вы думаете, почему исследователи использовали данные разных этнических групп для обучения агентов?
- Какие возможные преимущества и риски вы видите, если ИИ учится альтруистическому поведению?
Похожие статьи
ИИ предсказывает черты личности по обычной речи
Новое исследование показало, что доступные генеративные модели ИИ, как ChatGPT, Claude и LLaMa, по текстам повседневной речи могут предсказывать черты личности, эмоции и поведение с точностью, сопоставимой или лучше оценок близких людей.