ИИ учится культурным ценностям через наблюдение^{CEFR B2}

15 дек. 2025 г.

УровеньA1

Адаптировано по материалам U. Washington, Futurity • CC BY 4.0

Фото: Hitesh Choudhary, Unsplash

Уровень B2 – выше среднегоCEFR B2

4 мин

205 слов

Исследование Университета Вашингтона, опубликованное в PLOS One, показало, что ИИ может усваивать культурные ценности, наблюдая за человеческим поведением. Авторы ссылаются на ранние результаты, где 19‑месячные дети из латиноамериканских и азиатских семей оказывались более склонны к альтруизму, чем дети из других культур.

В эксперименте взрослые участники, назвавшие себя белыми (190 человек) или латиноамериканцами (110 человек), играли в модифицированную версию видеоигры Overcooked. Игроки могли отдавать лук другому игроку, что помогало тому, но снижало личный итог. Данные каждой группы использовали для обучения отдельного ИИ‑агента методом инверсного обучения с подкреплением (IRL). В отличие от классического обучения с подкреплением, IRL восстанавливает цели и награды, которые, предположительно, стояли за наблюдаемым поведением.

Исследователи обнаружили, что агент, обученный на Latino‑данных, чаще отдавал лук и в дополнительном тесте чаще жертвовал часть денег нуждающемуся. По словам соавтора Эндрю Мелтцоффа из I‑LABS, такой подход ближе к тому, как дети учатся у взрослых: родители подают пример и общий стиль поведения. Старший автор Раджеш Рао из Школы компьютерных наук имени Пола Г. Аллена отмечает, что не стоит жёстко прописывать единый набор ценностей для всех ИИ, и что демонстрации можно масштабировать с ростом объёма и разнообразия культурных данных.

Публикация: PLOS One.
Авторы из UW и San Diego State University.
Исследование показывает важность культурной настройки ИИ.

Сложные слова

усваивать — принимать и делать своим знания или привычки
альтруизм — поведение ради пользы других людей
альтруизму
жертвовать — отдавать что-то своё ради другого человека
жертвовал
обучение с подкреплением — метод, где действие связано с наградой или штрафом
обучения с подкреплением
восстанавливать — выявлять или возвращать скрытую информацию о мотивах
восстанавливает
демонстрация — показ примера действия для обучения других
демонстрации
масштабировать — увеличивать что-то по размерам или объёму
культурная настройка — адаптация продукта к особенностям разных культур
культурной настройки

Подсказка: наведите, сфокусируйтесь или нажмите на выделенные слова, чтобы увидеть краткие определения прямо во время чтения или прослушивания.

1. Что показало исследование Университета Вашингтона?
2. Какой метод использовали для обучения отдельных ИИ‑агентов?
3. Какое поведение чаще проявлял агент, обученный на Latino‑данных?
4. Что отметил старший автор Раджеш Рао о ценностях для ИИ?

Вопросы для обсуждения

Какие преимущества и риски вы видите в том, что ИИ усваивает культурные ценности через наблюдение за людьми?
Как можно собрать или организовать демонстрации из разных культур, чтобы улучшить поведение ИИ?
Должны ли разработчики ИИ явно прописывать ценности или лучше полагаться на примеры человеческого поведения? Почему?

Читать

ИИ учится культурным ценностям через наблюдение CEFR B2

Сложные слова

Вопросы для обсуждения

Похожие статьи

Частые отключения в Mile four заставляют жителей ставить солнечные панели

Самоварные танцы в Уфе возвращают башкирские традиции

Ланре Обисесан: Кинематографист и исцеление

Как стресс влияет на сон

Дети и травма в зонах войны

ИИ учится культурным ценностям через наблюдение^{CEFR B2}