レベル B1 – 中級CEFR B1
4 分
191 語
ワシントン大学の研究は、AIが人間の行動を観察して文化的な価値を学べるかを検証しました。研究では、自己を白人と識別した参加者と自己をラテン系と識別した参加者のデータを別々に使って、AIエージェントを訓練しました。参加者の数は、白人グループが190人、ラテン系グループが110人でした。
エージェントは逆強化学習(逆報酬を推定する学習法、IRL)で訓練され、人の行動からその行動を動かす目標や報酬を推定しました。主要な実験では改変版のゲーム「Overcooked」で、プレイヤーが玉ねぎスープを届けながら他者を助けるかを確かめました。
結果として、ラテン系のデータで訓練されたエージェントは、ゲーム中により多くの玉ねぎを渡すなど利他的に振る舞いました。寄付を判断する別の試験でも同様の傾向が見られ、著者らはより多様な文化データの必要性を指摘しました。
難しい単語
- 観察する — 人や行動を注意深く見ること観察して
- 文化的 — 社会や集団の習慣や価値に関すること文化的な
- 逆強化学習 — 行動から報酬を推定する学習法
- 推定する — データから値や原因をおおよそ決めること
- エージェント — ソフトやロボットなどの動く主体AIエージェント
- 利他的 — 自分より他人を先に考えるさま利他的に
- 寄付 — 金銭や物を他人や団体に与えること
ヒント:記事中の強調表示された単語にマウスオーバー/フォーカス/タップすると、その場で簡単な意味が表示されます。
ディスカッション用の質問
- AIが文化的な価値を学べることについてあなたはどう思いますか。理由を二つ書いてください。
- 研究で違う文化のデータを使うと結果が変わりました。あなたの生活で多様なデータが重要だと感じる場面はありますか。
- ゲームのような状況でAIが利他的に振る舞うことの利点と問題点を一つずつ挙げてください。