LingVo.club
等级
研究:AI会从文化中学到价值观 — 等级 B2 — person holding green paper

研究:AI会从文化中学到价值观CEFR B2

2025年12月15日

改编自 U. Washington, Futurity CC BY 4.0

照片: Hitesh Choudhary, Unsplash

等级 B2 – 中高级
5 分钟
261

华盛顿大学的一项研究在 PLOS One 上发表,探讨 AI 是否会从训练数据中吸收文化价值观。研究者借鉴早期儿童行为研究,招募了自认是白人和自认是拉丁裔的成年人,并分别用两组数据训练各自的 AI 代理。训练方法是逆向强化学习(IRL),该方法让 AI 观察人类行为并推断出行为背后的目标与回报,研究者认为这更接近人类通过示范学习的方式。

在主要实验中,参与者玩改编的 Overcooked 游戏:玩家在自己的厨房做洋葱汤,并且能看到另一名玩家的厨房;那名玩家需要走更远的路来完成同样任务。参与者并不知道对方实际上是会请求帮助的机器人。玩家可以把洋葱分给对方以提供帮助,但这样会减少他们自己能送出的汤数。研究发现,来自拉丁裔组的数据训练出的代理更经常赠送洋葱,第二项关于捐款的测试也显示同样的利他差异。

高级作者 Rajesh Rao 强调不应将一套普世价值硬编码进 AI 系统。作者建议通过增加文化特定数据的数量和多样性,并在部署前对系统进行微调,来让 AI 更具文化敏感性。研究者同时指出,需要进一步测试更多文化群体、相互竞争的价值观以及现实世界的应用。研究合著者来自华盛顿大学和圣地亚哥州立大学。

难词

  • 逆向强化学习通过观察行为推测目标和回报的方法
    逆向强化学习(IRL)
  • 代理代表人类在环境中行动的程序
    AI 代理
  • 示范学习通过模仿他人行为来学习的方法
  • 利他差异群体间帮助他人行为的不同
  • 微调在已有模型上进行小范围调整
  • 文化敏感性理解并尊重不同文化差异的态度
  • 普世价值被广泛认为适用于多数人的价值观

提示:在文章中将鼠标悬停、聚焦或轻触高亮词语,即可在阅读或听音频时快速查看简要释义。

讨论问题

  • 你认为用来自不同文化群体的数据训练 AI,会带来哪些潜在好处和风险?请给出一两个理由。
  • 在现实世界应用中,应该怎样收集和增加“文化特定数据”的多样性?请提出可行的方法。
  • 作者反对将一套普世价值硬编码进 AI,你是否同意?说明你的理由并举例支持你的观点。

相关文章