LingVo.club
等级
研究:AI会从文化中学到价值观 — person holding green paper

研究:AI会从文化中学到价值观CEFR B1

2025年12月15日

改编自 U. Washington, Futurity CC BY 4.0

照片: Hitesh Choudhary, Unsplash

等级 B1 – 中级
4 分钟
184

一项发表在 PLOS One 的研究探讨了 AI 是否能像儿童那样通过观察学习文化价值观。研究者用两组不同文化背景成年人的行为数据训练 AI 代理,训练方法是逆向强化学习(IRL),即让 AI 观察人类行为并推断驱动这些行为的目标和回报。

主要实验使用改编的游戏 Overcooked:玩家在自己的厨房做洋葱汤,同时可见另一名玩家的厨房,那名玩家走得更远才完成任务。参与者不知道第二名玩家其实是会请求帮助的机器人。玩家可以把洋葱分给对方,但这样会减少自己送出的汤数。实验结果显示,一方参与者更倾向于帮助,训练自该组数据的 AI 代理也表现出相同倾向。

研究者指出,不应把一套普世价值硬编码进 AI,而应通过增加文化特定数据、多样性和部署前微调来改善系统的文化敏感性,并且需要对更多文化群体和现实世界问题做进一步测试。

难词

  • 逆向强化学习从人类行为推断目标的学习方法
  • 代理代表人或系统执行任务的程序
    AI 代理
  • 推断根据已有信息估计或判断情况
  • 驱动促使行为发生的原因或力量
  • 观察学习通过看别人做事学会新行为
  • 部署把系统安装并投入使用的过程
    部署前微调
  • 微调在投入使用前做的小幅改进
    部署前微调
  • 文化敏感性理解并尊重不同文化差异
  • 普世价值被广泛认为适用于多数人的价值观念
  • 多样性包含不同背景或类型的情况

提示:在文章中将鼠标悬停、聚焦或轻触高亮词语,即可在阅读或听音频时快速查看简要释义。

相关文章

AI帮助医学生练习缝合
2025年12月1日

AI帮助医学生练习缝合

研究人员开发一种可解释的人工智能工具,用于指导医学生练习缝合并提供即时、个性化反馈。团队在一项随机对照研究中比较了AI指导和观看外科医生录像的训练效果。