📖+20 XP
🎧+15 XP
✅+25 XP
等级 A2 – 基础CEFR A2
2 分钟
83 字
一个研究团队研究现代大型语言模型是否能判断事件的合理性。他们把不同合理性的句子给模型看,例如常见、不太可能、不可能和荒谬的句子。
研究者使用一种叫做机制可解释性的方法,检查模型的内部数学状态,看看模型在内部编码了什么。
结果显示,较大的模型会出现对应的内部向量,这些向量与人类的判断相似。研究者认为这些发现有助于让模型更可信。
难词
- 大型语言模型 — 能处理大量语言任务的计算模型
- 合理性 — 事情是否合乎常识和逻辑
- 机制可解释性 — 研究模型内部工作原理的方法
- 内部向量 — 模型内部表示信息的数字向量
- 编码 — 把信息转换成模型能用的形式编码了
- 可信 — 可以让人相信、不容易出错更可信
提示:在文章中将鼠标悬停、聚焦或轻触高亮词语,即可在阅读或听音频时快速查看简要释义。
讨论问题
- 你觉得判断一句话是否荒谬重要吗?为什么?
- 你认为让模型更可信对人们有什么好处?
- 如果你是研究者,你会先检查模型的哪些内部信息?