研究：语言模型能判断事件是否合理 — 中文等级 B1

这项工作由布朗大学的研究团队完成，并在国际学习表征会议上发表。领导该研究的博士生Michael Lepori表示，研究发现语言模型在内部编码了类似现实世界因果约束的东西，并且这些编码能预测人类判断。

为检验这一点，团队向模型呈现了描述不同合理性的句子，例如“有人用冰冷却饮料”、“有人用雪冷却饮料”、“有人用火冷却饮料”和荒谬的“有人用昨天冷却饮料”。研究使用机制可解释性方法，检查模型产生的内部数学状态。

实验在若干模型上进行，包括GPT-2、Llama 3.2和Gemma 2。研究发现，足够大的模型会形成与合理性类别相对应的内部向量，这些向量能区分相近类别，准确率约为85%。这些发现有助于开发更智能、更值得信赖的模型。

难词

研究 — 调查或实验以获得新知识

研究团队, 该研究, 研究发现, 研究使用

编码 — 把信息变成可表示的符号

编码了, 这些编码

因果约束 — 关于原因和结果的限制

可解释性 — 能被人理解和解释的性质

机制可解释性方法

向量 — 表示数值或特征的数组

内部向量, 这些向量

合理性 — 符合常识或逻辑的性质

不同合理性的句子, 合理性类别

准确率 — 结果正确的比例或概率

提示：在文章中将鼠标悬停、聚焦或轻触高亮词语，即可在阅读或听音频时快速查看简要释义。

讨论问题

你认为这些研究发现对开发更智能、更值得信赖的模型有什么帮助？请说两点理由。

如果模型能预测人类判断，你会在生活中怎样使用这样的模型？举一两个例子。

研究在若干不同模型上做实验，你觉得测试多种模型有什么好处？

2025年12月18日

台风Ditwah重创斯里兰卡，专家呼吁以科学重建

上个月台风Ditwah袭击斯里兰卡，造成大规模山体滑坡、洪涝和人员伤亡。专家指出损失与未遵守科学预警和土地利用指引有关，呼吁以科学和更好规划为导向重建。

等级

阅读

2026年3月31日

亚马逊莫莉的基因秘密

密苏里大学研究发现，全雌性鱼亚马逊莫莉通过基因转化维持遗传健康，已存续超过十万年。研究挑战了无性谱系必然走向进化死胡同的观点。

等级

阅读

2026年3月31日

传感器在拍摄时为图片和音频生成签名以对抗伪造

苏黎世联邦理工学院的研究人员开发了一种传感器芯片，它在拍摄或录音的瞬间生成加密签名，帮助识别被篡改的照片、视频和音频，并可将签名存入不可更改的账本核验真伪。

等级

阅读

2025年12月24日

大脑时钟中发现关键枢纽细胞

研究团队用一种名为MITE的新计算工具，重建了小鼠视交叉上核的细胞连接，发现少数高度连接的枢纽细胞对网络同步性至关重要。该发现可能帮助校准生物钟。

等级

阅读

2026年3月16日

新口服药获批，简化昏睡病治疗

欧洲监管机构建议批准口服药acoziborole，由赛诺菲与DNDi研发。一次口服即可治疗，临床试验18个月随访成功率达96%。将向世卫组织捐赠，但需配合病媒控制实现消除目标。

等级

阅读

研究：语言模型能判断事件是否合理^{CEFR B1}

难词

讨论问题