用鸟群法减少AI长文摘要的“幻觉” (中文, 等级 B1)

研究者指出，人工智能生成摘要时会出现“幻觉”，尤其是在输入冗长、噪声多或重复的文本时，这会拖慢工作进度，因为人们必须核查并修正这些错误。

纽约大学一个由 Anasse Bari 领导、Binxu Huang 等人参与的团队，开发了一个算法框架，作为大型语言模型的预处理步骤。第一阶段对句子进行清洗，保留名词、动词和形容词，并合并多词术语以保持概念完整，然后将句子转换为融合词汇、语义和主题特征的数值向量并计算多项评分。

第二阶段应用鸟群的凝聚、对齐与分离原则，把含义相近的句子聚成簇。每簇选取得分最高的代表句，既减少冗余又保留背景、方法、结果与结论等覆盖。所选句子重排后交给大型语言模型合成为基于原文的流畅摘要。研究在超过9,000份文档上测试，结果显示与未用该框架的模型相比，事实准确性有所提高。

Bari 表示该框架是预处理步骤，目的不是与大型语言模型竞争，而是帮助人工智能生成更贴近原始材料的摘要。作者也指出该方法能降低幻觉风险，但不能完全消除。

难词

幻觉 — 模型生成的不真实信息

冗长 — 比需要更长的文本

清洗 — 去掉无关或错误内容

语义 — 词句的意义或信息

聚成簇 — 把相似句子分到同一组

冗余 — 重复或多余的内容

预处理 — 在主处理前先做的准备工作

提示：在文章中将鼠标悬停、聚焦或轻触高亮词语，即可在阅读或听音频时快速查看简要释义。

讨论问题

你平时会怎样核查自动生成摘要的事实准确性？举两个方法并说明原因。

你认为先对文本做清洗和聚类，会如何影响摘要的质量？为什么？

作者说该方法能降低但不能完全消除幻觉，你觉得还需要哪些其他措施来进一步减少错误？

罗彻斯特大学研究人员开发新算法，解释丙烷如何转为丙烯并研究金属相与氧化物相共存时的反应。算法识别关键原子特征，结果可应用于甲醇合成等工业反应。

等级

康妮·恩谢梅雷维是教育测量专家和前工程师。她在采访中说，非洲的研究议程应由基层产生，要加强南方科学家的联系，并改善科学传播与教育恢复措施。

等级

一项研究发现，广泛可得的生成型人工智能（如 ChatGPT、Claude、LLaMa）能从人们的日常语言中预测个性、行为和情绪，AI 给出的评分与自评高度一致，有时优于亲友判断。

等级

研究显示，生成式人工智能可以读取旅行者的情绪和偏好，实时提供个性化行程建议，覆盖出行前、行程中和行程后。研究者同时提醒需要注意隐私和伦理问题。来源：Virginia Tech。

等级

布朗大学团队研究大型语言模型是否在内部编码现实世界的合理性约束。研究通过机制可解释性分析模型内部向量，发现这些向量与人类的合理性判断相吻合。

等级

用鸟群法减少AI长文摘要的“幻觉”^{CEFR B1}