📖+20 XP
🎧+15 XP
✅+25 XP
等级 A2 – 基础CEFR A2
3 分钟
128 字
研究人员发现,人工智能在处理冗长或重复的文本时,容易产生虚假或误导性的信息,称为“幻觉”。这些错误会增加人们核查和修正输出的工作。
纽约大学的团队开发了一个预处理框架,先对每句话做清洗,保留名词、动词和形容词,并合并多词术语,然后把句子转成数值表示并为其打分,重点提升引言、结果和结论等章节。
接着按鸟群的聚合规则把相似句子聚成簇,从每簇选择得分最高的句子并重排,最后交给大型语言模型生成基于原文的通顺摘要。研究在大量文档上测试,并发表在期刊 Frontiers in Artificial Intelligence。
难词
- 幻觉 — 模型生成的虚假或误导性信息
- 预处理 — 在主要步骤前对文本初步处理
- 清洗 — 去掉不重要或错误的词句
- 合并 — 把几个词或片段放到一起
- 聚成簇 — 把许多相似句子分成一组
- 摘要 — 把文章主要内容写成短的文字
提示:在文章中将鼠标悬停、聚焦或轻触高亮词语,即可在阅读或听音频时快速查看简要释义。
讨论问题
- 你有没有看到过人工智能写出的错误信息?请简单说一件事。
- 你觉得先清洗句子再做摘要有没有帮助?为什么?