等级 A2 – 基础CEFR A2
3 分钟
124 字
研究团队开发了一款名为“主动听力助手”的智能耳机原型,用来解决在嘈杂环境中听不清对话的问题。系统用人工智能检测对话的节奏,并自动识别谁在说话。
这个原型由两个模型协同工作:一个跟踪轮流发言,另一个过滤不符合节奏的噪音。系统只需大约 2 到 4 秒的音频就能开始识别参与者,并能处理除佩戴者外 1 到 4 名对话者。
团队在苏州的会议上展示了成果,并把代码开源。测试显示,经过 AI 过滤的音频理解度明显提高,但仍受讲话重叠和长时间独白影响。
难词
- 原型 — 产品或设备的初步模型
- 节奏 — 声音或动作的速度和顺序
- 识别 — 分辨并确定说话者或事物
- 过滤 — 去掉不需要的声音或杂音
- 开源 — 把程序代码公开给大家
- 重叠 — 两个声音同时发生在一起
提示:在文章中将鼠标悬停、聚焦或轻触高亮词语,即可在阅读或听音频时快速查看简要释义。
讨论问题
- 你在嘈杂环境中听别人说话时有什么困难?
- 如果有这样的智能耳机,你会想用吗?为什么?
- 你认为为什么讲话重叠会影响理解?