等级 B1 – 中级CEFR B1
4 分钟
183 字
研究人员设计了一个智能耳机原型,目标是减轻所谓的“鸡尾酒会问题”——在嘈杂环境中听清对话困难。原型名为“主动听力助手”,在佩戴者开始说话时激活,旨在把交流对象的声音隔离出来。
系统由两个模型组成:第一个模型跟踪对话中的轮替节奏,判断谁在何时说话;第二个模型在此基础上静音不符合节奏的背景声音。团队表示,系统仅用 2 到 4 秒的音频即可识别参与者,并能在现成硬件上运行,面对 1 到 4 名对话者时仍能保持响应速度,避免明显延迟。
研究在苏州的会议上展示并开源了代码。团队用 11 名参与者进行了测试,结果显示经过滤波的音频评分比基线高出两倍多。研究者也指出,讲话重叠、长篇独白和人员进出会降低准确性,未来希望将系统缩小到可运行在耳塞或助听器上的芯片。
难词
- 鸡尾酒会问题 — 嘈杂环境中听清对话的困难
- 轮替节奏 — 谁何时说话的交替模式
- 静音 — 使声音变得没有声响
- 基线 — 用来比较的标准结果
- 开源 — 公开提供软件源码给别人开源了代码
- 延迟 — 系统或声音反应的时间迟缓
- 重叠 — 同时发生或彼此覆盖在一起
提示:在文章中将鼠标悬停、聚焦或轻触高亮词语,即可在阅读或听音频时快速查看简要释义。
讨论问题
- 你在嘈杂环境中听别人说话时遇到困难吗?可以举个例子。
- 如果这种系统能做成耳塞或助听器,你认为最有用的场景是什么?为什么?
- 研究提到的限制(例如讲话重叠)会影响效果,你有什么改进建议吗?