等级 B1 – 中级CEFR B1
4 分钟
183 字
研究人员设计了一个智能耳机原型,目标是减轻所谓的“鸡尾酒会问题”——在嘈杂环境中听清对话困难。原型名为“主动听力助手”,在佩戴者开始说话时激活,旨在把交流对象的声音隔离出来。
系统由两个模型组成:第一个模型跟踪对话中的轮替节奏,判断谁在何时说话;第二个模型在此基础上静音不符合节奏的背景声音。团队表示,系统仅用 2 到 4 秒的音频即可识别参与者,并能在现成硬件上运行,面对 1 到 4 名对话者时仍能保持响应速度,避免明显延迟。
研究在苏州的会议上展示并开源了代码。团队用 11 名参与者进行了测试,结果显示经过滤波的音频评分比基线高出两倍多。研究者也指出,讲话重叠、长篇独白和人员进出会降低准确性,未来希望将系统缩小到可运行在耳塞或助听器上的芯片。
难词
- 鸡尾酒会问题 — 嘈杂环境中听清对话的困难
- 轮替节奏 — 谁何时说话的交替模式
- 静音 — 使声音变得没有声响
- 基线 — 用来比较的标准结果
- 开源 — 公开提供软件源码给别人开源了代码
- 延迟 — 系统或声音反应的时间迟缓
- 重叠 — 同时发生或彼此覆盖在一起
提示:在文章中将鼠标悬停、聚焦或轻触高亮词语,即可在阅读或听音频时快速查看简要释义。
相关文章
2025年6月24日
2025年12月16日
用电动汽车电池给住宅供电可省钱并减排
密歇根大学的研究发现,车辆到家庭(V2H)技术可以让车主用车载电池为家用电器供电,从而节省数千美元并减少电网相关的温室气体排放。研究发表于期刊 Nature Energy。
2025年11月18日
人工智能对 LGBTQ+ 社区的风险与关注
全球调查显示 55 percent 的人认为人工智能利大于弊,但图像和语言模型对 LGBTQ+ 存在偏见,生物识别监控在匈牙利骄傲活动获批,倡导者要求更强保护与参与。
2025年11月25日
作者身份如何影响大型语言模型的评估
苏黎世大学研究发现,当告知文本作者身份时,大型语言模型会改变对同一文本的判断。研究在四款模型上进行,发现没有作者信息时高度一致,但加入作者标签后出现隐藏偏见。
2025年9月23日
喀麦隆推出 AI 职业指导平台 OSIA 帮助中学生
一款名为 OSIA 的人工智能平台在喀麦隆上线,为中学生提供虚拟辅导、心理测评和题库,已在 23 所学校拥有 13,500 名订阅者,并获得多方支持。该工具旨在改善过时的职业指导体系。
2025年10月21日