Команда разработчиков показала прототип умных наушников, цель которых — облегчить восприятие речи в шумной обстановке, известной как «проблема коктейльной вечеринки». Устройство использует искусственный интеллект для обнаружения ритма разговора и смены говорящих.
Первая модель выполняет анализ «who spoke when» и отслеживает, кто говорил и когда, вторая модель подавляет голоса, не относящиеся к диалогу, и другие фоновые шумы. Система может идентифицировать собеседников, используя всего 2–4 секунды аудио, и работает на стандартном коммерческом аппаратном обеспечении.
Результаты представили в Сучжоу (Suzhou, China) на Conference on Empirical Methods in Natural Language Processing, а исходный код выложили в открытый доступ. Авторы отмечают, что система улучшала понимание речи в тестах по сравнению с базовым звуком.
Сложные слова
- прототип — первый рабочий образец нового устройства
- облегчить — сделать что-то более лёгким для понимания
- восприятие — процесс понимания услышанного или увиденного
- искусственный интеллект — компьютерные системы, имитирующие человеческий разум
- идентифицировать — определить, кто является говорящим в записи
- подавлять — устранять или уменьшать нежелательные фоновые звукиподавляет
Подсказка: наведите, сфокусируйтесь или нажмите на выделенные слова, чтобы увидеть краткие определения прямо во время чтения или прослушивания.
Вопросы для обсуждения
- В каких ситуациях такие наушники были бы особенно полезны? Приведите один-два примера.
- Какие возможные проблемы с приватностью могут возникнуть при идентификации собеседников?
- Что ещё можно улучшить в такой системе, чтобы она лучше работала в реальной жизни?
Похожие статьи
Искусственный интеллект помогает диагностировать аутизм в Миссури
Учёные из University of Missouri проверили одобренное FDA устройство CanvasDx с искусственным интеллектом для помощи при диагностике аутизма. В исследовании из 80 детей устройство дало определённые результаты для 52% и не давало ложных диагнозов.
Журналисты просят помочь в борьбе с AI‑фейками
На Форуме журналистов «Пояс и путь» в Ганьчжоу представители СМИ из стран с низким и средним доходом призвали китайскую журналистскую организацию помочь в борьбе с фейками, созданными искусственным интеллектом, и требовать маркировки такого контента.