Uma equipe de pesquisa apresentou um protótipo de fones de ouvido inteligentes chamados "proactive hearing assistants" que usam modelos de inteligência artificial para isolar interlocutores em conversas ruidosas. O autor sênior Shyam Gollakota, professor da University of Washington na Paul G. Allen School of Computer Science & Engineering, afirmou que muitas abordagens anteriores dependem de eletrodos implantados no cérebro, enquanto a nova técnica prevê o ritmo de alternância da fala apenas com áudio.
O sistema opera com dois modelos complementares: o primeiro realiza uma análise de "quem falou quando" e favorece baixa sobreposição entre trocas de fala; o segundo isola os participantes identificados e reproduz um áudio limpo para o usuário. O protótipo identifica interlocutores com apenas dois a quatro segundos de áudio, roda em hardware comercial e evita atraso perceptível. Consegue lidar com um a quatro interlocutores além do usuário.
A equipe testou os fones com 11 participantes, que avaliaram supressão de ruído e compreensão com e sem a filtragem por IA; o áudio filtrado recebeu nota mais de duas vezes superior ao baseline. O autor principal Guilin Hu, doutorando na Allen School, disse que sistemas anteriores pediam que o usuário selecionasse um falante, enquanto a nova abordagem é proativa e infere a intenção automaticamente.
Persistem desafios, como falas sobrepostas, monólogos longos e pessoas entrando ou saindo da conversa, e os modelos foram testados com diálogo em English, Mandarin e Japanese, o que pode exigir ajuste para outros ritmos de língua. O protótipo usa fones circumaurais, microfones e circuitos; a equipe pretende miniaturizar o sistema para earbuds ou aparelhos auditivos pequenos. Trabalhos apresentados na MobiCom 2025 mostram que modelos de IA já podem rodar em aparelhos auditivos muito pequenos. A pesquisa foi financiada pelo programa Moore Inventor Fellows.
Palavras difíceis
- protótipo — versão inicial de um produto em testes
- isolar — separar sons ou pessoas de outros sonsisola
- interlocutor — pessoa que participa de uma conversainterlocutores
- sobreposição — quando dois sons ocorrem ao mesmo tempo
- filtragem — processo de remover ruído de um áudio
- proativo — agente que age antecipando intenção alheiaproativa
- miniaturizar — reduzir o tamanho físico de um dispositivo
- supressão — redução ou eliminação de som indesejado
Dica: passe o mouse, foque ou toque nas palavras destacadas no artigo para ver definições rápidas enquanto lê ou ouve.
Perguntas para discussão
- Que benefícios e riscos você vê se esses fones proativos se tornarem comuns no dia a dia?
- Como a necessidade de ajuste para outros ritmos de língua pode afetar a adoção em diferentes países?
- Quais prioridades a equipe deveria ter ao miniaturizar o sistema para earbuds ou aparelhos auditivos?