Une équipe de l’University of Washington a mis au point un casque intelligent, présenté à Suzhou lors de la Conference on Empirical Methods in Natural Language Processing. Le coauteur principal Shyam Gollakota et le premier auteur Guilin Hu décrivent une approche proactive qui suit le rythme de prise de parole pour isoler les voix sans recourir à des électrodes implantées.
Le prototype, nommé « assistants auditifs proactifs », combine deux modèles : l’un effectue une analyse « qui a parlé quand » et recherche une faible superposition entre locuteurs ; l’autre coupe les voix qui ne respectent pas le schéma de conversation ainsi que les bruits indésirables. Le système reconnaît un interlocuteur en 2 à 4 secondes et peut gérer de 1 à 4 interlocuteurs en plus du porteur, tout en restant assez rapide pour éviter un délai perceptible.
Les tests avec des participants ont montré que l’audio filtré était évalué plus de deux fois mieux que la configuration de base. Les modèles ont été testés sur des dialogues en English, Mandarin et Japanese, mais les rythmes d’autres langues peuvent demander des ajustements. Le prototype utilise des casques circum‑auriculaires commerciaux, des microphones et des circuits, et l’équipe espère miniaturiser le système pour de petites puces dans des écouteurs ou des appareils auditifs. Des travaux présentés à MobiCom 2025 montrent que des modèles d’IA peuvent tourner sur de très petits appareils auditifs. La recherche a été financée par le Moore Inventor Fellows program et le code est open‑source.
Mots difficiles
- mettre au point — concevoir et développer quelque chose de nouveaumis au point
- proactif — qui anticipe et agit avant les événementsproactive, proactifs
- superposition — recouvrement de deux signaux ou éléments
- schéma — organisation ou structure d'un élément ou action
- interlocuteur — personne qui prend part à une conversation
- miniaturiser — rendre plus petit pour tenir dans un appareil
- électrode — petit dispositif qui mesure ou stimule électriquementélectrodes
Astuce : survolez, mettez le focus ou touchez les mots en surbrillance dans l’article pour voir des définitions rapides pendant que vous lisez ou écoutez.
Questions de discussion
- Quels avantages et inconvénients voyez-vous à utiliser des casques qui isolent automatiquement les voix ? Donnez des exemples.
- L'article dit que les rythmes d'autres langues peuvent demander des ajustements. Comment cela pourrait-il affecter la performance du système ?
- La miniaturisation pour des appareils auditifs est mentionnée. Quels enjeux techniques ou sociaux cela pourrait-il poser selon vous ?
Articles liés
Un site pour sauver les langues du Bangladesh
Un projet du gouvernement et du Bangladesh Computer Council a créé en juillet 2025 un site qui documente et enregistre des langues autochtones menacées. Le dépôt contient mots, phrases, transcriptions phonétiques et enregistrements audio.
L'IA pour l'information en santé sexuelle en Amérique latine
Des groupes et ONG en Amérique latine utilisent l'intelligence artificielle pour élargir l'accès à l'information sur la santé sexuelle et reproductive. Des projets au Pérou et en Argentine ciblent les jeunes et les populations marginalisées, mais des risques de biais sont signalés.