Een onderzoeksteam ontwikkelde een prototype-koptelefoon dat met kunstmatige intelligentie het beurtwisselingsritme van gesprekken detecteert om stemmen van gesprekspartners te isoleren. Eén model volgt wie wanneer sprak en zoekt naar weinig overlap in uitwisselingen; een tweede model dempt spraak die niet in het gesprekspatroon past en reduceert ander achtergrondgeluid. Het systeem kan gesprekspartners herkennen met slechts two to four seconds of audio en draait op standaard hardware.
Het prototype, genoemd "proactive hearing assistants", activeert wanneer de drager spreekt en speelt de gezuiverde audio direct terug om verwarrende audioverschuiving te voorkomen. In tests met 11 deelnemers beoordeelden gebruikers ruisonderdrukking en begrip; de gefilterde audio werd meer dan twee keer zo gunstig beoordeeld als de baseline.
De onderzoekers noemen ook beperkingen: overlappende spraak, lange monologen en mensen die een gesprek betreden of verlaten verminderen de nauwkeurigheid. De modellen zijn getest op Engels, Mandarijn en Japans en kunnen voor andere talen verder afgestemd moeten worden.
Het huidige systeem werkt met commerciële over-ear koptelefoons, microfoons en elektronica, maar het team wil het verkleinen zodat het op kleine chips in oordopjes of hoortoestellen kan draaien. De onderliggende code is open-source en het werk werd gepresenteerd op de Conference on Empirical Methods in Natural Language Processing in Suzhou; aanvullend werk toonde mogelijkheden op MobiCom 2025. Het onderzoek is gefinancierd door het Moore Inventor Fellows-programma.
Moeilijke woorden
- kunstmatige intelligentie — computersystemen die leren en beslissingen nemen
- beurtwisselingsritme — tempo waarop deelnemers om de beurt spreken
- isoleren — een geluid apart houden van andere geluiden
- dempen — geluid zachter maken of het verminderendempt
- zuiveren — ongewenste geluiden uit audio weghalengezuiverde
- nauwkeurigheid — hoe precies een systeem resultaten geeft
Tip: beweeg de muisaanwijzer over gemarkeerde woorden in het artikel, of tik erop om snelle definities te zien terwijl je leest of luistert.
Discussievragen
- Welke voordelen zou het verkleinen van dit systeem naar kleine chips in oordopjes of hoortoestellen kunnen hebben voor gebruikers? Geef twee voorbeelden.
- Welke problemen of situaties uit het artikel maken het lastiger voor het systeem om goed te werken? Noem twee en leg kort uit.
- Zou je vertrouwen hebben in dit soort ruisonderdrukking in drukke openbare ruimtes? Waarom wel of niet?
Gerelateerde artikelen
App en sms-coaching verminderen psychische klachten bij studenten
Een grote studie vond dat een smartphone-app plus persoonlijke sms-coaching depressie, angst en eetstoornissen bij studenten verminderde. Meer dan 6.200 studenten namen deel en effecten bleven zichtbaar tot twee jaar.
Mensen met gezichtsverlies schatten aankomst van voertuigen
Onderzoekers vergeleken volwassenen met leeftijdsgebonden maculadegeneratie en mensen met normaal zicht bij het schatten van de aankomsttijd van een voertuig in een virtuele omgeving. Beide groepen gebruikten zicht en geluid; er was geen extra voordeel van beide samen.