Een onderzoeksteam ontwikkelde een prototype-koptelefoon dat met kunstmatige intelligentie het beurtwisselingsritme van gesprekken detecteert om stemmen van gesprekspartners te isoleren. Eén model volgt wie wanneer sprak en zoekt naar weinig overlap in uitwisselingen; een tweede model dempt spraak die niet in het gesprekspatroon past en reduceert ander achtergrondgeluid. Het systeem kan gesprekspartners herkennen met slechts two to four seconds of audio en draait op standaard hardware.
Het prototype, genoemd "proactive hearing assistants", activeert wanneer de drager spreekt en speelt de gezuiverde audio direct terug om verwarrende audioverschuiving te voorkomen. In tests met 11 deelnemers beoordeelden gebruikers ruisonderdrukking en begrip; de gefilterde audio werd meer dan twee keer zo gunstig beoordeeld als de baseline.
De onderzoekers noemen ook beperkingen: overlappende spraak, lange monologen en mensen die een gesprek betreden of verlaten verminderen de nauwkeurigheid. De modellen zijn getest op Engels, Mandarijn en Japans en kunnen voor andere talen verder afgestemd moeten worden.
Het huidige systeem werkt met commerciële over-ear koptelefoons, microfoons en elektronica, maar het team wil het verkleinen zodat het op kleine chips in oordopjes of hoortoestellen kan draaien. De onderliggende code is open-source en het werk werd gepresenteerd op de Conference on Empirical Methods in Natural Language Processing in Suzhou; aanvullend werk toonde mogelijkheden op MobiCom 2025. Het onderzoek is gefinancierd door het Moore Inventor Fellows-programma.
Moeilijke woorden
- kunstmatige intelligentie — computersystemen die leren en beslissingen nemen
- beurtwisselingsritme — tempo waarop deelnemers om de beurt spreken
- isoleren — een geluid apart houden van andere geluiden
- dempen — geluid zachter maken of het verminderendempt
- zuiveren — ongewenste geluiden uit audio weghalengezuiverde
- nauwkeurigheid — hoe precies een systeem resultaten geeft
Tip: beweeg de muisaanwijzer over gemarkeerde woorden in het artikel, of tik erop om snelle definities te zien terwijl je leest of luistert.
Discussievragen
- Welke voordelen zou het verkleinen van dit systeem naar kleine chips in oordopjes of hoortoestellen kunnen hebben voor gebruikers? Geef twee voorbeelden.
- Welke problemen of situaties uit het artikel maken het lastiger voor het systeem om goed te werken? Noem twee en leg kort uit.
- Zou je vertrouwen hebben in dit soort ruisonderdrukking in drukke openbare ruimtes? Waarom wel of niet?
Gerelateerde artikelen
AI kan persoonlijkheid voorspellen uit taal
Onderzoekers vonden dat algemene AI-modellen zoals ChatGPT, Claude en LLaMa persoonlijkheid en dagelijks gedrag kunnen voorspellen uit wat mensen zeggen. De AI-scores kwamen vaak overeen met zelfbeoordelingen en voorspelden ook emoties en stress.