Een onderzoeksteam ontwikkelde een prototype-koptelefoon dat met kunstmatige intelligentie het beurtwisselingsritme van gesprekken detecteert om stemmen van gesprekspartners te isoleren. Eén model volgt wie wanneer sprak en zoekt naar weinig overlap in uitwisselingen; een tweede model dempt spraak die niet in het gesprekspatroon past en reduceert ander achtergrondgeluid. Het systeem kan gesprekspartners herkennen met slechts two to four seconds of audio en draait op standaard hardware.
Het prototype, genoemd "proactive hearing assistants", activeert wanneer de drager spreekt en speelt de gezuiverde audio direct terug om verwarrende audioverschuiving te voorkomen. In tests met 11 deelnemers beoordeelden gebruikers ruisonderdrukking en begrip; de gefilterde audio werd meer dan twee keer zo gunstig beoordeeld als de baseline.
De onderzoekers noemen ook beperkingen: overlappende spraak, lange monologen en mensen die een gesprek betreden of verlaten verminderen de nauwkeurigheid. De modellen zijn getest op Engels, Mandarijn en Japans en kunnen voor andere talen verder afgestemd moeten worden.
Het huidige systeem werkt met commerciële over-ear koptelefoons, microfoons en elektronica, maar het team wil het verkleinen zodat het op kleine chips in oordopjes of hoortoestellen kan draaien. De onderliggende code is open-source en het werk werd gepresenteerd op de Conference on Empirical Methods in Natural Language Processing in Suzhou; aanvullend werk toonde mogelijkheden op MobiCom 2025. Het onderzoek is gefinancierd door het Moore Inventor Fellows-programma.
Moeilijke woorden
- kunstmatige intelligentie — computersystemen die leren en beslissingen nemen
- beurtwisselingsritme — tempo waarop deelnemers om de beurt spreken
- isoleren — een geluid apart houden van andere geluiden
- dempen — geluid zachter maken of het verminderendempt
- zuiveren — ongewenste geluiden uit audio weghalengezuiverde
- nauwkeurigheid — hoe precies een systeem resultaten geeft
Tip: beweeg de muisaanwijzer over gemarkeerde woorden in het artikel, of tik erop om snelle definities te zien terwijl je leest of luistert.
Discussievragen
- Welke voordelen zou het verkleinen van dit systeem naar kleine chips in oordopjes of hoortoestellen kunnen hebben voor gebruikers? Geef twee voorbeelden.
- Welke problemen of situaties uit het artikel maken het lastiger voor het systeem om goed te werken? Noem twee en leg kort uit.
- Zou je vertrouwen hebben in dit soort ruisonderdrukking in drukke openbare ruimtes? Waarom wel of niet?
Gerelateerde artikelen
Burgerarchivarissen bewaren mondelinge tradities in Zuid-Azië
Burgerarchivarissen leggen volksliederen, mondelinge geschiedenissen, raadsels en traditionele geneeskunde vast. Het project ondersteunt moedertaalsprekers bij opnemen, uploaden en transcriberen voor Wikimedia Commons, Wikisource en Wikipedia (14 taalgemeenschappen, 227 opnamen).
AI helpt prothese natuurlijker grijpen
Onderzoekers voegden druk- en nabijheidssensoren en kunstmatige intelligentie toe aan een commerciële prothese. De combinatie verbeterde grijpprecisie en -veiligheid, verminderde mentale inspanning en maakte veel dagelijkse taken mogelijk zonder lange training.
Sociale media geven vroege signalen van ontheemding
Onderzoekers vinden dat berichten op sociale media vroegtijdige signalen kunnen geven van bevolkingsbewegingen tijdens crises. De studie onderzoekt methoden om te voorspellen wanneer en waar mensen verplaatsen en vergelijkt meerdere casussen en datasettypen.
Waarom taalmodellen moeite hebben met vermenigvuldigen
Onderzoekers van de University of Chicago en partners onderzochten waarom grote taalmodellen twee viercijferige getallen slecht vermenigvuldigen. Een nieuwe trainingsmethode (ICoT) liet modellen tussentijdse waarden onthouden en verbeterde de nauwkeurigheid sterk.