Laute Umgebungen sind für Menschen mit Hörverlust besonders belastend. Ein Forschungsteam stellte einen Prototyp smarter Kopfhörer vor, die mit künstlicher Intelligenz den Turn‑Taking‑Rhythmus in Gesprächen erkennen. Ein Modell analysiert, wer wann gesprochen hat, und ein anderes reduziert Stimmen, die nicht dem Gesprächsmuster folgen, sowie unerwünschte Hintergrundgeräusche.
Das System kann Gesprächspartner bereits nach zwei bis vier Sekunden Audio identifizieren und läuft auf handelsüblicher Hardware. Die Kopfhörer aktivieren sich, sobald der Träger zu sprechen beginnt, und geben bereinigtes Audio in Echtzeit weiter. Das System kann ein bis vier Gesprächspartner zusätzlich zum Träger verarbeiten, ohne auffällige Verzögerungen zu erzeugen.
Die Forschenden testeten die Kopfhörer mit 11 Teilnehmenden und bewerteten Rauschunterdrückung sowie Sprachverständnis mit und ohne KI‑Filtration; das gefilterte Audio erhielt deutlich bessere Bewertungen. Die Modelle wurden mit Englisch‑, Mandarin‑ und Japanisch‑Dialogen geprüft. Herausforderungen wie überlappendes Sprechen, lange Monologe und Personen, die ein- oder austreten, können die Genauigkeit verringern.
Der aktuelle Prototyp nutzt kommerzielle Over‑ear‑Kopfhörer, Mikrofone und Elektronik. Das Team hofft, das System so zu verkleinern, dass es in Earbuds oder Hörgeräten läuft.
Schwierige Wörter
- belastend — etwas, das Stress oder Schwierigkeiten verursacht
- turn‑taking‑rhythmus — Rhythmus, wie Menschen beim Sprechen wechseln
- künstliche Intelligenz — Computerprogramme, die Aufgaben ähnlich wie Menschen lösenkünstlicher Intelligenz
- rauschunterdrückung — Reduzieren von störenden Hintergrundgeräuschen in Audio
- sprachverständnis — Wie gut eine Person gesprochene Sprache versteht
- prototyp — erstes Modell eines Produkts zum Testen
Tipp: Fahre über markierte Wörter oder tippe darauf, um kurze Definitionen zu sehen – während du liest oder zuhörst.
Diskussionsfragen
- Würden Sie solche Kopfhörer in lauten Umgebungen nutzen? Warum oder warum nicht?
- Welche Vorteile hätte es, wenn das System in Earbuds oder Hörgeräten läuft?
- Welche Probleme erwarten Sie bei der Erkennung von Gesprächspartnern in größeren Gruppen?
Verwandte Artikel
Warum KI voreingenommen ist
Forscher der University of Texas at Austin untersuchten problematische Algorithmen und fanden drei Hauptursachen für KI-Bias: fehlende klare Entscheidungsgrundlagen, vereinfachte Modelle der Realität und fehlende Vielfalt bei den Entwicklern. Mehr als bessere Genauigkeit ist nötig.
Weniger Teilen, mehr Nachdenken: Reaktion gegen Fehlinformationen
Forschende der University of Copenhagen schlagen vor, das Teilen in sozialen Medien kurz zu verzögern und ein kurzes Lernfenster einzuführen. Modelltests zeigen, dass Verzögerung plus Lernen die Qualität geteilter Beiträge verbessern kann.
Neue KI-Werkzeuge zur Erkennung von Tuberkulose
Auf der Union World Conference on Lung Health in Kopenhagen (18–21 November) wurden vier KI-basierte Werkzeuge vorgestellt, die TB-Erkennung und Überwachung verbessern könnten. Sie zielen auf schnellere, günstigere und besser zugängliche Tests ab.