Laute Umgebungen sind für Menschen mit Hörverlust besonders belastend. Ein Forschungsteam stellte einen Prototyp smarter Kopfhörer vor, die mit künstlicher Intelligenz den Turn‑Taking‑Rhythmus in Gesprächen erkennen. Ein Modell analysiert, wer wann gesprochen hat, und ein anderes reduziert Stimmen, die nicht dem Gesprächsmuster folgen, sowie unerwünschte Hintergrundgeräusche.
Das System kann Gesprächspartner bereits nach zwei bis vier Sekunden Audio identifizieren und läuft auf handelsüblicher Hardware. Die Kopfhörer aktivieren sich, sobald der Träger zu sprechen beginnt, und geben bereinigtes Audio in Echtzeit weiter. Das System kann ein bis vier Gesprächspartner zusätzlich zum Träger verarbeiten, ohne auffällige Verzögerungen zu erzeugen.
Die Forschenden testeten die Kopfhörer mit 11 Teilnehmenden und bewerteten Rauschunterdrückung sowie Sprachverständnis mit und ohne KI‑Filtration; das gefilterte Audio erhielt deutlich bessere Bewertungen. Die Modelle wurden mit Englisch‑, Mandarin‑ und Japanisch‑Dialogen geprüft. Herausforderungen wie überlappendes Sprechen, lange Monologe und Personen, die ein- oder austreten, können die Genauigkeit verringern.
Der aktuelle Prototyp nutzt kommerzielle Over‑ear‑Kopfhörer, Mikrofone und Elektronik. Das Team hofft, das System so zu verkleinern, dass es in Earbuds oder Hörgeräten läuft.
Schwierige Wörter
- belastend — etwas, das Stress oder Schwierigkeiten verursacht
- turn‑taking‑rhythmus — Rhythmus, wie Menschen beim Sprechen wechseln
- künstliche Intelligenz — Computerprogramme, die Aufgaben ähnlich wie Menschen lösenkünstlicher Intelligenz
- rauschunterdrückung — Reduzieren von störenden Hintergrundgeräuschen in Audio
- sprachverständnis — Wie gut eine Person gesprochene Sprache versteht
- prototyp — erstes Modell eines Produkts zum Testen
Tipp: Fahre über markierte Wörter oder tippe darauf, um kurze Definitionen zu sehen – während du liest oder zuhörst.
Diskussionsfragen
- Würden Sie solche Kopfhörer in lauten Umgebungen nutzen? Warum oder warum nicht?
- Welche Vorteile hätte es, wenn das System in Earbuds oder Hörgeräten läuft?
- Welche Probleme erwarten Sie bei der Erkennung von Gesprächspartnern in größeren Gruppen?
Verwandte Artikel
Studie: KI kann kulturelle Werte aus Verhalten lernen
Wissenschaftler der University of Washington untersuchten, ob KI durch Beobachtung menschlichen Handelns kulturelle Werte übernimmt. In einem Spiel mit Helfen lernten KI-Agenten Unterschiede zwischen weißen und Latino-Teilnehmenden.
KI in Lateinamerika gegen geschlechtsspezifische Gewalt
Gruppen in Lateinamerika entwickeln offene, lokale KI‑Systeme, um geschlechtsspezifische Ungleichheiten und Gewalt zu untersuchen. Sie schützen sensible Daten, liefern Belege für Zivilgesellschaft und Staat und arbeiten an neuen Funktionen wie Audio‑Transkription.