Laute Umgebungen sind für Menschen mit Hörverlust besonders belastend. Ein Forschungsteam stellte einen Prototyp smarter Kopfhörer vor, die mit künstlicher Intelligenz den Turn‑Taking‑Rhythmus in Gesprächen erkennen. Ein Modell analysiert, wer wann gesprochen hat, und ein anderes reduziert Stimmen, die nicht dem Gesprächsmuster folgen, sowie unerwünschte Hintergrundgeräusche.
Das System kann Gesprächspartner bereits nach zwei bis vier Sekunden Audio identifizieren und läuft auf handelsüblicher Hardware. Die Kopfhörer aktivieren sich, sobald der Träger zu sprechen beginnt, und geben bereinigtes Audio in Echtzeit weiter. Das System kann ein bis vier Gesprächspartner zusätzlich zum Träger verarbeiten, ohne auffällige Verzögerungen zu erzeugen.
Die Forschenden testeten die Kopfhörer mit 11 Teilnehmenden und bewerteten Rauschunterdrückung sowie Sprachverständnis mit und ohne KI‑Filtration; das gefilterte Audio erhielt deutlich bessere Bewertungen. Die Modelle wurden mit Englisch‑, Mandarin‑ und Japanisch‑Dialogen geprüft. Herausforderungen wie überlappendes Sprechen, lange Monologe und Personen, die ein- oder austreten, können die Genauigkeit verringern.
Der aktuelle Prototyp nutzt kommerzielle Over‑ear‑Kopfhörer, Mikrofone und Elektronik. Das Team hofft, das System so zu verkleinern, dass es in Earbuds oder Hörgeräten läuft.
Schwierige Wörter
- belastend — etwas, das Stress oder Schwierigkeiten verursacht
- turn‑taking‑rhythmus — Rhythmus, wie Menschen beim Sprechen wechseln
- künstliche Intelligenz — Computerprogramme, die Aufgaben ähnlich wie Menschen lösenkünstlicher Intelligenz
- rauschunterdrückung — Reduzieren von störenden Hintergrundgeräuschen in Audio
- sprachverständnis — Wie gut eine Person gesprochene Sprache versteht
- prototyp — erstes Modell eines Produkts zum Testen
Tipp: Fahre über markierte Wörter oder tippe darauf, um kurze Definitionen zu sehen – während du liest oder zuhörst.
Diskussionsfragen
- Würden Sie solche Kopfhörer in lauten Umgebungen nutzen? Warum oder warum nicht?
- Welche Vorteile hätte es, wenn das System in Earbuds oder Hörgeräten läuft?
- Welche Probleme erwarten Sie bei der Erkennung von Gesprächspartnern in größeren Gruppen?
Verwandte Artikel
OSIA: KI-Beratung für Schul- und Berufsentscheidungen in Kamerun
In Kamerun unterstützt die Plattform OSIA Schülerinnen und Schüler mit einem virtuellen Tutor und psychometrischen Tests bei Schul- und Berufsentscheidungen. Entwickelt hat sie Frédéric Ngaba; die Lösung ist auf lokale Lehrpläne und 20 Sprachen angepasst.
Bericht fordert Reformen für Ugandas Forschung und Innovation
Ein nationaler Bericht, präsentiert am 21. Juni, fordert Reformen in Ugandas Systemen für Wissenschaft, Technologie und Innovation. Er nennt Geschlechterlücken, schwache Finanzierung und ruft zu neuen Finanzierungsmodellen und stärkerer Zusammenarbeit auf.
Wissensgeleitete KI schreibt bessere Überschriften
Forschende der Yale School of Management zeigen, wie ein großes Sprachmodell durch das Generieren und Validieren von Hypothesen Überschriften erzeugt, die mehr Engagement und Vertrauen bringen. Das System wurde mit Upworthy‑Daten getestet und von Menschen bewertet.
KI hilft bei der Erkennung von Melanomen
Forscher der University of Missouri trainieren KI-Modelle mit 400,000 Hautbildern, um Melanome schneller zu erkennen. Einzelne Modelle erreichten bis zu 88% Genauigkeit; kombiniert lagen die Modelle über 92% und dienen als Entscheidungsunterstützung.