Un team ha costruito un prototipo di cuffie intelligenti per aiutare chi parla in luoghi rumorosi. Le cuffie usano intelligenza artificiale per capire il ritmo della conversazione e trovare chi parla.
Il sistema ha due modelli. Il primo stabilisce chi ha parlato e controlla che i turni non si sovrappongano molto. Il secondo isola i partecipanti e silenzia voci e rumori di fondo non desiderati.
Il prototipo funziona su hardware commerciale e può riconoscere gli interlocutori con pochi secondi di audio. È stato presentato in Cina e il codice è open-source. Nei test, l'audio filtrato è risultato più di due volte migliore rispetto al baseline.
Parole difficili
- prototipo — modello iniziale di un dispositivo
- intelligenza artificiale — programmi che simulano capacità umane
- sovrapporsi — verificarsi nello stesso momento due suonisovrappongano
- isolare — separare una persona o un suono dagli altriisola
- interlocutore — persona che partecipa a una conversazioneinterlocutori
- rumore di fondo — suoni presenti nell'ambiente che non sono volutirumori di fondo
Suggerimento: passa il mouse o tocca le parole evidenziate nell’articolo per vedere definizioni rapide mentre leggi o ascolti.
Domande di discussione
- Ti piacerebbe usare queste cuffie in un luogo rumoroso? Perché?
- In quali posti pensi che queste cuffie sarebbero più utili?
- Cosa ne pensi del fatto che il codice sia open-source?
Articoli correlati
Controversie sul vaccino contro la peste suina nelle Filippine
La peste suina africana minaccia l'allevamento e la sicurezza alimentare nelle Filippine. Il governo presenta kit diagnostici e ha importato il vaccino AVAC dal Vietnam, ma esperti e allevatori contestano i risultati e la sicurezza.
Archivio digitale per salvare le lingue del Bangladesh
Un progetto del governo del Bangladesh ha creato il sito Multilingual Cloud per documentare 42 lingue indigene. Il portale pubblica parole, frasi, trascrizioni in IPA e registrazioni audio per conservare le lingue in pericolo.
Strumento riduce l'ostilità nel feed di X
Ricercatori hanno creato un'estensione che usa un grande modello linguistico per riordinare il feed di X, declassando contenuti antidemocratici. In test con volontari durante le elezioni del 2024, l'atteggiamento verso l'altro partito è migliorato.