Investigadores han desarrollado un prototipo de auriculares llamado “proactive hearing assistants” que aborda el llamado "cocktail party problem". El sistema usa inteligencia artificial para predecir y seguir el ritmo de turn-taking en las conversaciones, lo que permite separar voces relevantes de ruido y voces no deseadas sin electrodos implantados.
El diseño combina dos modelos: uno que realiza un análisis de who spoke when y detecta baja superposición entre turnos, y otro que aísla a los interlocutores identificados y genera para el usuario una versión del audio limpiada. El sistema identifica a un participante con entre dos y cuatro segundos de audio, evita retardos confusos y puede manejar de uno a cuatro partners además del usuario.
Los investigadores probaron el prototipo con 11 participantes y comprobaron que el audio filtrado recibió más del doble de valoración que la línea base. También advirtieron límites: la superposición de habla, los monólogos largos y la entrada o salida de personas reducen la precisión. Los ensayos incluyeron diálogo en English, Mandarin y Japanese, por lo que los ritmos de otros idiomas pueden necesitar ajuste.
El prototipo emplea auriculares circumaurales comerciales, micrófonos y circuitería, y el equipo busca reducir tamaño para chips diminutos en auriculares intrauditivos o audífonos. Trabajo concurrente mostrado en MobiCom 2025 sugiere que modelos de IA pueden ejecutarse en dispositivos de audífono muy pequeños. La investigación contó con financiación del Moore Inventor Fellows program y el código es open-source para descarga.
Palabras difíciles
- prototipo — versión inicial de un producto o diseño
- inteligencia artificial — sistemas informáticos que imitan decisiones humanas
- superposición — coincidencia temporal de dos o más voces
- interlocutor — persona que participa en una conversacióninterlocutores
- retardo — demora en la transmisión o reproducción de audioretardos
- filtrar — separar o eliminar señales no deseadasfiltrado
- circumaural — diseño de auriculares que rodea la orejacircumaurales
- financiación — dinero que apoya un proyecto o investigación
Consejo: pasa el cursor, enfoca o toca las palabras resaltadas en el artículo para ver definiciones rápidas mientras lees o escuchas.
Preguntas de discusión
- ¿Qué ventajas y desventajas crees que tiene usar inteligencia artificial para separar voces en conversaciones reales?
- ¿Cómo podría cambiar este sistema la experiencia de personas con pérdida auditiva?
- Si el código es de código abierto, ¿qué riesgos u oportunidades podría traer su uso generalizado?
Artículos relacionados
TikTok y el clan en Somalia
Una investigación muestra que TikTok amplifica la identidad clanica en Somalia, aumenta la polarización y puede financiar conflictos como los de Laasanood en 2023. También hay creadores que promueven la paz y recomendaciones de moderación y educación digital.
Microbios permiten saber la edad de las heces de termitas
Un estudio propone usar los microbios y su ADN en los pellets de termitas para distinguir excremento reciente de viejo. El método podría ofrecer una prueba rápida en el lugar para detectar infestaciones y evitar tratamientos innecesarios.