Investigadores han desarrollado un prototipo de auriculares llamado “proactive hearing assistants” que aborda el llamado "cocktail party problem". El sistema usa inteligencia artificial para predecir y seguir el ritmo de turn-taking en las conversaciones, lo que permite separar voces relevantes de ruido y voces no deseadas sin electrodos implantados.
El diseño combina dos modelos: uno que realiza un análisis de who spoke when y detecta baja superposición entre turnos, y otro que aísla a los interlocutores identificados y genera para el usuario una versión del audio limpiada. El sistema identifica a un participante con entre dos y cuatro segundos de audio, evita retardos confusos y puede manejar de uno a cuatro partners además del usuario.
Los investigadores probaron el prototipo con 11 participantes y comprobaron que el audio filtrado recibió más del doble de valoración que la línea base. También advirtieron límites: la superposición de habla, los monólogos largos y la entrada o salida de personas reducen la precisión. Los ensayos incluyeron diálogo en English, Mandarin y Japanese, por lo que los ritmos de otros idiomas pueden necesitar ajuste.
El prototipo emplea auriculares circumaurales comerciales, micrófonos y circuitería, y el equipo busca reducir tamaño para chips diminutos en auriculares intrauditivos o audífonos. Trabajo concurrente mostrado en MobiCom 2025 sugiere que modelos de IA pueden ejecutarse en dispositivos de audífono muy pequeños. La investigación contó con financiación del Moore Inventor Fellows program y el código es open-source para descarga.
Palabras difíciles
- prototipo — versión inicial de un producto o diseño
- inteligencia artificial — sistemas informáticos que imitan decisiones humanas
- superposición — coincidencia temporal de dos o más voces
- interlocutor — persona que participa en una conversacióninterlocutores
- retardo — demora en la transmisión o reproducción de audioretardos
- filtrar — separar o eliminar señales no deseadasfiltrado
- circumaural — diseño de auriculares que rodea la orejacircumaurales
- financiación — dinero que apoya un proyecto o investigación
Consejo: pasa el cursor, enfoca o toca las palabras resaltadas en el artículo para ver definiciones rápidas mientras lees o escuchas.
Preguntas de discusión
- ¿Qué ventajas y desventajas crees que tiene usar inteligencia artificial para separar voces en conversaciones reales?
- ¿Cómo podría cambiar este sistema la experiencia de personas con pérdida auditiva?
- Si el código es de código abierto, ¿qué riesgos u oportunidades podría traer su uso generalizado?
Artículos relacionados
La “respiración” de las baterías reduce su vida útil
Investigadores hallaron que la expansión y contracción en cada ciclo de carga y descarga causa tensiones internas, llamadas degradación quimomecánica y "cascadas de tensión", que acortan la vida de las baterías. El estudio fue publicado en Science.
La IA puede aprender valores culturales
Una investigación de la University of Washington estudia si la inteligencia artificial aprende valores culturales observando el comportamiento humano. Encontraron que agentes entrenados con datos latinos mostraron más conducta altruista en pruebas de juego y donaciones.
IA para mejorar el acceso a la salud sexual en América Latina
Grupos e investigadores en América Latina usan inteligencia artificial para ofrecer información sobre salud sexual y reproductiva a jóvenes y comunidades marginadas. Proyectos en Perú y Argentina buscan reducir barreras y enfrentan retos como el sesgo de datos.
La IA y la modernización de los tribunales en India
India moderniza sus tribunales con el proyecto e-Courts y Fase III, que incorpora IA y otras tecnologías. Herramientas como SUPACE, SUVAS y Adalat.AI ayudan al trabajo judicial, pero hay preocupaciones sobre errores, sesgos y datos personales.