Investigadores han desarrollado un prototipo de auriculares llamado “proactive hearing assistants” que aborda el llamado "cocktail party problem". El sistema usa inteligencia artificial para predecir y seguir el ritmo de turn-taking en las conversaciones, lo que permite separar voces relevantes de ruido y voces no deseadas sin electrodos implantados.
El diseño combina dos modelos: uno que realiza un análisis de who spoke when y detecta baja superposición entre turnos, y otro que aísla a los interlocutores identificados y genera para el usuario una versión del audio limpiada. El sistema identifica a un participante con entre dos y cuatro segundos de audio, evita retardos confusos y puede manejar de uno a cuatro partners además del usuario.
Los investigadores probaron el prototipo con 11 participantes y comprobaron que el audio filtrado recibió más del doble de valoración que la línea base. También advirtieron límites: la superposición de habla, los monólogos largos y la entrada o salida de personas reducen la precisión. Los ensayos incluyeron diálogo en English, Mandarin y Japanese, por lo que los ritmos de otros idiomas pueden necesitar ajuste.
El prototipo emplea auriculares circumaurales comerciales, micrófonos y circuitería, y el equipo busca reducir tamaño para chips diminutos en auriculares intrauditivos o audífonos. Trabajo concurrente mostrado en MobiCom 2025 sugiere que modelos de IA pueden ejecutarse en dispositivos de audífono muy pequeños. La investigación contó con financiación del Moore Inventor Fellows program y el código es open-source para descarga.
Palabras difíciles
- prototipo — versión inicial de un producto o diseño
- inteligencia artificial — sistemas informáticos que imitan decisiones humanas
- superposición — coincidencia temporal de dos o más voces
- interlocutor — persona que participa en una conversacióninterlocutores
- retardo — demora en la transmisión o reproducción de audioretardos
- filtrar — separar o eliminar señales no deseadasfiltrado
- circumaural — diseño de auriculares que rodea la orejacircumaurales
- financiación — dinero que apoya un proyecto o investigación
Consejo: pasa el cursor, enfoca o toca las palabras resaltadas en el artículo para ver definiciones rápidas mientras lees o audicións.
Preguntas de discusión
- ¿Qué ventajas y desventajas crees que tiene usar inteligencia artificial para separar voces en conversaciones reales?
- ¿Cómo podría cambiar este sistema la experiencia de personas con pérdida auditiva?
- Si el código es de código abierto, ¿qué riesgos u oportunidades podría traer su uso generalizado?
Artículos relacionados
IA para mejorar el acceso a la salud sexual en América Latina
Grupos e investigadores en América Latina usan inteligencia artificial para ofrecer información sobre salud sexual y reproductiva a jóvenes y comunidades marginadas. Proyectos en Perú y Argentina buscan reducir barreras y enfrentan retos como el sesgo de datos.
Repensar lo humano en la inteligencia artificial
La artista Xonorika Kira critica la idea de 'centrar lo humano' en la inteligencia artificial porque excluye otras formas de conocimiento. Propone reconocer la interdependencia entre especies, tecnologías y planetas y cambiar cómo se usan datos y modelos.
Usar baterías de vehículos eléctricos para alimentar hogares puede ahorrar dinero y reducir emisiones
Un estudio de la University of Michigan, publicado en Nature Energy, muestra que usar la batería de un vehículo eléctrico para alimentar la casa (V2H) puede ahorrar miles de dólares y bajar las emisiones de la red.
Cómo juzgan la llegada de coches las personas con pérdida de visión
Un estudio comparó a adultos con degeneración macular y a adultos con visión normal usando realidad virtual y sonidos de coche. Encontraron estimaciones similares y no hallaron ventaja cuando vista y sonido se combinaron.