시끄러운 환경에서 여러 사람의 목소리를 구별하는 '칵테일 파티 문제'는 청력 손실이 있는 사람에게 특히 힘듭니다. 연구팀은 착용자의 대화 상대 목소리를 분리하는 스마트 헤드폰 시제품을 개발했습니다. 이 시스템은 인공지능으로 발화의 리듬과 교대를 추적합니다.
한 모델은 누가 언제 말했는지 추적해 겹침이 적은 부분을 찾고, 다른 모델은 대화를 따르지 않는 소리와 배경 소음을 음소거해 정제된 오디오를 재생합니다. 시스템은 2~4초의 짧은 오디오로 상대를 식별할 수 있고, 상용 하드웨어에서 동작합니다.
시제품은 착용자가 말을 시작하면 활성화되며, 착용자를 포함해 최대 네 명의 대화 상대를 처리할 수 있습니다. 11명의 참가자 실험에서 필터링된 오디오는 기준음보다 두 배 이상 긍정적으로 평가되었습니다.
수석 저자 샤얌 골라코타 교수는 기존 방법이 종종 이식형 전극을 필요로 했지만, 이 접근은 오디오만으로 추적해 이식형 장치가 필요 없다고 밝혔습니다.
어려운 단어·표현
- 칵테일 파티 문제 — 시끄러운 곳에서 여러 목소리 구별하기 어려움'칵테일 파티 문제'
- 청력 손실 — 소리를 듣는 능력이 약해지는 상태
- 착용자 — 기기를 몸에 착용한 사람을 가리킴착용자의, 착용자가
- 발화 — 사람이 말을 하거나 소리를 내는 일발화의
- 겹침 — 두 명 이상의 소리가 동시에 나는 상태겹침이
- 음소거 — 소리나 소음을 들리지 않게 하는 행위음소거해
- 시제품 — 최종 제품 전에 만든 시험용 모델
- 인공지능 — 데이터로 결정을 배우는 컴퓨터 기술인공지능으로
팁: 글에서 강조된 단어에 마우스를 올리거나 포커스/탭하면, 읽거나 들으면서 바로 간단한 뜻을 볼 수 있습니다.
관련 기사
서부 발칸 인스타그램 계정에 대한 봇 공격
2025년 11월 서부 발칸에서 조정된 봇 캠페인이 활동가와 언론인 인스타그램 계정을 겨냥했다. Meta.mk의 11월 16일과 11월 23일 보도는 자동화된 플랫폼 규칙을 악용해 비판적 목소리를 잠재우려 했다고 전했다.
AI와 LGBTQ+: 편향과 감시의 위험
여론조사에서는 AI의 이점이 크다고 느끼지만, 학습 데이터와 설계 때문에 LGBTQ+에 대한 편향과 생체인식 감시의 위험이 제기된다. 옹호단체들은 더 강한 보호와 협력을 요구한다.
제니차 만화학교: 전쟁 속에서 시작된 예술 학교
제니차의 만화학교는 1992-95년 전쟁 동안 시작되어 30년 넘게 운영됐다. 약 200명의 젊은 작가를 배출했고, 기술 변화와 출판 환경 악화 속에서도 축제와 지역 협력으로 만화 문화가 이어지고 있다.
결핵 진단과 모니터를 돕는 새 AI 도구들
연구자들이 결핵을 더 잘 찾아내고 추적할 수 있는 여러 인공지능 도구를 발표했다. 발표는 코펜하겐에서 열린 학회에서 11월 18일~21일에 이루어졌고, 일부 결과는 아직 검증 중이다.
2020 봉쇄와 중국 대학생의 온라인 수업 성적 변화
연구는 2020년 봉쇄로 대면 수업이 온라인으로 바뀌었을 때 중국 대학생의 성적이 어떻게 달라졌는지 분석했다. 과목 성격과 지역 봉쇄 정책에 따라 결과가 다르게 나타났다.
나미비아 사막의 그린 수소 마을에서 채소를 재배합니다
나미비아 연구자들이 재생에너지로 수소와 녹색 암모니아를 만들어 사막에서 수경 재배로 채소를 키우는 파일럿 프로젝트를 진행합니다. 목표는 아프리카 최초의 넷 제로 마을과 지역 식량 안보 개선입니다.