Para peneliti mempresentasikan prototipe headphone pintar di Conference on Empirical Methods in Natural Language Processing di Suzhou, China. Alat ini berusaha menyelesaikan "cocktail party problem" dengan memanfaatkan ritme alami pergantian bicara: satu model menganalisis "who spoke when" untuk menemukan pertukaran dengan tingkat tumpang tindih rendah, sementara model lain mengisolasi peserta yang teridentifikasi dan meredam suara lain serta kebisingan latar.
Menurut penulis senior Shyam Gollakota dari University of Washington, pendekatan ini memungkinkan pelacakan percakapan hanya dari audio, tanpa elektroda yang ditanamkan. Sistem bisa mengenali peserta dari 2–4 detik audio, menangani satu hingga empat mitra percakapan selain pemakai, dan berjalan pada perangkat keras komersial. Prototipe menggunakan headphone over-the-ear, mikrofon, dan rangkaian elektronik, dan tim berharap dapat mengecilkannya agar berjalan pada chip di earbud atau alat bantu dengar.
Pengujian pada 11 peserta menunjukkan bahwa audio yang disaring dinilai lebih dari dua kali lebih baik dibanding garis dasar. Penulis utama Guilin Hu menjelaskan bahwa metode ini proaktif dan menyimpulkan niat secara otomatis, berbeda dari sistem sebelumnya yang memerlukan pemilihan pembicara. Tantangan tersisa meliputi tumpang tindih bicara, monolog panjang, serta orang yang masuk atau keluar dari percakapan. Kode dasar proyek bersifat sumber-terbuka dan dapat diunduh. Penelitian ini didanai oleh Moore Inventor Fellows program dan pekerjaan terkait pada MobiCom 2025 menunjukkan bahwa model AI serupa bisa dijalankan pada perangkat alat bantu dengar yang sangat kecil.
Kata-kata sulit
- prototipe — contoh awal produk untuk diuji
- tumpang tindih — keadaan dua suara bersamaan atau berlapis
- meredam — mengurangi volume atau kekuatan suara
- pelacakan — proses memantau perkembangan atau posisi
- sumber-terbuka — kode perangkat lunak yang dapat diakses publik
- elektroda — konduktor kecil untuk mengukur atau mengirim sinyal
- proaktif — bertindak lebih awal untuk mencegah masalah
- menyimpulkan — menentukan makna atau niat dari bukti
Tips: arahkan kursor, fokus, atau ketuk kata yang disorot di dalam teks untuk melihat definisi singkat sambil membaca atau mendengarkan.
Pertanyaan diskusi
- Bagaimana kemampuan mengenali peserta dari 2–4 detik audio dapat memengaruhi privasi pengguna dan penggunaan alat bantu dengar? Berikan alasan.
- Apa keuntungan dan kekurangan jika kode dasar proyek ini bersifat sumber-terbuka bagi pengembangan teknologi serupa?
Artikel terkait
Kecerdasan buatan memperluas akses informasi kesehatan seksual
Organisasi dan peneliti di Amerika Latin menggunakan kecerdasan buatan untuk memberi informasi kesehatan seksual dan reproduksi kepada anak muda dan kelompok terpinggirkan. Proyek di Peru dan Argentina mengatasi hambatan bahasa, stigma, dan keterbatasan layanan.
Jurnalis Minta Bantuan untuk Lawan Berita Palsu AI
Perwakilan media dari negara berpenghasilan rendah dan menengah meminta kelompok jurnalis China membantu melawan berita palsu yang dibuat oleh AI pada forum Belt and Road di Ganzhou. Mereka menuntut label jelas pada konten AI dan tindakan terhadap platform.
AI memperkuat prakiraan monsun dan membantu petani India
Alat AI seperti NeuralGCM meningkatkan prakiraan monsun di India. Pada musim panas ini, 38 million farmers menerima prakiraan empat minggu sebelum monsun, dan proyek ini akan diperluas ke banyak negara untuk membantu petani merencanakan tanam.
Jeda Singkat di Media Sosial untuk Kurangi Misinformasi
Peneliti dari University of Copenhagen meneliti cara sederhana untuk memperlambat penyebaran misinformasi di media sosial. Mereka menemukan bahwa menambah jeda kecil dan elemen pembelajaran dapat mengurangi pembagian impulsif dan meningkatkan kualitas unggahan yang dibagikan.