Para peneliti mempresentasikan prototipe headphone pintar di Conference on Empirical Methods in Natural Language Processing di Suzhou, China. Alat ini berusaha menyelesaikan "cocktail party problem" dengan memanfaatkan ritme alami pergantian bicara: satu model menganalisis "who spoke when" untuk menemukan pertukaran dengan tingkat tumpang tindih rendah, sementara model lain mengisolasi peserta yang teridentifikasi dan meredam suara lain serta kebisingan latar.
Menurut penulis senior Shyam Gollakota dari University of Washington, pendekatan ini memungkinkan pelacakan percakapan hanya dari audio, tanpa elektroda yang ditanamkan. Sistem bisa mengenali peserta dari 2–4 detik audio, menangani satu hingga empat mitra percakapan selain pemakai, dan berjalan pada perangkat keras komersial. Prototipe menggunakan headphone over-the-ear, mikrofon, dan rangkaian elektronik, dan tim berharap dapat mengecilkannya agar berjalan pada chip di earbud atau alat bantu dengar.
Pengujian pada 11 peserta menunjukkan bahwa audio yang disaring dinilai lebih dari dua kali lebih baik dibanding garis dasar. Penulis utama Guilin Hu menjelaskan bahwa metode ini proaktif dan menyimpulkan niat secara otomatis, berbeda dari sistem sebelumnya yang memerlukan pemilihan pembicara. Tantangan tersisa meliputi tumpang tindih bicara, monolog panjang, serta orang yang masuk atau keluar dari percakapan. Kode dasar proyek bersifat sumber-terbuka dan dapat diunduh. Penelitian ini didanai oleh Moore Inventor Fellows program dan pekerjaan terkait pada MobiCom 2025 menunjukkan bahwa model AI serupa bisa dijalankan pada perangkat alat bantu dengar yang sangat kecil.
Kata-kata sulit
- prototipe — contoh awal produk untuk diuji
- tumpang tindih — keadaan dua suara bersamaan atau berlapis
- meredam — mengurangi volume atau kekuatan suara
- pelacakan — proses memantau perkembangan atau posisi
- sumber-terbuka — kode perangkat lunak yang dapat diakses publik
- elektroda — konduktor kecil untuk mengukur atau mengirim sinyal
- proaktif — bertindak lebih awal untuk mencegah masalah
- menyimpulkan — menentukan makna atau niat dari bukti
Tips: arahkan kursor, fokus, atau ketuk kata yang disorot di dalam teks untuk melihat definisi singkat sambil membaca atau mendengarkan.
Pertanyaan diskusi
- Bagaimana kemampuan mengenali peserta dari 2–4 detik audio dapat memengaruhi privasi pengguna dan penggunaan alat bantu dengar? Berikan alasan.
- Apa keuntungan dan kekurangan jika kode dasar proyek ini bersifat sumber-terbuka bagi pengembangan teknologi serupa?
Artikel terkait
Model Fisika Baru untuk Meningkatkan Ketajaman MRI
Peneliti di Rice University dan Oak Ridge National Laboratory mengembangkan model fisika baru yang menghubungkan gerak molekul dengan sinyal MRI klinis. Studi ini menjelaskan relaksasi NMR dalam cairan dan diuji pada frekuensi MRI klinis.
Permainan Komputer Bantu Perbaiki Otak Setelah Cedera
Studi menunjukkan orang dewasa dengan cedera otak traumatik dapat memperbaiki struktur otak dan kemampuan berpikir dengan menyelesaikan permainan kognitif berbasis komputer. Perubahan terukur terlihat pada neuroplastisitas, kecepatan pemrosesan, perhatian, dan memori.
Media sosial dorong penjualan daging satwa liar di Afrika Barat
Sebuah studi di jurnal One Health memperingatkan media sosial dapat meningkatkan perdagangan daging satwa liar di Afrika Barat. Peneliti menemukan iklan di Facebook, pengalihan ke WhatsApp, dan risiko penyakit yang berpindah dari hewan ke manusia.
Kesenjangan Pendidikan dan Akses Digital di Chiapas
Di dataran tinggi Chiapas, kemiskinan, tuna aksara, dan akses internet yang rendah membatasi peluang pendidikan bagi perempuan muda. Beberapa program seperti Low‑Tech dan Tecnolochicas menunjukkan kemajuan, tetapi dukungan jangka panjang masih diperlukan.