LingVo.club
Level
Headphone Pintar Memisahkan Suara Mitra di Tempat Bising — Level B2 — Three bursts of colored patterns.

Headphone Pintar Memisahkan Suara Mitra di Tempat BisingCEFR B2

16 Des 2025

Diadaptasi dari U. Washington, Futurity CC BY 4.0

Foto oleh Logan Voss, Unsplash

Level B2 – Menengah-atas
4 mnt
223 kata

Para peneliti mempresentasikan prototipe headphone pintar di Conference on Empirical Methods in Natural Language Processing di Suzhou, China. Alat ini berusaha menyelesaikan "cocktail party problem" dengan memanfaatkan ritme alami pergantian bicara: satu model menganalisis "who spoke when" untuk menemukan pertukaran dengan tingkat tumpang tindih rendah, sementara model lain mengisolasi peserta yang teridentifikasi dan meredam suara lain serta kebisingan latar.

Menurut penulis senior Shyam Gollakota dari University of Washington, pendekatan ini memungkinkan pelacakan percakapan hanya dari audio, tanpa elektroda yang ditanamkan. Sistem bisa mengenali peserta dari 2–4 detik audio, menangani satu hingga empat mitra percakapan selain pemakai, dan berjalan pada perangkat keras komersial. Prototipe menggunakan headphone over-the-ear, mikrofon, dan rangkaian elektronik, dan tim berharap dapat mengecilkannya agar berjalan pada chip di earbud atau alat bantu dengar.

Pengujian pada 11 peserta menunjukkan bahwa audio yang disaring dinilai lebih dari dua kali lebih baik dibanding garis dasar. Penulis utama Guilin Hu menjelaskan bahwa metode ini proaktif dan menyimpulkan niat secara otomatis, berbeda dari sistem sebelumnya yang memerlukan pemilihan pembicara. Tantangan tersisa meliputi tumpang tindih bicara, monolog panjang, serta orang yang masuk atau keluar dari percakapan. Kode dasar proyek bersifat sumber-terbuka dan dapat diunduh. Penelitian ini didanai oleh Moore Inventor Fellows program dan pekerjaan terkait pada MobiCom 2025 menunjukkan bahwa model AI serupa bisa dijalankan pada perangkat alat bantu dengar yang sangat kecil.

Kata-kata sulit

  • prototipecontoh awal produk untuk diuji
  • tumpang tindihkeadaan dua suara bersamaan atau berlapis
  • meredammengurangi volume atau kekuatan suara
  • pelacakanproses memantau perkembangan atau posisi
  • sumber-terbukakode perangkat lunak yang dapat diakses publik
  • elektrodakonduktor kecil untuk mengukur atau mengirim sinyal
  • proaktifbertindak lebih awal untuk mencegah masalah
  • menyimpulkanmenentukan makna atau niat dari bukti

Tips: arahkan kursor, fokus, atau ketuk kata yang disorot di dalam teks untuk melihat definisi singkat sambil membaca atau mendengarkan.

Pertanyaan diskusi

  • Bagaimana kemampuan mengenali peserta dari 2–4 detik audio dapat memengaruhi privasi pengguna dan penggunaan alat bantu dengar? Berikan alasan.
  • Apa keuntungan dan kekurangan jika kode dasar proyek ini bersifat sumber-terbuka bagi pengembangan teknologi serupa?

Artikel terkait