Sebuah tim meneliti solusi untuk masalah berbicara di tempat bising, yang sering disebut "cocktail party problem". Mereka mengembangkan prototipe headphone pintar yang menggunakan kecerdasan buatan untuk mendeteksi ritme pergantian bicara. Satu model melacak siapa yang berbicara dan kapan, sedangkan model kedua membisukan suara yang tidak mengikuti pola percakapan dan kebisingan latar.
Sistem dapat mengenali peserta hanya dari 2–4 detik audio dan berjalan pada perangkat keras komersial yang umum. Prototipe disebut "proactive hearing assistants" dan aktif saat pemakai mulai berbicara; audio yang dibersihkan kemudian diputar ke telinga pemakai dengan keterlambatan minimal sehingga tidak membingungkan.
Tim menguji headphone pada 11 peserta dan membandingkan pemahaman dengan dan tanpa penyaringan AI. Secara keseluruhan, audio yang disaring dinilai jauh lebih baik. Masih ada tantangan, termasuk pembicaraan tumpang tindih, monolog panjang, dan orang yang masuk atau keluar dari percakapan.
Kata-kata sulit
- kecerdasan buatan — teknik komputer yang meniru kemampuan manusia
- prototipe — model awal dari sebuah perangkat atau produk
- mendeteksi — menemukan atau mengenali sesuatu dari data
- ritme — pola berulang dalam bunyi atau gerakan
- membisukan — mengurangi atau mematikan suara agar tidak terdengar
- perangkat keras — bagian fisik dari komputer atau alat elektronikperangkat keras komersial
- penyaringan — proses memisahkan suara atau sinyal yang tidak diinginkan
Tips: arahkan kursor, fokus, atau ketuk kata yang disorot di dalam teks untuk melihat definisi singkat sambil membaca atau mendengarkan.
Pertanyaan diskusi
- Pernahkah Anda kesulitan mendengar saat berada di tempat bising? Ceritakan pengalaman singkat dan apa yang membuatnya sulit.
- Bagaimana menurut Anda headphone yang menyaring suara bisa memengaruhi percakapan dalam kelompok teman atau keluarga?
- Fitur apa yang Anda ingin ada pada perangkat seperti itu untuk membantu Anda dalam situasi bising?
Artikel terkait
Model Bahasa Mengubah Penilaian Berdasarkan Identitas Pengarang
Peneliti University of Zurich menemukan bahwa large language models mengubah penilaian teks ketika diberi tahu siapa pengarangnya. Tanpa sumber, model sering sepakat, tetapi menyebut pengarang memicu bias, termasuk bias anti-Cina.
Media sosial dorong penjualan daging satwa liar di Afrika Barat
Sebuah studi di jurnal One Health memperingatkan media sosial dapat meningkatkan perdagangan daging satwa liar di Afrika Barat. Peneliti menemukan iklan di Facebook, pengalihan ke WhatsApp, dan risiko penyakit yang berpindah dari hewan ke manusia.
AI memperkuat prakiraan monsun dan membantu petani India
Alat AI seperti NeuralGCM meningkatkan prakiraan monsun di India. Pada musim panas ini, 38 million farmers menerima prakiraan empat minggu sebelum monsun, dan proyek ini akan diperluas ke banyak negara untuk membantu petani merencanakan tanam.