LingVo.club
Trình độ
Tai nghe dùng AI giúp nghe trong tiếng ồn — Trình độ B2 — Three bursts of colored patterns.

Tai nghe dùng AI giúp nghe trong tiếng ồnCEFR B2

16 thg 12, 2025

Phỏng theo U. Washington, Futurity CC BY 4.0

Ảnh: Logan Voss, Unsplash

Trình độ B2 – Trung cao
6 phút
343 từ

Nguyên mẫu tai nghe thông minh của nhóm dùng trí tuệ nhân tạo để giải quyết khó khăn khi nói trong môi trường ồn, tức "vấn đề tiệc cocktail". Hệ thống gồm hai mô hình: một mô hình theo dõi nhịp thay phiên nói để xác định chính xác ai nói vào thời điểm nào, và một mô hình khác tắt tiếng các nguồn không tuân theo mẫu trao đổi đồng thời loại bỏ tiếng ồn nền. Nhờ vậy, tai nghe có thể cô lập tiếng nói của những người đối thoại với người đeo.

Hệ thống nhận diện một người đối thoại chỉ dựa trên hai đến bốn giây âm thanh và chạy trên phần cứng thương mại hiện có. Nguyên mẫu gọi là "proactive hearing assistants" kích hoạt khi người đeo bắt đầu nói; mô hình đầu tìm các trao đổi ít chồng lấp, mô hình sau tách riêng các người tham gia và phát lại âm thanh đã lọc cho người đeo. Thiết kế đủ nhanh để tránh trễ gây bối rối và có thể xử lý từ một đến bốn người đối thoại bên cạnh người đeo.

Nhóm giới thiệu công trình tại Suzhou, tại Conference on Empirical Methods in Natural Language Processing, và công bố mã nguồn nền tảng để tải xuống. Thử nghiệm với 11 người cho thấy âm thanh sau lọc được đánh giá tốt hơn so với mức nền hơn hai lần. Tác giả chính Guilin Hu và giáo sư Shyam Gollakota từ University of Washington giải thích rằng phương pháp này dựa trên nhịp trao đổi có thể dự đoán được chỉ bằng âm thanh, tránh việc phải cấy điện cực vào não.

  • Thách thức: chồng lời, độc thoại dài, người vào/ra giảm độ chính xác.
  • Mô hình đã thử trên English, Mandarin và Japanese; các ngôn ngữ khác có thể cần tinh chỉnh.
  • Nhóm hy vọng thu nhỏ hệ thống để chạy trên tai nghe nhét tai hoặc máy trợ thính; công trình được tài trợ bởi chương trình Moore Inventor Fellows.

Từ khó

  • vấn đề tiệc cocktailkhó khăn tách tiếng người trong môi trường ồn
  • nhịp thay phiên nóimẫu luân phiên xác định ai nói khi nào
  • cô lậptách riêng một âm thanh khỏi các âm khác
  • phần cứng thương mạithiết bị vật lý bán trên thị trường
  • mã nguồntập hợp mã máy tính của một phần mềm
  • chồng lấphai hoặc nhiều âm xảy ra cùng lúc che nhau
  • tinh chỉnhđiều chỉnh chương trình để phù hợp hơn

Mẹo: di chuột, dùng phím Tab hoặc chạm vào các từ được tô sáng trong bài để xem định nghĩa nhanh ngay khi bạn đọc hoặc nghe.

Câu hỏi thảo luận

  • Bạn nghĩ lợi ích lớn nhất của tai nghe này cho người dùng hàng ngày là gì? Nêu lý do.
  • Trong bài có nêu các thách thức như chồng lời, độc thoại dài và người vào/ra giảm độ chính xác. Bạn đề xuất cách nào để giảm những vấn đề này?
  • Việc thu nhỏ hệ thống để chạy trên tai nghe nhét tai hoặc máy trợ thính sẽ đem lại thay đổi gì cho người dùng? Hãy nêu ưu và nhược điểm.

Bài viết liên quan