Gürültülü bir ortamda bir konuşmayı sürdürmek zor olabilir ve araştırmacılar bunu "cocktail party problem" olarak adlandırıyor. Bu sorunu çözmek amacıyla geliştirilen akıllı kulaklık prototipi, kullanıcı için konuşma partnerlerinin seslerini izole etmeye çalışıyor ve konuşmanın ritmini tespit eden yapay zekâ modelleri kullanıyor.
Prototipte iki model bulunuyor: Birinci model, konuşmada sıra almayı (turn-taking) takip ederek kimin ne zaman konuştuğunu belirliyor ve değişimlerde düşük örtüşme arıyor. İkinci model ise konuşma desenine uymayan sesleri ve istenmeyen arka plan gürültüsünü bastırıyor ve tanımlanan katılımcıların temizlenmiş sesini kullanıcıya iletiyor. Sistemin bir konuşma partnerini tanımlamak için yalnızca 2 ila 4 saniye ses örneğine ihtiyacı var ve sistem kafa karıştırıcı bir gecikme olmadan çalışacak kadar hızlıdır; kullanıcı dışında 1–4 konuşma partnerini işleyebiliyor.
- Prototip, baş üstü kulaklıklar, mikrofonlar ve devrelerle kuruldu.
- Ekip sistemi kulakiçi kulaklıklara veya işitme cihazlarına sığdırmayı hedefliyor.
- Modeler İngilizce, Mandarin ve Japonca diyaloglarda test edildi.
Baş yazarı olmayan kıdemli araştırmacı bir profesör mevcut yaklaşımların sıklıkla beyine yerleştirilen elektrotlara dayandığını, oysa bu yöntemin yalnızca sesle ritmi tahmin edip implant gerektirmediğini belirtti. Lead author olarak anılan doktora öğrencisi ise önceki sistemlerin kullanıcıdan bir konuşmacı seçmesini istediğini, yeni yaklaşımın proaktif olarak niyeti otomatik çıkardığını söyledi. Testlerde 11 katılımcı yer aldı ve katılımcılar yapay zekâ filtrelemesi olan durumda anlayış ve gürültü bastırmayı genel olarak iki kattan fazla daha olumlu değerlendirdi. Araştırma Moore Inventor Fellows programı tarafından fonlandı; eş zamanlı çalışmalar MobiCom 2025'te küçük işitme cihazlarında modellerin çalışabileceğini gösterdi.
Zor kelimeler
- prototip — gerçek ürüne benzer ilk modelPrototipte, Prototip,
- sıra almak — konuşmalarda kimin konuşacağını belirleme eylemisıra almayı
- örtüşme — iki sesin aynı anda duyulma durumu
- bastırmak — istenmeyen sesi azaltmak veya yok etmekbastırıyor, bastırmayı
- filtreleme — sesten istenmeyen bileşenleri ayıklama işlemifiltrelemesi
- fonlamak — bir projeye para veya kaynak sağlama eylemifonlandı
İpucu: Türkçe metni okurken veya ses kaydını dinlerken, vurgulanan kelimelerin üzerine gel, odaklan ya da dokun; anında kısa tanımlar görünür.
Tartışma soruları
- Böyle bir akıllı kulaklık günlük yaşamda hangi durumlarda en yararlı olur? Nedenleriyle açıklayın.
- Bu teknolojinin kullanımı sırasında hangi gizlilik veya etik endişeler ortaya çıkabilir? Örnek verin.
- Sistemin yalnızca 2–4 saniye ses örneğiyle çalışabilmesi hangi avantajları ve olası sorunları beraberinde getirebilir?
İlgili makaleler
Pandemi Döneminde Çinli Üniversite Öğrencilerinin Çevrimiçi Eğitimi
Çalışma 2020 kapanması sırasında Çin’de yüz yüze eğitimden çevrimiçi eğitime ani geçişin üniversite öğrencilerinin başarılarını nasıl etkilediğini inceliyor. Farklı ders türleri ve kapanma politikaları arasındaki farklar değerlendiriliyor.