أصبح إجراء محادثة في بيئة صاخبة تحدياً معروفاً، ولا سيما للأشخاص الذين يعانون فقدان السمع. طوّر فريق بحثي نموذجاً أولياً أسماه «مساعدات السمع الاستباقية» ليعزل أصوات شركاء المحادثة باستخدام تقنيات الذكاء الاصطناعي، مع حفظ جودة الصوت وبدون أي زراعة أقطاب.
يعتمد النظام على نموذجين؛ الأول يكتشف إيقاع تبادل الكلام ويتولى تتبّع الأدوار لتحديد من يتكلم ومتى، والثاني يكبت الأصوات التي لا تتبع نمط المحادثة والضوضاء الخلفية. يقدر الفريق أن النظام يتعرّف على شركاء المحادثة بعد 2 إلى 4 ثوانٍ من الصوت، ويمكنه التعامل مع محادثات تضم من واحد إلى أربعة شركاء بالإضافة إلى مرتدي السماعات، مع سرعة كافية لتجنب تأخر صوتي محير.
عرَض الفريق النماذج في مدينة Suzhou خلال مؤتمر Conference on Empirical Methods in Natural Language Processing ونشر الكود الأساسي كمصدر مفتوح. اختبرت المجموعة النموذج الأولي على 11 مشاركًا، وكانت التقييمات لصالح الصوت المصفّى بأكثر من ضعف التقييم في الحالة الأساسية دون تصفية. ذكر باحثون أن النهج استباقي ويستنتج القصد تلقائياً، بينما تظل تحديات مثل الكلام المتداخل والطلَب الطويل ودخول أو خروج أشخاص من المحادثة عوامل تقلل الدقة.
حالياً تعتمد بنية النموذج على سماعات رأس تجارية فوق الأذن تحتوي ميكروفونات ودارات إلكترونية، ويركز الفريق على تقليص الحجم ليعمل على شرائح صغيرة داخل سماعات الأذن أو معينات السمع. أظهرت أعمال موازية في MobiCom 2025 إمكانية تشغيل نماذج الذكاء الاصطناعي على أجهزة معينات سمع صغيرة جداً. تمول هذه البحوث من برنامج Moore Inventor Fellows.
كلمات صعبة
- استباقي — يتصرف قبل حدوث مشكلة أو بناءً على توقعهاالاستباقية
- عزل — فصل صوت معين عن أصوات أخرىليعزل
- نموذج أولي — نسخة تجريبية مبكرة لاختبار فكرةنموذجاً أولياً
- تتبّع — مراقبة ترتيب الأدوار لمعرفة من يتكلم
- الضوضاء الخلفية — الأصوات غير المرغوب فيها في المحيط
- تأخر صوتي — زمن تأخير بين الكلام وسماع الصوت
- مصفّى — تمت إزالة الضوضاء منه ليصبح أوضحالمصفّى
تلميح: مرّر المؤشر أو ركّز أو اضغط على الكلمات المظلَّلة داخل القصة لرؤية تعريفات سريعة أثناء القراءة أو الاستماع.
أسئلة للمناقشة
- ما الفوائد المحتملة لمثل هذه المساعدات للأشخاص الذين يعانون فقدان السمع؟ اذكر مثالين ولماذا مهمان.
- ما المخاطر أو قضايا الخصوصية التي قد تطرحها تقنية تستطيع عزل أصوات شركاء المحادثة تلقائياً؟ اشرح باختصار.
- ما التحديات التقنية أو العملية التي تتوقعها عند نقل النموذج للعمل على معينات سمع صغيرة جداً؟ اذكر سببين