لغات أفريقيا غير ممثلة في أنظمة الذكاء الاصطناعيCEFR B2
٢٠ أبريل ٢٠٢٦
مقتبس من Guest Contributor, Global Voices • CC BY 3.0
صورة من Zulfugar Karimov, Unsplash
تعتمد منصات مراقبة المحتوى في كثير من الأحيان على نماذج مدرَّبة ببيانات بالإنجليزية، ما يجعل معظم لغات أفريقيا غير مرئية عمليًا لنظم المراقبة. دراسة عام 2025 وجدت أن 42 لغة فقط تظهر بطرق ذات معنى عبر نماذج اللغة الكبرى، وأن أربع لغات فقط تُعالَج بقدر من الاتساق: الأمهرية، السواحلية، الأفريكانية، والملغاشية. نتيجة لذلك تحدث أخطاء من نوعَي الإيجابيات الكاذبة والسلبيات الكاذبة؛ يُحذف محتوى دون شرح أو تبقى منشورات ضارة بلغة قليلة الموارد.
برزت حالات ملموسة تعكس المشكلة. قال Bereket Tsegay إنه واجه مقاطع بلغات محلية لا تُفهم. وجد مبدع كيني، Jackson Busolo، أن حسابه حُذف في فبراير 2025 ثم أُعيد لاحقًا. بين يناير ومارس 2025 أزالت تيك توك أكثر من 450,000 فيديو من كينيا وحظرت أكثر من 43,000 حساب، وارتفعت الإزالات إلى 592,000 بحلول الربع الثاني.
تحمل الفجوة عبءًا كبيرًا على المبدعين والصحفيين الذين ينشرون بلغاتهم المحلية. تجري مجموعات بحثية مثل AfricaNLP وفِرق أكاديمية في بريتوريا ونيروبي وأديس أبابا جهودًا لبناء مجموعات بيانات، وعُقدت ورشة AfricaNLP 2025 لمهام في Hausa وIgbo وSwahili. تعاونت Cohere مع HausaNLP لإضافة بيانات إلى نموذج Aya. كما أقر الاتحاد الأفريقي استراتيجية قارية للذكاء الاصطناعي في يوليو 2024 وتلتها استراتيجيات وطنية، منها استراتيجية نيجيريا في أبريل 2025.
على صعيد التنظيم، دخل قانون الاتحاد الأوروبي للذكاء الاصطناعي حيّز التطبيق في أغسطس 2024 ونص قانون الخدمات الرقمية في فبراير 2024 على التزامات بالشفافية وعدم التمييز. مع ذلك يبقى بناء بيانات تدريب تمثيلية وتوفير تغطية تشغيلية تحديًا عمليًا يحتاج إلى جهود مستمرة.
كلمات صعبة
- نموذج — برنامج حاسوبي يتعامل مع اللغةنماذج
- مراقبة — متابعة المحتوى والتأكد من مطابقته للقواعد
- إيجابيات كاذبة — تقارير أو إشعارات تشير لوجود خطأ غير حقيقيالإيجابيات الكاذبة
- سلبيات كاذبة — حالات تفشل فيها الأنظمة في كشف محتوى ضارالسلبيات الكاذبة
- لغة — نمط كلام مجموعة بشرية أو قوميةلغات
- إزالة — حذف المحتوى من منصات الإنترنت أو تقييدهالإزالات
- تمثيلي — يعكس تنوع الواقع أو توزيع الفئاتتمثيلية
تلميح: مرّر المؤشر أو ركّز أو اضغط على الكلمات المظلَّلة داخل القصة لرؤية تعريفات سريعة أثناء القراءة أو الاستماع.
أسئلة للمناقشة
- كيف يؤثر حذف المحتوى أو الخطأ في تصنيفه على المبدعين والصحفيين الذين ينشرون بلغاتهم المحلية؟ أعط أمثلة أو تبعات ممكنة.
- ما الخطوات العملية التي يمكن أن تتخذها الشركات والمنظمات لتحسين تغطية لغات أفريقيا في نماذج اللغة؟ ناقش دور البيانات والتنظيم والتعاون الأكاديمي.