ورقة بحثية صدرت عام 2025 من Stanford Institute for Human-Centered Artificial Intelligence (HAI) وجدت أن العديد من نماذج اللغة الكبيرة الشائعة تؤدي أداءً ضعيفًا في لغات غير الإنجليزية. أهم سبب هو أن المحتوى الإلكتروني وداتا التدريب يهيمن عليهما الإنجليزية.
أشار الباحثون أيضًا إلى أن بعض النماذج، بما في ذلك نماذج طوِّرت جزئيًا من قبل Google وMeta، قد تولّد ردودًا لا تتناسب واحتياجات معظم المستخدمين في العالم. كما وسّع تركّز شركات الذكاء الاصطناعي في مناطق أغنى الفجوة بين المجتمعات.
ظهرت أمثلة عملية على المشكلات: طلبات بلغة محلية قد تنتج مسودات مشوشة أو نتائج مليئة بالأخطاء، وجمع نصوص عن لغات قليلة الموارد على الويب أعاد أحيانًا نصوصًا مترجمة بشكل خاطئ. كثير من المساهمين لا يملكون أدوات التحقق، فتُكرَّر الأخطاء في بيانات التدريب.
يقترح الخبراء العمل مع المجتمعات المهمشة وإدراج مدخلات محلية ومراجعة المخرجات للتثبت من الدقة، إضافة إلى شراكات تعاونية تحترم الفروقات الثقافية.
كلمات صعبة
- نموذج — برنامج حاسوبي ينتج نصوص أو ردودنماذج اللغة الكبيرة
- هيمن — يسيطر على شيء أو يتفوق عليهيهيمن
- قليل — لا يملك مصادر أو بيانات كثيرةقليلة الموارد
- مهمش — مجموعة محرومة من الحقوق أو الخدماتالمهمشة
- مدخل — معلومات أو مساهمات تقدم للمشروعمدخلات محلية
- مراجعة — فحص النتائج للتأكد من دقتهامراجعة المخرجات
- تحقق — التأكد من صحة معلومات أو بياناتأدوات التحقق
- فجوة — فرق أو عدم مساواة بين مجموعتينالفجوة
تلميح: مرّر المؤشر أو ركّز أو اضغط على الكلمات المظلَّلة داخل القصة لرؤية تعريفات سريعة أثناء القراءة أو الاستماع.
أسئلة للمناقشة
- هل واجهت أنت أو أحد تعرفه مشكلة في استخدام برامج باللغة المحلية؟ اذكر مثالاً وتأثيره.
- كيف يمكن للمجتمعات المحلية المشاركة بفعالية في تحسين نماذج اللغة؟ اذكر خطوتين عمليتين.
- ما رأيك في تأثير تركّز شركات الذكاء الاصطناعي في مناطق أغنى على الفجوة بين المجتمعات؟ كيف يمكن تخفيف هذا التأثير؟