تُستخدم نماذج اللغة لعدد من المهام، ولذلك يجب أن تكون إجاباتها آمنة. درس فريق في جامعة ولاية نورث كارولاينا كيفية تحسين محاذاة السلامة في هذه النماذج وجرّب تقنيات تدريب جديدة.
وجد الفريق مشكلتين أساسيتين: أولاً، تدريب السلامة قد يقلل من دقة النموذج أحيانًا، وثانيًا، بعض فحوصات السلامة السطحية يمكن للمستخدمين تجاوزها. اقترح الباحثون فرضية محاذاة السلامة السطحية (SSAH) وشرحوا أن تجميد أجزاء محددة داخل النموذج أثناء التخصيص الدقيق يمكن أن يقلل هذه المشكلة مع الحفاظ على سلوك السلامة.
كلمات صعبة
- محاذاة — تنظيم سلوك النموذج ليتوافق مع القواعد
- سلامة — حماية الناس من إجابات ضارة أو خطرالسلامة
- تخصيص — تعديل النموذج ليتعلم بيانات جديدةالتخصيص
- تجميد — إيقاف تدريب أجزاء من النموذج مؤقتا
- فحص — اختبار للتحقق من وجود مشاكل أو خطرفحوصات
- دقة — مدى صحة إجابات النموذج وموثوقيتها
تلميح: مرّر المؤشر أو ركّز أو اضغط على الكلمات المظلَّلة داخل القصة لرؤية تعريفات سريعة أثناء القراءة أو الاستماع.
أسئلة للمناقشة
- هل تقلق من أن تدريب السلامة قد يقلل دقة النماذج؟ ولماذا؟
- هل تعتقد أن تجميد أجزاء النموذج فكرة مفيدة عند التخصيص الدقيق؟ اشرح باختصار.
قصص ذات صلة
الذكاء الاصطناعي ومعلومات الصحة الجنسية في أمريكا اللاتينية
تستخدم مجموعات بحثية ومنظمات غير حكومية الذكاء الاصطناعي لنشر معلومات عن الصحة الجنسية والإنجابية والوصول إلى الشباب والفئات المهمشة. تبرز مشاريع في بيرو وأرجنتين منصات مثل TeleNanu وNOA وتواجه تحديات تتعلق بالتحيّز والبيانات والتنظيم.