نشرت مجموعة من الباحثين في كلية إدارة الأعمال بجامعة ييل دراسة توضح طريقة جديدة لتدريب النماذج التوليدية للكتابة. حدد الباحثان Tong Wang وK. Sudhir، بمساعدة Hengguang Zhou، مشكلة مهمة: إذا درّبت النماذج على العناوين الفائزة فقط، فقد تتعلّم استغلال إشارات سطحية مثل كلمة "shocking" بدل استنتاج تفسيرات حقيقية لسلوك القارئ.
للتغلب على ذلك، بنى الفريق نموذجاً لغوياً كبيراً (LLM) يولّد فروضاً متنافسة حول سبب تفوق عنوان على آخر، ثم يختبر هذه الفروض على بيانات اختبارات A/B حتى تبرز مجموعة صغيرة من التفسيرات المُثبَتَة. تعتمد هذه الطريقة على مرحلتين تشبهان التفكير العلمي: استنتاج افتراضي (الـabduction) ثم استقراء (induction) لاختبار الفروض على عينات أكبر.
استخدم الباحثون مجموعة بيانات من Upworthy تضم آلاف العناوين والمقالات، واعتمدوا نموذج تقييم مُدرّب مسبقاً على نتائج اختبارات A/B لقياس جودة العناوين. اختبروا النظام أيضاً مع نحو 150 مشاركاً؛ فاختير النموذج الجديد في 44% من الحالات مقابل نحو 30% للعناوين البشرية والذكاء الاصطناعي القياسي، كما أظهرت التحليلات أن النموذج القياسي اعتمد أكثر على لغة مثيرة.
أشار الباحثون إلى تطبيقات أوسع، مثل تدريب ذكي لعاملين في خدمة العملاء حيث يمكن للنظام مراجعة تفاعلات، واقتراح فروض حول ما ينجح والتحقق منها، وقد تشمل المدخلات بيانات صوتية أو بصرية. خلصوا إلى أن الذكاء الاصطناعي الموجه بالمعرفة قد يحسّن المحتوى ويجعل الأنظمة أكثر مسؤولية وجديرة بالثقة. (المصدر: Yale)
كلمات صعبة
- نموذج — تمثيل أو برنامج حاسوبي يقوم بمهام محددةالنماذج, نموذجاً, النموذج
- توليدي — ينتج نصوصاً أو محتوى جديداً بدل تكرارالتوليدية
- إشارة — مؤشر أو علامة بسيطة عن سبب محتملإشارات
- فرض — تفسير مقترح يختبر لدعم أو رفضهفروضاً
- استنتاج — تقدير أو استدلال من ملاحظة معينة
- استقراء — تعميم نتائج من أمثلة أو عينات أكبر
- اختبار — إجراء يقارن أداء طريقتين أو أكثراختبارات
- مسبق — حدث أو تدريب حصل قبل مرحلة أخرىمسبقاً
- قياسي — تقليدي أو شائع الاستخدام كمرجعالقياسي
- مسؤولية — حالة الالتزام بالمعايير الأخلاقية والتقنية
تلميح: مرّر المؤشر أو ركّز أو اضغط على الكلمات المظلَّلة داخل القصة لرؤية تعريفات سريعة أثناء القراءة أو الاستماع.
أسئلة للمناقشة
- ما فوائد وطُرُق استخدام توليد فروض مُثبَّتة لتحسين المحتوى في مواقع الأخبار أو التسويق؟ اذكر أمثلة عملية.
- ما المخاطر الأخلاقية المحتملة عند اعتماد نماذج توليدية تعدّل العناوين لتجذب القارئ؟ وكيف يمكن التقليل منها؟
- كيف يمكن لتقنيات الاختبار والتحقق من الفروض أن تُحسّن ثقة المستخدمين في أنظمة الذكاء الاصطناعي المصممة لإنتاج محتوى؟ اشرح مع أمثلة.