أظهر باحثان هما Tong Wang وK. Sudhir، مع باحث ما قبل الدكتوراه Hengguang Zhou، أن تدريب النماذج التوليدية على العناوين الفائزة فقط قد يجعلها تتعلم إشارات سطحية بدل فهم الأسباب الحقيقية لنجاح العناوين. اعتمد الفريق على بيانات فعلية من Upworthy تشمل آلاف العناوين والمقالات.
بنى الفريق نموذجاً لغوياً كبيراً (LLM) ليولّد فروضاً متنافسة حول أسباب تفوق عنوان على آخر، ثم اختبروا هذه الفروض عبر البيانات حتى يحتفظوا بمجموعة مُثبَتَة من التفسيرات. بعد ذلك عدّلوا النموذج ليكتب عناوين تزيد التفاعل للأسباب الصحيحة.
في تجربة تقييمية سنّى حوالي 150 شخصاً عناوين من مصادر مختلفة، فاختيرت عناوين البشر والعناوين القياسية للذكاء الاصطناعي في نحو 30% من الحالات، بينما اختير النموذج الجديد في 44% من الحالات، وكان النموذج القياسي أكثر اعتماداً على كلمات مثيرة.
كلمات صعبة
- نموذج — تمثيل أو نسخة تُستخدم للدراسة أو الاختبارالنماذج, نموذجاً, النموذج
- اعتماد — الاستناد إلى شيء كمصدر أو مرجعاعتمد
- سبب — الشيء الذي يفسّر حدوث حدث أو نتيجةالأسباب
- تفاعل — رد الفعل أو المشاركة بين الناس والأشياءالتفاعل
- سطحي — غير عميق، يركّز على المظاهر فقطسطحية
- قياسي — متبع كقاعدة أو مألوف وشائعالقياسية, القياسي
- باحث — شخص يدرس موضوعاً علمياً أو يحلّل بياناتباحثان
تلميح: مرّر المؤشر أو ركّز أو اضغط على الكلمات المظلَّلة داخل القصة لرؤية تعريفات سريعة أثناء القراءة أو الاستماع.
أسئلة للمناقشة
- ما مخاطر تدريب نماذج على العناوين الفائزة فقط؟ اذكر سببين ببساطة.
- كيف يمكنك التحقق عمليا أن عنوان ناجح بسبب جودة المقال وليس بسبب كلمات مثيرة؟ اشرح خطوات بسيطة.
- إذا كان نموذج جديد يكتب عناوين تجذب قرّاء أكثر، هل تفضّل استخدامه أم عناوين بشرية؟ ولماذا؟