يطرح بحث من جامعة واشنطن سؤالًا عمليًا حول مدى قدرة الذكاء الاصطناعي على اكتساب القيم الثقافية بملاحظة سلوك البشر، كما يفعل الأطفال. نُشرت النتائج في مجلة PLOS One وشارك في التأليف باحثون من جامعة واشنطن وجامعة ولاية سان دييغو.
جند الفريق 190 بالغًا عرّفوا أنفسهم بأنهم من البيض و110 عرّفوا أنفسهم بأنهم لاتينيين، واستُخدمت بيانات كل مجموعة لتدريب وكيل ذكاء اصطناعي منفصل عبر التعلم العكسي للمكافأة (inverse reinforcement learning). في هذا الأسلوب يراقب الوكيل سلوك الإنسان ويستنتج الأهداف والمكافآت بدلًا من إعطائه هدفًا ومكافآت صريحة كما في التعلم المعزز التقليدي.
في التجربة الأساسية لعب المشاركون نسخة معدّلة من لعبة Overcooked حيث طهوا ووزّعوا حساء البصل بينما شاهدوا مطبخًا آخر يضطر فيه اللاعب الثاني للمشي لمسافة أطول لأداء نفس المهام. لم يعلم المشاركون أن اللاعب الثاني روبوت؛ كان بإمكانهم إعطاء بصل للمساعدة لكن ذلك يقلل ما يسلمونه بأنفسهم. المشاركون اللاتينيون ساعدوا أكثر، وتعلّم الوكلاء هذه التوجّهات فوكيل المجموعة اللاتينية منح بصلًا أكثر وتبرّع بمزيد من المال في اختبار لاحق.
يقول أندرو ميلتزوف، أستاذ علم النفس ومشارك في إدارة معهد علوم التعلم والدماغ (I-LABS)، إن الآباء يقدمون نموذجًا عامًّا لتصرف الأطفال بدلًا من تدريبهم على مهمة واحدة. ويضيف راجيش راو، أستاذ في كلية بول جي. ألين لعلوم الحاسب والهندسة ومشارك في إدارة مركز التكنولوجيا العصبية، أنه لا ينبغي برمجة مجموعة قيَم عالمية ثابتة لأن لكل ثقافة قيمها الخاصة. يشير الفريق إلى أن زيادة كمية وتنوّع البيانات الثقافية قد تسمح بضبط أدق قبل النشر، لكن هناك حاجة لأبحاث إضافية لاختبار مجموعات ثقافية أكثر والقيم المتنافسة والتحديات في العالم الحقيقي.
كلمات صعبة
- اكتساب — تحصيل أو تعلم شيء جديد
- قيمة ثقافية — معتقدات وسلوكيات تعتبر مهمة في مجتمع معينالقيم الثقافية
- التعلم العكسي للمكافأة — طريقة يستدل بها الوكيل على أهداف البشر من سلوكهم
- وكيل — برنامج أو نظام يتصرف بناء على أهداف مستنتجةالوكيل, الوكلاء, فوكيل
- التعلم المعزز — طريقة تعليم فيها الوكيل يحصل على مكافآتالتعلم المعزز التقليدي
- تبرّع — إعطاء مال أو موارد طواعية للآخرين
- تنوّع — وجود اختلافات أو أنواع مختلفة داخل مجموعة
تلميح: مرّر المؤشر أو ركّز أو اضغط على الكلمات المظلَّلة داخل القصة لرؤية تعريفات سريعة أثناء القراءة أو الاستماع.
أسئلة للمناقشة
- هل تعتقد أن جمع بيانات أكثر وتنوّعًا يكفي لضبط قيم الذكاء الاصطناعي؟ لماذا؟
- ما مخاطر تدريب وكيل على قيم مجموعة ثقافية واحدة فقط؟ أعط مثالًا واحدًا.
- كيف يمكن للباحثين اختبار قيم متنافسة وتحديات العالم الحقيقي عمليًا؟ اقترح خطوة محددة.