ब्राउन यूनिवर्सिटी के शोधकर्ताओं ने यह अध्ययन किया कि क्या आधुनिक भाषा‑मॉडलों में वास्तविक‑दुनिया की कोई समझ बनी रहती है। शोध का आधार यह था कि अधिकांश चैटबॉट इंटरनेट पर उपलब्ध विशाल पाठ से सीखते हैं, जिसमें सटीक तथ्य, त्रुटियाँ और अर्थहीन सामग्री भी होती है। शोध ने यह पूछा कि क्या ऐसे प्रशिक्षित मॉडल सामान्य, असम्भव‑सी पर संभव, असम्भव और तर्कहीन घटनाओं के बीच फर्क कर पाते हैं।
टीम ने प्रयोग में घटनाओं के विभिन्न संभाव्यता‑वर्गों का वर्णन करने वाले वाक्य दिए — जैसे "Someone cooled a drink with ice," "Someone cooled a drink with snow," "Someone cooled a drink with fire," और "Someone cooled a drink with yesterday." हर वाक्य के लिए उन्होंने मॉडल के आंतरिक गणितीय अवस्थाओं का परीक्षण किया; इस पद्धति को mechanistic interpretability कहा गया और इसे Lepori ने AI प्रणालियों के लिए तंत्रिका विज्ञान के समान बताया। प्रयोग कई open‑source मॉडल पर चलाए गए ताकि निष्कर्ष मॉडल‑निरपेक्ष रहें।
अध्ययन में पाया गया कि पर्याप्त बड़े मॉडलों में संभाव्यता श्रेणियों के अनुरूप अलग आंतरिक वेक्टर बन गए। इन वेक्टरों ने निकटवर्ती श्रेणियों, जैसे improbable बनाम impossible, को लगभग 85% सटीकता से अलग किया। स्थानीय वेक्टर मानवीय अनिश्चितता को भी दर्शाते थे; अस्पष्ट बयानों में मॉडल के संकेत मानव सर्वेक्षणों में देखी गई विभाजित राय से मेल खाते थे। शोधकर्ता रिपोर्ट करते हैं कि ये वेक्टर 2 billion parameters से अधिक वाले मॉडलों में प्रकट होने लगते हैं, जो आज के ट्रिलियन‑प्लस‑पैरामीटर मॉडल की तुलना में आकार में छोटे हैं।
- mechanistic interpretability से मॉडलों में क्या एन्कोड है, वह सामने आ सकता है।
- ये वेक्टर मानवीय संभाव्यता निर्णयों से जुड़ते हैं।
- यह खोजें स्मार्ट और अधिक विश्वसनीय मॉडल विकसित करने में मदद कर सकती हैं।
कठिन शब्द
- अध्ययन — किसी विषय पर व्यवस्थित जांच या परीक्षण
- प्रशिक्षित — किसी काम के लिए सिखाया या तैयार किया गया
- मॉडल — किसी प्रक्रिया का सरलीकृत प्रतिनिधि या सिस्टम
- वेक्टर — गणितीय संकेतों का क्रम या दिशात्मक सूची
- सटीकता — किसी नतीजे की सही होने की मात्रा
- अनिश्चितता — किसी घटना के न होने या होने का संदेह
- एन्कोड — जानकारी को मॉडल के अंदर आंकड़ों में बदलना
युक्ति: जब आप किसी भी भाषा में कहानी पढ़ें या ऑडियो सुनें, तो लेख में हाइलाइट किए गए शब्दों पर होवर/फ़ोकस/टैप करें और तुरंत छोटी-सी परिभाषा देखें।
चर्चा के प्रश्न
- यदि मॉडल मानवीय संभाव्यता निर्णयों से जुड़ते हैं, तो यह वास्तविक‑दुनिया अनुप्रयोगों में कैसे मदद कर सकता है? उदाहरण दें।
- आपके हिसाब से बड़े मॉडलों में इस तरह की आंतरिक संरचना जानने के क्या जोखिम और फायदे हैं?
- मॉडल की आंतरिक अवस्थाओं की व्याख्या करने वाली पद्धतियाँ क्यों महत्वपूर्ण हो सकती हैं, और इन्हें कैसे लागू किया जा सकता है?