क्या आधुनिक भाषा मॉडल वास्तविक दुनिया समझते हैं?^{CEFR B2}

26 अप्रैल 2026

स्तरA1

आधारित: Brown University, Futurity • CC BY 4.0

फोटो: Zach M, Unsplash

स्तर B2 – ऊपरी-मध्य स्तरCEFR B2

5 मिनट

286 शब्द

ब्राउन यूनिवर्सिटी के शोधकर्ताओं ने यह अध्ययन किया कि क्या आधुनिक भाषा‑मॉडलों में वास्तविक‑दुनिया की कोई समझ बनी रहती है। शोध का आधार यह था कि अधिकांश चैटबॉट इंटरनेट पर उपलब्ध विशाल पाठ से सीखते हैं, जिसमें सटीक तथ्य, त्रुटियाँ और अर्थहीन सामग्री भी होती है। शोध ने यह पूछा कि क्या ऐसे प्रशिक्षित मॉडल सामान्य, असम्भव‑सी पर संभव, असम्भव और तर्कहीन घटनाओं के बीच फर्क कर पाते हैं।

टीम ने प्रयोग में घटनाओं के विभिन्न संभाव्यता‑वर्गों का वर्णन करने वाले वाक्य दिए — जैसे "Someone cooled a drink with ice," "Someone cooled a drink with snow," "Someone cooled a drink with fire," और "Someone cooled a drink with yesterday." हर वाक्य के लिए उन्होंने मॉडल के आंतरिक गणितीय अवस्थाओं का परीक्षण किया; इस पद्धति को mechanistic interpretability कहा गया और इसे Lepori ने AI प्रणालियों के लिए तंत्रिका विज्ञान के समान बताया। प्रयोग कई open‑source मॉडल पर चलाए गए ताकि निष्कर्ष मॉडल‑निरपेक्ष रहें।

अध्ययन में पाया गया कि पर्याप्त बड़े मॉडलों में संभाव्यता श्रेणियों के अनुरूप अलग आंतरिक वेक्टर बन गए। इन वेक्टरों ने निकटवर्ती श्रेणियों, जैसे improbable बनाम impossible, को लगभग 85% सटीकता से अलग किया। स्थानीय वेक्टर मानवीय अनिश्चितता को भी दर्शाते थे; अस्पष्ट बयानों में मॉडल के संकेत मानव सर्वेक्षणों में देखी गई विभाजित राय से मेल खाते थे। शोधकर्ता रिपोर्ट करते हैं कि ये वेक्टर 2 billion parameters से अधिक वाले मॉडलों में प्रकट होने लगते हैं, जो आज के ट्रिलियन‑प्लस‑पैरामीटर मॉडल की तुलना में आकार में छोटे हैं।

mechanistic interpretability से मॉडलों में क्या एन्कोड है, वह सामने आ सकता है।
ये वेक्टर मानवीय संभाव्यता निर्णयों से जुड़ते हैं।
यह खोजें स्मार्ट और अधिक विश्वसनीय मॉडल विकसित करने में मदद कर सकती हैं।

कठिन शब्द

अध्ययन — किसी विषय पर व्यवस्थित जांच या परीक्षण
प्रशिक्षित — किसी काम के लिए सिखाया या तैयार किया गया
मॉडल — किसी प्रक्रिया का सरलीकृत प्रतिनिधि या सिस्टम
वेक्टर — गणितीय संकेतों का क्रम या दिशात्मक सूची
सटीकता — किसी नतीजे की सही होने की मात्रा
अनिश्चितता — किसी घटना के न होने या होने का संदेह
एन्कोड — जानकारी को मॉडल के अंदर आंकड़ों में बदलना

युक्ति: जब आप किसी भी भाषा में कहानी पढ़ें या ऑडियो सुनें, तो लेख में हाइलाइट किए गए शब्दों पर होवर/फ़ोकस/टैप करें और तुरंत छोटी-सी परिभाषा देखें।

1. शोधकर्ताओं ने किस बात का अध्ययन किया?
2. टीम ने मॉडल की आंतरिक गणितीय अवस्थाओं का परीक्षण कैसे किया?
3. अध्ययन ने बड़े मॉडलों में वेक्टरों के बारे में क्या पाया?
4. ये वेक्टर किस आकार के मॉडलों में प्रकट होने लगे?
5. स्थानीय वेक्टर किस मानवीय प्रतिक्रिया के साथ मेल खाते थे?

चर्चा के प्रश्न

यदि मॉडल मानवीय संभाव्यता निर्णयों से जुड़ते हैं, तो यह वास्तविक‑दुनिया अनुप्रयोगों में कैसे मदद कर सकता है? उदाहरण दें।
आपके हिसाब से बड़े मॉडलों में इस तरह की आंतरिक संरचना जानने के क्या जोखिम और फायदे हैं?
मॉडल की आंतरिक अवस्थाओं की व्याख्या करने वाली पद्धतियाँ क्यों महत्वपूर्ण हो सकती हैं, और इन्हें कैसे लागू किया जा सकता है?

पढ़ें

क्या आधुनिक भाषा मॉडल वास्तविक दुनिया समझते हैं? CEFR B2

कठिन शब्द

चर्चा के प्रश्न

संबंधित लेख

AI से आवाज़ें अलग करने वाले स्मार्ट हेडफ़ोन

लकड़ी के चूहे और रैटलस्नेक के विष के प्रति प्रतिरोध

पूर्वी अमेरिका में बर्फीला तूफ़ान और बड़ी बिजली कटौती

एप भी नाटक-खेल और कल्पना कर सकते हैं

अध्ययन: AI चैटबॉट लोगों की राजनीतिक राय बदल सकते हैं

क्या आधुनिक भाषा मॉडल वास्तविक दुनिया समझते हैं?^{CEFR B2}