LingVo.club
📖+40 XP
🎧+25 XP
+45 XP
बड़े भाषा मॉडल और सरल गुणा में असफलता (स्तर B2) — brown wooden blocks on white surface

बड़े भाषा मॉडल और सरल गुणा में असफलताCEFR B2

29 दिस॰ 2025

स्तर B2 – ऊपरी-मध्य स्तर
6 मिनट
322 शब्द

एक व्यापक अध्ययन में Xiaoyan Bai और Chenhao Tan (University of Chicago) ने MIT, Harvard University, University of Waterloo और Google DeepMind के सहयोगियों के साथ मिलकर यह जांच की कि क्यों अत्याधुनिक बड़े भाषा मॉडल सरल प्राथमिक-स्तर गणनाओं—विशेषकर दो चार-अंकीय संख्याओं का गुणा—में भी असफल रहते हैं। अध्ययन ने मानक फाइन-ट्यूनिंग और Implicit Chain of Thought (ICoT) प्रशिक्षण विधियों की तुलना पर ध्यान केन्द्रित किया, खासकर लंबी-दूरी निर्भरताओं के संदर्भ में जहाँ मॉडल को आंशिक गुणा और चलती राशियाँ बनाए रखना होता है।

परिणाम स्पष्ट थे: मानक फाइन-ट्यूनिंग के तहत दो से 12 परतों वाले मॉडल चार-अंकीय गुणा पर 1% से भी कम सटीकता दिखाते रहे, जबकि ICoT से प्रशिक्षित मॉडल ने 100% सटीकता हासिल की। आंतरिक विश्लेषण से पता चला कि ICoT मॉडल मध्यवर्ती मानों को एन्कोड करते हैं और इनके छिपे हुए राज्यों से चलती राशियाँ डिकोड कर पाते हैं। टीम ने ध्यान के संगठन में परत-विशेष विभाजन देखा: शुरुआती परतें निश्चित स्थानों पर अंक-जुड़ियों के गुणनफल निकालकर संग्रहीत करतीं और बाद की परतें उन मानों को पुनः प्राप्त कर अंतिम उत्तर के प्रत्येक अंक का निर्माण करती थीं।

शोध ने यह भी बताया कि अंक Fourier-जैसे आधारों में प्रस्तुत होते हैं और प्रशिक्षण के दौरान Minkowski योग जैसा एक ज्यामितीय ऑपरेशन स्वाभाविक रूप से उभर आया। व्यवहारिक सुधार के लिये टीम ने एक प्रशिक्षण उद्देश्य जोड़ा जो प्रत्येक चरण पर चलती राशियों को ट्रैक करना सिखाता; इस लक्ष्य ने बिना स्पष्ट चेन-ऑफ-थॉट पर्यवेक्षण के दो-परत वाले मॉडल की सटीकता 99% तक बढ़ा दी। अध्ययन का निष्कर्ष यह है कि केवल डेटा या पैरामीटर बढ़ाने से सीमाएँ नहीं हटतीं; आर्किटेक्चरल मार्गदर्शन और लक्षित प्रशिक्षण उद्देश्य बहु-चरण तर्क सीखने में निर्णायक हो सकते हैं।

"जैसे-जैसे AI महत्वपूर्ण निर्णय-निर्माण में अधिक समाहित होता जा रहा है, इसके सीखने और सोचने के विशिष्ट तरीकों को समझना आवश्यक है," Tan कहते हैं। Source: University of Chicago

कठिन शब्द

  • गणनासंख्याओं या आंकड़ों पर किया गया हिसाब
    गणनाओं
  • फाइन-ट्यूनिंगमौजूदा मॉडल को विशेष काम के लिये बदलना
  • प्रशिक्षणमशीन को नया व्यवहार सिखाने की प्रक्रिया
  • परतमॉडल के भीतर अलग-अलग स्तर या तह
    परतों
  • मध्यवर्तीबीच के स्तर या मध्य में होने वाला
  • चलती राशिगणना के बीच के अस्थायी संख्यात्मक मान
    चलती राशियाँ
  • सटीकताउत्तर या परिणाम की शुद्धता की मात्रा
  • आर्किटेक्चरल मार्गदर्शनडिजाइन या संरचना के आधार पर निर्देश देना

युक्ति: जब आप किसी भी भाषा में कहानी पढ़ें या ऑडियो सुनें, तो लेख में हाइलाइट किए गए शब्दों पर होवर/फ़ोकस/टैप करें और तुरंत छोटी-सी परिभाषा देखें।

चर्चा के प्रश्न

  • अध्ययन में बताया गया है कि आर्किटेक्चरल मार्गदर्शन और लक्षित प्रशिक्षण महत्वपूर्ण हैं। आप कैसे सोचते हैं कि ये उपाय वास्तविक दुनिया के AI सिस्टम की भरोसेमंदता बढ़ा सकते हैं? उदाहरण दें।
  • क्या मॉडल के मध्यवर्ती मानों (चलती राशियों) को समझना और ट्रैक करना रोज़मर्रा के अनुप्रयोगों में उपयोगी होगा? किन स्थितियों में यह जरूरी हो सकता है?
  • डेटा या पैरामीटर बढ़ाने की बजाय लक्षित प्रशिक्षण उद्देश्य चुनने के क्या फायदे और सीमाएँ हो सकती हैं? अपने विचार संक्षेप में बताइए।

संबंधित लेख

Rano Raraku का पहला तीन-आयामी डिजिटल मॉडल (स्तर B2)
30 दिस॰ 2025

Rano Raraku का पहला तीन-आयामी डिजिटल मॉडल

शोधकर्ताओं ने Rano Raraku के खदान का पहला तीन-आयामी डिजिटल मॉडल बनाया। मॉडल ने moai मूर्तियों का स्थान और आकार दर्ज किया और स्थानीय समुदाय के साथ डेटा साझा किया गया।

साझा करना थोड़ा कठिन करने से फर्जी खबरें कम हो सकती हैं (स्तर B2)
6 दिस॰ 2025

साझा करना थोड़ा कठिन करने से फर्जी खबरें कम हो सकती हैं

कोपनहेगन विश्वविद्यालय के शोधकर्ताओं ने प्रस्ताव दिया है कि सोशल मीडिया पर साझा करने में थोड़ी देरी और एक छोटा शिक्षण प्रश्न उपयोगी हो सकता है। शोध से पता चला कि यह भ्रामक सूचना के प्रसार को धीमा कर सकता है।

EL छात्रों का समूह बनाना: दो अध्ययनों के निष्कर्ष (स्तर B2)
24 नव॰ 2025

EL छात्रों का समूह बनाना: दो अध्ययनों के निष्कर्ष

दो अध्ययनों ने देखा कि अंग्रेजी सीखने वाले छात्रों (ELs) को एक साथ कक्षाओं में रखना आम प्रथा है। शोध ने पाया कि उच्च EL संगति कुछ शैक्षिक नतीजों को घटा रही थी और नीति में सावधानी सुझाई गई।

कलाकारों और पत्रकारों ने 'Stop AI Theft' अभियान शुरू किया (स्तर B2)
9 अप्रैल 2026

कलाकारों और पत्रकारों ने 'Stop AI Theft' अभियान शुरू किया

ऑस्ट्रेलियाई कलाकारों, पत्रकारों और आदिवासी सांस्कृतिक कार्यकर्ताओं ने 'Stop AI Theft' अभियान शुरू किया है। वे जनरेटिव AI द्वारा बिना अनुमति उनके काम के उपयोग की शिकायत कर रहे हैं और सुरक्षा माँग रहे हैं।

तीन मनोवैज्ञानिक जरूरतें और जिम्मेदार शराब पीना (स्तर B2)
26 मार्च 2026

तीन मनोवैज्ञानिक जरूरतें और जिम्मेदार शराब पीना

एक नया शोध बताता है कि स्वायत्तता, क्षमता और संबंध जैसी तीन मनोवैज्ञानिक आवश्यकताएँ पूरी होने पर लोग शराब पीते समय अधिक सुरक्षित कदम उठाते हैं और दुरुपयोग का जोखिम कम होता है।