LingVo.club
📖+40 XP
🎧+25 XP
+45 XP
बड़े भाषा मॉडल और सरल गुणा में असफलता — स्तर B2 — brown wooden blocks on white surface

बड़े भाषा मॉडल और सरल गुणा में असफलताCEFR B2

29 दिस॰ 2025

स्तर B2 – ऊपरी-मध्य स्तर
6 मिनट
322 शब्द

एक व्यापक अध्ययन में Xiaoyan Bai और Chenhao Tan (University of Chicago) ने MIT, Harvard University, University of Waterloo और Google DeepMind के सहयोगियों के साथ मिलकर यह जांच की कि क्यों अत्याधुनिक बड़े भाषा मॉडल सरल प्राथमिक-स्तर गणनाओं—विशेषकर दो चार-अंकीय संख्याओं का गुणा—में भी असफल रहते हैं। अध्ययन ने मानक फाइन-ट्यूनिंग और Implicit Chain of Thought (ICoT) प्रशिक्षण विधियों की तुलना पर ध्यान केन्द्रित किया, खासकर लंबी-दूरी निर्भरताओं के संदर्भ में जहाँ मॉडल को आंशिक गुणा और चलती राशियाँ बनाए रखना होता है।

परिणाम स्पष्ट थे: मानक फाइन-ट्यूनिंग के तहत दो से 12 परतों वाले मॉडल चार-अंकीय गुणा पर 1% से भी कम सटीकता दिखाते रहे, जबकि ICoT से प्रशिक्षित मॉडल ने 100% सटीकता हासिल की। आंतरिक विश्लेषण से पता चला कि ICoT मॉडल मध्यवर्ती मानों को एन्कोड करते हैं और इनके छिपे हुए राज्यों से चलती राशियाँ डिकोड कर पाते हैं। टीम ने ध्यान के संगठन में परत-विशेष विभाजन देखा: शुरुआती परतें निश्चित स्थानों पर अंक-जुड़ियों के गुणनफल निकालकर संग्रहीत करतीं और बाद की परतें उन मानों को पुनः प्राप्त कर अंतिम उत्तर के प्रत्येक अंक का निर्माण करती थीं।

शोध ने यह भी बताया कि अंक Fourier-जैसे आधारों में प्रस्तुत होते हैं और प्रशिक्षण के दौरान Minkowski योग जैसा एक ज्यामितीय ऑपरेशन स्वाभाविक रूप से उभर आया। व्यवहारिक सुधार के लिये टीम ने एक प्रशिक्षण उद्देश्य जोड़ा जो प्रत्येक चरण पर चलती राशियों को ट्रैक करना सिखाता; इस लक्ष्य ने बिना स्पष्ट चेन-ऑफ-थॉट पर्यवेक्षण के दो-परत वाले मॉडल की सटीकता 99% तक बढ़ा दी। अध्ययन का निष्कर्ष यह है कि केवल डेटा या पैरामीटर बढ़ाने से सीमाएँ नहीं हटतीं; आर्किटेक्चरल मार्गदर्शन और लक्षित प्रशिक्षण उद्देश्य बहु-चरण तर्क सीखने में निर्णायक हो सकते हैं।

"जैसे-जैसे AI महत्वपूर्ण निर्णय-निर्माण में अधिक समाहित होता जा रहा है, इसके सीखने और सोचने के विशिष्ट तरीकों को समझना आवश्यक है," Tan कहते हैं। Source: University of Chicago

कठिन शब्द

  • गणनासंख्याओं या आंकड़ों पर किया गया हिसाब
    गणनाओं
  • फाइन-ट्यूनिंगमौजूदा मॉडल को विशेष काम के लिये बदलना
  • प्रशिक्षणमशीन को नया व्यवहार सिखाने की प्रक्रिया
  • परतमॉडल के भीतर अलग-अलग स्तर या तह
    परतों
  • मध्यवर्तीबीच के स्तर या मध्य में होने वाला
  • चलती राशिगणना के बीच के अस्थायी संख्यात्मक मान
    चलती राशियाँ
  • सटीकताउत्तर या परिणाम की शुद्धता की मात्रा
  • आर्किटेक्चरल मार्गदर्शनडिजाइन या संरचना के आधार पर निर्देश देना

युक्ति: जब आप किसी भी भाषा में कहानी पढ़ें या ऑडियो सुनें, तो लेख में हाइलाइट किए गए शब्दों पर होवर/फ़ोकस/टैप करें और तुरंत छोटी-सी परिभाषा देखें।

चर्चा के प्रश्न

  • अध्ययन में बताया गया है कि आर्किटेक्चरल मार्गदर्शन और लक्षित प्रशिक्षण महत्वपूर्ण हैं। आप कैसे सोचते हैं कि ये उपाय वास्तविक दुनिया के AI सिस्टम की भरोसेमंदता बढ़ा सकते हैं? उदाहरण दें।
  • क्या मॉडल के मध्यवर्ती मानों (चलती राशियों) को समझना और ट्रैक करना रोज़मर्रा के अनुप्रयोगों में उपयोगी होगा? किन स्थितियों में यह जरूरी हो सकता है?
  • डेटा या पैरामीटर बढ़ाने की बजाय लक्षित प्रशिक्षण उद्देश्य चुनने के क्या फायदे और सीमाएँ हो सकती हैं? अपने विचार संक्षेप में बताइए।

संबंधित लेख

ऑस्ट्रेलिया ने सोशल मीडिया पर 16 साल से कम आयु का प्रतिबंध लगाया — स्तर B2
15 दिस॰ 2025

ऑस्ट्रेलिया ने सोशल मीडिया पर 16 साल से कम आयु का प्रतिबंध लगाया

10 December 2025 को ऑस्ट्रेलिया ने बड़े प्लेटफ़ॉर्म्स पर एक नया नियम लागू किया। नियम के अनुसार 16 साल से कम उम्र के लोगों के खाते नहीं बनने चाहिए; कंपनियों को यह दिखाना होगा कि वे कदम उठा रही हैं।

सहायक तकनीक तक पहुँच कम: WHO-यूनिसेफ रिपोर्ट — स्तर B2
17 मई 2022

सहायक तकनीक तक पहुँच कम: WHO-यूनिसेफ रिपोर्ट

16 May को WHO और यूनिसेफ की रिपोर्ट कहती है कि लगभग एक अरब बच्चे और वयस्क, खासकर विकलांग और बुजुर्ग, आवश्यक सहायक तकनीक तक नहीं पहुँच पाते। रिपोर्ट कमी और सुधार के सुझाव देती है।

नाक के स्वाब से अल्जाइमर के शुरुआती संकेत — स्तर B2
20 मार्च 2026

नाक के स्वाब से अल्जाइमर के शुरुआती संकेत

नए शोध में दिखा कि एक साधारण नाक का स्वाब मन और स्मृति में होने वाले शुरुआती जैविक बदलावों का पता लगा सकता है, जो लक्षण आने से पहले दिखाई देते हैं। शोध टीम ने कोशिकाओं की जीन गतिविधि भी मापी।

2025 की सहायता कटौती और स्वास्थ्य संकट — स्तर B2
22 दिस॰ 2025

2025 की सहायता कटौती और स्वास्थ्य संकट

2025 में बड़े पैमाने पर विदेशी सहायता कटौती से स्वास्थ्य और मानवीय सेवाएँ प्रभावित हुईं। अमेरिका ने 20 जनवरी 2025 को कई सहायता अनुबंध निलंबित किए और USAID बंद हो गया; इसके बाद कई देशों ने समर्थन घटाया।

AI_r: दक्षिण अफ्रीका में वास्तविक समय वायु‑गुणवत्ता निगरानी — स्तर B2
9 सित॰ 2025

AI_r: दक्षिण अफ्रीका में वास्तविक समय वायु‑गुणवत्ता निगरानी

वैज्ञानिकों ने AI_r नाम की प्रणाली बनाई जो सस्ते IoT सेंसर और आर्टिफिशियल इंटेलिजेंस से दक्षिण अफ्रीका में प्रदूषण हॉटस्पॉट पर वास्तविक समय वायु गुणवत्ता नापती है। पायलट जोहानेसबर्ग के Soweto में चलाया गया।