📖+30 XP

🎧+20 XP

✅+35 XP

बड़े भाषा मॉडल और सरल गुणा में असफलता — स्तर B1 — brown wooden blocks on white surface

बड़े भाषा मॉडल और सरल गुणा में असफलता^{CEFR B1}

29 दिस॰ 2025

स्तरA1

आधारित: U. Chicago, Futurity • CC BY 4.0

फोटो: Brett Jordan, Unsplash

स्तर B1 – मध्य स्तरCEFR B1

4 मिनट

184 शब्द

University of Chicago के नेतृत्व में एक टीम ने यह शोध किया, जिसमें MIT, Harvard University, University of Waterloo और Google DeepMind के सहयोगी भी शामिल थे। अध्ययन ने यह देखा कि मौजूदा प्रशिक्षण तरीके मॉडल की लंबी-दूरी निर्भरताएँ संभालने की क्षमता पर कैसे असर डालते हैं। शोध का फोकस दो चार-अंकीय संख्याओं के गुणा जैसे बहु-चरण गणनात्मक कार्य पर था।

टीम ने मानक फाइन-ट्यूनिंग की तुलना ICoT से की। मानक तरीके में दो से 12 परतों वाले मॉडल चार-अंकीय गुणा पर 1% से भी कम सटीकता दिखाते रहे, जबकि ICoT से प्रशिक्षित मॉडल 100% सटीकता पर पहुँचे। शोधकर्ताओं ने पाया कि ICoT मॉडल आंतरिक अवस्थाओं में मध्यवर्ती मान एन्कोड करते हैं और उनसे चलती राशियाँ (running sums) डिकोड कर पाते हैं।

शोध में यह भी दिखा कि शुरुआती परतें अंक-जुड़ियों के गुणनफल निकाल कर संग्रहीत करती हैं और बाद की परतें उन मानों को पुनः प्राप्त कर अंतिम उत्तर का निर्माण करती हैं। टीम ने एक प्रशिक्षण उद्देश्य जोड़ा जो हर चरण पर चलती राशियों को ट्रैक करना सिखाता; इससे छोटे मॉडलों की सटीकता बहुत बेहतर हुई।

कठिन शब्द

नेतृत्व — किसी समूह या परियोजना का निर्देशन या मार्गदर्शन
प्रशिक्षण — मशीन या मॉडल को जानकारी देने की प्रक्रिया
प्रशिक्षित
निर्भरता — एक चीज़ का दूसरी चीज़ पर आश्रित होना
निर्भरताएँ
बहु-चरण — कई अलग-अलग चरणों में होने वाला कार्य
फाइन-ट्यूनिंग — पूर्व प्रशिक्षित मॉडल का अतिरिक्त सुधार या समायोजन
सटीकता — नतीजे या उत्तर के सही होने की मात्रा
एन्कोड — जानकारी को किसी अन्य रूप में बदलना और रखना
चलती राशियाँ — हर कदम पर जोड़े गए संख्याओं का क्रमिक जोड़

युक्ति: जब आप किसी भी भाषा में कहानी पढ़ें या ऑडियो सुनें, तो लेख में हाइलाइट किए गए शब्दों पर होवर/फ़ोकस/टैप करें और तुरंत छोटी-सी परिभाषा देखें।

1. यह शोध किसके नेतृत्व में किया गया?
2. शोध का फोकस किस प्रकार के कार्य पर था?
3. ICoT से प्रशिक्षित मॉडलों की चार-अंकीय गुणा पर सटीकता क्या थी?
4. शोधकर्ताओं ने आंतरिक अवस्थाओं के बारे में क्या पाया?

चर्चा के प्रश्न

आपको क्यों लगता है कि मॉडलों को मध्यवर्ती मान सीखाना उपयोगी होता है?
क्या आप कभी गणित में बहु-चरण समस्याएँ हल करते समय बीच के कदम लिखते हैं? उस तरीके का एक छोटा उदाहरण दें।
अगर यह प्रशिक्षण उद्देश्य स्कूल की पढ़ाई में लगाया जाए, तो छात्रों को कौन सा सीधा लाभ दिखेगा?

संबंधित लेख

31 दिस॰ 2025

दृष्टि हानि और क्या दृष्टि वापस आ सकती है?

एक वीडियो में Juliette McGregor ने अंधापन को समझाया और बताया कि कभी-कभी इलाज से आगे दृष्टि हानि रोकी या कम की जा सकती है। शोध और क्लिनिकल परीक्षण आगे की प्रगति तय करेंगे।

स्तर

पढ़ें

30 दिस॰ 2025

Rano Raraku का पहला तीन-आयामी डिजिटल मॉडल

शोधकर्ताओं ने Rano Raraku के खदान का पहला तीन-आयामी डिजिटल मॉडल बनाया। मॉडल ने moai मूर्तियों का स्थान और आकार दर्ज किया और स्थानीय समुदाय के साथ डेटा साझा किया गया।

स्तर

पढ़ें

2 दिस॰ 2025

मस्तिष्क की एक सुरक्षात्मक प्रणाली: GLO1 और कैल्शियम

येल के शोधकर्ताओं ने दिखाया कि युवा मस्तिष्कों में GLO1 नामक प्रोटीन कैल्शियम असंतुलन के नुकसान को कम कर सकता है। उम्र के साथ यह प्रणाली कमजोर होती है और स्मृति प्रभावित हो सकती है।

स्तर

पढ़ें

4 फ़र॰ 2026

गर्भावस्था बनाम गर्भपात: मृत्यु जोखिम का नया अनुमान

नए सार्वजनिक स्वास्थ्य विश्लेषण में पाया गया कि गर्भावस्था से होने वाला मृत्यु जोखिम गर्भपात की तुलना में बहुत अधिक है। अध्ययन ने 2018–2021 के डेटा से अद्यतन अनुमान दिए और नीतिगत चर्चा के लिए जानकारी दी।

स्तर

पढ़ें

25 नव॰ 2025

NMR eigenmodes फ्रेमवर्क से तेज और सटीक MRI

Rice University और Oak Ridge National Laboratory के शोधकर्ताओं ने एक नया भौतिक-आधारित मॉडल बनाया है। यह फ्रेमवर्क आणविक गति को MRI संकेतों से जोड़कर तेज और अधिक सटीक स्कैन संभव बनाता है और कोड ओपन सोर्स है।

स्तर

पढ़ें

बड़े भाषा मॉडल और सरल गुणा में असफलता CEFR B1

कठिन शब्द

चर्चा के प्रश्न

संबंधित लेख

दृष्टि हानि और क्या दृष्टि वापस आ सकती है?

Rano Raraku का पहला तीन-आयामी डिजिटल मॉडल

मस्तिष्क की एक सुरक्षात्मक प्रणाली: GLO1 और कैल्शियम

गर्भावस्था बनाम गर्भपात: मृत्यु जोखिम का नया अनुमान

NMR eigenmodes फ्रेमवर्क से तेज और सटीक MRI

बड़े भाषा मॉडल और सरल गुणा में असफलता^{CEFR B1}