LingVo.club
📖+30 XP
🎧+20 XP
+35 XP
बड़े भाषा मॉडल और सरल गुणा में असफलता — स्तर B1 — brown wooden blocks on white surface

बड़े भाषा मॉडल और सरल गुणा में असफलताCEFR B1

29 दिस॰ 2025

स्तर B1 – मध्य स्तर
4 मिनट
184 शब्द

University of Chicago के नेतृत्व में एक टीम ने यह शोध किया, जिसमें MIT, Harvard University, University of Waterloo और Google DeepMind के सहयोगी भी शामिल थे। अध्ययन ने यह देखा कि मौजूदा प्रशिक्षण तरीके मॉडल की लंबी-दूरी निर्भरताएँ संभालने की क्षमता पर कैसे असर डालते हैं। शोध का फोकस दो चार-अंकीय संख्याओं के गुणा जैसे बहु-चरण गणनात्मक कार्य पर था।

टीम ने मानक फाइन-ट्यूनिंग की तुलना ICoT से की। मानक तरीके में दो से 12 परतों वाले मॉडल चार-अंकीय गुणा पर 1% से भी कम सटीकता दिखाते रहे, जबकि ICoT से प्रशिक्षित मॉडल 100% सटीकता पर पहुँचे। शोधकर्ताओं ने पाया कि ICoT मॉडल आंतरिक अवस्थाओं में मध्यवर्ती मान एन्कोड करते हैं और उनसे चलती राशियाँ (running sums) डिकोड कर पाते हैं।

शोध में यह भी दिखा कि शुरुआती परतें अंक-जुड़ियों के गुणनफल निकाल कर संग्रहीत करती हैं और बाद की परतें उन मानों को पुनः प्राप्त कर अंतिम उत्तर का निर्माण करती हैं। टीम ने एक प्रशिक्षण उद्देश्य जोड़ा जो हर चरण पर चलती राशियों को ट्रैक करना सिखाता; इससे छोटे मॉडलों की सटीकता बहुत बेहतर हुई।

कठिन शब्द

  • नेतृत्वकिसी समूह या परियोजना का निर्देशन या मार्गदर्शन
  • प्रशिक्षणमशीन या मॉडल को जानकारी देने की प्रक्रिया
    प्रशिक्षित
  • निर्भरताएक चीज़ का दूसरी चीज़ पर आश्रित होना
    निर्भरताएँ
  • बहु-चरणकई अलग-अलग चरणों में होने वाला कार्य
  • फाइन-ट्यूनिंगपूर्व प्रशिक्षित मॉडल का अतिरिक्त सुधार या समायोजन
  • सटीकतानतीजे या उत्तर के सही होने की मात्रा
  • एन्कोडजानकारी को किसी अन्य रूप में बदलना और रखना
  • चलती राशियाँहर कदम पर जोड़े गए संख्याओं का क्रमिक जोड़

युक्ति: जब आप किसी भी भाषा में कहानी पढ़ें या ऑडियो सुनें, तो लेख में हाइलाइट किए गए शब्दों पर होवर/फ़ोकस/टैप करें और तुरंत छोटी-सी परिभाषा देखें।

चर्चा के प्रश्न

  • आपको क्यों लगता है कि मॉडलों को मध्यवर्ती मान सीखाना उपयोगी होता है?
  • क्या आप कभी गणित में बहु-चरण समस्याएँ हल करते समय बीच के कदम लिखते हैं? उस तरीके का एक छोटा उदाहरण दें।
  • अगर यह प्रशिक्षण उद्देश्य स्कूल की पढ़ाई में लगाया जाए, तो छात्रों को कौन सा सीधा लाभ दिखेगा?

संबंधित लेख

दृष्टि हानि और क्या दृष्टि वापस आ सकती है? — स्तर B1
31 दिस॰ 2025

दृष्टि हानि और क्या दृष्टि वापस आ सकती है?

एक वीडियो में Juliette McGregor ने अंधापन को समझाया और बताया कि कभी-कभी इलाज से आगे दृष्टि हानि रोकी या कम की जा सकती है। शोध और क्लिनिकल परीक्षण आगे की प्रगति तय करेंगे।

Rano Raraku का पहला तीन-आयामी डिजिटल मॉडल — स्तर B1
30 दिस॰ 2025

Rano Raraku का पहला तीन-आयामी डिजिटल मॉडल

शोधकर्ताओं ने Rano Raraku के खदान का पहला तीन-आयामी डिजिटल मॉडल बनाया। मॉडल ने moai मूर्तियों का स्थान और आकार दर्ज किया और स्थानीय समुदाय के साथ डेटा साझा किया गया।

मस्तिष्क की एक सुरक्षात्मक प्रणाली: GLO1 और कैल्शियम — स्तर B1
2 दिस॰ 2025

मस्तिष्क की एक सुरक्षात्मक प्रणाली: GLO1 और कैल्शियम

येल के शोधकर्ताओं ने दिखाया कि युवा मस्तिष्कों में GLO1 नामक प्रोटीन कैल्शियम असंतुलन के नुकसान को कम कर सकता है। उम्र के साथ यह प्रणाली कमजोर होती है और स्मृति प्रभावित हो सकती है।

गर्भावस्था बनाम गर्भपात: मृत्यु जोखिम का नया अनुमान — स्तर B1
4 फ़र॰ 2026

गर्भावस्था बनाम गर्भपात: मृत्यु जोखिम का नया अनुमान

नए सार्वजनिक स्वास्थ्य विश्लेषण में पाया गया कि गर्भावस्था से होने वाला मृत्यु जोखिम गर्भपात की तुलना में बहुत अधिक है। अध्ययन ने 2018–2021 के डेटा से अद्यतन अनुमान दिए और नीतिगत चर्चा के लिए जानकारी दी।

NMR eigenmodes फ्रेमवर्क से तेज और सटीक MRI — स्तर B1
25 नव॰ 2025

NMR eigenmodes फ्रेमवर्क से तेज और सटीक MRI

Rice University और Oak Ridge National Laboratory के शोधकर्ताओं ने एक नया भौतिक-आधारित मॉडल बनाया है। यह फ्रेमवर्क आणविक गति को MRI संकेतों से जोड़कर तेज और अधिक सटीक स्कैन संभव बनाता है और कोड ओपन सोर्स है।