📖+30 XP

🎧+20 XP

✅+35 XP

AI मॉडल और गैर-अंग्रेज़ी भाषाएँ (स्तर B1) — a wooden table topped with scrabble tiles that spell out languages

AI मॉडल और गैर-अंग्रेज़ी भाषाएँ^{CEFR B1}

8 अप्रैल 2026

स्तरA1

आधारित: Aaron Spitler, Global Voices • CC BY 3.0

फोटो: Ling App, Unsplash

स्तर B1 – मध्य स्तरCEFR B1

3 मिनट

167 शब्द

2025 में Stanford Institute for Human-Centered Artificial Intelligence (HAI) के एक पेपर में पता चला कि कई लोकप्रिय बड़े भाषा मॉडल (LLMs) अंग्रेज़ी के अलावा अन्य भाषाओं में कमजोर रहे। सार्वजनिक LLMs, जिनमें कुछ मॉडल आंशिक रूप से बड़ी कंपनियों द्वारा विकसित हैं, वैश्विक बहुसंख्यक की ज़रूरतों का पूरा ध्यान नहीं रखते।

Silicon Valley जैसी जगहों पर कंपनियों और डेटा की सघनता ने यह खाई और चौड़ी कर दी है। समाचारों में बताया गया कि कुर्दिश और स्वाहिली जैसी भाषाएँ करोड़ों लोगों के लिए व्यवहार में पिछड़ी हुई हैं। किस तरह के उदाहरणों में Wired ने बताया कि ChatGPT जैसे मॉडल तमिल में ईमेल लिखते समय अंग्रेज़ी में उलझा हुआ मसौदा दे सकते हैं।

MIT Technology Review ने पाया कि वेब से खींचे गए कम-संसाधन भाषाओं के पाठों में मशीन-अनुवाद की गलतियाँ होती हैं और दान करने वाले अक्सर सटीकता जाँचने के कौशल नहीं रखते। विशेषज्ञ सुझाव देते हैं कि कंपनियाँ स्थानीय इनपुट लें, डेटा सत्यापित करें और जमीनी डेवलपर्स के साथ साझेदारी करें।

कठिन शब्द

कम-संसाधन भाषा — वह भाषा जिस पर कम डिजिटल डेटा उपलब्ध हो
कम-संसाधन भाषाओं
सघनता — किसी क्षेत्र में मौजूद चीज़ों की अधिकता
डेवलपर — कम्प्यूटर प्रोग्राम या एप बनाने वाला व्यक्ति
डेवलपर्स
सत्यापित करना — किसी जानकारी की सही या सटीक होने की जाँच करना
सत्यापित करें
दान करना — किसी को मदद या चीज़ें देना
दान करने वाले
बहुसंख्यक — अधिक संख्या में लोगों या चीज़ों का समूह
साझेदारी — दो या अधिक पक्षों का मिलकर काम करना

युक्ति: जब आप किसी भी भाषा में कहानी पढ़ें या ऑडियो सुनें, तो लेख में हाइलाइट किए गए शब्दों पर होवर/फ़ोकस/टैप करें और तुरंत छोटी-सी परिभाषा देखें।

1. पेपर में क्या पाया गया?
2. यह खाई और चौड़ी क्यों हुई?
3. MIT Technology Review ने वेब से खींचे गए पाठों में क्या समस्या पाई?
4. विशेषज्ञ कंपनियों को क्या सुझाव देते हैं?

चर्चा के प्रश्न

कम-संसाधन भाषाओं में बड़े भाषा मॉडल कमजोर होने से आपके समुदाय पर क्या असर पड़ सकता है? उदाहरण दें।
क्या कंपनियों को स्थानीय इनपुट और जमीनी डेवलपर्स के साथ काम करना चाहिए? अपने कारण बताइए।
आपके हिसाब से स्थानीय डेटा सत्यापित करने के आसान तरीके कौन से हो सकते हैं?

संबंधित लेख

31 दिस॰ 2025

Futurity के 2025 के शीर्ष 10 शोध समाचार

साल 2025 के अंत पर Futurity ने साल की शीर्ष 10 शोध समाचार पोस्ट प्रकाशित की। सूची में पशु चिकित्सा, ऊर्जा, पुरातत्व, तंत्रिका विज्ञान, पोषण और पर्यावरण स्वास्थ्य से जुड़ी कहानियाँ हैं और पाठकों को 2026 में लौटने का न्यौता दिया गया।

स्तर

पढ़ें

4 फ़र॰ 2026

ऐसे धातु ट्यूब जो पानी में नहीं डूबते

यूनिवर्सिटी ऑफ रोचेस्टर के शोधकर्ताओं ने ऐसी एल्यूमिनियम ट्यूब बनाई हैं जिनकी अंदरूनी सतह हवा रोकती है और वे पानी में डूबती नहीं। यह डिजाइन जहाज, फ्लोटिंग प्लेटफॉर्म और ऊर्जा उपकरणों पर असर डाल सकता है।

स्तर

पढ़ें

15 दिस॰ 2025

बच्चों के लिए विज्ञान गेम 'Virtual Vet'

जॉर्जिया विश्वविद्यालय के शोधकर्ताओं ने प्राथमिक छात्रों के लिए 'Virtual Vet' नामक वीडियो गेम बनाया है। परीक्षण में गेम खेलने वाले बच्चों के अंक पारंपरिक कक्षा गतिविधि करने वालों से बेहतर रहे।

स्तर

पढ़ें

24 अप्रैल 2026

Sportellino: प्रवासियों के लिए बहुभाषी चैटबॉट

जुलाई 2025 में लॉन्च हुआ Sportellino चैटबॉट प्रवासियों को कदम-दर-कदम जानकारी और व्यावहारिक मार्गदर्शन देता है। यह नि:शुल्क, गुमनाम और WhatsApp/Telegram पर 24/7 उपलब्ध है और मार्च 2026 तक लगभग 10,000 उपयोगकर्ताओं तक पहुंच चुका है।

स्तर

पढ़ें

6 दिस॰ 2025

साझा करना थोड़ा कठिन करने से फर्जी खबरें कम हो सकती हैं

कोपनहेगन विश्वविद्यालय के शोधकर्ताओं ने प्रस्ताव दिया है कि सोशल मीडिया पर साझा करने में थोड़ी देरी और एक छोटा शिक्षण प्रश्न उपयोगी हो सकता है। शोध से पता चला कि यह भ्रामक सूचना के प्रसार को धीमा कर सकता है।

स्तर

पढ़ें

AI मॉडल और गैर-अंग्रेज़ी भाषाएँ CEFR B1

कठिन शब्द

चर्चा के प्रश्न

संबंधित लेख

Futurity के 2025 के शीर्ष 10 शोध समाचार

ऐसे धातु ट्यूब जो पानी में नहीं डूबते

बच्चों के लिए विज्ञान गेम 'Virtual Vet'

Sportellino: प्रवासियों के लिए बहुभाषी चैटबॉट

साझा करना थोड़ा कठिन करने से फर्जी खबरें कम हो सकती हैं

AI मॉडल और गैर-अंग्रेज़ी भाषाएँ^{CEFR B1}