AI मॉडल और गैर-अंग्रेज़ी भाषाएँ^{CEFR B2}

8 अप्रैल 2026

स्तरA1

आधारित: Aaron Spitler, Global Voices • CC BY 3.0

फोटो: Ling App, Unsplash

स्तर B2 – ऊपरी-मध्य स्तरCEFR B2

5 मिनट

283 शब्द

एक 2025 के पेपर में Stanford Institute for Human-Centered Artificial Intelligence (HAI) ने चेतावनी दी कि कई लोकप्रिय बड़े भाषा मॉडल (LLMs) अंग्रेज़ी के अलावा अन्य भाषाओं में खराब प्रदर्शन करते हैं। सार्वजनिक मॉडलों में कुछ ऐसे भी हैं जिनका विकास आंशिक रूप से बड़ी कंपनियों ने किया है, और इसने वैश्विक भाषाई असमानता को उजागर किया है।

विशेष रूप से Silicon Valley जैसे संपन्न क्षेत्रों में AI कंपनियों और डेटा की सघनता ने यह खाई और चौड़ी कर दी है। रिपोर्टों के अनुसार कुर्दिश और स्वाहिली जैसी भाषाएँ करोड़ों बोलने वालों के लिए व्यवहारिक रूप से पिछाड़ी रखी जा रही हैं। Wired ने उदाहरण के तौर पर बताया कि ChatGPT जैसे मॉडल तमिल में ईमेल लिखने पर अंग्रेज़ी में उलझा मसौदा दे सकते हैं।

बहुभाषी डेटा बढ़ाने के प्रयासों का भी उल्टा असर सामने आया है। MIT Technology Review ने पाया कि वेब से खींचे गए कम-संसाधन भाषाओं के पाठों में मशीन-अनुवाद की गलतियाँ होती हैं, और अच्छे इरादे से योगदान करने वाले अक्सर सटीकता जाँचने में सक्षम नहीं होते। The Atlantic ने चेतावनी दी कि AI आउटपुट अक्सर संसाधन-समृद्ध देशों के अंग्रेज़ी भाषियों के नियमों और मानों को प्रतिबिंबित करता है, और टेक सेक्टर की "तेजी से बढ़ो, तोड़-फोड़ करो" प्रवृत्ति गैर-अंग्रेज़ी समुदायों को नुकसान पहुँचा सकती है।

विशेषज्ञ और टिप्पणीकार कुछ ठोस कदम सुझाते हैं: कंपनियों को किनारे रखे गए समुदायों और जमीनी AI नेताओं के साथ मिलकर मॉडल बनानी चाहिए, स्थानीय इनपुट शामिल करना चाहिए, आउटपुट की सटीकता और प्रामाणिकता की समीक्षा करनी चाहिए और सांस्कृतिक भेदों का सम्मान करते हुए साझेदारी करनी चाहिए।

स्थानीय समुदायों के साथ काम करें
बहुभाषी डेटा की सत्यापिता करें
जमीनी स्तर के डेवलपर्स के साथ साझेदारी करें

कठिन शब्द

असमानता — लोगों या समूहों के बीच बराबरी की कमी
सघनता — किसी चीज़ का घना होना या अधिक मात्रा होना
संसाधन — जरूरी सामग्री, पैसे या तकनीकी सुविधा
कम-संसाधन, संसाधन-समृद्ध
बहुभाषी — एक से अधिक भाषाओं में जुड़ा या संबंधित
प्रामाणिकता — किसी जानकारी की सच्चाई और भरोसेयोग्यता
जमीनी — स्थानीय स्तर पर मौजूद या आधारभूत
प्रवृत्ति — किसी तरह के बार-बार दिखने वाला व्यवहार
साझेदारी — दो या अधिक पक्षों का मिलकर काम करना

युक्ति: जब आप किसी भी भाषा में कहानी पढ़ें या ऑडियो सुनें, तो लेख में हाइलाइट किए गए शब्दों पर होवर/फ़ोकस/टैप करें और तुरंत छोटी-सी परिभाषा देखें।

1. Stanford HAI ने क्या चेतावनी दी?
2. लेख के अनुसार Silicon Valley जैसे क्षेत्रों में क्या खाई चौड़ी कर रही है?
3. MIT Technology Review ने बहुभाषी डेटा के बारे में क्या पाया?
4. The Atlantic ने किस बात की चेतावनी दी?
5. लेख में विशेषज्ञों ने किस तरह के कदम सुझाए?

चर्चा के प्रश्न

बहुभाषी डेटा में मशीन-अनुवाद की गलतियाँ कम करने के लिए आप किन कदमों को प्राथमिकता देंगे? कारण बताइए।
स्थानीय समुदायों और जमीनी डेवलपर्स के साथ साझेदारी करने से किन सकारात्मक परिणामों की उम्मीद की जा सकती है? उदाहरण दें।
टेक सेक्टर की "तेजी से बढ़ो, तोड़-फोड़ करो" प्रवृत्ति गैर-अंग्रेज़ी भाषाओं के लिए क्यों ख़तरनाक हो सकती है? अपने विचार स्पष्ट करें।

पढ़ें

AI मॉडल और गैर-अंग्रेज़ी भाषाएँ CEFR B2

कठिन शब्द

चर्चा के प्रश्न

संबंधित लेख

CanvasDx से ग्रामीण इलाकों में ऑटिज्म निदान में तेजी

40,000 साल पुराने मैमथ से सबसे पुराना RNA मिला

मनुष्यों की उपस्थिति बदलती है जंगली जानवरों का व्यवहार

कृत्रिम पैरों के साथ चलने से शरीर की धारणा बदलती है

CODA: AI से मृत्यु-कारण डेटा सुधार

AI मॉडल और गैर-अंग्रेज़ी भाषाएँ^{CEFR B2}