एक 2025 के पेपर में Stanford Institute for Human-Centered Artificial Intelligence (HAI) ने चेतावनी दी कि कई लोकप्रिय बड़े भाषा मॉडल (LLMs) अंग्रेज़ी के अलावा अन्य भाषाओं में खराब प्रदर्शन करते हैं। सार्वजनिक मॉडलों में कुछ ऐसे भी हैं जिनका विकास आंशिक रूप से बड़ी कंपनियों ने किया है, और इसने वैश्विक भाषाई असमानता को उजागर किया है।
विशेष रूप से Silicon Valley जैसे संपन्न क्षेत्रों में AI कंपनियों और डेटा की सघनता ने यह खाई और चौड़ी कर दी है। रिपोर्टों के अनुसार कुर्दिश और स्वाहिली जैसी भाषाएँ करोड़ों बोलने वालों के लिए व्यवहारिक रूप से पिछाड़ी रखी जा रही हैं। Wired ने उदाहरण के तौर पर बताया कि ChatGPT जैसे मॉडल तमिल में ईमेल लिखने पर अंग्रेज़ी में उलझा मसौदा दे सकते हैं।
बहुभाषी डेटा बढ़ाने के प्रयासों का भी उल्टा असर सामने आया है। MIT Technology Review ने पाया कि वेब से खींचे गए कम-संसाधन भाषाओं के पाठों में मशीन-अनुवाद की गलतियाँ होती हैं, और अच्छे इरादे से योगदान करने वाले अक्सर सटीकता जाँचने में सक्षम नहीं होते। The Atlantic ने चेतावनी दी कि AI आउटपुट अक्सर संसाधन-समृद्ध देशों के अंग्रेज़ी भाषियों के नियमों और मानों को प्रतिबिंबित करता है, और टेक सेक्टर की "तेजी से बढ़ो, तोड़-फोड़ करो" प्रवृत्ति गैर-अंग्रेज़ी समुदायों को नुकसान पहुँचा सकती है।
विशेषज्ञ और टिप्पणीकार कुछ ठोस कदम सुझाते हैं: कंपनियों को किनारे रखे गए समुदायों और जमीनी AI नेताओं के साथ मिलकर मॉडल बनानी चाहिए, स्थानीय इनपुट शामिल करना चाहिए, आउटपुट की सटीकता और प्रामाणिकता की समीक्षा करनी चाहिए और सांस्कृतिक भेदों का सम्मान करते हुए साझेदारी करनी चाहिए।
- स्थानीय समुदायों के साथ काम करें
- बहुभाषी डेटा की सत्यापिता करें
- जमीनी स्तर के डेवलपर्स के साथ साझेदारी करें
कठिन शब्द
- असमानता — लोगों या समूहों के बीच बराबरी की कमी
- सघनता — किसी चीज़ का घना होना या अधिक मात्रा होना
- संसाधन — जरूरी सामग्री, पैसे या तकनीकी सुविधाकम-संसाधन, संसाधन-समृद्ध
- बहुभाषी — एक से अधिक भाषाओं में जुड़ा या संबंधित
- प्रामाणिकता — किसी जानकारी की सच्चाई और भरोसेयोग्यता
- जमीनी — स्थानीय स्तर पर मौजूद या आधारभूत
- प्रवृत्ति — किसी तरह के बार-बार दिखने वाला व्यवहार
- साझेदारी — दो या अधिक पक्षों का मिलकर काम करना
युक्ति: जब आप किसी भी भाषा में कहानी पढ़ें या ऑडियो सुनें, तो लेख में हाइलाइट किए गए शब्दों पर होवर/फ़ोकस/टैप करें और तुरंत छोटी-सी परिभाषा देखें।
चर्चा के प्रश्न
- बहुभाषी डेटा में मशीन-अनुवाद की गलतियाँ कम करने के लिए आप किन कदमों को प्राथमिकता देंगे? कारण बताइए।
- स्थानीय समुदायों और जमीनी डेवलपर्स के साथ साझेदारी करने से किन सकारात्मक परिणामों की उम्मीद की जा सकती है? उदाहरण दें।
- टेक सेक्टर की "तेजी से बढ़ो, तोड़-फोड़ करो" प्रवृत्ति गैर-अंग्रेज़ी भाषाओं के लिए क्यों ख़तरनाक हो सकती है? अपने विचार स्पष्ट करें।
संबंधित लेख
कंप्यूटर खेलों से ट्रॉमैटिक मस्तिष्क चोट में सुधार
शोध में पाया गया कि ट्रॉमैटिक मस्तिष्क चोट वाले लोगों ने कंप्यूटर-आधारित संज्ञानात्मक खेल पूरा करने पर मस्तिष्क की संरचना और सोचने की क्षमता में सुधार दिखाया। अध्ययन ने न्यूरोप्लास्टिसिटी और ध्यान, स्मृति व प्रोसेसिंग स्पीड में बेहतर नतीजे देखे।