Un site pour sauver les langues du BangladeshCEFR B2
24 août 2025
Adapté de Nurunnaby Chowdhury, Global Voices • CC BY 3.0
Photo de litoon dev, Unsplash
Plusieurs autorités et chercheurs s'inquiètent de la disparition rapide des langues autochtones au Bangladesh. Pour y répondre, la Division des technologies de l'information et de la communication (ICTD) du ministère des Postes, des Télécommunications et de la Technologie de l'Information a lancé un projet de numérisation des langues ethniques dans le cadre d'EBLICT, mis en œuvre par le Bangladesh Computer Council.
En juillet 2025, le projet a publié Multilingual Cloud sur le portail bangla.gov.bd. Ce dépôt rassemble des données pour 42 langues : collections de mots et d'expressions, transcriptions en alphabet phonétique international (API) et enregistrements audio. Selon Mamun Or Rashid, la plateforme comprend 7,177 topics, 97,782 sentences transcribed in IPA et 12,646 minutes d'audio collectées auprès de 214 locuteurs natifs ; il a partagé ces chiffres sur Facebook à l'occasion de la Journée internationale des peuples autochtones.
Le site donne des exemples précis, comme le khasi de la région de Sylhet, sans alphabet propre et écrit en alphabet romain depuis le début des années 1800 (le premier livre en khasi a été publié par William Carey en 1814). Le portail contient plus de 300 minutes d'audio khasi réparties sur 151 topics, avec des histoires, des chansons et des souvenirs de la vie villageoise.
Le projet vise aussi des outils pratiques : polices, claviers, outils de grammaire et dictionnaires, et la mise en ligne des données. Le contexte international est préoccupant — l'UNESCO note qu'une langue meurt tous les 14 jours et, parmi plus de 7,000 languages dans le monde, environ 2,500 are endangered — et des enquêtes locales ont listé 14 langues du Bangladesh en danger. Une étude de 2025 a montré que l'absence de ces langues à l'école et dans la vie publique accélère leur déclin. Multiling.cloud est présenté comme un dépôt numérique important qui peut aider chercheurs et citoyens à apprendre et à documenter les conversations de base en langues autochtones.
Mots difficiles
- disparition — fin ou perte progressive d'une langue
- numérisation — conversion d'informations en format numérique
- transcription — écriture des sons en signes écritstranscriptions
- alphabet phonétique international — système de signes pour transcrire les sons
- dépôt — lieu numérique qui conserve des données
- locuteur — personne qui parle une languelocuteurs
Astuce : survolez, mettez le focus ou touchez les mots en surbrillance dans l’article pour voir des définitions rapides pendant que vous lisez ou écoutez.
Questions de discussion
- Les ressources en ligne (audios, transcriptions) peuvent-elles suffire à préserver une langue? Donnez des raisons.
- L'étude de 2025 dit que l'absence des langues autochtones à l'école accélère leur déclin. Quelles mesures concrètes proposeriez-vous pour les intégrer à l'école?
- Quels bénéfices pratiques peuvent apporter les polices et claviers développés par le projet aux locuteurs natifs?
Articles liés
Exercices informatiques aident le cerveau après un traumatisme crânien
Une étude montre que des personnes avec traumatisme crânien ont amélioré la structure de leur cerveau et leurs capacités mentales en faisant des jeux cognitifs sur ordinateur. Les gains concernent la vitesse de traitement, l’attention et la mémoire.
L'IA favorise l'anglais, selon une étude
Une étude de 2025 du Stanford HAI montre que de nombreux grands modèles de langage donnent de mauvais résultats dans des langues autres que l'anglais. Cela exclut des communautés et des experts proposent de valider les données et de travailler avec les locaux.
La poussière lunaire comme ressource
Des chercheurs montrent que la poussière lunaire pourrait renforcer des matériaux composites. Des tests en laboratoire avec un simulant de régolithe indiquent des gains de performance et ouvrent des pistes pour construire habitats et infrastructures sur la Lune.
L'IA transforme le travail des tribunaux en Inde
Les tribunaux indiens modernisent leur travail avec des outils d'IA pour la transcription, la recherche et la traduction. Le projet e-Courts phase III et des plateformes comme SUPACE et Adalat.AI font partie de cette transformation, avec des risques et des règles.