OpenSpeaks Archives : protéger les langues oralesCEFR B2
17 avr. 2026
Adapté de Subhashish Panigrahi, Global Voices • CC BY 3.0
Photo de Joshi Milestoner, Unsplash
Les OpenSpeaks Archives ont été lancées en 2024 pour aider les contributeurs de Wikimedia à citer et préserver des savoirs principalement oraux. Elles fournissent des outils destinés aux archivistes communautaires pour documenter, transcrire et archiver des langues, et hébergent aujourd’hui près de 20 langues provenant d’Inde, du Népal et du Sri Lanka.
Dans une interview résumée par Rising Voices, Subhashish Panigrahi a échangé par appel vocal avec Taukeer Alam, conservateur indien et locuteur de Van Gujjari. Un entretien vidéo, réalisé pour le documentaire « MarginalizedAadhaar », est disponible sous licence Creative Commons BY‑SA 4.0. Le Van Gujjari est une langue vulnérable parlée par les Van Gujjar, une communauté musulmane nomade de l’Uttarakhand.
Taukeer insiste sur le rôle de l’audio et de la vidéo : ces supports captent la voix, le ton, l’expression et le langage corporel, éléments souvent perdus dans l’écrit. Il note aussi que la même écriture peut rendre des rythmes et des émotions très différents, et que, dans les livres, le lecteur impose souvent sa propre intonation. Il signale des différences générationnelles : les personnes âgées, souvent peu alphabétisées, préfèrent l’enregistrement oral, tandis que l’alphabétisation croissante des enfants rend les supports écrits utiles si ceux‑ci reflètent les récits communautaires.
Pour garder et rendre ces savoirs, Taukeer recommande des méthodes participatives formant les jeunes, la mise à disposition rapide des matériaux auprès de la communauté et l’usage d’un bon équipement pour enregistrer les aînés. Il donne l’exemple de chansons populaires dont le sens a été perdu après la mort de leurs dépositaires. Il exprime aussi son inquiétude face au mauvais usage par l’intelligence artificielle et réclame des protections qui reconnaissent les droits communautaires, exigent le consentement et donnent à la communauté le contrôle de l’usage des matériaux. Ces efforts ont conduit au projet « Maari Jaban Maari Birsa » en 2024.
- Outils pour documenter et transcrire.
- Restitution rapide aux communautés.
- Formation des jeunes archivistes.
- Protections contre l’usage abusif par l’IA.
Mots difficiles
- archiviste — personne qui collecte et conserve des documentsarchivistes
- transcrire — mettre des paroles orales en texte écrit
- vulnérable — exposé au risque de disparaître ou s’affaiblir
- alphabétisation — processus d’apprentissage de la lecture et écriture
- dépositaire — personne qui conserve une tradition ou un savoirdépositaires
- consentement — acceptation claire et volontaire d’un usage
- restitution — retour rapide des matériaux à la communauté
- intelligence artificielle — systèmes informatiques capables d’imiter des fonctions humaines
Astuce : survolez, mettez le focus ou touchez les mots en surbrillance dans l’article pour voir des définitions rapides pendant que vous lisez ou écoutez.
Questions de discussion
- Quels avantages et quelles limites voyez‑vous à utiliser l’audio et la vidéo plutôt que l’écrit pour préserver des savoirs oraux ? Donnez des exemples.
- Comment, selon vous, une communauté peut‑elle garder le contrôle de ses enregistrements tout en les partageant pour la recherche ou l’éducation ?
- Quel rôle les jeunes archivistes peuvent‑ils jouer pour transmettre les récits communautaires et pour quelles compétences devraient‑ils être formés ?
Articles liés
Les LLM jugent différemment selon l'auteur indiqué
Des chercheurs de l'Université de Zurich montrent que les grands modèles de langage changent leur évaluation d'un texte si l'on précise qui l'a écrit. L'étude révèle un biais marqué, notamment anti‑chinois, et demande plus de transparence.
Des adolescents de Hong Kong utilisent des chatbots IA pour un soutien émotionnel
Hong Kong Free Press a publié le 12 octobre 2025 un reportage sur des adolescents qui parlent avec des chatbots IA pour du soutien. Le texte montre aussi les risques, les procès et des projets locaux comme Dustykid.
Soudan : un système de santé en crise et le recours à l'IA
Le système de santé du Soudan est très touché après presque deux ans de guerre. Les autorités évoquent des pénuries, des médecins partis ou tués, et un recours à l'intelligence artificielle, tandis que les inondations aggravent la situation.
Internet en Iran : coupure et contrôle du réseau
Les manifestations de décembre 2025–janvier 2026 ont provoqué une longue coupure d’Internet en Iran. Les autorités ont imposé une interruption complète le 8 janvier, puis un accès limité est revenu le 23 janvier; des restrictions subsistaient au 23 février.