OpenSpeaks Archives : protéger les langues oralesCEFR B1
17 avr. 2026
Adapté de Subhashish Panigrahi, Global Voices • CC BY 3.0
Photo de Joshi Milestoner, Unsplash
Les OpenSpeaks Archives, lancées en 2024, fournissent des outils pour documenter des langues principalement orales et aider les contributeurs de Wikimedia à citer ces savoirs. L’archive héberge aujourd’hui près de 20 langues en provenance d’Inde, du Népal et du Sri Lanka, et elle vise à former des archivistes communautaires.
Subhashish Panigrahi, pour Rising Voices, a discuté par appel vocal avec Taukeer Alam, conservateur indien et locuteur de Van Gujjari. Le Van Gujjari est parlé par les Van Gujjar, une communauté musulmane nomade de l’Uttarakhand. L’entretien vidéo figure dans le documentaire « MarginalizedAadhaar » (licence Creative Commons BY‑SA 4.0).
Taukeer souligne que l’audio et la vidéo saisissent la voix, le ton, l’expression et le langage corporel, ce que le texte écrit omet souvent. Il décrit aussi des différences générationnelles : les personnes âgées préfèrent l’audio, tandis que les enfants deviennent plus alphabétisés et peuvent utiliser des supports écrits, à condition qu’ils viennent du contexte communautaire. Il demande une restitution rapide des documents et des protections contre l’usage abusif par l’intelligence artificielle.
De ces travaux est né en 2024 le projet de documentation linguistique « Maari Jaban Maari Birsa » aux OpenSpeaks Archives.
Mots difficiles
- archive — collection qui conserve des documents et enregistrementsArchives
- documenter — enregistrer ou décrire des informations pour garder trace
- contributeur — personne qui apporte du contenu à un projetcontributeurs
- oral — qui se transmet par la parole, pas par écritorales
- archiviste — personne qui organise et garde des archivesarchivistes
- conservateur — personne qui protège et gère des collections
- restitution — retour ou remise des documents à leur origine
- intelligence artificielle — système informatique qui imite des capacités humaines
Astuce : survolez, mettez le focus ou touchez les mots en surbrillance dans l’article pour voir des définitions rapides pendant que vous lisez ou écoutez.
Questions de discussion
- Pourquoi pensez-vous que la restitution rapide des documents est importante pour une communauté ?
- Quelles protections contre l'usage abusif par l'intelligence artificielle proposeriez-vous pour ces archives communautaires ?
Articles liés
Les réseaux sociaux comme alerte sur les déplacements de population
Une étude publiée dans EPJ Data Science montre que l’analyse des publications sur les réseaux sociaux peut donner une alerte précoce sur les mouvements de population pendant les crises et aider les agences humanitaires à mieux réagir.
L'IA et le travail : ce que disent les historiens
Des historiens étudient comment les précédentes inventions ont changé le travail pour éclairer les inquiétudes liées à l'intelligence artificielle. Un message viral et des outils très rapides relancent le débat sur l'emploi, la réglementation et la société.
Le cerveau anticipe des groupes de mots
Une étude publiée dans Nature Neuroscience montre que le cerveau prédit les mots en tenant compte de groupes grammaticaux, pas seulement du mot suivant. Les chercheurs ont utilisé la magnétoencéphalographie et des tests linguistiques pour arriver à cette conclusion.
COP30 à Belém : la société civile et les peuples territoriaux en première ligne
La COP30 à Belém (2025) a vu une forte mobilisation de la société civile et des peuples indigènes. Ils ont investi le Sommet des Peuples, organisé des actions de rue et obtenu la reconnaissance des droits territoriaux dans le texte final.
Une coque qui se referme comme un tatou
Des chercheurs de North Carolina State University ont créé un module protecteur qui se recroqueville en boule pour abriter des appareils fragiles et des robots souples. Le dispositif, appelé MIPM, se déclenche automatiquement quand il détecte un contact.