OpenSpeaks Archives : protéger les langues oralesCEFR B1
17 avr. 2026
Adapté de Subhashish Panigrahi, Global Voices • CC BY 3.0
Photo de Joshi Milestoner, Unsplash
Les OpenSpeaks Archives, lancées en 2024, fournissent des outils pour documenter des langues principalement orales et aider les contributeurs de Wikimedia à citer ces savoirs. L’archive héberge aujourd’hui près de 20 langues en provenance d’Inde, du Népal et du Sri Lanka, et elle vise à former des archivistes communautaires.
Subhashish Panigrahi, pour Rising Voices, a discuté par appel vocal avec Taukeer Alam, conservateur indien et locuteur de Van Gujjari. Le Van Gujjari est parlé par les Van Gujjar, une communauté musulmane nomade de l’Uttarakhand. L’entretien vidéo figure dans le documentaire « MarginalizedAadhaar » (licence Creative Commons BY‑SA 4.0).
Taukeer souligne que l’audio et la vidéo saisissent la voix, le ton, l’expression et le langage corporel, ce que le texte écrit omet souvent. Il décrit aussi des différences générationnelles : les personnes âgées préfèrent l’audio, tandis que les enfants deviennent plus alphabétisés et peuvent utiliser des supports écrits, à condition qu’ils viennent du contexte communautaire. Il demande une restitution rapide des documents et des protections contre l’usage abusif par l’intelligence artificielle.
De ces travaux est né en 2024 le projet de documentation linguistique « Maari Jaban Maari Birsa » aux OpenSpeaks Archives.
Mots difficiles
- archive — collection qui conserve des documents et enregistrementsArchives
- documenter — enregistrer ou décrire des informations pour garder trace
- contributeur — personne qui apporte du contenu à un projetcontributeurs
- oral — qui se transmet par la parole, pas par écritorales
- archiviste — personne qui organise et garde des archivesarchivistes
- conservateur — personne qui protège et gère des collections
- restitution — retour ou remise des documents à leur origine
- intelligence artificielle — système informatique qui imite des capacités humaines
Astuce : survolez, mettez le focus ou touchez les mots en surbrillance dans l’article pour voir des définitions rapides pendant que vous lisez ou écoutez.
Questions de discussion
- Pourquoi pensez-vous que la restitution rapide des documents est importante pour une communauté ?
- Quelles protections contre l'usage abusif par l'intelligence artificielle proposeriez-vous pour ces archives communautaires ?
Articles liés
Des médias demandent de l’aide contre les fausses informations par l’IA
Lors du Belt and Road Journalists Forum à Ganzhou, des représentants de médias de pays à revenu faible et intermédiaire ont demandé à un groupement de journalistes chinois d’aider à lutter contre les fausses informations créées par l’IA.
Pertes de récoltes en Inde liées au climat et aux ravageurs
La variabilité climatique, les ravageurs et la pollution augmentent les pertes de récoltes en Inde. Cela réduit la qualité des grains, menace la santé et oblige les experts à demander de meilleures mesures et infrastructures.
Peuples autochtones demandent protection des forêts à la COP30
À la COP30 à Belém (Brésil), des peuples autochtones et communautés locales demandent la protection des forêts, la reconnaissance des droits territoriaux et un accès direct aux financements climatiques. Leurs revendications s'appuient sur un rapport cartographique des menaces extractives.
IA et photos citoyennes pour détecter Anopheles stephensi à Madagascar
Des chercheurs disent avoir utilisé l'intelligence artificielle et des photos envoyées par des citoyens pour identifier ce qu'ils pensent être le premier Anopheles stephensi à Madagascar. La photo date de 2020 et la découverte met en lumière des défis de surveillance urbaine.
Textiles intelligents et MXenes pour la santé
Des chercheurs examinent l’usage des MXenes, de nouveaux matériaux appliqués aux tissus pour surveiller la santé, capter l’énergie solaire et réduire les bactéries. La revue note aussi des limites de durabilité et des travaux pour y remédier.