OpenSpeaks Archives: mondelinge talen documenterenCEFR B2
17 apr 2026
Gebaseerd op Subhashish Panigrahi, Global Voices • CC BY 3.0
Foto door Joshi Milestoner, Unsplash
Veel talen bestaan vooral in gesproken vorm, waardoor mondelinge kennis lastig te citeren is in geschreven bronnen. OpenSpeaks Archives, gestart in 2024, ondersteunt Wikimedians en gemeenschapsarchivarissen met tools om talen te documenteren, te transcriberen en duurzaam te archiveren. De archieven bevatten inmiddels bijna twintig talen uit India, Nepal en Sri Lanka.
In een interview uit de collaborator series sprak Subhashish Panigrahi voor Rising Voices via een spraakoproep met Taukeer Alam, een Indiase natuurbeschermer en spreker van Van Gujjari. Van Gujjari is een kwetsbare inheemse taal van de Van Gujjar, een nomadische moslimgemeenschap die vooral in Uttarakhand woont. Het video-interview werd gemaakt voor de documentaire "MarginalizedAadhaar" en is beschikbaar onder de Creative Commons-licentie BY-SA 4.0.
Alam benadrukt dat audio en video beter dan schrift vastleggen hoe woorden klinken: stem, intonatie, mimiek en lichaamstaal zijn belangrijk en dezelfde spelling kan in verschillende talen heel andere ritmes en gevoelswaarden hebben. Hij beschrijft generatieverschillen: ouderen zijn vaak niet geletterd en geven de voorkeur aan opnames, terwijl kinderen meer geletterd raken en geschreven materiaal nuttig kan zijn voor onderwijs als het voortkomt uit gemeenschappelijke verhalen en context. Alam waarschuwt dat veel oorspronkelijke betekenissen al verloren raakten, bijvoorbeeld bij volksliederen waarvan kennisdragers overleden.
Hij pleit voor snel, gemeenschapsgericht werk en het snel teruggeven van materiaal in de formaten die mensen gebruiken, zoals videoplatforms of gedrukte publicaties. Hij adviseert participatieve methoden, training van jongeren, materialen die toegankelijk zijn voor de gemeenschap en het gebruik van opnameapparatuur van goede kwaliteit bij het opnemen van ouderen. Alam uit ook zorg over misbruik van gemeenschapskennis via AI en vraagt bescherming die gemeenschapsrechten erkent, toestemming vereist en de gemeenschap controle geeft over het gebruik van materiaal. Het interview leidde in 2024 tot het taaldocumentatieproject "Maari Jaban Maari Birsa" bij OpenSpeaks Archives.
Moeilijke woorden
- transcriberen — gesproken tekst in schrift overzetten
- archiveren — materiaal bewaren zodat het later terugvindbaar is
- kwetsbaar — makkelijk schade of verlies te lijdenkwetsbare
- inheems — oorspronkelijk in een bepaald gebied aanweziginheemse
- nomadisch — zonder vaste woonplaats, rondtrekkend levenswijzenomadische
- geletterd — kunnen lezen en schrijven, vaak door onderwijs
- kennisdrager — iemand die traditionele informatie of verhalen bewaartkennisdragers
- toestemming — schriftelijke of mondelinge goedkeuring voor gebruik
Tip: beweeg de muisaanwijzer over gemarkeerde woorden in het artikel, of tik erop om snelle definities te zien terwijl je leest of luistert.
Discussievragen
- Welke voordelen en risico's ziet u bij het snel teruggeven van opnames aan gemeenschappen?
- Hoe kunnen participatieve methoden jongeren betrekken bij taaldocumentatie en onderwijs?
- Welke maatregelen zou een gemeenschap kunnen vragen om misbruik van haar kennis door AI te voorkomen?
Gerelateerde artikelen
Zorgen over cyberrisico's na Amerikaanse aanvallen op Iran
Amerikaanse aanvallen op Iran roepen vragen op over mogelijke vergeldende cyberaanvallen op infrastructuur. Een hoogleraar van Syracuse University beoordeelt de realistische dreiging en noemt watersystemen, elektriciteitsnetten en kwantumcomputing als aandachtspunten.
VN: bijna één miljard heeft geen toegang tot hulpmiddelen
Een VN-rapport, gepresenteerd op 16 May door WHO en UNICEF, zegt dat veel mensen geen hulpmiddelen zoals brillen of protheses kunnen krijgen. De behoefte groeit door vergrijzing en ziekten; het rapport roept op tot betere toegang.
AI-audiooverzichten maken onderzoek toegankelijk, maar bevatten fouten
Onderzoekers testten Google’s NotebookLM op drie artikelen over vulkanisme op Mars. De audio’s waren begrijpelijk en boeiend, maar bevatten herhaalde onnauwkeurigheden; de onderzoekers adviseren altijd het originele onderzoek te lezen.