孟加拉国启动少数民族语言数字化工程CEFR B2
2025年8月24日
改编自 Nurunnaby Chowdhury, Global Voices • CC BY 3.0
照片: litoon dev, Unsplash
等级 B2 – 中高级CEFR B2
5 分钟
257 字
孟加拉国信息与通信技术司(ICTD)在“通过研发提升 ICT 中孟加拉语”(EBLICT)项目框架内,启动了一项少数民族语言数字化工程,由 Bangladesh Computer Council 负责实施。2025年7月,该计划在 bangla.gov.bd 门户下发布了名为 Multilingual Cloud 的网站,作为原住民语言的数字仓库。
平台已收集并整理了大量语言材料,主要数据包括:
- 收录语言数量:42 种;
- 主题条目:7,177 个;
- 经 IPA 转写的句子:97,782 句;
- 录音来源:214 名母语者,合计 12,646 分钟。
网站对个别语言也有详尽保存。以 Khasi 为例,该语言在 Sylhet 使用,长期用罗马字母书写,第一本 Khasi 书由 William Carey 于1814年出版。门户保存了超过300分钟的 Khasi 录音,包含151个主题,如故事、歌曲和乡村生活记忆。
联合国教科文组织报告显示,每14天就有一种语言消亡;全球7,000多种语言中约2,500种处于濒危状态。位于达卡的 International Mother Language Institute 将14种孟加拉国语言列为高风险,其中包括 Konda、Kharia、Koda。2025年 Ritesh Karmakar 的研究也发现,语言在学校和公共生活缺席时容易衰退。为应对这一局面,项目旨在创建字体、键盘、语法工具和词典,并将语言数据在线公开,Samar Soren 将 Multiling.cloud 描述为重要的数字档案,有助于研究者和公众学习原住民族语言的基础会话。
难词
- 数字化 — 把信息转为电子形式数字化工程
- 门户 — 提供信息和服务的网站
- 转写 — 把语音按符号写出来转写的句子
- 母语者 — 以某语言为第一语言的人
- 濒危 — 快要消失或灭绝的状态濒危状态
- 档案 — 保存重要记录或资料的集合数字档案
提示:在文章中将鼠标悬停、聚焦或轻触高亮词语,即可在阅读或听音频时快速查看简要释义。
讨论问题
- 把语言数据在线公开(如录音、转写和词典)能如何帮助保护濒危语言?有哪些可能的限制或风险?
- 项目要创建字体、键盘和语法工具。你认为这些工具会如何影响学校或社区中少数民族语言的使用?请举例说明。