孟加拉国启动少数民族语言数字化工程CEFR B1
2025年8月24日
改编自 Nurunnaby Chowdhury, Global Voices • CC BY 3.0
照片: litoon dev, Unsplash
等级 B1 – 中级CEFR B1
3 分钟
171 字
一项名为 EBLICT 的项目在孟加拉国开展少数民族语言的数字化工作。2025年7月,项目在 bangla.gov.bd 下发布了 Multilingual Cloud 网站,收录了42种语言的词汇、短语和用以记录发音差异的国际音标(IPA)转写,同时保存了大量录音。
项目顾问、Jahangirnagar University 教员 Mamun Or Rashid 在国际原住民族日的帖子中写道,平台包含7,177个主题、97,782句经IPA转写的句子,以及来自214名母语者的12,646分钟录音。网站还展示语言分布地图、已记录句子数量和每种语言的词典部分。
例如 Khasi 语言在 Sylhet 地区使用,网站保存了超过300分钟的 Khasi 录音,涵盖151个主题,包括故事、歌曲和乡村生活记忆。研究指出,原住民语言在学校和公共生活缺席时会逐渐消退,因此项目还计划制作字体、键盘和语法工具,公开语言数据供研究和学习使用。
难词
- 数字化 — 把语言资料以电子形式保存
- 国际音标 — 表示语音的标准符号系统国际音标(IPA)
- 录音 — 把声音保存成音频文件
- 母语者 — 从小使用某种语言的人
- 收录 — 把资料加入数据库或集合收录了
- 消退 — 逐渐减少或不再使用
提示:在文章中将鼠标悬停、聚焦或轻触高亮词语,即可在阅读或听音频时快速查看简要释义。
讨论问题
- 你觉得把少数民族语言数字化有哪些好处?请说两点。
- 如果你要学习一种少数民族语言,你会如何使用网站上的录音和词典?
- 除了制作字体和键盘,你认为还可以用什么方法帮助保护原住民语言?