Bangladesh ra mắt Multilingual Cloud để bảo tồn ngôn ngữCEFR B2
24 thg 8, 2025
Phỏng theo Nurunnaby Chowdhury, Global Voices • CC BY 3.0
Ảnh: litoon dev, Unsplash
Bối cảnh toàn cầu và khảo sát tại địa phương cho thấy tính cấp bách trong việc bảo tồn ngôn ngữ bản địa ở Bangladesh. ICTD khởi xướng dự án EBLICT, do Bangladesh Computer Council triển khai, và tháng 7 năm 2025 công bố trang Multilingual Cloud trên bangla.gov.bd. Nền tảng này lưu trữ dữ liệu cho 42 ngôn ngữ bản địa, gồm bộ sưu tập từ vựng, cụm từ, phiên âm theo Bảng chữ cái ngữ âm quốc tế (IPA) và nhiều bản ghi âm.
Ông Mamun Or Rashid, tư vấn cho dự án và giảng viên tại Jahangirnagar University, cho biết nền tảng đã thu thập cả văn bản và dạng truyền miệng: 7.177 chủ đề, 97.782 câu đã được phiên âm theo IPA và 12.646 phút âm thanh từ 214 người bản xứ. Một ví dụ chi tiết là tiếng Khasi ở vùng Sylhet; cổng thông tin lưu hơn 300 phút âm thanh Khasi trên 151 chủ đề, gồm truyện, bài hát và kỷ niệm đời sống làng xã. Khasi không có chữ viết riêng và từ đầu những năm 1800 người ta đã dùng chữ Latinh; sách Khasi đầu tiên do William Carey xuất bản năm 1814.
UNESCO cảnh báo một ngôn ngữ biến mất trung bình sau mỗi 14 ngày và trong hơn 7.000 ngôn ngữ thế giới có khoảng 2.500 ngôn ngữ có nguy cơ. Một khảo sát của International Mother Language Institute tại Dhaka liệt kê 14 ngôn ngữ Bangladesh có nguy cơ, trong đó có Konda, Kharia và Koda. Nghiên cứu năm 2025 của Ritesh Karmakar cũng chỉ ra rằng ngôn ngữ bản địa mai một khi không xuất hiện trong trường học và đời sống công cộng; hơn 50 nhóm dân tộc thiểu số gặp khó khăn và phần lớn thành viên phải học tiếng Bengali làm ngôn ngữ thứ hai.
Dự án hướng tới việc tạo font, bàn phím, công cụ ngữ pháp và từ điển, đồng thời đưa dữ liệu lên mạng. Trang web còn hiển thị bản đồ vùng ngôn ngữ, số câu đã ghi và mục từ điển riêng cho từng ngôn ngữ. Samar Soren mô tả Multiling.cloud là một kho số quan trọng, có thể hỗ trợ cả nhà nghiên cứu và người dân học giao tiếp cơ bản bằng ngôn ngữ bản địa.
Từ khó
- bảo tồn — giữ gìn để không bị mất đi
- bản địa — thuộc về cộng đồng địa phương
- phiên âm — chuyển âm thanh thành ký tự viết
- lưu trữ — ghi lại và giữ dữ liệu trên máy
- mai một — dần giảm và có nguy cơ biến mất
- kho số — nơi lưu trữ thông tin dưới dạng số
Mẹo: di chuột, dùng phím Tab hoặc chạm vào các từ được tô sáng trong bài để xem định nghĩa nhanh ngay khi bạn đọc hoặc nghe.
Câu hỏi thảo luận
- Việc lưu trữ âm thanh và văn bản trên Multilingual Cloud có thể giúp gì cho cộng đồng nói ngôn ngữ bản địa? Nêu ví dụ cụ thể.
- Theo bài, vì sao ngôn ngữ bản địa dễ bị mai một? Bạn đề xuất hai biện pháp trong trường học hoặc cộng đồng để chống lại xu hướng đó.
- Dự án đang tạo font, bàn phím, công cụ ngữ pháp và từ điển. Ngoài các công cụ kỹ thuật này, bạn nghĩ cộng đồng cần những hỗ trợ nào khác để giữ gìn ngôn ngữ?
Bài viết liên quan
Siêu âm mới giúp phân biệt nang và khối vú
Các nhà nghiên cứu phát triển phương pháp xử lý tín hiệu siêu âm dựa trên tương quan, giúp phân biệt dịch và khối rắn trong vú. Thử nghiệm ban đầu với bệnh nhân thật cho thấy chẩn đoán chính xác hơn và có thể giảm sinh thiết không cần thiết.
Mô hình NMR mới giúp cải thiện độ nét ảnh MRI
Các nhà nghiên cứu ở Rice University và Oak Ridge National Laboratory phát triển khung lý thuyết chế độ riêng NMR. Phương pháp dùng phương trình Fokker-Planck liên kết chuyển động phân tử với tín hiệu MRI và tái tạo phép đo thực nghiệm.