В Бангладеш создали цифровой архив коренных языковCEFR B2
24 авг. 2025 г.
Адаптировано по материалам Nurunnaby Chowdhury, Global Voices • CC BY 3.0
Фото: litoon dev, Unsplash
В нескольких регионах Бангладеш многие коренные языки находятся под угрозой исчезновения. Чтобы помочь сохранить эти языки, подразделение информационно-коммуникационных технологий (ICTD) при Министерстве почты, телекоммуникаций и информационных технологий запустило проект оцифровки этнических языков в рамках EBLICT; реализацию ведёт Bangladesh Computer Council. В июле 2025 года инициатива опубликовала сайт Multilingual Cloud на портале bangla.gov.bd — репозиторий коренных языков с материалами для 42 языков.
Консультант проекта Мамун Ор Рашид сообщил, что платформа собрала 7,177 тем, 97,782 предложения, транскрибированные в IPA, и 12,646 минут аудиозаписей, сделанных 214 носителями языка. На портале есть коллекции слов, фраз и транскрипции для документирования произношения и употребления в разных сообществах. Для каждого языка доступна карта территорий, счётчик записанных предложений и отдельный словарный раздел.
Один из представленных языков — Khasi, распространённый в регионе Силхет; для него собрано более 300 минут аудио по 151 теме, включая рассказы, песни и воспоминания. Исторически Khasi записывался латинским алфавитом с начала 1800-х годов, а первая книга на Khasi была опубликована Уильямом Кери в 1814 году.
Глобальные данные и местные обследования подчёркивают срочность: UNESCO указывает, что язык исчезает каждые 14 дней, а из более чем 7,000 языков мира около 2,500 находятся под угрозой. Исследование 2025 года Ritesh Karmakar показало, что языки исчезают, когда их нет в школах и общественной жизни. Проект ставит цель создать шрифты, клавиатуры, грамматические инструменты и словари и разместить языковые данные в интернете. Samar Soren охарактеризовал Multiling.cloud как важный цифровой архив, который поможет учёным и обычным людям освоить базовый разговор на коренных языках.
Сложные слова
- оцифровка — перевод материалов в цифровой форматоцифровки
- репозиторий — онлайн-хранилище языковых данных или ресурсов
- транскрипция — запись звучания речи с помощью специальных знаковтранскрипции
- коренной — относящийся к первоначальным жителям регионакоренные, коренных
- носитель — человек, для которого язык является роднымносителями
- срочность — необходимость действовать быстро или немедленно
Подсказка: наведите, сфокусируйтесь или нажмите на выделенные слова, чтобы увидеть краткие определения прямо во время чтения или прослушивания.
Вопросы для обсуждения
- Как цифровой репозиторий может помочь сохранить коренные языки в регионах, подобных Бангладеш?
- Какие практические сложности могут возникнуть при создании шрифтов и клавиатур для редких языков?
- Нужно ли включать коренные языки в школьную программу? Приведите аргументы, опираясь на текст.
Похожие статьи
Носимые устройства с ИИ при диабете 2 типа
Метаобзор учёных Университета Буффало в NPJ Digital Medicine оценивает носимые устройства с искусственным интеллектом для людей с диабетом 2 типа и преддиабетом. Описаны потенциал в прогнозировании глюкозы и серьёзные проблемы с данными и объяснимостью моделей.
Как клетки и молекулы формируют мозговые сети
Учёные объединили данные сканов, генетики и молекулярной визуализации, чтобы связать микроскопические признаки мозга с крупномасштабными сетями, наблюдаемыми при fMRI. Работа опубликована в Nature Communications и связана с депрессией, шизофренией и болезнью Альцгеймера.