OpenSpeaks Archives сохраняет устные языкиCEFR B2
17 апр. 2026 г.
Адаптировано по материалам Subhashish Panigrahi, Global Voices • CC BY 3.0
Фото: Joshi Milestoner, Unsplash
OpenSpeaks Archives, запущенный в 2024 году, помогает фиксировать устные знания коренных народов и позволяет викимедийцам ссылаться на эти источники. Проект разрабатывает инструменты, с помощью которых общинные архивариусы документируют, транскрибируют и архивируют языки; в архиве хранится почти 20 языков из Индии, Непала и Шри‑Ланки.
Субхашиш Паниграхи из Rising Voices по голосовому звонку побеседовал с Туккииром Аламом, индийским защитником природы и носителем Van Gujjari. Видеоинтервью, подготовленное для документального фильма «MarginalizedAadhaar», доступно по лицензии Creative Commons BY‑SA 4.0. Алам подчеркнул, что для Van Gujjari особенно важны аудио и видео: они передают тембр голоса, интонацию, мимику и язык тела, которые не отражаются в печатном тексте. Он заметил, что одна и та же графика в разных языках может нести разные ритмы и эмоции, и читатель по книге не узнает, как слово звучит в общине.
Алам указал на поколенческие различия: старшие часто неграмотны и предпочитают аудио и видео, тогда как грамотность среди детей растёт и письменные материалы становятся полезны для образования, если они опираются на собственные истории и контекст общины. Он призвал к оперативной, ориентированной на общину работе, когда документацию быстро возвращают в тех форматах, которые используют люди.
Среди рекомендаций были партисипативные методы с обучением молодёжи, обеспечение доступности материалов для общины и использование качественной аппаратуры при записи старейшин. Алам также выразил обеспокоенность возможным злоупотреблением общинными знаниями с помощью ИИ и призвал к мерам защиты, признающим права общины, требующим согласия и дающим общине контроль над использованием материалов. Интервью привело к запуску проекта документирования языка «Maari Jaban Maari Birsa» в OpenSpeaks Archives в 2024 году.
Сложные слова
- транскрибировать — переводить устную речь в письменный тексттранскрибируют
- тембр — характерный оттенок звучания человеческого голоса
- интонация — изменение высоты и ритма голоса при речиинтонацию
- носитель — человек, который свободно говорит на языкеносителем
- партисипативный — вовлекающий людей сообщества в совместную работупартисипативные
- злоупотребление — недобросовестное или вредное использование чего‑тозлоупотреблением
- согласие — добровольное разрешение на использование материаловсогласия
Подсказка: наведите, сфокусируйтесь или нажмите на выделенные слова, чтобы увидеть краткие определения прямо во время чтения или прослушивания.
Вопросы для обсуждения
- Какие преимущества и ограничения вы видите в использовании аудио и видео для сохранения языков общины?
- Какие дополнительные меры защиты от возможного злоупотребления общинными материалами с помощью ИИ вы бы предложили?
- Как, по‑вашему, можно сочетать устные и письменные материалы, чтобы они были полезны молодёжи в образовании?
Похожие статьи
Почему языковые модели ошибаются при умножении четырёхзначных чисел
Новое исследование показало, что современные большие языковые модели плохо умножают четырёхзначные числа, потому что не хранят и не используют промежуточные результаты. Метод ICoT и дополнительные цели обучения помогают моделям запоминать шаги и давать правильный ответ.