Инструменты искусственного интеллекта быстро распространяются, однако доступ к ним остаётся неравномерным: многие люди, которые не говорят по‑английски, получают низкокачественные ответы. В 2025 году исследование Института Стэнфорда по человеку‑ориентированному ИИ (HAI) показало, что популярные большие языковые модели (LLMs) плохо работают на языках, отличных от английского. Авторы отмечали, что публичные LLMs, включая те, которые частично разрабатывались Google и Meta, способны выдавать результаты, не соответствующие потребностям мировой аудитории.
Несправедливость усиливает концентрация AI‑компаний и данных в более обеспеченных регионах, таких как Силиконовая долина. В сообщениях СМИ указывалось, что миллионы говорящих на курдском, суахили и других языках фактически попадают в низкий приоритет. Практические примеры включают репореж Wired: просьба к модели написать письмо на тамильском иногда даёт смазанный черновик на английском. MIT Technology Review отмечал, что многие тексты на языках с ограниченными ресурсами, собранные из интернета, содержат ошибки машинного перевода; добровольцы иногда не умеют проверять точность, и их материалы становятся обучающими данными, которые закрепляют ошибки.
Культурные последствия тоже значимы: The Atlantic предупреждал, что выходы ИИ склонны отражать нормы и ценности англоговорящих в богатых странах, делая неанглоязычные точки зрения невидимыми. Наблюдатели указывают, что подход «двигаться быстро, ломать вещи» в секторе технологий в эпоху ИИ остаётся в пользу англоязычных сообществ.
Эксперты предлагают конкретные шаги для снижения вреда: сотрудничать с удалёнными и местными сообществами, учитывать местные мнения, проверять результаты на точность и аутентичность, а также выстраивать партнёрства, уважающие культурные различия.
- Работать с местными сообществами и лидерами.
- Проверять и очищать многоязычные данные.
- Сотрудничать с низовыми разработчиками и проверяющими.
Сложные слова
- неравномерный — имеющий разную степень или распределениенеравномерным
- низкокачественный — имеющий плохое качество или низкую точностьнизкокачественные
- модель — программная система, создающая ответы на запросымодели
- концентрация — сосредоточение людей, ресурсов или власти
- машинный перевод — автоматический перевод текста с одного языкамашинного перевода
- аутентичность — соответствие оригиналу или реальной информации
- неанглоязычный — не относящийся к носителям английского языканеанглоязычные
Подсказка: наведите, сфокусируйтесь или нажмите на выделенные слова, чтобы увидеть краткие определения прямо во время чтения или прослушивания.
Вопросы для обсуждения
- Какие преимущества и риски вы видите в сотрудничестве AI‑компаний с местными сообществами?
- Какие конкретные действия можно предпринять в вашей стране, чтобы улучшить качество ответов ИИ на языках с ограниченными ресурсами?
- Как вы думаете, как влияет на культурное разнообразие то, что ИИ чаще отражает ценности англоговорящих богатых стран?
Похожие статьи
Архивы устной культуры в Южной Азии
Гражданские архивисты собирают и сохраняют устные традиции региона. Проект «Enhancing Indic oral culture on Wikimedia projects» помогает записывать, транскрибировать и размещать песни, истории, загадки и медицинские знания на Commons, Wikisource и Wikipedia.