ИИ-модерация и невидимые языки АфрикиCEFR B1
20 апр. 2026 г.
Адаптировано по материалам Guest Contributor, Global Voices • CC BY 3.0
Фото: Zulfugar Karimov, Unsplash
Системы искусственного интеллекта, которые удаляют вредный контент в социальных сетях, плохо понимают большинство языков Африки. Исследование 2025 года показало: в крупных языковых моделях значимо представлены только 42 африканских языка, и лишь четыре из них обрабатываются с относительной последовательностью — амхарский, суахили, африкаанс и малагасийский.
Это приводит к ложным удалениям и упущениям: платформы удаляют публикации без понятного объяснения, а вредный контент на языках с ограниченными ресурсами остаётся в сети. К примеру, кенийский автор Джексон Бусоло в феврале 2025 года обнаружил свой аккаунт удалённым, но позже его восстановили. С января по март 2025 года TikTok удалил более 450,000 видео из Кении и забанил свыше 43,000 аккаунтов; к II кварталу число удалений выросло до 592,000.
Группы вроде AfricaNLP и академические команды в Претории, Найроби и Аддис‑Абебе создают наборы данных. Компании также сотрудничают с локальными инициативами, но обеспечить качественное покрытие всех языков остаётся задачей.
Сложные слова
- удаление — действие по убиранию чего-либо из сайтаудалениям, удалений
- модель — компьютерная программа для обработки языкамоделях
- ограниченный — с маленьким количеством нужных ресурсовограниченными
- набор данных — собрание текстов или примеров для обучениянаборы данных
- покрытие — объём или степень охвата темы или языка
- восстановить — вернуть доступ или состояние раньшевосстановили
Подсказка: наведите, сфокусируйтесь или нажмите на выделенные слова, чтобы увидеть краткие определения прямо во время чтения или прослушивания.
Вопросы для обсуждения
- Как отсутствие качественной поддержки языков может повлиять на пользователей в Африке?
- Какие преимущества могут дать наборы данных, которые создают местные команды?
- Какие шаги могли бы предпринять платформы, чтобы снизить число ложных удалений?
Похожие статьи
Переход на электромобили может снизить расходы домохозяйств
Исследование, опубликованное в Energy Policy, показывает, что быстрый переход с автомобилей с двигателями внутреннего сгорания на электромобили в 2022–2035 годах может снизить счета за энергию и уменьшить зависимость США от импорта нефти.
Пандемия и научная журналистика: глобальный отчёт
SciDev.Net опубликовал Global Science Journalism Report 2021 к 20-летию. Опрос 633 научных журналистов из 77 стран показывает рост нагрузки, смешанные оценки профессии и влияние пандемии на практики, включая использование препринтов.
Искусственный интеллект для выявления причин смерти
Проект CODA, финансируемый Фондом Гейтсов на трёхлетний срок, использует искусственный интеллект для улучшения данных о причинах смерти в странах с низким доходом, где лишь 8% случаев имеют документированную причину. Система сочетает посмертные интервью и клинические данные и даёт рекомендации с уровнем уверенности.