LingVo.club
📖+40 XP
🎧+25 XP
+45 XP
IA de moderação não entende muitas línguas africanas — Nível B2 — Tiktok logo on a dark keyboard background

IA de moderação não entende muitas línguas africanasCEFR B2

20/04/2026

Adaptado de Guest Contributor, Global Voices CC BY 3.0

Foto de Zulfugar Karimov, Unsplash

Nível B2 – Intermediário-avançado
5 min
283 palavras

Os sistemas de IA responsáveis pela moderação de conteúdo nas redes sociais frequentemente não compreendem a maioria das línguas africanas. Um estudo de 2025 mostrou que apenas 42 línguas aparecem de forma significativa nos principais modelos de linguagem e que só quatro — amárico, suaíli, afrikaans e malgaxe — são tratadas com alguma consistência. Como resultado, mais de 98 por cento das línguas africanas ficam em grande parte invisíveis para essas ferramentas.

Essa lacuna tem efeitos práticos: a dependência de dados em inglês provoca tanto falsos positivos — conteúdos removidos sem explicação clara — quanto falsos negativos, quando publicações nocivas em línguas menos representadas não são detetadas. Casos concretos ilustram o problema: entre janeiro e março de 2025 o TikTok removeu mais de 450.000 vídeos do Quénia e baniu mais de 43.000 contas; no segundo trimestre as remoções subiram para 592.000. Em outro exemplo, alegações falsas sobre tropas a tomar o porto eritreu no Mar Vermelho difundiram-se no Facebook antes de serem desmentidas por verificadores de factos.

Investigadores e organizações procuram colmatar a falha: grupos como AfricaNLP, equipas académicas em Pretória, Nairobi e Addis Ababa e o workshop AfricaNLP de 2025 trabalharam tarefas em Hausa, Igbo e suaíli. Projetos como a parceria entre Cohere e HausaNLP contribuíram com dados para o modelo Aya. A União Africana aprovou uma Estratégia Continental de IA em julho de 2024 e seguiram-se estratégias nacionais, incluindo a da Nigéria em abril de 2025. A regulação também avança: o AI Act da UE entrou em vigor em agosto de 2024 e a Digital Services Act em fevereiro de 2024, impondo deveres de não discriminação e transparência, mas construir dados de treino representativos e cobertura operacional continua a ser um desafio prático.

Palavras difíceis

  • moderaçãocontrole e revisão de conteúdo em plataformas digitais
  • lacunafalta ou ausência importante em determinado contexto
  • detetarencontrar ou perceber algo por análise
    detetadas
  • representativoque reflete bem a variedade real de algo
    representativos
  • removertirar ou excluir algo de um lugar ou sistema
    removeu
  • falso positivoconteúdo removido mas que não era proibido
    falsos positivos
  • falso negativoconteúdo proibido que o sistema não detectou
    falsos negativos
  • discriminaçãotratar pessoas de forma desigual ou injusta

Dica: passe o mouse, foque ou toque nas palavras destacadas no artigo para ver definições rápidas enquanto lê ou ouve.

Perguntas para discussão

  • Que efeitos práticos a invisibilidade das línguas africanas em modelos de IA pode ter nas comunidades locais? Explique com exemplos do texto.
  • Que medidas, mencionadas no texto, parecem úteis para melhorar a cobertura linguística? Que outras ações práticas ainda seriam necessárias, na sua opinião?

Artigos relacionados