IA de moderação não entende muitas línguas africanasCEFR B2
20/04/2026
Adaptado de Guest Contributor, Global Voices • CC BY 3.0
Foto de Zulfugar Karimov, Unsplash
Os sistemas de IA responsáveis pela moderação de conteúdo nas redes sociais frequentemente não compreendem a maioria das línguas africanas. Um estudo de 2025 mostrou que apenas 42 línguas aparecem de forma significativa nos principais modelos de linguagem e que só quatro — amárico, suaíli, afrikaans e malgaxe — são tratadas com alguma consistência. Como resultado, mais de 98 por cento das línguas africanas ficam em grande parte invisíveis para essas ferramentas.
Essa lacuna tem efeitos práticos: a dependência de dados em inglês provoca tanto falsos positivos — conteúdos removidos sem explicação clara — quanto falsos negativos, quando publicações nocivas em línguas menos representadas não são detetadas. Casos concretos ilustram o problema: entre janeiro e março de 2025 o TikTok removeu mais de 450.000 vídeos do Quénia e baniu mais de 43.000 contas; no segundo trimestre as remoções subiram para 592.000. Em outro exemplo, alegações falsas sobre tropas a tomar o porto eritreu no Mar Vermelho difundiram-se no Facebook antes de serem desmentidas por verificadores de factos.
Investigadores e organizações procuram colmatar a falha: grupos como AfricaNLP, equipas académicas em Pretória, Nairobi e Addis Ababa e o workshop AfricaNLP de 2025 trabalharam tarefas em Hausa, Igbo e suaíli. Projetos como a parceria entre Cohere e HausaNLP contribuíram com dados para o modelo Aya. A União Africana aprovou uma Estratégia Continental de IA em julho de 2024 e seguiram-se estratégias nacionais, incluindo a da Nigéria em abril de 2025. A regulação também avança: o AI Act da UE entrou em vigor em agosto de 2024 e a Digital Services Act em fevereiro de 2024, impondo deveres de não discriminação e transparência, mas construir dados de treino representativos e cobertura operacional continua a ser um desafio prático.
Palavras difíceis
- moderação — controle e revisão de conteúdo em plataformas digitais
- lacuna — falta ou ausência importante em determinado contexto
- detetar — encontrar ou perceber algo por análisedetetadas
- representativo — que reflete bem a variedade real de algorepresentativos
- remover — tirar ou excluir algo de um lugar ou sistemaremoveu
- falso positivo — conteúdo removido mas que não era proibidofalsos positivos
- falso negativo — conteúdo proibido que o sistema não detectoufalsos negativos
- discriminação — tratar pessoas de forma desigual ou injusta
Dica: passe o mouse, foque ou toque nas palavras destacadas no artigo para ver definições rápidas enquanto lê ou ouve.
Perguntas para discussão
- Que efeitos práticos a invisibilidade das línguas africanas em modelos de IA pode ter nas comunidades locais? Explique com exemplos do texto.
- Que medidas, mencionadas no texto, parecem úteis para melhorar a cobertura linguística? Que outras ações práticas ainda seriam necessárias, na sua opinião?
Artigos relacionados
Grandes empresas e tecnologia dificultam agricultores familiares
Um relatório do IPES-Food, publicado na quarta-feira (25 February), alerta que alianças entre grandes empresas agrícolas e de tecnologia tornam ferramentas digitais caras e inacessíveis para agricultores familiares e concentram o controlo dos dados.
Práticas concierge e atenção primária direta crescem nos EUA
Um estudo mostra crescimento rápido de práticas de concierge e de atenção primária direta nos Estados Unidos entre 2018 e 2023. Os autores avisam que esse aumento pode afetar o acesso a cuidados rotineiros e a escolha dos médicos.
Corte de internet e novo modelo de censura no Irã
Grandes protestos no Irã, entre dezembro de 2025 e janeiro de 2026, causaram um longo corte de internet. As autoridades impuseram um corte total em 8 de janeiro; acesso limitado voltou em 23 de janeiro, mas restrições seguiam em 23 de fevereiro.
Jogos cognitivos melhoram o cérebro após lesão
Pesquisa mostra que adultos com lesão cerebral traumática podem melhorar a estrutura do cérebro e funções cognitivas ao completar jogos cognitivos computadorizados. Houve alterações na neuroplasticidade e ganhos em velocidade de processamento, atenção e memória.