La IA y las lenguas africanas en las redesCEFR B2
20 abr 2026
Adaptado de Guest Contributor, Global Voices • CC BY 3.0
Foto de Zulfugar Karimov, Unsplash
Los sistemas automatizados de moderación basados en inteligencia artificial suelen tener una cobertura limitada de las lenguas africanas, y esa limitación influye en la visibilidad del contenido para millones de usuarios. Moderadores y investigadores señalan una brecha entre las lenguas que se hablan y las que pueden procesar los modelos: Bereket Tsegay, que trabajó en el centro de TikTok en Kenia, relató que frecuentemente encontraba vídeos en Luo, Dholuo, Kikuyu y Dinka que no entendía.
Un estudio de 2025 mostró que solo 42 lenguas africanas aparecen de forma significativa en los grandes modelos de lenguaje y que apenas cuatro —amárico, suajili, afrikaans y malgache— reciben tratamiento relativamente consistente. La dependencia de datos en inglés provoca tanto falsos positivos (contenidos legítimos retirados sin explicación clara) como falsos negativos (publicaciones dañinas en lenguas con pocos recursos que permanecen en línea).
Hay ejemplos concretos: un creador keniano vio su cuenta eliminada en febrero de 2025 y luego restablecida; entre enero y marzo de 2025 TikTok eliminó más de 450,000 vídeos de Kenia y prohibió más de 43,000 cuentas, y para el segundo trimestre las eliminaciones habían subido a 592,000. En Etiopía circularon en Facebook afirmaciones falsas sobre tropas que tomaban un puerto eritreo antes de ser desmentidas.
Para reducir la brecha, grupos como AfricaNLP y equipos académicos en Pretoria, Nairobi y Adís Abeba construyen conjuntos de datos; el taller AfricaNLP de 2025 abordó tareas en hausa, igbo y suajili. Cohere se asoció con HausaNLP para añadir datos a su modelo Aya. La Unión Africana aprobó una Estrategia Continental de IA en julio de 2024 y varios países, incluida Nigeria, presentaron estrategias nacionales en 2025. La entrada en vigor de la EU AI Act en agosto de 2024 y de la Digital Services Act en febrero de 2024 introduce obligaciones de no discriminación y transparencia, pero construir datos representativos y cobertura operativa sigue siendo un desafío práctico.
Palabras difíciles
- moderación — Control y revisión de contenido en plataformas.
- cobertura — Grado en que algo está incluido o atendido.
- brecha — Diferencia o separación entre dos situaciones.
- falso positivo — Contenido marcado como peligroso pero legítimo.falsos positivos
- falso negativo — Contenido dañino que no fue detectado.falsos negativos
- conjunto de datos — Colección organizada de ejemplos para entrenar modelos.conjuntos de datos
- transparencia — Claridad sobre cómo funcionan decisiones y procesos.
Consejo: pasa el cursor, enfoca o toca las palabras resaltadas en el artículo para ver definiciones rápidas mientras lees o audicións.
Preguntas de discusión
- ¿Qué desafíos prácticos pueden surgir al intentar crear datos representativos para lenguas africanas?
- ¿Cómo pueden afectar las eliminaciones masivas de vídeos a la confianza de los usuarios en una plataforma?
- ¿En qué medida crees que leyes como la EU AI Act pueden mejorar la moderación en lenguas con pocos recursos?
Artículos relacionados
Crisis eléctrica y desperdicio de renovables en República Dominicana
La República Dominicana aumentó las renovables al 25% de su matriz, pero problemas en la red causan desperdicio y más uso de combustibles fósiles. Un apagón en Punta Catalina y un pico de demanda desencadenaron medidas de emergencia.
Detección de Anopheles stephensi en Madagascar con IA y fotos ciudadanas
Investigadores usaron inteligencia artificial y fotos enviadas por ciudadanos para identificar lo que creen fue la primera detección de Anopheles stephensi en Madagascar. La imagen fue tomada en 2020 y revisada años después.
Nuevas herramientas digitales dan más control a los agricultores
En el foro virtual ICTforAg (9-10 de marzo) expertos explicaron que tecnologías como Web3 y herramientas como FarmStack pueden dar a los agricultores más control sobre sus datos y mejorar servicios en países en desarrollo.