Un estudio de 2025 del Stanford Institute for Human-Centered Artificial Intelligence (HAI) muestra que las herramientas de inteligencia artificial, en particular los modelos de lenguaje a gran escala, rinden de forma desigual fuera del inglés. Varios LLMs públicos, incluidos algunos desarrollados en parte por Google y Meta, generan respuestas que no responden a las necesidades de la mayoría global.
La dominancia del inglés en la web y la concentración de empresas y datos en zonas más acomodadas, como Silicon Valley, han ampliado la brecha. Medios señalaron que millones de hablantes de lenguas como kurdo y suajili quedan en posición secundaria, y usuarios que piden ayuda en otros idiomas a menudo reciben resultados poco útiles o con errores.
Existen problemas prácticos y culturales. Wired describió que pedir a ChatGPT que redacte un correo en tamil puede producir un borrador confuso en inglés. MIT Technology Review encontró que muchos textos raspados contienen traducciones automáticas defectuosas; contribuyentes bienintencionados que no verifican la exactitud hacen que esos errores entren en los datos de entrenamiento. The Atlantic y otros advirtieron que los resultados tienden a reflejar normas y valores de hablantes de inglés en países con más recursos, y que la filosofía de “moverse rápido y romper cosas” sigue dejando a comunidades no anglófonas en desventaja.
Para reducir daños, expertos y comentaristas proponen pasos concretos y colaborativos:
- Trabajar con comunidades locales y líderes de base.
- Validar datos multilingües y revisar salidas por precisión.
- Asociarse con desarrolladores comunitarios y respetar diferencias culturales.
Palabras difíciles
- modelo — sistema o programa que genera texto o prediccionesmodelos
- dominancia — situación de superioridad o control sobre otros
- brecha — diferencia grande que causa desigualdad entre grupos
- raspar — extraer datos de la web de forma automáticaraspados
- validar — comprobar que la información es correcta y fiable
- anglófono — persona o comunidad cuya lengua principal es el inglésanglófonas
- bienintencionado — que tiene buenas intenciones sin malicia realbienintencionados
Consejo: pasa el cursor, enfoca o toca las palabras resaltadas en el artículo para ver definiciones rápidas mientras lees o escuchas.
Preguntas de discusión
- ¿Qué beneficios y retos ves al trabajar con comunidades locales para mejorar modelos de IA, según el artículo?
- ¿Cómo pueden afectar las traducciones automáticas defectuosas a hablantes de lenguas menos representadas?
- ¿Qué pasos concretos propondrías para validar datos multilingües en un proyecto de inteligencia artificial?
Artículos relacionados
Ciudades asiáticas combaten la congestión y la contaminación
La congestión en ciudades de Asia genera emisiones y pérdidas económicas. Varias urbes aplican medidas: retiro de vehículos viejos, más transporte eléctrico y ampliación del metro, y usan tecnología para gestionar el tráfico.
Archivistas ciudadanos registran tradiciones orales en el sur de Asia
Archivistas ciudadanos graban y transcriben canciones, historias, acertijos y saberes medicinales para preservarlos. El proyecto «Enhancing Indic oral culture on Wikimedia projects» apoya la subida de 227 piezas de 14 comunidades a plataformas Wikimedia.