Un estudio de 2025 del Stanford Institute for Human-Centered Artificial Intelligence (HAI) encontró que muchos modelos de lenguaje a gran escala rinden peor en idiomas distintos del inglés. Los LLMs públicos, incluidos algunos desarrollados en parte por Google y Meta, pueden generar respuestas que no se ajustan a las necesidades de la mayoría global.
El mundo en línea está dominado por el inglés y los desarrolladores suelen basarse en datos en inglés; además, la concentración de empresas y datos en zonas acomodadas, como Silicon Valley, ha ampliado la división. Medios informaron que millones de hablantes de lenguas como kurdo y suajili quedan en una posición secundaria y reciben resultados poco útiles o llenos de errores.
Wired explicó que pedir a un LLM como ChatGPT que redacte un correo en tamil puede producir un borrador confuso en inglés. MIT Technology Review halló que muchos textos raspados de la web contienen errores de traducción automática, y contribuyentes sin las habilidades para verificar la exactitud pueden convertir esos textos en datos de entrenamiento que refuerzan errores.
Expertos proponen trabajar con comunidades marginadas, incluir aportes locales, revisar salidas por precisión y autenticidad, y formar colaboraciones que respeten diferencias culturales.
Palabras difíciles
- modelo — representación o sistema usado para procesar informaciónmodelos
- rendir — funcionar o producir resultados en una tarearinden
- dominar — tener control o influencia sobre algo o alguiendominado
- raspar — copiar datos de páginas web automáticamenteraspados
- contribuyente — persona que aporta información o contenidocontribuyentes
- marginado — grupo social con menos recursos o influenciamarginadas
- autenticidad — cualidad de ser verdadero y fiel al origen
Consejo: pasa el cursor, enfoca o toca las palabras resaltadas en el artículo para ver definiciones rápidas mientras lees o escuchas.
Preguntas de discusión
- ¿Cómo afectaría a tu comunidad que los modelos de lenguaje rindan peor en su idioma?
- ¿Qué medidas concretas propondrías para mejorar la precisión y autenticidad en otros idiomas?
- ¿Por qué es importante trabajar con comunidades locales al desarrollar sistemas de inteligencia artificial?
Artículos relacionados
Redes sociales y venta ilegal de carne de monte
Un estudio advierte que las redes sociales podrían aumentar la venta ilegal de carne de monte y amenazar la biodiversidad. Los investigadores analizaron anuncios en Facebook y describen tácticas que dificultan la detección y la regulación.
Cortes de luz en Mile Four y crecimiento de la energía solar
Los vecinos de Mile Four, en Bamenda, sufren apagones prolongados por problemas en la red y menor producción hidroeléctrica. Ante la inestabilidad, la comunidad compró un transformador y muchas viviendas instalaron paneles solares.
TikTok y el clan en Somalia
Una investigación muestra que TikTok amplifica la identidad clanica en Somalia, aumenta la polarización y puede financiar conflictos como los de Laasanood en 2023. También hay creadores que promueven la paz y recomendaciones de moderación y educación digital.