Um estudo de 2025 do Stanford HAI concluiu que muitos modelos grandes de linguagem não funcionam bem em línguas que não são o inglês. O mundo online usa muito o inglês e os desenvolvedores dependem de dados em inglês.
Jornais disseram que milhões de falantes de línguas como o curdo e o suaíli ficam em segundo plano. Usuários em outras línguas podem receber respostas inúteis. Pedir a um modelo para escrever um e-mail em tâmil pode dar um rascunho confuso em inglês. Muitos textos na web têm traduções automáticas com erros, e estes erros entram nos dados de treino. Especialistas pedem colaboração com comunidades locais e verificação das respostas.
Palavras difíceis
- desenvolvedor — pessoa que cria programas de computadordesenvolvedores
- falante — pessoa que usa uma língua para falarfalantes
- segundo plano — algo menos importante ou visível
- rascunho — texto escrito sem estar acabado
- tradução — texto de uma língua para outratraduções automáticas
- verificação — checar se algo está correto
- treino — uso de dados para ensinar modelos
Dica: passe o mouse, foque ou toque nas palavras destacadas no artigo para ver definições rápidas enquanto lê ou ouve.
Perguntas para discussão
- Você já recebeu uma resposta inútil de um tradutor automático ou modelo? O que aconteceu?
- Você acha importante verificar as respostas geradas por modelos? Por quê?
- Como a sua comunidade poderia ajudar a melhorar modelos na sua língua?
Artigos relacionados
Desigualdade e o risco das pandemias
Matthew M. Kavanagh, diretor do Georgetown University Center for Global Health Policy and Politics, alerta que a desigualdade aumenta a vulnerabilidade a pandemias. Ele propõe mudanças em finanças, tecnologia e políticas sociais para reduzir esse risco.
Pausas e pop-ups para reduzir a partilha de desinformação
Investigadores propõem tornar a partilha nas redes sociais um pouco mais difícil. Um modelo computacional mostra que atrasos e pequenos questionários podem reduzir republicações impulsivas e, quando combinados, aumentar a qualidade do conteúdo partilhado.