LingVo.club
Nível
Por que modelos de linguagem falham ao multiplicar 4 dígitos — Nível B1 — brown wooden blocks on white surface

Por que modelos de linguagem falham ao multiplicar 4 dígitosCEFR B1

29/12/2025

Nível B1 – Intermediário
4 min
210 palavras

Pesquisadores liderados por Xiaoyan Bai e Chenhao Tan, da University of Chicago, com colaboradores do MIT, Harvard, University of Waterloo e Google DeepMind, investigaram por que modelos de linguagem falham em multiplicar dois números de quatro dígitos. O estudo foca nas dependências de longo alcance, quando o modelo precisa manter produtos parciais e somas correntes para chegar à resposta correta.

Comparando o ajuste fino padrão com o método Implicit Chain of Thought (ICoT), a equipe observou que modelos de 2 a 12 camadas treinados de forma padrão atingiram menos de 1% de acurácia porque aprendem padrões superficiais, sem desenvolver um mecanismo para armazenar valores intermédios. Já o modelo ICoT alcançou 100% de acurácia e codificou esses valores nos estados ocultos, permitindo decodificar as somas correntes.

Os autores também viram que camadas iniciais calculam e armazenam produtos de pares de dígitos em locais específicos e que camadas posteriores recuperam esses valores para formar cada dígito da resposta. Inserir um objetivo de treino para rastrear somas elevou um modelo de 2 camadas para 99% de acurácia, sem supervisão explícita de cadeia de pensamento.

"À medida que a IA é cada vez mais integrada a decisões críticas, é essencial entender suas formas singulares de aprender e pensar", afirma Tan. Fonte: University of Chicago.

Palavras difíceis

  • dependênciarelação em que uma parte precisa de outra
    dependências
  • acuráciagrau de precisão de uma resposta
  • armazenarguardar informação para usar depois
  • codificartransformar informação em outro formato
    codificou
  • estado ocultorepresentação interna que modelo mantém
    estados ocultos
  • cadeia de pensamentosequência de passos mentais explícitos
  • métodoprocedimento ou técnica usada numa tarefa
  • camadanível ou etapa numa rede neural
    camadas

Dica: passe o mouse, foque ou toque nas palavras destacadas no artigo para ver definições rápidas enquanto lê ou ouve.

Perguntas para discussão

  • O estudo mostra que rastrear somas melhorou muito a acurácia. Você usaria objetivos de treino semelhantes em outros problemas? Explique porque sim ou não.
  • Tan afirma que a IA está integrada a decisões críticas. Como isso afeta a sua confiança em sistemas automáticos? Dê algumas razões.

Artigos relacionados

Por que modelos de linguagem falham ao multiplicar 4 dígitos — Português Nível B1 | LingVo.club