Por que modelos de linguagem falham ao multiplicar 4 dígitos — Português Nível B1

Pesquisadores liderados por Xiaoyan Bai e Chenhao Tan, da University of Chicago, com colaboradores do MIT, Harvard, University of Waterloo e Google DeepMind, investigaram por que modelos de linguagem falham em multiplicar dois números de quatro dígitos. O estudo foca nas dependências de longo alcance, quando o modelo precisa manter produtos parciais e somas correntes para chegar à resposta correta.

Comparando o ajuste fino padrão com o método Implicit Chain of Thought (ICoT), a equipe observou que modelos de 2 a 12 camadas treinados de forma padrão atingiram menos de 1% de acurácia porque aprendem padrões superficiais, sem desenvolver um mecanismo para armazenar valores intermédios. Já o modelo ICoT alcançou 100% de acurácia e codificou esses valores nos estados ocultos, permitindo decodificar as somas correntes.

Os autores também viram que camadas iniciais calculam e armazenam produtos de pares de dígitos em locais específicos e que camadas posteriores recuperam esses valores para formar cada dígito da resposta. Inserir um objetivo de treino para rastrear somas elevou um modelo de 2 camadas para 99% de acurácia, sem supervisão explícita de cadeia de pensamento.

"À medida que a IA é cada vez mais integrada a decisões críticas, é essencial entender suas formas singulares de aprender e pensar", afirma Tan. Fonte: University of Chicago.

Palavras difíceis

dependência — relação em que uma parte precisa de outra

dependências

acurácia — grau de precisão de uma resposta

armazenar — guardar informação para usar depois

codificar — transformar informação em outro formato

codificou

estado oculto — representação interna que modelo mantém

estados ocultos

cadeia de pensamento — sequência de passos mentais explícitos

método — procedimento ou técnica usada numa tarefa

camada — nível ou etapa numa rede neural

camadas

Dica: passe o mouse, foque ou toque nas palavras destacadas no artigo para ver definições rápidas enquanto lê ou ouve.

Futurity: os 10 principais posts de pesquisa de 2025

Futurity publicou uma seleção com os dez principais posts de pesquisa de 2025. A lista cobre saúde animal, energia, arqueologia, neurociência, nutrição, materiais e saúde ambiental; leitores são convidados a voltar em 2026.

Nível

Ler

31/12/2025

Vídeo explica perda de visão e pesquisas

Um vídeo analisa a perda de visão e se a visão perdida pode voltar. Juliette McGregor, do University of Rochester Medical Center, explica o espectro da cegueira, tratamentos, apoio assistivo e pesquisas em andamento.

Nível

Ler

10/12/2025

Reduzir atividade de um circuito do cérebro ajuda contra recaída por opioides

Pesquisadores da Washington State University relatam que diminuir a atividade entre o córtex prelimbico e o tálamo paraventricular reduziu a busca por heroína em um modelo pré-clínico. O estudo foi publicado no Journal of Neuroscience.

Nível

Ler

17/05/2022

Falta de acesso à tecnologia assistiva

Relatório da OMS e UNICEF, lançado a 16 de maio, mostra que muitas pessoas com deficiência e idosos não conseguem aceder a dispositivos como óculos, aparelhos auditivos e próteses. O documento pede mais financiamento e inclusão na saúde.

Nível

Ler

13/06/2023

Redes sociais e venda ilegal de carne de caça na África Ocidental

Um estudo na revista One Health alerta que redes sociais podem aumentar a venda ilegal de carne de caça na África Ocidental. Isso pode ameaçar espécies e aumentar o risco de doenças que passam de animais para humanos.

Nível

Ler

Por que modelos de linguagem falham ao multiplicar 4 dígitos^{CEFR B1}

Palavras difíceis

Perguntas para discussão

Artigos relacionados

Futurity: os 10 principais posts de pesquisa de 2025

Vídeo explica perda de visão e pesquisas

Reduzir atividade de um circuito do cérebro ajuda contra recaída por opioides

Falta de acesso à tecnologia assistiva

Redes sociais e venda ilegal de carne de caça na África Ocidental

Por que modelos de linguagem falham ao multiplicar 4 dígitos CEFR B1

Palavras difíceis

Perguntas para discussão

Artigos relacionados

Futurity: os 10 principais posts de pesquisa de 2025

Vídeo explica perda de visão e pesquisas

Reduzir atividade de um circuito do cérebro ajuda contra recaída por opioides

Falta de acesso à tecnologia assistiva

Redes sociais e venda ilegal de carne de caça na África Ocidental

Por que modelos de linguagem falham ao multiplicar 4 dígitos^{CEFR B1}