Uma pesquisa recente explica por que modelos de linguagem avançados têm dificuldade para multiplicar dois números de quatro dígitos. O estudo analisa como os métodos de treino atuais afetam a capacidade dos modelos de armazenar e reutilizar resultados intermédios, algo necessário para cálculos longos.
Uma equipe de várias universidades e da indústria comparou o ajuste fino padrão com um método chamado Implicit Chain of Thought (ICoT). Sob ajuste fino padrão, modelos com 2 a 12 camadas alcançaram menos de 1% de acurácia. Em contraste, o modelo treinado com ICoT alcançou 100% de acurácia.
Os pesquisadores também mostraram que dar ao modelo o objetivo de rastrear somas correntes melhorou o resultado: um modelo de 2 camadas chegou a 99% de acurácia sem supervisão explícita de cadeia de pensamento.
Palavras difíceis
- modelo de linguagem — programa que gera ou processa textomodelos de linguagem
- ajuste fino — treino adicional para melhorar um modelo
- acurácia — porcentagem ou taxa de respostas corretas
- armazenar — guardar informação para usar depois
- resultado intermédio — resposta parcial usada durante um cálculo longoresultados intermédios
- cadeia de pensamento — sequência de passos mentais para resolver problema
Dica: passe o mouse, foque ou toque nas palavras destacadas no artigo para ver definições rápidas enquanto lê ou ouve.
Perguntas para discussão
- Você acha importante que um modelo guarde resultados intermédios ao calcular? Por quê?
- Qual método do texto alcançou 100% de acurácia e por que você acha que teve esse resultado?
Artigos relacionados
Cortes na ajuda internacional em 2025 põem saúde global em risco
Em 2025, cortes substanciais na ajuda internacional — iniciados com a suspensão de contratos pelos EUA em 20 de janeiro — interromperam serviços de saúde e humanitários, deixando muitos países vulneráveis, segundo investigações e relatórios.
Sensor vestível detecta anticorpos em 10 minutos
Pesquisadores da Universidade de Pittsburgh criaram um biossensor vestível que detecta anticorpos de vírus em 10 minutos sem punção venosa. O trabalho foi publicado na revista Analytical Chemistry e mede anticorpos no fluido intersticial.
Expansão territorial em chimpanzés de Ngogo aumenta nascimentos
Estudo em Ngogo, Uganda, mostra que após a comunidade matar grupos vizinhos e ampliar seu território houve mais nascimentos e menor mortalidade infantil nos três anos seguintes. Pesquisadores analisaram dados de mais de 30 anos.