Uma pesquisa recente explica por que modelos de linguagem avançados têm dificuldade para multiplicar dois números de quatro dígitos. O estudo analisa como os métodos de treino atuais afetam a capacidade dos modelos de armazenar e reutilizar resultados intermédios, algo necessário para cálculos longos.
Uma equipe de várias universidades e da indústria comparou o ajuste fino padrão com um método chamado Implicit Chain of Thought (ICoT). Sob ajuste fino padrão, modelos com 2 a 12 camadas alcançaram menos de 1% de acurácia. Em contraste, o modelo treinado com ICoT alcançou 100% de acurácia.
Os pesquisadores também mostraram que dar ao modelo o objetivo de rastrear somas correntes melhorou o resultado: um modelo de 2 camadas chegou a 99% de acurácia sem supervisão explícita de cadeia de pensamento.
Palavras difíceis
- modelo de linguagem — programa que gera ou processa textomodelos de linguagem
- ajuste fino — treino adicional para melhorar um modelo
- acurácia — porcentagem ou taxa de respostas corretas
- armazenar — guardar informação para usar depois
- resultado intermédio — resposta parcial usada durante um cálculo longoresultados intermédios
- cadeia de pensamento — sequência de passos mentais para resolver problema
Dica: passe o mouse, foque ou toque nas palavras destacadas no artigo para ver definições rápidas enquanto lê ou ouve.
Perguntas para discussão
- Você acha importante que um modelo guarde resultados intermédios ao calcular? Por quê?
- Qual método do texto alcançou 100% de acurácia e por que você acha que teve esse resultado?
Artigos relacionados
Estudo encontra muitos falso-negativos no teste Abbott-Bioline
Um estudo publicado na Malaria Journal diz que o teste rápido Abbott-Bioline dá muitos falso-negativos na detecção da malária no Sudeste Asiático. A pesquisa foi feita na fronteira Tailândia–Myanmar entre October 2024 e January 2025.
Pesquisa sobre antiveneno para o escorpião preto
Pesquisadores na Índia mapearam o veneno do escorpião preto Heterometrus bengalensis e identificaram muitas toxinas. Testes em camundongos mostraram danos graves; a equipa trabalha para desenvolver um antiveneno eficaz contra várias espécies.