Uma pesquisa recente explica por que modelos de linguagem avançados têm dificuldade para multiplicar dois números de quatro dígitos. O estudo analisa como os métodos de treino atuais afetam a capacidade dos modelos de armazenar e reutilizar resultados intermédios, algo necessário para cálculos longos.
Uma equipe de várias universidades e da indústria comparou o ajuste fino padrão com um método chamado Implicit Chain of Thought (ICoT). Sob ajuste fino padrão, modelos com 2 a 12 camadas alcançaram menos de 1% de acurácia. Em contraste, o modelo treinado com ICoT alcançou 100% de acurácia.
Os pesquisadores também mostraram que dar ao modelo o objetivo de rastrear somas correntes melhorou o resultado: um modelo de 2 camadas chegou a 99% de acurácia sem supervisão explícita de cadeia de pensamento.
Palavras difíceis
- modelo de linguagem — programa que gera ou processa textomodelos de linguagem
- ajuste fino — treino adicional para melhorar um modelo
- acurácia — porcentagem ou taxa de respostas corretas
- armazenar — guardar informação para usar depois
- resultado intermédio — resposta parcial usada durante um cálculo longoresultados intermédios
- cadeia de pensamento — sequência de passos mentais para resolver problema
Dica: passe o mouse, foque ou toque nas palavras destacadas no artigo para ver definições rápidas enquanto lê ou ouve.
Perguntas para discussão
- Você acha importante que um modelo guarde resultados intermédios ao calcular? Por quê?
- Qual método do texto alcançou 100% de acurácia e por que você acha que teve esse resultado?
Artigos relacionados
Expansão territorial em chimpanzés de Ngogo aumenta nascimentos
Estudo em Ngogo, Uganda, mostra que após a comunidade matar grupos vizinhos e ampliar seu território houve mais nascimentos e menor mortalidade infantil nos três anos seguintes. Pesquisadores analisaram dados de mais de 30 anos.
Violência digital contra jornalistas mulheres na Indonésia
A violência digital contra jornalistas e ativistas mulheres na Indonésia cresceu nos últimos cinco anos. Ataques incluem doxing, DDoS e manipulação de fotos; leis foram ampliadas, mas proteção institucional e moderação das plataformas seguem insuficientes.