Uma pesquisa recente explica por que modelos de linguagem avançados têm dificuldade para multiplicar dois números de quatro dígitos. O estudo analisa como os métodos de treino atuais afetam a capacidade dos modelos de armazenar e reutilizar resultados intermédios, algo necessário para cálculos longos.
Uma equipe de várias universidades e da indústria comparou o ajuste fino padrão com um método chamado Implicit Chain of Thought (ICoT). Sob ajuste fino padrão, modelos com 2 a 12 camadas alcançaram menos de 1% de acurácia. Em contraste, o modelo treinado com ICoT alcançou 100% de acurácia.
Os pesquisadores também mostraram que dar ao modelo o objetivo de rastrear somas correntes melhorou o resultado: um modelo de 2 camadas chegou a 99% de acurácia sem supervisão explícita de cadeia de pensamento.
Palavras difíceis
- modelo de linguagem — programa que gera ou processa textomodelos de linguagem
- ajuste fino — treino adicional para melhorar um modelo
- acurácia — porcentagem ou taxa de respostas corretas
- armazenar — guardar informação para usar depois
- resultado intermédio — resposta parcial usada durante um cálculo longoresultados intermédios
- cadeia de pensamento — sequência de passos mentais para resolver problema
Dica: passe o mouse, foque ou toque nas palavras destacadas no artigo para ver definições rápidas enquanto lê ou ouve.
Perguntas para discussão
- Você acha importante que um modelo guarde resultados intermédios ao calcular? Por quê?
- Qual método do texto alcançou 100% de acurácia e por que você acha que teve esse resultado?
Artigos relacionados
Estudo encontra muitos falso-negativos no teste Abbott-Bioline
Um estudo publicado na Malaria Journal diz que o teste rápido Abbott-Bioline dá muitos falso-negativos na detecção da malária no Sudeste Asiático. A pesquisa foi feita na fronteira Tailândia–Myanmar entre October 2024 e January 2025.
IA para ampliar informação de saúde sexual na América Latina
Grupos de investigação e ONGs usam inteligência artificial para levar informação sobre saúde sexual e reprodutiva a jovens e grupos marginalizados no Peru e na Argentina. Projetos incluem chatbots em quéchua e plataformas no WhatsApp.
Dispositivo com IA ajuda diagnóstico de autismo no Missouri
Pesquisadores testaram o CanvasDx para apoiar clínicos locais no Missouri. O dispositivo, aprovado pela FDA, deu resultados determinantes em parte dos casos, ajudou a acelerar diagnósticos e reduziu deslocamentos para famílias.