Pesquisadores liderados por Xiaoyan Bai e Chenhao Tan, da University of Chicago, com colaboradores do MIT, Harvard, University of Waterloo e Google DeepMind, investigaram por que modelos de linguagem falham em multiplicar dois números de quatro dígitos. O estudo foca nas dependências de longo alcance, quando o modelo precisa manter produtos parciais e somas correntes para chegar à resposta correta.
Comparando o ajuste fino padrão com o método Implicit Chain of Thought (ICoT), a equipe observou que modelos de 2 a 12 camadas treinados de forma padrão atingiram menos de 1% de acurácia porque aprendem padrões superficiais, sem desenvolver um mecanismo para armazenar valores intermédios. Já o modelo ICoT alcançou 100% de acurácia e codificou esses valores nos estados ocultos, permitindo decodificar as somas correntes.
Os autores também viram que camadas iniciais calculam e armazenam produtos de pares de dígitos em locais específicos e que camadas posteriores recuperam esses valores para formar cada dígito da resposta. Inserir um objetivo de treino para rastrear somas elevou um modelo de 2 camadas para 99% de acurácia, sem supervisão explícita de cadeia de pensamento.
"À medida que a IA é cada vez mais integrada a decisões críticas, é essencial entender suas formas singulares de aprender e pensar", afirma Tan. Fonte: University of Chicago.
Palavras difíceis
- dependência — relação em que uma parte precisa de outradependências
- acurácia — grau de precisão de uma resposta
- armazenar — guardar informação para usar depois
- codificar — transformar informação em outro formatocodificou
- estado oculto — representação interna que modelo mantémestados ocultos
- cadeia de pensamento — sequência de passos mentais explícitos
- método — procedimento ou técnica usada numa tarefa
- camada — nível ou etapa numa rede neuralcamadas
Dica: passe o mouse, foque ou toque nas palavras destacadas no artigo para ver definições rápidas enquanto lê ou ouve.
Perguntas para discussão
- O estudo mostra que rastrear somas melhorou muito a acurácia. Você usaria objetivos de treino semelhantes em outros problemas? Explique porque sim ou não.
- Tan afirma que a IA está integrada a decisões críticas. Como isso afeta a sua confiança em sistemas automáticos? Dê algumas razões.
Artigos relacionados
Anticorpo limpa vestígios do mieloma múltiplo em estudo inicial
Um ensaio clínico de fase 2 mostrou que o anticorpo linvoseltamab eliminou sinais detectáveis de mieloma múltiplo em pacientes avaliados com testes muito sensíveis. Pesquisadores expandem o estudo, mas são necessários mais testes.
Vitamina C pode proteger a fertilidade contra perclorato
Um estudo com peixe sugere que a vitamina C reduz os danos reprodutivos causados pelo perclorato de potássio, um químico comum em explosivos e fogos. Os peixes tratados com vitamina C tiveram melhor fertilidade do que os expostos apenas ao químico.
Vestível com IA detecta fragilidade em idosos
Pesquisadores da University of Arizona criaram uma manga vestível com inteligência artificial que identifica sinais precoces de fragilidade em adultos mais velhos. A deteção antecipada pode mudar o cuidado, do tratamento após quedas para intervenções preventivas.