Pesquisadores liderados por Xiaoyan Bai e Chenhao Tan, da University of Chicago, com colaboradores do MIT, Harvard, University of Waterloo e Google DeepMind, investigaram por que modelos de linguagem falham em multiplicar dois números de quatro dígitos. O estudo foca nas dependências de longo alcance, quando o modelo precisa manter produtos parciais e somas correntes para chegar à resposta correta.
Comparando o ajuste fino padrão com o método Implicit Chain of Thought (ICoT), a equipe observou que modelos de 2 a 12 camadas treinados de forma padrão atingiram menos de 1% de acurácia porque aprendem padrões superficiais, sem desenvolver um mecanismo para armazenar valores intermédios. Já o modelo ICoT alcançou 100% de acurácia e codificou esses valores nos estados ocultos, permitindo decodificar as somas correntes.
Os autores também viram que camadas iniciais calculam e armazenam produtos de pares de dígitos em locais específicos e que camadas posteriores recuperam esses valores para formar cada dígito da resposta. Inserir um objetivo de treino para rastrear somas elevou um modelo de 2 camadas para 99% de acurácia, sem supervisão explícita de cadeia de pensamento.
"À medida que a IA é cada vez mais integrada a decisões críticas, é essencial entender suas formas singulares de aprender e pensar", afirma Tan. Fonte: University of Chicago.
Palavras difíceis
- dependência — relação em que uma parte precisa de outradependências
- acurácia — grau de precisão de uma resposta
- armazenar — guardar informação para usar depois
- codificar — transformar informação em outro formatocodificou
- estado oculto — representação interna que modelo mantémestados ocultos
- cadeia de pensamento — sequência de passos mentais explícitos
- método — procedimento ou técnica usada numa tarefa
- camada — nível ou etapa numa rede neuralcamadas
Dica: passe o mouse, foque ou toque nas palavras destacadas no artigo para ver definições rápidas enquanto lê ou ouve.
Perguntas para discussão
- O estudo mostra que rastrear somas melhorou muito a acurácia. Você usaria objetivos de treino semelhantes em outros problemas? Explique porque sim ou não.
- Tan afirma que a IA está integrada a decisões críticas. Como isso afeta a sua confiança em sistemas automáticos? Dê algumas razões.
Artigos relacionados
Líderes africanos pedem maior controlo regional da investigação em saúde
Com a ajuda externa a cair 70% desde 2021, investigadores africanos pedem mais liderança local em investigação, desenvolvimento e inovação em saúde. Há exemplos de fábricas e centros científicos e propostas de políticas públicas.
IA e dispositivos vestíveis no controlo do diabetes tipo 2
Uma meta-revisão da University at Buffalo, publicada em NPJ Digital Medicine, analisou 60 estudos sobre IA em dispositivos vestíveis para diabetes tipo 2 e pré-diabetes. Encontrou benefícios e limites e pede estudos maiores e modelos mais transparentes.