Investigadores da New York University, liderados por Anasse Bari e com o coautor Binxu Huang, apresentaram na Frontiers in Artificial Intelligence uma estrutura algorítmica de pré‑processamento para LLMs destinada a reduzir alucinações em resumos de documentos longos.
A abordagem funciona em duas etapas. Na fase inicial, as frases são limpas e normalizadas — preservando substantivos, verbos e adjetivos e fundindo termos compostos — e transformadas em vetores que refletem traços lexicais, semânticos e temáticos. Cada frase recebe pontuações de centralidade no documento, importância por secção e alinhamento com o abstract, com reforço numérico para secções-chave como Introdução, Resultados e Conclusão.
Na fase seguinte, são aplicados princípios de voo em bando — coesão, alinhamento e separação — para formar aglomerados de frases semelhantes. Dentro de cada aglomerado emergem líderes e seguidores; apenas as frases com pontuações mais elevadas são selecionadas, reduzindo redundância e preservando cobertura de contexto, métodos, resultados e conclusões. As frases escolhidas são reordenadas e um LLM gera o resumo final. Testes em mais de 9,000 documentos mostraram que a combinação da estrutura inspirada em bandos com LLMs aumenta a precisão factual em relação a LLMs sem essa etapa de pré-processamento.
Segundo Bari, a estrutura foi pensada como um passo preparatório, não como concorrente dos LLMs; pode reduzir o risco de alucinações, mas não o elimina.
Palavras difíceis
- pré‑processamento — etapa inicial para preparar dados antes
- alucinação — informação falsa gerada por modelos de linguagemalucinações
- normalizar — tornar formas de texto mais uniformesnormalizadas
- vetor — representação numérica de uma frasevetores
- centralidade — medida da importância de uma frase
- aglomerado — grupo de frases semelhantes reunidasaglomerados
- redundância — repetição desnecessária de informação no texto
Dica: passe o mouse, foque ou toque nas palavras destacadas no artigo para ver definições rápidas enquanto lê ou ouve.
Perguntas para discussão
- Que vantagens e limitações vê na ideia de pré‑processar frases antes de usar um LLM para resumir documentos longos? Dê exemplos.
- Como a seleção de 'líderes' em cada aglomerado pode afetar a qualidade e a cobertura do resumo final?
- De que forma a ênfase em secções-chave (Introdução, Resultados, Conclusão) pode mudar o conteúdo de um resumo gerado por LLM?
Artigos relacionados
Novos modelos mudam a visão sobre Urano e Netuno
Cientistas da University of Zurich criaram simulações do interior de Urano e Netuno que desafiam a classificação como "gigantes de gelo". Os resultados mostram que os planetas podem ser ricos em água ou em rocha e ajudam a explicar campos magnéticos estranhos.
Projeto digital para preservar línguas de Bangladesh
O governo de Bangladesh lançou o site Multilingual Cloud para digitalizar e guardar línguas étnicas. O portal reúne palavras, frases, gravações e transcrições em IPA para ajudar comunidades e pesquisadores a preservar idiomas ameaçados.
Dados da Cassini mudam ideia sobre o interior de Titã
Nova reanálise dos dados da missão Cassini sugere que Titã pode não ter um oceano interno global. Cientistas agora interpretam os sinais como uma camada espessa e pastosa com bolsões de água perto do núcleo, o que muda a visão sobre habitabilidade.
Connie Nshemereirwe e a ciência em África
Connie Nshemereirwe, especialista em avaliação educacional e ex‑engenheira, defende que a agenda de investigação em África deve surgir das bases. Fala também sobre comunicação científica e sobre as consequências do encerramento das escolas durante a pandemia.