Um estudo recente, publicado na Nature Neuroscience, mostra que a previsão de palavras pelo cérebro humano é organizada em blocos gramaticais (constituintes) e não reduzida à previsão da próxima palavra, como ocorre nos grandes modelos de linguagem. «Enquanto os LLMs são treinados e otimizados para prever a próxima palavra, o cérebro humano faz previsões agrupando gramaticalmente as palavras em frases», explicou o coautor David Poeppel.
Os investigadores realizaram vários experimentos com falantes de mandarim e registaram a atividade cerebral por magnetoencefalografia (MEG). Utilizaram também testes comportamentais Cloze e analisaram dados adicionais de doentes expostos ao inglês para avaliar a generalidade dos resultados. Para quantificar a previsibilidade, recorreram a LLMs e calcularam duas medidas: entropia e surpresa (surprisal). Alta entropia indica que o contexto permite muitas palavras possíveis (por exemplo, «Eu vi um» tem entropia maior do que «Eu me sentei em um»). Alta surpresa significa que uma palavra é inesperada no contexto; por exemplo, «gato» tem maior surpresa depois de «Eu me sentei em um» do que depois de «Eu vi um».
Ao comparar as previsões dos modelos com os sinais cerebrais, esperaria-se uma correlação uniforme se o cérebro funcionasse como um LLM. Em vez disso, a atividade cerebral variou conforme a posição da palavra na estrutura gramatical, sinalizando sensibilidade a constituintes. Os autores concluem que a previsão humana é equilibrada e modulada por blocos gramaticais, e que os LLMs não refletem integralmente essa sensibilidade, o que levanta novas questões sobre a relação entre processos cerebrais da linguagem e modelos computacionais.
Palavras difíceis
- previsão — antecipação do que pode vir a seguirprevisões
- constituinte — unidade gramatical que forma uma fraseconstituintes
- entropia — grau de incerteza sobre palavras possíveis
- surpresa — grau de inesperado de uma palavra
- magnetoencefalografia — técnica que regista atividade cerebral magnética
- correlação — relação estatística entre duas medidas observadas
- sensibilidade — capacidade de reagir a diferenças linguísticas
Dica: passe o mouse, foque ou toque nas palavras destacadas no artigo para ver definições rápidas enquanto lê ou ouve.
Perguntas para discussão
- De que maneira a descoberta de que o cérebro usa blocos gramaticais pode influenciar o desenvolvimento de novos modelos de linguagem?
- Quais são as vantagens e limitações de testar falantes de mandarim e doentes expostos ao inglês para avaliar a generalidade dos resultados?
- Como a sensibilidade a constituintes gramaticais pode afetar a aprendizagem de línguas em sala de aula?
Artigos relacionados
Especialistas: IA pode reduzir marketing do tabaco para jovens
No congresso em Dublin, especialistas disseram que a inteligência artificial pode ajudar a impedir que o setor do tabaco atraia jovens online. Relataram usos da IA em vários países e avisaram sobre novos produtos que exigem regras.
Nano‑OLEDs do ETH Zurich com pixels menores que células
Pesquisadores do ETH Zurich fabricaram OLEDs em escala nanométrica com pixels de até 100 nanômetros e demonstraram um logótipo de 2.800 nano‑pixels. O trabalho saiu na revista Nature Photonics e aponta aplicações em ecrãs e microscopia.