Мозг предсказывает слова через грамматические группы^{CEFR B2}

21 апр. 2026 г.

УровеньA1

Адаптировано по материалам James Devitt-NYU, Futurity • CC BY 4.0

Фото: Google DeepMind, Unsplash

Уровень B2 – выше среднегоCEFR B2

4 мин

192 слов

Исследование, опубликованное в Nature Neuroscience, показало, что человеческий мозг формирует предсказания о языке на уровне грамматически организованных блоков, а не только отдельного следующего слова. Авторы отмечают, что большие языковые модели обучаются и оптимизируются для прогнозирования следующего слова, тогда как мозг проявляет чувствительность к целым конституентам — группы слов, объединённые грамматически.

Для анализа учёные провели серию экспериментов с носителями мандаринского варианта китайского языка и записывали мозговую активность с помощью магнитоэнцефалографии (MEG). Кроме того, использовали поведенческие Cloze‑тесты, а также проанализировали дополнительные данные мозговой активности пациентов, подвергшихся воздействию английского языка, чтобы проверить распространение выводов на другие языки.

Команда связала реакции мозга с предсказаниями больших языковых моделей, вычисляя энтропию и неожиданность (surprisal). В статье приводят примеры: фраза «я видел(а) …» имеет более высокую энтропию, чем «я сел(а) на …», а слово «кот» будет более неожиданным после «я сел(а) на …». Результаты показали, что корреляции с моделями менялись в зависимости от позиции слова в грамматической структуре, что указывает на чувствительность мозга к конституентам.

Авторы делают вывод, что человеческие предсказания уравновешены и модулируются грамматическими блоками, а большие языковые модели не отражают такую же структуру предсказаний. Это ставит новые вопросы о соотношении процессов языка в мозге и вычислительных моделей.

Сложные слова

предсказание — ожидание будущего слова или информации
предсказания
конституент — группа слов, объединённая в одно грамматическое целое
конституентам
энтропия — мера неопределённости вероятностного распределения при прогнозах слов
энтропию
неожиданность — степень неожиданности события в данном контексте
магнитоэнцефалография — метод записи мозговой активности по магнитным полям
магнитоэнцефалографии
корреляция — взаимная связь или зависимость между двумя переменными
корреляции

Подсказка: наведите, сфокусируйтесь или нажмите на выделенные слова, чтобы увидеть краткие определения прямо во время чтения или прослушивания.

1. Что показало исследование, опубликованное в Nature Neuroscience?
2. Каким методом записывали мозговую активность в эксперименте с носителями мандаринского варианта?
3. Какие величины команда вычисляла, связывая реакции мозга с предсказаниями моделей?
4. Какую из фраз авторы приводят как имеющую более высокую энтропию?
5. Каков один из выводов авторов о больших языковых моделях?

Вопросы для обсуждения

Почему, по вашему мнению, чувствительность мозга к грамматическим конституентам важна для понимания языка?
Какие изменения в обучении больших языковых моделей могли бы помочь им лучше учитывать грамматические блоки?
Какие трудности могут возникнуть при проверке таких результатов на языках с другой структурой, чем мандарин и английский?

Читать

Мозг предсказывает слова через грамматические группы CEFR B2

Сложные слова

Вопросы для обсуждения

Похожие статьи

Топ‑10 научных новостей года от Futurity

Учёные отследили активность мозга по отдельным клеткам в течение суток

Sportellino — чат‑бот для мигрантов в Италии

«Не спрашивай ИИ, спроси коллегу» — серия о правах и творчестве

Ученые нашли ген, который улучшает внимание у мышей

Мозг предсказывает слова через грамматические группы^{CEFR B2}