Исследование, опубликованное в Nature Neuroscience, показало, что человеческий мозг формирует предсказания о языке на уровне грамматически организованных блоков, а не только отдельного следующего слова. Авторы отмечают, что большие языковые модели обучаются и оптимизируются для прогнозирования следующего слова, тогда как мозг проявляет чувствительность к целым конституентам — группы слов, объединённые грамматически.
Для анализа учёные провели серию экспериментов с носителями мандаринского варианта китайского языка и записывали мозговую активность с помощью магнитоэнцефалографии (MEG). Кроме того, использовали поведенческие Cloze‑тесты, а также проанализировали дополнительные данные мозговой активности пациентов, подвергшихся воздействию английского языка, чтобы проверить распространение выводов на другие языки.
Команда связала реакции мозга с предсказаниями больших языковых моделей, вычисляя энтропию и неожиданность (surprisal). В статье приводят примеры: фраза «я видел(а) …» имеет более высокую энтропию, чем «я сел(а) на …», а слово «кот» будет более неожиданным после «я сел(а) на …». Результаты показали, что корреляции с моделями менялись в зависимости от позиции слова в грамматической структуре, что указывает на чувствительность мозга к конституентам.
Авторы делают вывод, что человеческие предсказания уравновешены и модулируются грамматическими блоками, а большие языковые модели не отражают такую же структуру предсказаний. Это ставит новые вопросы о соотношении процессов языка в мозге и вычислительных моделей.
Сложные слова
- предсказание — ожидание будущего слова или информациипредсказания
- конституент — группа слов, объединённая в одно грамматическое целоеконституентам
- энтропия — мера неопределённости вероятностного распределения при прогнозах словэнтропию
- неожиданность — степень неожиданности события в данном контексте
- магнитоэнцефалография — метод записи мозговой активности по магнитным поляммагнитоэнцефалографии
- корреляция — взаимная связь или зависимость между двумя переменнымикорреляции
Подсказка: наведите, сфокусируйтесь или нажмите на выделенные слова, чтобы увидеть краткие определения прямо во время чтения или прослушивания.
Вопросы для обсуждения
- Почему, по вашему мнению, чувствительность мозга к грамматическим конституентам важна для понимания языка?
- Какие изменения в обучении больших языковых моделей могли бы помочь им лучше учитывать грамматические блоки?
- Какие трудности могут возникнуть при проверке таких результатов на языках с другой структурой, чем мандарин и английский?
Похожие статьи
Сокращения помощи в 2025 году угрожают здравоохранению
В 2025 году крупные сокращения международной помощи, начавшиеся после распоряжения президента США 20 января приостановить зарубежные контракты, привели к остановке служб, закрытию USAID и угрозе для здравоохранения в десятках стран.
ИИ, который понимает, почему работают заголовки
Исследование Йельской школы менеджмента показывает: генеративный ИИ, который учится объяснять, почему заголовки привлекают внимание, создаёт более вовлекающий и заслуживающий доверия контент. Авторы проверяли метод на данных и тестах с людьми.