LingVo.club
Уровень
Почему языковые модели ошибаются при умножении четырёхзначных чисел — Уровень B1 — brown wooden blocks on white surface

Почему языковые модели ошибаются при умножении четырёхзначных чиселCEFR B1

29 дек. 2025 г.

Уровень B1 – средний
3 мин
141 слов

Новое исследование под руководством Xiaoyan Bai и Chenhao Tan (University of Chicago) совместно с учёными из MIT, Harvard, University of Waterloo и Google DeepMind объясняет, почему современные большие языковые модели плохо умножают четырёхзначные числа. Авторы сравнили стандартную дообученную настройку и метод Implicit Chain of Thought (ICoT). При стандартной донастройке модели с от двух до 12 слоёв показали менее 1% точности при умножении четырёхзначных чисел.

Модель, обученная по ICoT, достигла 100% точности. Исследователи проанализировали скрытые состояния и выяснили, что ICoT кодирует промежуточные значения: из них можно декодировать текущие суммы, что подтверждает запоминание важных для вычислений величин.

Также команда показала, что добавление вспомогательной цели обучения для отслеживания сумм повысило точность обычной двухслойной модели почти до 99% и привело к появлению механизмов внимания, похожих на ICoT. Авторы подчёркивают, что простое увеличение данных или параметров не решает проблему без подходящих архитектурных подсказок и целей обучения.

Сложные слова

  • исследованиеработа чтобы узнать новые факты
  • донастройкадополнительное обучение модели после основного
    донастройке
  • скрытое состояниевнутренние представления модели в нейронных слоях
    скрытые состояния
  • промежуточное значениечисло между шагами вычисления или обработки
    промежуточные значения
  • вниманиемеханизм фокусировки модели на части входа
    внимания
  • вспомогательная цельдополнительная задача которую модель учится решать
    вспомогательной цели
  • декодироватьпереводить внутренние представления в понятный результат
  • точностьнасколько ответы модели являются правильными
    точности

Подсказка: наведите, сфокусируйтесь или нажмите на выделенные слова, чтобы увидеть краткие определения прямо во время чтения или прослушивания.

Вопросы для обсуждения

  • Почему кодирование промежуточных значений важно для точных вычислений в моделях?
  • Какие преимущества и недостатки у подхода с вспомогательной целью обучения?
  • Достаточно ли улучшать модели только увеличением данных и параметров? Объясните.

Похожие статьи

Возраст гранул термитов показывает, активна ли колония — Уровень B1
30 дек. 2025 г.

Возраст гранул термитов показывает, активна ли колония

Исследование Университета Калифорнии в Риверсайде показало, что микробы в гранулах помёта термитов меняются со временем. Ученые измерили падение бактериальной ДНК и предлагают полевой тест, чтобы отличать свежие гранулы от старых.

Уровень
Механический «переключатель» в фиброзе — Уровень B1
2 дек. 2025 г.

Механический «переключатель» в фиброзе

Учёные из Вашингтонского университета и Цинхуа выяснили, почему фиброз иногда разворачивается внезапно. Модель показала механическую точку невозврата: клетки взаимодействуют на критическом расстоянии, а коллаген образует жёсткие «пояса».

Уровень
Африка просит больше контроля над исследованиями в здравоохранении — Уровень B1
9 окт. 2025 г.

Африка просит больше контроля над исследованиями в здравоохранении

Снижение внешней помощи и проблемы в здравоохранении побудили африканских лидеров требовать регионального контроля над исследованиями и производством лекарств и вакцин. Делегаты в Лусаке и учёные называют RD&I ключом к безопасности и росту.

Уровень
Деменция в Африке: рост и новые исследования — Уровень B1
8 окт. 2024 г.

Деменция в Африке: рост и новые исследования

Число людей с деменцией в Африке увеличивается вместе со старением населения. Учёные призывают к новым исследованиям, работе с общинами и применению генетики, цифровых методов и традиционной медицины в уходе за пожилыми людьми.

Уровень
Новые микробы в кишечнике африканских популяций — Уровень B1
12 мар. 2025 г.

Новые микробы в кишечнике африканских популяций

Исследование показало, что в кишечнике у людей в Африке есть тысячи ранее неизвестных микробов. Учёные нашли уникальный микробный отпечаток, связанный с ВИЧ, и различия между сельскими и городскими жительницами.

Уровень