Почему языковые модели ошибаются при умножении четырёхзначных чисел
Новое исследование показало, что современные большие языковые модели плохо умножают четырёхзначные числа, потому что не хранят и не используют промежуточные результаты. Метод ICoT и дополнительные цели обучения помогают моделям запоминать шаги и давать правильный ответ.