Учёные изучили, почему большие языковые модели плохо умножают четырёхзначные числа. Они сравнили стандартное дообучение и метод под названием ICoT. При обычной донастройке модели с несколькими слоями давали почти нулевую точность.
Модель, обученная по ICoT, научилась хранить промежуточные суммы и дала правильные ответы — исследователи смогли декодировать текущие суммы из скрытых состояний модели. Учёные также добавили цель обучения, которая учит отслеживать суммы на каждом шаге, и это заметно помогло обычным моделям.
Сложные слова
- дообучение — дополнительное обучение модели после первоначального
- донастройка — небольшая настройка модели под конкретную задачудонастройке
- умножать — выполнять операцию умножения чисел обычно по шагамумножают
- промежуточный — находящийся между шагами или этапами процессапромежуточные
- скрытый — не видимый напрямую внутри моделискрытых
- декодировать — переводить внутренние сигналы в понятный вывод
- точность — насколько ответы модели правильные и близки к эталону
Подсказка: наведите, сфокусируйтесь или нажмите на выделенные слова, чтобы увидеть краткие определения прямо во время чтения или прослушивания.
Вопросы для обсуждения
- Почему, по-вашему, отслеживание промежуточных сумм помогает моделям давать правильные ответы?
- Как вы понимаете фразу «декодировать текущие суммы из скрытых состояний» своими словами?
- Пробовали ли вы решать умножение большой цифры по шагам? Какие шаги вы делаете?
Похожие статьи
Высокие дозы антиоксидантов могут навредить сперме и потомству
Исследование на мышах показало, что приём высоких доз антиоксидантов у самцов повредил ДНК спермы и вызвал изменения формы черепа и лица у потомства. Учёные рекомендуют мужчинам осторожнее принимать сильные добавки перед зачатием.
Датчики и искусственный интеллект помогают следить за людьми с БАС
Команда Университета Миссури тестирует систему с домашними датчиками и искусственным интеллектом для отслеживания изменений в здоровье людей с БАС. Данные анализируют машинным обучением, чтобы заранее заметить ухудшение и помочь клиницистам.
Алгоритмы объясняют превращение пропана в пропилен
Учёные из Университета Рочестера создали алгоритмы, которые выявляют атомные характеристики превращения пропана в пропилен на нанокатализаторах. Работа показывает роль металлической и оксидной фаз и может помочь в других промышленных реакциях.