LingVo.club
📖+40 XP
🎧+25 XP
+45 XP
Почему языковые модели ошибаются при умножении четырёхзначных чисел — Уровень B2 — brown wooden blocks on white surface

Почему языковые модели ошибаются при умножении четырёхзначных чиселCEFR B2

29 дек. 2025 г.

Уровень B2 – выше среднего
4 мин
229 слов

Исследование, руководимое Xiaoyan Bai и Chenhao Tan из University of Chicago при участии команд из MIT, Harvard, University of Waterloo и Google DeepMind, подробно изучает, почему передовые большие языковые модели испытывают трудности с умножением четырёхзначных чисел. В работе сравнили стандартную дообученную настройку (fine-tuning) и метод Implicit Chain of Thought (ICoT). Модели с двух до 12 слоёв при стандартной донастройке показали менее 1% точности, тогда как модель, обученная по ICoT, достигла 100%.

Анализ внутренних состояний показал, что ICoT кодирует промежуточные значения: из скрытых состояний можно декодировать текущие суммы. Модель организует процессы внимания по времени: ранние слои вычисляют и хранят произведения пар цифр в отдельных ячейках, а поздние слои извлекают эти значения для формирования каждой цифры ответа. Авторы также отмечают представление цифр через Фурье-подобные базисы и естественное появление операции, похожей на сумму Минковского.

Чтобы проверить, можно ли помочь стандартным моделям, команда добавила вспомогательную цель обучения, обучающую отслеживать текущие суммы на каждом шаге. Для двухслойной модели это повысило точность до 99% без явного контроля цепочек рассуждений; при этом она сформировала механизмы внимания, похожие на ICoT, и новые стратегии отслеживания нескольких пар цифр. Авторы делают вывод, что архитектурные подсказки и целевые цели обучения важны для усвоения многошагового рассуждения, поскольку простое увеличение данных или числа параметров не устраняет эти ограничения. По словам Tan, «По мере того как AI всё активнее интегрируется в критические решения, важно понимать его особые способы обучения и мышления».

Сложные слова

  • дообученная настройкапроцесс дополнительного обучения модели под задачу
    дообученную настройку
  • состояниевнутреннее представление модели в конкретный момент
    внутренних состояний, скрытых состояний
  • суммарезультат сложения чисел или частей
    текущие суммы
  • вниманиемеханизм фокусировки модели на части информации
    внимания
  • базиснабор функций для представления данных или сигналов
    Фурье-подобные базисы
  • подсказкадополнительная информация, помогающая модели учиться
    архитектурные подсказки
  • многошаговое рассуждениерешение задачи через последовательные логические шаги
    многошагового рассуждения

Подсказка: наведите, сфокусируйтесь или нажмите на выделенные слова, чтобы увидеть краткие определения прямо во время чтения или прослушивания.

Вопросы для обсуждения

  • Какие преимущества и возможные ограничения вы видите в подходе ICoT по сравнению со стандартной донастройкой?
  • Насколько важно, чтобы модель кодировала и отслеживала промежуточные суммы при решении многошаговых задач? Обоснуйте ответ.
  • Как выводы этой работы могут повлиять на применение искусственного интеллекта в критических областях принятия решений?

Похожие статьи

Высокие дозы антиоксидантов могут навредить сперме и потомству — Уровень B2
16 февр. 2026 г.

Высокие дозы антиоксидантов могут навредить сперме и потомству

Исследование на мышах показало, что приём высоких доз антиоксидантов у самцов повредил ДНК спермы и вызвал изменения формы черепа и лица у потомства. Учёные рекомендуют мужчинам осторожнее принимать сильные добавки перед зачатием.

Уровень
Датчики и искусственный интеллект помогают следить за людьми с БАС — Уровень B2
2 дек. 2025 г.

Датчики и искусственный интеллект помогают следить за людьми с БАС

Команда Университета Миссури тестирует систему с домашними датчиками и искусственным интеллектом для отслеживания изменений в здоровье людей с БАС. Данные анализируют машинным обучением, чтобы заранее заметить ухудшение и помочь клиницистам.

Уровень
Алгоритмы объясняют превращение пропана в пропилен — Уровень B2
28 нояб. 2025 г.

Алгоритмы объясняют превращение пропана в пропилен

Учёные из Университета Рочестера создали алгоритмы, которые выявляют атомные характеристики превращения пропана в пропилен на нанокатализаторах. Работа показывает роль металлической и оксидной фаз и может помочь в других промышленных реакциях.

Уровень
Закрытые коптильные печи помогают переработчикам у озера Малави — Уровень B2
28 апр. 2025 г.

Закрытые коптильные печи помогают переработчикам у озера Малави

В 2024 году учёные при поддержке SGCI и Национальной комиссии Малави разработали закрытые коптильные печи для переработчиков рыбы. Печи экономят дрова, улучшают качество копчёной рыбы и помогают сокращать потери.

Уровень