📖+30 XP

🎧+20 XP

✅+35 XP

Почему языковые модели ошибаются при умножении четырёхзначных чисел — Уровень B1 — brown wooden blocks on white surface

Почему языковые модели ошибаются при умножении четырёхзначных чисел^{CEFR B1}

29 дек. 2025 г.

УровеньA1

Адаптировано по материалам U. Chicago, Futurity • CC BY 4.0

Фото: Brett Jordan, Unsplash

Уровень B1 – среднийCEFR B1

3 мин

141 слов

Новое исследование под руководством Xiaoyan Bai и Chenhao Tan (University of Chicago) совместно с учёными из MIT, Harvard, University of Waterloo и Google DeepMind объясняет, почему современные большие языковые модели плохо умножают четырёхзначные числа. Авторы сравнили стандартную дообученную настройку и метод Implicit Chain of Thought (ICoT). При стандартной донастройке модели с от двух до 12 слоёв показали менее 1% точности при умножении четырёхзначных чисел.

Модель, обученная по ICoT, достигла 100% точности. Исследователи проанализировали скрытые состояния и выяснили, что ICoT кодирует промежуточные значения: из них можно декодировать текущие суммы, что подтверждает запоминание важных для вычислений величин.

Также команда показала, что добавление вспомогательной цели обучения для отслеживания сумм повысило точность обычной двухслойной модели почти до 99% и привело к появлению механизмов внимания, похожих на ICoT. Авторы подчёркивают, что простое увеличение данных или параметров не решает проблему без подходящих архитектурных подсказок и целей обучения.

Сложные слова

исследование — работа чтобы узнать новые факты
донастройка — дополнительное обучение модели после основного
донастройке
скрытое состояние — внутренние представления модели в нейронных слоях
скрытые состояния
промежуточное значение — число между шагами вычисления или обработки
промежуточные значения
внимание — механизм фокусировки модели на части входа
внимания
вспомогательная цель — дополнительная задача которую модель учится решать
вспомогательной цели
декодировать — переводить внутренние представления в понятный результат
точность — насколько ответы модели являются правильными
точности

Подсказка: наведите, сфокусируйтесь или нажмите на выделенные слова, чтобы увидеть краткие определения прямо во время чтения или прослушивания.

1. Какая модель достигла 100% точности при умножении четырёхзначных чисел?
2. Что показал анализ скрытых состояний у модели ICoT?
3. Что помогло обычной двухслойной модели почти достичь 99% точности?
4. Почему авторы считают, что простое увеличение данных или параметров не решает проблему?

Вопросы для обсуждения

Почему кодирование промежуточных значений важно для точных вычислений в моделях?
Какие преимущества и недостатки у подхода с вспомогательной целью обучения?
Достаточно ли улучшать модели только увеличением данных и параметров? Объясните.

Похожие статьи

24 февр. 2026 г.

Когнитивные игры улучшают мозг после травмы

Исследование показало, что люди с хроническими травмами головного мозга улучшили структуру мозга и когнитивные навыки, выполняя компьютерные игры для тренировки. Учёные зафиксировали изменения нейропластичности и улучшения в скорости обработки, внимании и памяти.

Уровень

Читать

28 дек. 2025 г.

Искусственный интеллект помогает диагностировать аутизм в Миссури

Учёные из University of Missouri проверили одобренное FDA устройство CanvasDx с искусственным интеллектом для помощи при диагностике аутизма. В исследовании из 80 детей устройство дало определённые результаты для 52% и не давало ложных диагнозов.

Уровень

Читать

25 нояб. 2025 г.

Две популяции микроглии влияют на тревогу у мышей

Учёные из Университета Юты обнаружили два типа микроглии, которые по-разному влияют на тревогу у мышей: одна группа усиливает тревогу, другая её предотвращает. Результаты опубликованы в журнале Molecular Psychiatry.

Уровень

Читать

26 янв. 2026 г.

Салфетки для быстрого обнаружения свинца в доме

Исследование показывает, что недорогие колориметрические салфетки могут быстро выявлять свинец на бытовых поверхностях. Учёные протестировали их в домах и автомобилях строителей в Бостоне и сравнили с лабораторными анализами.

Уровень

Читать

23 апр. 2026 г.

Как ИИ и цифровые технологии меняют землю в Бразилии

Исследование показывает, что ИИ, автоматизация и цифровые инструменты в Бразилии усиливают индустриальный агробизнес, вытесняют общины и стирают традиционные знания. Авторы требуют прозрачности, децентрализации и кооперативных подходов для защиты земель и биоразнообразия.

Уровень

Читать

Почему языковые модели ошибаются при умножении четырёхзначных чисел CEFR B1

Сложные слова

Вопросы для обсуждения

Похожие статьи

Когнитивные игры улучшают мозг после травмы

Искусственный интеллект помогает диагностировать аутизм в Миссури

Две популяции микроглии влияют на тревогу у мышей

Салфетки для быстрого обнаружения свинца в доме

Как ИИ и цифровые технологии меняют землю в Бразилии

Почему языковые модели ошибаются при умножении четырёхзначных чисел^{CEFR B1}