Языковые модели учатся различать правдоподобие^{CEFR B1}

26 апр. 2026 г.

УровеньA1

Адаптировано по материалам Brown University, Futurity • CC BY 4.0

Фото: Zach M, Unsplash

Уровень B1 – среднийCEFR B1

3 мин

143 слов

Исследование подготовили сотрудники Браунского университета и представили на конференции International Conference on Learning Representations в Рио-де-Жанейро. Докторант Майкл Лепори, руководивший проектом, отметил, что результаты дают «некоторые свидетельства» о кодировании причинных ограничений реального мира и что внутренние состояния моделей предсказывают человеческие суждения.

В эксперименте моделям показывали предложения разной правдоподобности — обычные, маловероятные, невозможные и бессмысленные. Примеры включали: «Кто-то охладил напиток льдом», «...снегом», «...огнём» и «...вчерашним днём». Учёные применяли подход механистической интерпретируемости, который стремится восстановить то, что модель кодирует в своём «состоянии мозга».

Тесты провели на нескольких открытых моделях, чтобы не зависеть от одной архитектуры, в том числе на GPT-2, Llama 3.2 и Gemma 2. Авторы обнаружили, что крупные модели вырабатывают внутренние векторы, соответствующие категориям правдоподобия; они различали близкие категории с примерно 85% точности. Такие векторы появляются в моделях с более чем 2 миллиарда параметров и отражают человеческую неопределённость для двусмысленных утверждений.

Сложные слова

исследование — систематическое изучение темы или явления
кодирование — представление информации в определённой форме
кодировании
ограничение — правило или условие, уменьшающее возможности
ограничений
состояние — текущее положение элементов или процессов
состояния, состоянии
интерпретируемость — возможность понять, что делает модель
интерпретируемости
вектор — математический объект с числами в порядке
векторы
параметр — число или переменная, влияющая на работу модели
параметров
неопределённость — ситуация, когда нет точного ответа
правдоподобность — степень, насколько что-то похоже на правду
правдоподобности

Подсказка: наведите, сфокусируйтесь или нажмите на выделенные слова, чтобы увидеть краткие определения прямо во время чтения или прослушивания.

1. Где представили исследование?
2. Что предсказывали внутренние состояния моделей?
3. Какие виды предложений показывали моделям в эксперименте?
4. Чему соответствовали внутренние векторы, обнаруженные авторами?
5. В моделях с каким размером параметров появлялись такие векторы?

Вопросы для обсуждения

Почему важно, что внутренние состояния моделей отражают человеческую неопределённость?
Какие примеры предложений можно показать модели, чтобы проверить понимание причинных ограничений?
Какие преимущества и какие проблемы может иметь механистическая интерпретируемость моделей?

Читать

Языковые модели учатся различать правдоподобие CEFR B1

Сложные слова

Вопросы для обсуждения

Похожие статьи

Как корни растений проходят через плотную почву

Как ультрафиолет меняет лёд: квантовые симуляции

Дзодзо Банива: премия за климат и традиционные знания

Самые маленькие в мире программируемые микророботы

В кишечнике нашли запасной путь для производства антител IgA

Языковые модели учатся различать правдоподобие^{CEFR B1}