ИИ, который понимает, почему работают заголовки^{CEFR B2}

23 дек. 2025 г.

УровеньA1

Адаптировано по материалам Yale, Futurity • CC BY 4.0

Фото: Markus Winkler, Unsplash

Уровень B2 – выше среднегоCEFR B2

5 мин

244 слов

Новое исследование Йельской школы менеджмента показывает: генеративный LLM, который учится не просто имитировать «победившие» заголовки, а объяснять, почему они работают, может создавать более вовлекающий и заслуживающий доверия контент. Авторы — Тонг Ван и К. Судхир при участии докторанта Хэнгуанга Чжоу — указывают на риск обучения только на «победителях»: модель начнёт эксплуатировать поверхностные сигналы, например сенсационные слова вроде «шокирующе», вместо понимания реальных причин кликов.

Исследователи разработали метод, близкий к научному рассуждению: сначала абдукция — LLM выдвигает несколько конкурирующих гипотез о том, почему один заголовок вовлекает больше, затем индукция — эти гипотезы проверяются на больших данных до появления валидационного набора верифицированных объяснений. После этого модель дообучают так, чтобы генерировать заголовки, максимизирующие вовлечение «по правильным причинам», а не за счёт эксплуатационных признаков.

В эксперименте использовали 23 000 заголовков, описывающих 4 500 статей от Upworthy; для оценки применяли предварительно обученную модель скоринга, основанную на результатах A/B-тестов. Система тестировали примерно на 150 человек, которым показывали три типа заголовков:

оригинальные заголовки Upworthy,
стандартные заголовки, сгенерированные ИИ,
заголовки новой модели.

Человеческие и стандартные ИИ-заголовки выбирали лучшими примерно в 30% случаев; новая модель была выбрана в 44% случаев. Анализ показал, что стандартный ИИ сильнее опирался на сенсационные формулировки. Авторы утверждают, что подход может порождать знания в разных областях; Судхир отметил работу по созданию персонализированного ИИ-коучинга для агентов службы поддержки, где входные данные могут быть не только текстом, но и аудио или визуальной информацией. Исследователи заключают, что управляемый знаниями ИИ способен улучшать контент и делать системы более ответственными и заслуживающими доверия. Источник: Yale

Сложные слова

генеративный — создающий новый текст на основе модели
абдукция — логическое выдвижение гипотез для объяснения явления
индукция — проверка гипотез на больших данных
вовлекающий — привлекающий внимание и побуждающий к действию
эксплуатационный — основанный на поверхностных, легко используемых признаках
эксплуатационных
дообучать — увеличивать навыки модели с помощью дополнительных данных
дообучают
верифицированный — прошедший проверку и признанный достоверным
верифицированных

Подсказка: наведите, сфокусируйтесь или нажмите на выделенные слова, чтобы увидеть краткие определения прямо во время чтения или прослушивания.

1. Что происходит, если модель учится только на «победителях»?
2. Какие два шага включает предложенный метод рассуждения?
3. Какие заголовки выбирали чаще всего участники эксперимента?
4. Сколько заголовков использовали в эксперименте?

Вопросы для обсуждения

Как, по вашему мнению, метод абдукции и индукции помогает создавать более надёжные заголовки? Приведите одно-два возможных преимущества.
Какие отрицательные последствия могут возникнуть, если ИИ будет полагаться на сенсационные формулировки для привлечения кликов?
Как можно применить описанный подход для обучения ИИ в службе поддержки, если входные данные включают аудио и видео?

Читать

ИИ, который понимает, почему работают заголовки CEFR B2

Сложные слова

Вопросы для обсуждения

Похожие статьи

Группировка учащихся, изучающих английский, и её эффект на успеваемость

Высокие дозы антиоксидантов могут навредить сперме и потомству

Дело против комика Вячеслава Комиссаренко

Как взгляд на сбережения влияет на счастье в браке

Соевое масло связано с набором веса у мышей

ИИ, который понимает, почему работают заголовки^{CEFR B2}