Chain-of-Thought — пошаговые рассуждения AI
Думай пошагово
Проблема: ИИ часто сразу прыгает к ответу, делая ошибки в сложных задачах, требующих пошагового рассуждения. Как заставить его думать внимательнее?
Решение: Думай вслух
Chain of Thought (CoT) промптинг — это когда ты просишь модель расписать рассуждения шаг за шагом перед финальным ответом. Как учитель математики говорит ученикам "покажи решение", ты заставляешь модель выписать промежуточные шаги, а не угадывать ответ наобум. В отличие от zero-shot промптинга, где модель сразу прыгает к ответу, CoT оставляет видимую цепочку рассуждений — и именно она даёт прирост точности на многошаговых задачах.
Почему это работает? Языковая модель генерирует ответ по одному токену за раз, и каждый написанный токен попадает в контекст для следующего. Когда ты просишь рассуждать вслух, ранние шаги ("сначала сложу эти два числа...") работают как черновик, на который опираются поздние шаги. По сути модель тратит больше вычислений на "размышление" до ответа, а промежуточные результаты не дают ей перескочить через важный шаг. Есть два основных варианта: zero-shot CoT, когда ты просто добавляешь фразу вроде "давай подумаем пошагово," и few-shot CoT (см. few-shot), когда ты показываешь пару полностью разобранных примеров, и модель копирует сам стиль рассуждения.
Разберём на примере. Спроси в лоб: "В магазине было 100 яблок, утром продали 23, днём 31 — сколько осталось?" — и модель может выпалить неверное число. Добавь "рассуждай пошагово", и она напишет: "Продажи утром: 23. Продажи днём: 31. Всего продано: 23 + 31 = 54. Осталось: 100 − 54 = 46." Видимая арифметика ловит ошибки, которые мгновенный ответ спрятал бы. Компромиссы: CoT тратит больше токенов и времени, а само объяснение может звучать убедительно, оставаясь при этом неверным — красивая цепочка это не доказательство, так что не считай её защитой от галлюцинаций (hallucinations). Для самых трудных задач комбинируй CoT с подходом Self-Consistency — сгенерируй несколько независимых цепочек рассуждений (с более высокой температурой (temperature)) и возьми ответ, который встречается чаще всего.
Представьте это как решение задачи вслух:
- 1. Читаю задачу: "Нужно найти, сколько денег осталось..."
- 2. Разбиваю на части: "Сначала посчитаю общую сумму трат..."
- 3. Выполняю шаги: "2000 + 1500 + 800 = 4300"
- 4. Делаю вывод: "10000 - 4300 = 5700 осталось"
Где это используется?
- Математические задачи: Многошаговые вычисления, текстовые задачи
- Логические рассуждения: Головоломки, задачи на дедукцию
- Сложные вопросы: Вопросы, требующие комбинации нескольких фактов
- Отладка кода: Пошаговый разбор выполнения кода
Интересный факт: Фраза "Давай подумаем пошагово" настолько мощная, что одна она может повысить точность на 10-40% в задачах на рассуждение! Это было открыто исследователями Google в 2022 году и называется "zero-shot CoT."
Попробуйте сами!
Используй интерактивный пример ниже, чтобы сравнить обычные промпты и Chain of Thought. Посмотри, как просьба рассуждать пошагово меняет качество ответов.
🔗 Chain of Thought (CoT) — техника, где модель "думает вслух" шаг за шагом. Это помогает решать сложные задачи точнее!
У Маши было 5 яблок. Она отдала 2 Пете, потом купила ещё 3. Сколько яблок у Маши?
6 яблок
Как писать CoT промпты:
1. Zero-shot CoT (простейший способ)
Просто добавь в конце промпта волшебную фразу, и модель начнёт рассуждать пошагово
Реши задачу: У Маши было 5 яблок. Она отдала 2 Пете, потом купила ещё 3. Сколько яблок у Маши? Давай подумаем пошагово.
2. Явный CoT (с структурой)
Задаём явную структуру рассуждений с пронумерованными шагами
Задача: Поезд едет со скоростью 60 км/ч. За сколько часов он проедет 180 км, если через каждые 60 км останавливается на 15 минут? Подумай пошагово: 1. Сначала определи чистое время в пути 2. Затем вычисли количество остановок 3. Посчитай общее время остановок 4. Сложи время в пути и время остановок Дай финальный ответ.
3. CoT с форматом вывода
Указываем формат для разделения рассуждений и финального ответа
Задача: В классе 30 учеников. 40% — мальчики. Сколько мальчиков присутствует, если 3 отсутствуют? Рассуждай так: <thinking> [твои пошаговые рассуждения здесь] </thinking> <answer> [финальный краткий ответ здесь] </answer>
CoT работает потому что заставляет модель "показать работу" — промежуточные шаги помогают избежать ошибок в сложных рассуждениях. Особенно полезно для математики, логики и многошаговых задач.
Частые вопросы
Что такое Chain-of-Thought (CoT) промптинг?
Chain-of-Thought промптинг — это техника, когда вы просите LLM показать свои рассуждения пошагово перед финальным ответом. Это значительно улучшает точность на сложных задачах вроде математики, логики и многошаговых рассуждений.
Насколько CoT улучшает точность?
Исследования показывают, что CoT может улучшить точность на 30-50% в сложных задачах рассуждений. На математическом бенчмарке GSM8K точность GPT-3 выросла с 17% до 58% при использовании CoT. Улучшение наиболее значительно в задачах, требующих многошаговых рассуждений.
Когда использовать Chain-of-Thought?
Используй CoT для: математических задач, логических рассуждений, многошаговых задач, принятия решений с множеством факторов, отладки кода или любой задачи, где промежуточные шаги рассуждений ценны. Пропускай для простых задач, где это добавляет ненужные затраты.
В чём разница между Zero-Shot CoT и Few-Shot CoT?
Zero-Shot CoT использует простые промпты вроде 'Давай подумаем пошагово' без примеров. Few-Shot CoT даёт 2-5 примеров пошаговых рассуждений перед реальным вопросом. Few-Shot обычно работает лучше, но требует больше токенов.
Попробуй сам
Интерактивное демо этой техники
У Маши было 5 яблок. Она отдала 2 Пете, потом купила ещё 3. Сколько яблок у Маши?
6 яблок.
Давай решим пошагово:
- Начальное количество: У Маши было 5 яблок
- Первое действие: Она отдала 2 Пете → 5 - 2 = 3 яблока
- Второе действие: Купила ещё 3 → 3 + 3 = 6 яблок
Ответ: У Маши 6 яблок.
Даже для простых задач CoT показывает ход мышления, что помогает проверить правильность и понять логику.
Создайте бесплатный аккаунт для решения челленджей
4 челленджей с AI-проверкой для этого урока
Этот урок — часть структурированного курса по LLM.
Мой путь обучения