Chain of Verification
Проверка каждого факта
Проблема: ИИ может уверенно давать неправильные ответы (галлюцинации). Как заставить ИИ перепроверять свою работу перед финальным ответом?
Решение: Двойная проверка как у бухгалтера
Chain of Verification (CoVe) — это техника промптинга, предложенная исследователями Meta AI в 2023 году, которая заставляет модель самостоятельно проверять свой черновой ответ до того, как выдать его как финальный. Вместо того чтобы доверять первому ответу, модель пишет черновик, формулирует короткий список проверочных вопросов, отвечает на каждый отдельно, а затем переписывает финальный ответ с учётом найденного. Это похоже на бухгалтера, который сверяет каждую строку отчёта с исходными чеками перед подписью, а не отдаёт первую посчитанную цифру.
Как это работает
Техника идёт в четыре шага. Сначала модель выдаёт базовый (baseline) ответ. Затем формулирует точечные проверочные вопросы, которые проверяют конкретные факты из этого ответа («В каком году основан X?», а не «Это верно?»). Третий шаг — самый важный: модель отвечает на эти вопросы независимо, в идеале не подглядывая в исходный черновик, чтобы не просто штамповать свои же утверждения. Наконец, она сравнивает независимые ответы с черновиком и исправляет всё, что не сходится. Именно независимость даёт CoVe силу: если проверка «заражена» первым ответом, модель склонна подтверждать свои собственные ошибки.
Когда использовать и на что смотреть
Бери CoVe для фактологических задач, где уверенный, но неверный ответ дорого стоит: проверка дат и имён, вопросы-списки («назови всех X»), извлечение данных и резюме, в которые нельзя добавлять новые факты. Техника снижает галлюцинации и хорошо сочетается с рассуждениями Chain-of-Thought. Цена вопроса — стоимость: ты платишь за несколько проходов модели вместо одного, и растёт задержка. К тому же CoVe не придумает знание, которого у модели не было: если модель просто не знает факт, проверка его не создаст — поэтому CoVe особенно хорош в паре с RAG, где на каждый проверочный вопрос можно ответить по найденным источникам. Разобранный пример: спрашиваешь «Какие политики родились в Нью-Йорке?», и модель выдаёт пять имён, два из них ошибочны. Дальше CoVe по очереди спрашивает «Где родился каждый из них?»; при независимой проверке две неверные записи не проходят проверку и удаляются, оставляя чистый, проверенный список.
Представьте это как бухгалтер, перепроверяющий работу:
- 1. Начальный ответ: "Итого 542 000 руб."
- 2. Генерируем проверки: "Сходится ли строка 3? Правильный ли НДС?"
- 3. Проверяем каждую: Проверяем каждую часть независимо
- 4. Исправляем при необходимости: "Строка 3 была неверна, исправленный итог: 532 000"
Где это используется?
- Проверка фактов: Верификация утверждений в сгенерированном контенте
- Извлечение данных: Подтверждение точности извлечённой информации
- Резюмирование: Проверка, что резюме не вносит ошибок
- Ответы на вопросы: Валидация ответов по исходному материалу
Интересный факт: Chain of Verification может снизить галлюцинации до 50% на фактологических задачах! Ключ в том, что проверочные вопросы отвечаются независимо, поэтому ИИ не просто подтверждает свои изначальные ошибки.
Попробуйте сами!
Используй интерактивный пример ниже, чтобы увидеть, как проверочные вопросы помогают находить и исправлять ошибки в ответах ИИ.
🔍 Chain of Verification — после генерации ответа модель проверяет каждое фактическое утверждение и исправляет ошибки. Особенно полезно для вопросов, требующих точных данных.
Расскажи о Эйфелевой башне.
Эйфелева башня — железная решётчатая башня в Париже, построенная в 1889 году. Её высота 324 метра. Это самое высокое сооружение Франции и самая посещаемая достопримечательность мира.
Расскажи о Эйфелевой башне. После ответа: 1. Выдели каждое фактическое утверждение 2. Проверь каждое утверждение на точность 3. Исправь ошибки в финальном ответе
LLM часто "галлюцинируют" — уверенно выдают неверные факты. Chain of Verification заставляет модель критически проверить каждое утверждение отдельно, что снижает количество фактических ошибок на 50-70%.
Частые вопросы
Что такое Chain of Verification (CoVe)?
Chain of Verification (CoVe) — это техника промптинга от Meta AI (2023), при которой модель сама проверяет свой черновой ответ: пишет черновик, формулирует проверочные вопросы, отвечает на них независимо и переписывает финальный ответ с учётом найденного. Это снижает количество фактических ошибок.
Чем Chain of Verification отличается от Chain-of-Thought?
Chain-of-Thought раскладывает само рассуждение на шаги, чтобы прийти к ответу. Chain of Verification работает уже над готовым черновиком: модель отдельно проверяет факты в нём и исправляет ошибки. Техники дополняют друг друга — сначала CoT для рассуждения, потом CoVe для проверки фактов.
Помогает ли CoVe против галлюцинаций ИИ?
Да. Ключевая идея в том, что проверочные вопросы отвечаются независимо, без оглядки на исходный черновик, поэтому модель не подтверждает свои же ошибки, а ловит их. На фактологических задачах это заметно снижает галлюцинации. Но CoVe не придумает факт, которого модель не знает — для этого его лучше сочетать с RAG.
Когда стоит использовать Chain of Verification?
Используй CoVe для фактологических задач, где уверенный, но неверный ответ дорого стоит: проверка дат и имён, вопросы-списки, извлечение данных, резюме без новых фактов. Минус — стоимость: несколько проходов модели вместо одного и большая задержка, поэтому для простых задач он избыточен.
Попробуй сам
Интерактивное демо этой техники
Назови 3 факта о Эйфелевой башне.
- Эйфелева башня была построена в 1889 году
- Её высота составляет 324 метра
- Она была самым высоким зданием в мире до 1930 года
ФАКТЫ:
- Эйфелева башня была построена в 1889 году
- Её высота составляет 324 метра
- Она была самым высоким зданием в мире до 1930 года
🔍 ВЕРИФИКАЦИЯ:
Факт 1: 1889 год ✅ Уверенность: ВЫСОКАЯ Построена к Всемирной выставке 1889 года (100-летие Французской революции) Статус: ПОДТВЕРЖДЁН
Факт 2: 324 метра ⚠️ Уверенность: СРЕДНЯЯ Проверка: Оригинальная высота была 300м. С антенной — 330м (современная).
📝 ИСПРАВЛЕНИЕ: Высота: 330 метров (с антенной), 300м без антенны.
Факт 3: Самое высокое до 1930 ⚠️ Уверенность: СРЕДНЯЯ Проверка: Крайслер-билдинг (319м) построен в 1930, но Эмпайр-стейт (381м) — в 1931.
📝 УТОЧНЕНИЕ: Была самым высоким сооружением до 1930 года (Крайслер-билдинг).
✅ ВЕРИФИЦИРОВАННЫЙ ОТВЕТ:
- Построена в 1889 году к Всемирной выставке ✓
- Высота: 330м с антенной (300м без) — уточнено
- Самое высокое сооружение в мире до 1930 года ✓
Chain of Verification заставляет модель проверять факты и честно указывать уровень уверенности. Найдена неточность в высоте.
Создайте бесплатный аккаунт для решения челленджей
3 челленджей с AI-проверкой для этого урока
Этот урок — часть структурированного курса по LLM.
Мой путь обучения