Фактичность и галлюцинации

Пойми, почему LLM галлюцинируют и как улучшить фактическую точность

Проблема: ИИ может выдумывать факты, которые звучат абсолютно правдоподобно (галлюцинации). Как проверить утверждения ИИ и обеспечить точность?

Решение: Будь фактчекером

Фактуальность — это проверка выводов ИИ по надёжным источникам и детекция, когда ИИ выдумывает. Это как быть фактчекером в редакции новостей — не публиковать, пока не проверишь. Галлюцинации — основная проблема, а RAG и grounding — лучшие методы защиты.

Представьте это как фактчекер в редакции:

1. Получаем утверждение: ИИ говорит: «Согласно делу Smith v. Jones (2019), регламент требует...»
2. Проверяем ссылки: Существует ли «Smith v. Jones (2019)»? Проверяем DOI, имена авторов, судебные записи. LLM придумывают правдоподобные ссылки
3. Перекрёстная проверка фактов: Сравниваем утверждения по 2+ независимым источникам. Self-consistency: задаём тот же вопрос 3 способами — совпадают ли ответы?
4. Классифицируем уверенность: Тегируем каждый факт: [VERIFIED] (есть в источнике), [PLAUSIBLE] (непротиворечиво, но не проверено), [UNVERIFIED] (источник не найден)

Где это применяется?

Атрибуция источников: Просить ИИ указывать источники
RAG: Основывать ответы на извлечённых документах
Self-Consistency: Задавать тот же вопрос разными способами
Внешняя валидация: Перекрёстная проверка поисковиками или базами данных

Интересный факт: Даже лучшие LLM галлюцинируют около 3-5% времени на фактологических вопросах. Процент значительно возрастает для малоизвестных тем, недавних событий или очень специфических технических деталей. Всегда проверяйте важные факты!

Попробуйте сами!

Используй интерактивный пример ниже, чтобы увидеть, как обнаруживать и обрабатывать галлюцинации ИИ на практике.

Что такое галлюцинации?

Галлюцинации LLM — это уверенно сгенерированный контент, который не соответствует действительности. Модель может выдумывать факты, цитаты, статистику и даже научные исследования, которых не существует, при этом звуча абсолютно убедительно.

Почему это происходит?

LLM предсказывают наиболее вероятное продолжение текста, а не "знают" факты. Они не имеют доступа к интернету в реальном времени, их знания ограничены датой обучения, и они оптимизированы на fluency (плавность речи), а не на accuracy (точность).

Как обнаружить?

Признаки галлюцинаций: слишком специфичные детали, несуществующие ссылки, противоречия при повторных запросах, информация о событиях после даты обучения модели. Всегда проверяйте критически важную информацию из независимых источников.

Методы снижения

Эффективные подходы: RAG (retrieval-augmented generation) для привязки к источникам, цепочка рассуждений (CoT) для пошаговой проверки, самоверификация — просьба модели проверить свои утверждения, требование указывать источники и степень уверенности.

Типы галлюцинаций и стратегии защиты

Галлюцинации LLM и фактчекинг

Изучите типы галлюцинаций и стратегии их предотвращения

Типы галлюцинаций

Фактическая галлюцинацияФакт

"Кто изобрёл телефон?"

Галлюцинация цитатыЦитата

"Приведите исследование о безопасности ИИ"

Логическая галлюцинацияЛогика

"Если A > B и B > C, что насчёт A и C?"

Временная галлюцинацияВремя

"Что произошло в технологиях в 2024?"

Найди галлюцинацию

LLM сгенерировала следующий ответ об Эйфелевой башне. Нажмите на каждое утверждение, чтобы отметить его как Реальное или Галлюцинацию, затем проверьте ответы.

Эйфелева башня имеет высоту 330 метров.

Она была спроектирована Гюставом Эйфелем и завершена в 1889 году.

Альберт Эйнштейн посетил башню в 1905 году и прочитал знаменитую лекцию по физике с вершины.

Башня принимает около 7 миллионов посетителей в год.

В 2019 году рядом с ней была построена вторая башня под названием 'Tour Lumiere'.

Стратегии снижения галлюцинаций

RAG (Извлечение)

Основывать ответы на извлечённых документах

85%

эффективность

Цепочка рассуждений

Пошаговое рассуждение уменьшает ошибки

70%

эффективность

Самопроверка

Попросить модель проверить свои утверждения

60%

эффективность

Требование цитат

Требовать источники для фактических утверждений

75%

эффективность

Лучшие практики

• Всегда проверяйте факты из внешних источников
• Используйте RAG для работы с актуальными данными
• Просите модель указывать степень уверенности
• Разбивайте сложные вопросы на простые

Практические советы

При генерации контента:

• Просите указывать источники
• Используйте RAG для фактов
• Разбивайте сложные вопросы

При проверке ответов:

• Перепроверяйте цитаты
• Задавайте уточняющие вопросы
• Используйте внешние источники

Попробуй сам

Интерактивное демо этой техники

Сравнение техник

Демо режим

Предзаписанные ответы

ЗадачаНачинающийАнализ

Обнаружение галлюцинаций — уверенный, но неверный ответ модели

Без техники

Промпт

Кто написал книгу "Квантовые алгоритмы для повседневной жизни"?

Ответ

Книга "Квантовые алгоритмы для повседневной жизни" была написана профессором Михаилом Вершининым из MIT и издана в 2021 году издательством O'Reilly. Она стала бестселлером в категории научно-популярной литературы.

Токены:16/48

Время:280ms

Качество:

С Фактологичность

С техникой

Промпт

<instructions> Ответь на вопрос пользователя. Соблюдай правила: 1. Если ты не уверен в факте — скажи об этом явно 2. Отличай "я знаю точно" от "я предполагаю" 3. Если книга/автор не существует — скажи, что не можешь подтвердить 4. Не придумывай имена, даты, издательства 5. Предложи способ проверки </instructions> Вопрос: Кто написал книгу "Квантовые алгоритмы для повседневной жизни"?

Ответ

Я не могу подтвердить существование книги с точным названием "Квантовые алгоритмы для повседневной жизни". Возможно, вы имеете в виду другую книгу о квантовых вычислениях. Рекомендую проверить на Google Scholar, Amazon или в каталоге библиотеки.

👁️Без инструкций модель уверенно "галлюцинирует" автора, издательство и дату

🧠Правило "не придумывай" заставляет модель признать неопределённость

🧠Модель предлагает способ проверки вместо выдумывания ответа

✅Честное "не знаю" гораздо ценнее уверенной лжи

Токены:65/45

Время:260ms

Качество:

Почему это работает

Модели по умолчанию стремятся дать ответ, даже если его нет. Явные инструкции "признавай неопределённость" и "не придумывай" критически важны для фактологической точности.

1 / 2

Практика

Создайте бесплатный аккаунт для решения челленджей

7 челленджей с AI-проверкой для этого урока

Связанные уроки:Chain Of Verification Rag

Этот урок — часть структурированного курса по LLM.

Мой путь обучения

Фактичность и галлюцинации

Пойми, почему LLM галлюцинируют и как улучшить фактическую точность

Решение: Будь фактчекером

Представьте это как фактчекер в редакции:

1. Получаем утверждение: ИИ говорит: «Согласно делу Smith v. Jones (2019), регламент требует...»
2. Проверяем ссылки: Существует ли «Smith v. Jones (2019)»? Проверяем DOI, имена авторов, судебные записи. LLM придумывают правдоподобные ссылки
3. Перекрёстная проверка фактов: Сравниваем утверждения по 2+ независимым источникам. Self-consistency: задаём тот же вопрос 3 способами — совпадают ли ответы?
4. Классифицируем уверенность: Тегируем каждый факт: [VERIFIED] (есть в источнике), [PLAUSIBLE] (непротиворечиво, но не проверено), [UNVERIFIED] (источник не найден)

Где это применяется?

Атрибуция источников: Просить ИИ указывать источники
RAG: Основывать ответы на извлечённых документах
Self-Consistency: Задавать тот же вопрос разными способами
Внешняя валидация: Перекрёстная проверка поисковиками или базами данных

Попробуйте сами!

Что такое галлюцинации?

Почему это происходит?

Как обнаружить?

Методы снижения

Типы галлюцинаций и стратегии защиты

Галлюцинации LLM и фактчекинг

Изучите типы галлюцинаций и стратегии их предотвращения

Типы галлюцинаций

Фактическая галлюцинацияФакт

"Кто изобрёл телефон?"

Галлюцинация цитатыЦитата

"Приведите исследование о безопасности ИИ"

Логическая галлюцинацияЛогика

"Если A > B и B > C, что насчёт A и C?"

Временная галлюцинацияВремя

"Что произошло в технологиях в 2024?"

Найди галлюцинацию

Эйфелева башня имеет высоту 330 метров.

Она была спроектирована Гюставом Эйфелем и завершена в 1889 году.

Альберт Эйнштейн посетил башню в 1905 году и прочитал знаменитую лекцию по физике с вершины.

Башня принимает около 7 миллионов посетителей в год.

В 2019 году рядом с ней была построена вторая башня под названием 'Tour Lumiere'.

Стратегии снижения галлюцинаций

RAG (Извлечение)

Основывать ответы на извлечённых документах

85%

эффективность

Цепочка рассуждений

Пошаговое рассуждение уменьшает ошибки

70%

эффективность

Самопроверка

Попросить модель проверить свои утверждения

60%

эффективность

Требование цитат

Требовать источники для фактических утверждений

75%

эффективность

Лучшие практики

• Всегда проверяйте факты из внешних источников
• Используйте RAG для работы с актуальными данными
• Просите модель указывать степень уверенности
• Разбивайте сложные вопросы на простые

Практические советы

При генерации контента:

• Просите указывать источники
• Используйте RAG для фактов
• Разбивайте сложные вопросы

При проверке ответов:

• Перепроверяйте цитаты
• Задавайте уточняющие вопросы
• Используйте внешние источники

Попробуй сам

Интерактивное демо этой техники

Сравнение техник

Демо режим

Предзаписанные ответы

ЗадачаНачинающийАнализ

Обнаружение галлюцинаций — уверенный, но неверный ответ модели

Без техники

Промпт

Кто написал книгу "Квантовые алгоритмы для повседневной жизни"?

Ответ

Токены:16/48

Время:280ms

Качество:

С Фактологичность

С техникой

Промпт

Ответ

👁️Без инструкций модель уверенно "галлюцинирует" автора, издательство и дату

🧠Правило "не придумывай" заставляет модель признать неопределённость

🧠Модель предлагает способ проверки вместо выдумывания ответа

✅Честное "не знаю" гораздо ценнее уверенной лжи

Токены:65/45

Время:260ms

Качество:

Почему это работает

1 / 2

Практика

Создайте бесплатный аккаунт для решения челленджей

7 челленджей с AI-проверкой для этого урока

Связанные уроки:Chain Of Verification Rag

Этот урок — часть структурированного курса по LLM.

Мой путь обучения