Галлюцинации vision-моделей
Когда модель уверенно врёт
Проблема: Vision-модели галлюцинируют с идеальной уверенностью — видят несуществующие объекты, путают атрибуты, ошибаются в пространственных отношениях, дописывают закрытый текст и подставляют ожидаемые количества. Без знания этих режимов отказа невозможно строить надёжные приложения.
Решение: Пять типов визуальных галлюцинаций
Галлюцинация — это любой ответ, который модель выдаёт как факт, хотя на самом деле он не подтверждается входными данными. Vision-модели не просто ошибаются — они уверенно выдумывают детали, выглядящие абсолютно правдоподобно. Модель может "видеть" кота, который на деле рисунок на подушке, путать лево и право, придумывать текст на частично закрытой вывеске или подставлять ожидаемое количество вместо реального подсчёта. Опасность в том, что модель никак не показывает неуверенность: выдуманный и верный ответ звучат с одинаковой уверенностью.
Почему так происходит
Vision-language-модель по сути предсказывает следующий токен на основе патчей изображения и твоего промпта. Её учат выдавать самое вероятное продолжение, а не сообщать откалиброванную уверенность. Когда пиксели неоднозначны — размытая вывеска, заваленная полка, перекрытый объект — самый сильный приор часто берётся из языковой статистики, а не из картинки. Фразу «дюжина яиц» модель видела куда чаще, чем реально их пересчитывала, поэтому опирается на этот приор. Тот же механизм, что позволяет ей бегло описать фото, заставляет её фантазировать, когда доказательств мало. Поэтому пять режимов отказа — объекты, атрибуты, пространственные, OCR и подсчёт — кучкуются именно там, где визуальный сигнал слабее всего.
Разбор примера
Покажи модели фото парковки с семью машинами и спроси «Сколько здесь машин?». Частая ошибка — быстрый круглый ответ вроде «около дюжины», игнорирующий реальную сцену. Лечат это принудительным заземлением: промпт «Посчитай каждую машину по очереди и назови её цвет, прежде чем дать итог. Если какая-то машина частично скрыта и ты не уверен — скажи об этом». Просьба перечислить доказательства и явно отметить неуверенность стабильно снижает галлюцинации подсчёта и объектов — не потому что модель поумнела, а потому что ты убрал короткий путь к правдоподобной догадке. Любой ответ «с одного взгляда» о количестве, тексте или лево/право считай непроверенным, пока он не заземлён.
Представьте это как уверенного свидетеля, дающего ложные показания в суде:
- 1. Галлюцинация объектов: Модель "видит" объекты, которых нет — кота из рисунка на подушке, человека из тени
- 2. Галлюцинация атрибутов: Неправильный цвет, размер или количество — путает атрибуты соседних объектов
- 3. Пространственная галлюцинация: Путаница лево/право и перед/за — самая частая пространственная ошибка vision-моделей
- 4. OCR-галлюцинация: Дописывает скрытый или частичный текст правдоподобным, но неверным содержимым
- 5. Галлюцинация подсчёта: Подставляет ожидаемые количества (12 яиц в лотке) вместо реального подсчёта
Где это особенно важно
- Контроль качества: Обнаружение ложных дефектов в производстве — модель может "видеть" трещины, которые на самом деле тени
- Медицинская визуализация: Предотвращение ложных срабатываний: модель может галлюцинировать опухоли из артефактов или шума изображения
- Автономное вождение: Критическая безопасность: модель не должна галлюцинировать пешеходов или пропускать реальные препятствия
- Юридическая проверка документов: Предотвращение выдуманных пунктов или сумм — галлюцинированный текст в контрактах имеет юридические последствия
Интересный факт: Исследования OpenAI (2025) показывают, что модели обучены «блефовать» вместо выражения неуверенности. Когда модель говорит «Я вижу красную машину слева» со 100% уверенностью, её внутренняя уверенность может быть только 60%. Именно поэтому явные промпты верификации так важны.
Попробуйте сами!
Исследуй галерею ниже: 5 типов визуальных галлюцинаций, как они выглядят на практике, и конкретные стратегии промптов для обнаружения и предотвращения каждого из них.
Частые вопросы
Что такое галлюцинации vision-моделей?
Галлюцинация — это деталь, которую модель уверенно выдаёт как факт, хотя её нет на изображении: несуществующий объект, неверный цвет, перепутанные лево/право, выдуманный текст на вывеске или ошибочное количество. Опасность в том, что выдуманный ответ звучит так же уверенно, как и верный — модель не показывает неуверенности.
Почему ИИ галлюцинирует на изображениях?
Vision-language-модель предсказывает самое вероятное продолжение текста по патчам картинки и промпту, а не сообщает откалиброванную уверенность. Когда пиксели неоднозначны (размытие, перекрытие, мелкий текст), модель опирается на языковую статистику — например, на частую фразу «дюжина яиц» — вместо реального анализа изображения, и выдаёт правдоподобную догадку.
Как уменьшить галлюцинации при работе с vision-моделями?
Заземляй ответ: проси модель перечислять доказательства по одному (посчитай каждый объект, назови цвет), явно разрешай ответ «не уверен / не видно» и требуй отметить перекрытые или нечёткие участки. Любой ответ «с одного взгляда» о количестве, тексте или направлении считай непроверенным, пока он не подкреплён пошаговым разбором.
Какие бывают типы визуальных галлюцинаций?
Выделяют пять режимов: галлюцинация объектов (видит то, чего нет), атрибутов (неверный цвет/размер/путает атрибуты соседних объектов), пространственная (лево/право, перед/за), OCR (дописывает закрытый текст) и подсчёта (подставляет ожидаемое число вместо реального счёта). Все они возникают там, где визуальный сигнал слабее всего.
Попробуй сам
Интерактивное демо этой техники
Обнаружить галлюцинацию подсчёта в ответе vision-модели
В лотке 12 яиц.
Раздел сетки 2×6:
- [1,1]: ЯЙЦО [1,2]: ЯЙЦО [1,3]: ПУСТО [1,4]: ЯЙЦО [1,5]: ЯЙЦО [1,6]: ЯЙЦО
- [2,1]: ЯЙЦО [2,2]: ПУСТО [2,3]: ЯЙЦО [2,4]: ПУСТО [2,5]: ЯЙЦО [2,6]: ЯЙЦО
Яйца: 9. Пустые ячейки: 3. Итого: 9 яиц из 12 ячеек.
Модели по умолчанию выдают "типичное" количество (12 яиц в лотке). Chain-of-Thought с сеткой заставляет считать каждый элемент отдельно.
Создайте бесплатный аккаунт для решения челленджей
3 челленджей с AI-проверкой для этого урока
Этот урок — часть структурированного курса по LLM.
Мой путь обучения