Fine-tuning vs Промптинг
Когда дообучать модель
Проблема: Твой чат-бот должен знать продукты твоей компании. Стоит ли обучать свою модель или просто вставить информацию в промпт?
Решение: Репетитор vs учебник
Представь, что тебе нужно изучить новый предмет. Прежде чем браться за файн-тюнинг, попробуй улучшить результаты с помощью промпт-инжиниринга. Если этого недостаточно, у тебя два варианта:
- Учебник (prompting): читай главу перед каждым тестом. Быстро начать, но каждый раз перечитывать.
- Репетитор (fine-tuning): занимайся с учителем, пока не поймёшь. Требует времени вначале, но знания остаются.
Золотая середина: RAG
Есть третий вариант: Retrieval Augmented Generation. Это как учебник, который сам открывается на нужной странице! Он использует эмбеддинги, чтобы найти самые релевантные отрывки.
- Храни свои знания в поисковой базе данных
- Когда приходит вопрос, находи релевантную информацию
- Автоматически добавляй её в промпт
- Модель отвечает на основе свежих и точных данных
Когда всё-таки нужен файн-тюнинг, техники вроде QLoRA сочетают его с квантизацией, чтобы снизить расход памяти.
Представьте это как обучение с репетитором vs учебник:
- 1. Prompting лучше, когда: Информация часто меняется, нужно быстро стартовать, ограниченный бюджет, задача универсальная
- 2. Fine-tuning лучше, когда: Нужен специфический стиль или формат, есть много хороших примеров, важна скорость при инференсе, одна и та же задача повторяется тысячи раз
Типы файн-тюнинга
- Полный fine-tuning: переобучение всех весов. Максимальное качество, но дорого (нужно 8+ GPU)
- LoRA / QLoRA: обучение только маленьких адаптеров. Дёшево и быстро, 90% качества
- RLHF: обучение на человеческом фидбеке. Для обучения предпочтениям: быть полезным, а не вредным
- Instruction tuning: обучение следовать инструкциям. Превращает базовую модель в чат-бота
Интересный факт: Начни с prompting + RAG. Делай fine-tuning только когда упрёшься в чёткие ограничения. 80% задач никогда не требуют файн-тюнинга! Fine-tuning стоит дорого. Сначала исчерпай более дешёвые варианты.
Попробуйте сами!
Ниже — дерево решений. Ответь на несколько вопросов о твоей задаче, и узнай, какой подход рекомендуется именно тебе!
Попробуй сам
Интерактивное демо этой техники
Классифицировать медицинские симптомы по специализации врача
Дерматолог (покраснение) или Невролог (ощущение песка может быть неврологическим).
Не уверен в ответе — нужно больше контекста.
Офтальмолог (confidence: 0.96)
Сопутствующие специалисты: Аллерголог (0.23 — если аллергический конъюнктивит)
Few-shot ограничен количеством примеров в промпте. Fine-tuning «зашивает» тысячи примеров в веса модели — быстрее, дешевле за запрос и точнее для узких доменных задач.
Создайте бесплатный аккаунт для решения челленджей
3 челленджей с AI-проверкой для этого урока
Этот урок — часть структурированного курса по LLM.
Мой путь обучения