Context Engineering
Дисциплина контекста
Представьте рабочий стол
Контекстное окно — это как рабочий стол с ограниченным пространством. Нельзя свалить на него всё подряд — нужно выбрать самое важное, аккуратно разложить и держать ключевые вещи под рукой. Context engineering — это умение организовать этот стол так, чтобы LLM работала максимально эффективно.
Что такое Context Engineering?
Context engineering — это дисциплина проектирования и оптимизации всего, что попадает на вход LLM: системный промпт, данные пользователя, примеры, история и инструкции. Цель — сделать каждый токен полезным.
Определение
Систематическая практика выбора, структурирования и приоритизации информации в конечном контекстном окне модели для максимизации качества ответа.
Почему это важно
Контекст — единственное, что видит модель. Плохой контекст = плохой ответ, независимо от качества модели. Хорошо спроектированный контекст позволяет маленькой модели превзойти большую.
vs Prompt Engineering
Prompt engineering фокусируется на написании хороших инструкций. Context engineering шире — он включает выбор данных, их структурирование, отсечение лишнего и управление бюджетом токенов.
Ключевой навык для продакшна
В продакшен-системах context engineering определяет стоимость, задержку и качество. Это разница между API-вызовом за $0.01 и за $0.50 для той же задачи.
5 столпов Context Engineering
Каждое решение в context engineering относится к одной из пяти областей.
Отбор — что включить
Выбирайте самую релевантную информацию. Не всё полезно — нерелевантные данные добавляют шум и тратят токены. Используйте оценку релевантности, фильтрацию и RAG.
Структура — как организовать
Порядок имеет значение. Системный промпт → инструкции → контекст → примеры → ввод пользователя → формат ответа. Используйте разделители (XML-теги, markdown) для чётких границ.
Сжатие — как вместить больше
Когда данные не помещаются в окно, сжимайте: суммаризируйте длинные тексты, разбивайте документы на чанки для RAG, используйте скользящее окно для истории чата.
Приоритизация — что важнее
Когда всё не помещается, приоритизируйте: текущий запрос > недавний контекст > релевантные данные > примеры > старая история. Свежесть и релевантность важнее полноты.
Бюджетирование — распределение токенов
Планируйте бюджет токенов: сколько на системный промпт, примеры, данные и резерв на ответ. Всегда оставляйте минимум 20% на ответ модели.
Типичная ошибка: stuffing без стратегии
Самая частая ошибка — сваливать всю доступную информацию в контекст без раздумий. Результат: упираетесь в лимит токенов, полезный сигнал тонет в шуме, и вы платите больше за худший результат. Всегда спрашивайте себя: «Нужна ли модели эта информация для ответа?»
С чего начать
Аудит текущих промптов
Посчитайте токены в каждой секции промпта. Определите, что действительно необходимо, а что — просто «на всякий случай». Уберите дубли.
Установите бюджет токенов
Распределите токены по приоритетам: системный промпт (5-10%), примеры (10-20%), данные пользователя (40-60%), резерв на ответ (20-30%). Корректируйте под задачу.
Выберите стратегию под тип данных
Мало данных → stuffing. Большой корпус → RAG. Длинные диалоги → скользящее окно + суммаризация. Документы → чанкинг + retrieval.
Измеряйте и итерируйте
Отслеживайте качество ответа vs. размер контекста. Часто фокусированный контекст на 2K токенов превосходит шумный на 100K. Меньше может быть лучше.
Интересный факт
Исследования Anthropic показали, что LLM уделяют больше внимания началу и концу контекста (эффект «lost in the middle»). Критически важную информацию нужно размещать в начале или конце контекста, а не прятать в середине.
Инженерия контекста
Попробуй сам
Интерактивное демо этой техники
Написать приветственное письмо клиенту — с системным промптом и без него
Уважаемый клиент! Добро пожаловать в наш магазин. Мы предлагаем широкий ассортимент товаров. Надеемся, вам понравится у нас. С уважением, Команда магазина.
Привет! Мы очень рады, что ты с нами! Ты теперь часть семьи СуперМаркета, а значит, шопинг станет ещё приятнее. Держи подарок на старт — промокод WELCOME10 на скидку 10% на первый заказ. Не стесняйся писать, если что-то нужно! С теплом, Лена из СуперМаркета
Системный промпт — это "ДНК" ответа. Он задаёт личность, тон и правила, превращая шаблонный текст в брендированное сообщение.
Создайте бесплатный аккаунт для решения челленджей
4 челленджей с AI-проверкой для этого урока
Этот урок — часть структурированного курса по LLM.
Мой путь обучения