AI Рецепты
Практические пошаговые гайды для решения реальных задач с AI. Фокус на логике решения, а не на конкретных инструментах.
У человека есть рабочая, долговременная и процедурная память — у агента должно быть то же самое. В 2026 память перестала быть оптимизацией и стала архитектурным требованием: без неё каждая сессия начинается с нуля, а пользователь объясняет одно и то же третий раз подряд.
Открыть рецептАгенты слишком доверяют своему первому ответу — и ошибаются ровно там, где человек бы перечитал и поправил. Reflection заставляет модель сначала написать черновик, затем критиковать его, затем переписать — и качество резко растёт.
Открыть рецептВ 2026 году только 22% людей доверяют автономным агентам — и EU AI Act прямо требует человеческого контроля над high-risk системами. Агент, который умеет остановиться и спросить разрешения в критических точках, — это не баг, а обязательная часть production-архитектуры.
Открыть рецептБольшинство команд гоняет один премиум-LLM на всё — от классификации до архитектурных решений. Умный роутер сначала классифицирует запрос, потом диспетчеризует в дешёвую/среднюю/премиум-модель — и режет счёт на 30-80% без потери качества.
Открыть рецепт87% топовых моделей до сих пор уязвимы к jailbreak, штрафы по EU AI Act — до €35M, а слоистые guardrails ловят 95% инцидентов. Разбираем, как строить защиту на каждом шве пайплайна: один guardrail — это не guardrail, а ощущение страховки.
Открыть рецептВсе строят агентов, почти никто их не измеряет. Разбираемся, почему обычные тесты тут ломаются, как собрать первый eval-датасет за час, в чём разница между оценкой результата и оценкой траектории, и как не обмануть себя с LLM-as-judge.
Открыть рецептСамая дешёвая оптимизация LLM-приложения — не смена модели и не RAG, а правильно устроенный prefix cache. Разбираемся, как устроен кэш на самом деле, где ставить точки разрыва, почему порядок сегментов важнее содержания и как мерить hit-rate, чтобы не обманывать себя.
Открыть рецептКлассический RAG — не единственный способ строить личную базу знаний. Разбираем идею Андрея Карпати: LLM как библиотекарь, который сам поддерживает тематическую вики из ваших заметок. Когда это работает лучше RAG, как устроена структура и что делать, когда подход ломается.
Открыть рецептГолосовой агент — это не «текстовый бот плюс TTS». Это цепочка STT → LLM → TTS, которая должна успеть ответить за время, пока человек не начал говорить снова. Разбираем latency-бюджет, turn-taking, обработку прерываний и три типичные поломки streaming-пайплайна.
Открыть рецептVision-агенты, которые кликают по сайтам, — самый хайповый тренд автоматизации 2026. Разбираем, когда они действительно нужны (не всегда), в чём разница между DOM- и vision-подходами, почему «нажал — жду 2 секунды» почти всегда ломается и какие границы обязательно ставить до запуска в прод.
Открыть рецептАвтоматически анализирует тональность отзыва и генерирует персонализированный ответ. Разбираем главный принцип: один сложный промпт — зло, цепочка простых — сила. Строим воркфлоу с ветвлением на случай, когда AI нужно позвать человека.
Открыть рецептMCP (Model Context Protocol) — это USB-интерфейс для AI: стандартный разъём, через который Claude подключается к любому инструменту. Разбираем, как спроектировать и запустить собственный MCP-сервер — от выбора инструментов до первого вызова из Claude Desktop.
Открыть рецептКлассический RAG — конвейер без мозгов: запрос, поиск, ответ. Agentic RAG — это когда агент сам решает, нужен ли поиск, что искать и достаточно ли найденного. Разбираем, как превратить линейный пайплайн в цикл с принятием решений — на LangGraph и ChromaDB.
Открыть рецептКод-ревью — идеальная задача для AI-агента: нужно читать контекст, искать связанные файлы, применять разные критерии к разным участкам кода. Разбираем, как построить агента, который делает ревью как опытный инженер — с приоритизацией замечаний, поиском контекста и структурированным отчётом прямо в GitHub.
Открыть рецептЛюбая компания тонет в документах: счета, договоры, заявки, письма. AI умеет их читать — но чтобы это работало надёжно, нужна не одна волшебная кнопка, а конвейер: сначала понять что за документ, потом вытащить нужные данные, потом решить что с ними делать. Разбираем, как собрать такой пайплайн в n8n с Claude API.
Открыть рецептCrewAI — это фреймворк, в котором несколько AI-агентов работают как настоящая команда: у каждого своя роль, свои инструменты и своя зона ответственности. Разбираем, как собрать исследовательскую команду из координатора и специалистов — от проектирования ролей до отладки первого реального сценария.
Открыть рецепт