Архитектуры агентов
MRKL, Reflexion, LATS
Проблема: Создание ИИ-агента — это не только про сам ИИ. Как структурировать всю систему? Как агенты общаются? Кто главный? Плохая архитектура ведёт к хаосу, даже с отличным ИИ.
Решение: Организационные паттерны
Как у компаний есть оргструктуры, так и у систем ИИ-агентов есть архитектуры. Один агент может следовать паттерну ReAct, тогда как мультиагентная система требует координации и маршрутизации. Независимо от формы, каждый агент полагается на вызов функций для взаимодействия с внешним миром.
Представьте это как разные структуры компаний:
- 1. Один агент (Фрилансер): Один ИИ делает всё. Просто, но ограниченно.
- 2. Последовательная (Конвейер): Агенты работают один за другим. Задача передаётся по цепочке.
- 3. Иерархическая (Корпорация): Агенты-менеджеры делегируют агентам-работникам.
- 4. Коллаборативная (Стартап): Агенты обсуждают и принимают решения вместе.
- 5. Супервайзер (Scrum-команда): Один координатор направляет задачи специалистам.
- 6. Граф-ориентированная (LangGraph): Агенты как узлы графа с условными рёбрами. Поддержка циклов, ветвлений, human-in-the-loop и персистентного состояния между запусками.
- 7. Командная (CrewAI): Ролевые агенты с предысториями и целями. Фреймворк автоматически обрабатывает делегирование задач, передачу результатов и проверку качества.
- 8. Swarm Handoffs (OpenAI): Минимальные накладные расходы: агенты передают друг другу контекст. Без центрального оркестратора. Лучше всего для маршрутизации поддержки и доменных пайплайнов.
Выбор архитектуры
- Сложность задачи: Простые → один агент; сложные → много агентов
- Нужен контроль: Высокие риски → иерархия с этапами одобрения
- Параллелизация: Независимые подзадачи → коллаборативная или супервайзер
- Специализация: Нужны разные навыки → специализированные агенты
- Фреймворк CrewAI: Определить агентов как «членов команды» с ролями (исследователь, писатель, ревьюер). У каждого агента — предыстория, цель и инструменты. Команда следует процессу (последовательный, иерархический или консенсусный).
- LangGraph: Граф-ориентированная оркестрация агентов от LangChain. Агенты — узлы, рёбра — переходы. Поддержка циклов, условной маршрутизации, checkpoints с участием человека и персистентного состояния.
- Паттерн Swarm: Лёгкие передачи между агентами (OpenAI Swarm). Каждый агент обрабатывает свою область, передаёт контекст следующему через handoff-функции. Центральный оркестратор не нужен.
Интересный факт: Самые продвинутые системы ИИ используют "смесь экспертов" — как иметь много консультантов-специалистов на связи. Маршрутизатор определяет, какого эксперта спросить для каждого вопроса. Именно так модели вроде GPT-4 справляются с такими разными задачами!
Попробуйте сами!
Исследуй интерактивную диаграмму ниже, чтобы увидеть, как разные архитектуры обрабатывают одну и ту же задачу. Обрати внимание на компромиссы между простотой, контролем и параллелизмом!
Попробуй сам
Интерактивное демо этой техники
Ответь на разнотипные вопросы: математическую задачу, перевод текста и вопрос о погоде.
- 15% от 240 = 36
- "meeting postponed" = "встреча перенесена"
- Вероятно, будет пасмурно. Проверьте прогноз.
[Router] Классификация запросов:
-
"15% от 240" → MathAgent [MathAgent] 240 * 0.15 = 36.00 ✓
-
"meeting postponed → русский" → TranslationAgent [TranslationAgent] "meeting postponed" = "встреча перенесена" (деловой контекст) ✓
-
"Дождь в Москве завтра" → WeatherAgent [WeatherAgent] → get_forecast("Moscow", "tomorrow") ← { "precipitation": 80%, "type": "rain", "temp": 5°C } Да, завтра в Москве ожидается дождь (вероятность 80%), температура около 5°C. ✓
Все 3 запроса обработаны специализированными агентами.
Архитектура "маршрутизатор" направляет запросы к экспертам. Один универсальный LLM справляется "средне" со всем, а специализированные агенты — отлично каждый в своей области.
Создайте бесплатный аккаунт для решения челленджей
3 челленджей с AI-проверкой для этого урока
Этот урок — часть структурированного курса по LLM.
Мой путь обучения