Опубликовано 10 апреля 2026 г.
#2: Mythos слишком опасен для релиза, GLM-5.1 обогнал Claude, Microsoft Agent Framework дошёл до 1.0
Главное за неделю
Claude Mythos Preview нашёл тысячи zero-day в операционных системах и браузерах — умеет не только находить уязвимости, но и писать эксплойты и собирать цепочки атак. Anthropic не выпускает модель публично: только 9 компаний (AWS, Apple, Google, Microsoft, Cisco, JPMorgan, CrowdStrike, Broadcom, Nvidia) получили доступ для defensive security через Project Glasswing. Компания выделила $100M в API-кредитах и $4M донатов open-source security.
Z.AI выпустил GLM-5.1 — 754B параметров под лицензией MIT. 58.4% на SWE-Bench Pro против Opus 4.6 (57.3%), GPT-5.4 (57.7%), Gemini 3.1 Pro (54.2%). Главная фишка — не деградирует на длинных задачах: держит 8 часов автономной работы и 6000+ tool calls в одной сессии, оптимизируя решения сотнями итераций.
3 апреля Microsoft выпустил Agent Framework 1.0 для .NET и Python. Production-ready: стабильные API, long-term support, поддержка MCP и A2A (agent-to-agent) из коробки. Коннекторы к Azure OpenAI, Anthropic, OpenAI, Amazon Bedrock, Google Gemini и Ollama. Для миграции с Semantic Kernel или AutoGen есть автоматический ассистент.
Новые инструменты
n8n AI Workflow Builder (beta)
Описываешь автоматизацию на естественном языке — n8n генерирует стартовый workflow. Плюс убрали лимит на количество активных workflow во всех тарифах: теперь платите только за исполнения.
N8nMCP v2.1 — Server Cards
Новый стандарт дискавери MCP-серверов через `.well-known` URL. Браузеры, crawlers и реестры узнают возможности сервера без подключения. Протокол пересёк 97M установок за март.
ModelcontextprotocolAMD PACE
Открытый фреймворк оптимизации инференса LLM на 5-м поколении EPYC CPU. Для тех, кто хостит open-source модели на своём железе без GPU — реальный способ снизить latency.
AmdРецепт недели
Мультиагентная команда на CrewAI: координатор + специалисты
CrewAI — это фреймворк, в котором несколько AI-агентов работают как настоящая команда: у каждого своя роль, свои инструменты и своя зона ответственности. Разбираем, как собрать исследовательскую команду из координатора и специалистов — от проектирования ролей до отладки первого реального сценария.
Полезная ссылка
Assessing Claude Mythos Preview's Cybersecurity Capabilities (Anthropic red team)
Технический отчёт о том, как Mythos находил zero-day, какие сценарии тестировались, и где модель провалилась. Для security-инженеров — обязательное чтение, для всех остальных — отрезвляющий взгляд на то, на что способны современные модели.
Цифра недели
Model Context Protocol пересёк 97M установок за март 2026 — каждый крупный AI-провайдер теперь поставляет MCP-совместимый tooling. Из эксперимента Anthropic за год превратился в дефолтный способ, которым агенты подключаются к инструментам.