Опубликовано 18 апреля 2026 г.

#3: Opus 4.7 обошёл всех, Claude Code получил Routines, OpenAI ответил cyber-моделью

Главное за неделю

Claude Opus 4.7 — новый флагман для кода

16 апреля Anthropic выпустил Claude Opus 4.7: 87.6% на SWE-bench Verified (было 80.8%) и 64.3% на SWE-bench Pro (было 53.4%). На GDPval-AA — 1753 Elo против GPT-5.4 (1674) и Gemini 3.1 Pro (1314). Цены прежние: $5/$25 за миллион input/output токенов. Из нового — команда /ultrareview в Claude Code, режим xhigh для более глубокого thinking, task budgets в public beta и зрение в 3× разрешении (до 2576px по длинной стороне).

Что это значит: Если ждали повод обновить daily driver для кода — вот он. Цена та же, прирост реальный на самых сложных задачах. /ultrareview — быстрый способ ловить баги до коммита. А если делаете OCR или анализ скриншотов — зрение наконец видит мелкий текст.

Anthropic

Claude Code получил параллельные сессии и Routines

14 апреля Anthropic перекроил десктоп Claude Code: боковая панель со всеми активными и недавними сессиями, drag-and-drop layout, встроенный терминал и редактор файлов, переработанный diff-viewer под большие чейнджсеты. Вторая новинка — Routines: агенты, которые запускаются без активной сессии — по расписанию, через API-вызов или по событию на GitHub (например, новый PR). Доступно на всех платных тарифах.

Что это значит: Агенты-на-кроне стали first-class. Настройте Routine «чинить упавшие тесты на main» — и перестаньте дёргаться на каждый красный CI. Параллельные сессии убирают налог на внимание, когда агенты работают в нескольких репо одновременно.

Claude

OpenAI выпустил GPT-5.4-Cyber — ответ Anthropic Glasswing

14 апреля OpenAI запустил GPT-5.4-Cyber — fine-tune флагмана, у которого опущен порог отказов по security-задачам. Умеет binary reverse engineering, анализ компилированного кода на уязвимости, написание defensive tooling. Доступ идёт через программу Trusted Access for Cyber (TAC) — тысячи верифицированных defenders и сотни команд. У Anthropic Glasswing — 9 партнёров.

Что это значит: OpenAI и Anthropic пошли в разные стороны: Anthropic — «модель слишком опасна, даём только 9 компаниям», OpenAI — «широкий доступ, но только верифицированным security-инженерам». Если работаете в infosec и писали промпты вокруг отказов — проще подать заявку в TAC и перестать танцевать.

Openai

Новые инструменты

Gemini Robotics-ER 1.6

Google DeepMind выпустил обновлённую reasoning-модель для робототехники. Pointing & counting — 80% (было 61%). Boston Dynamics Spot теперь читает аналоговые приборы с точностью 98% (было 23%). Если строите робота или ML-пайплайн со spatial reasoning — доступно через Gemini API и AI Studio.

Deepmind

Kimi K2.6 Code Preview

Moonshot AI раскатал K2.6 на всех подписчиков Kimi Code. В 5× дешевле на input ($0.60 vs $3) и в 6× на output ($2.50 vs $15) относительно Claude Sonnet 4.6. Глубже reasoning traces, надёжнее tool calls. Если жмёт бюджет на Claude Code — альтернатива.

Kimi

Cloudflare Code Mode MCP Server

MCP-сервер с агрессивной экономией токенов: только два тула — search() и execute(). Модель пишет JavaScript под type-aware SDK и выполняет его в V8-изоляте, не загружая определения всех endpoint-ов в контекст. Для интеграций с большими API — стратегия must-try.

Infoq

Рецепт недели

Агент для код-ревью на Claude Agent SDK

Код-ревью — идеальная задача для AI-агента: нужно читать контекст, искать связанные файлы, применять разные критерии к разным участкам кода. Разбираем, как построить агента, который делает ревью как опытный инженер — с приоритизацией замечаний, поиском контекста и структурированным отчётом прямо в GitHub.

Полезная ссылка

We tested Anthropic's redesigned Claude Code desktop app and Routines (VentureBeat)

Живой hands-on обзор новой десктопной версии Claude Code и Routines — с конкретными сценариями: сколько агентов тянет в параллель, как ведут себя Routines при отказах, что всё ещё приходится чинить руками. Если собираетесь внедрять у себя — сохраняйте.

Цифра недели

$242 млрд — 80% глобального венчурного капитала в Q1 2026 — ушло в AI-компании (Crunchbase). Четыре из пяти крупнейших раундов в истории закрыты в этом квартале: OpenAI ($122B), Anthropic ($30B), xAI ($20B), Waymo ($16B). Похоже, в 2026 под «венчуром» по умолчанию уже имеется в виду AI.

Все выпуски