Опубликовано 18 апреля 2026 г.
#3: Opus 4.7 обошёл всех, Claude Code получил Routines, OpenAI ответил cyber-моделью
Главное за неделю
16 апреля Anthropic выпустил Claude Opus 4.7: 87.6% на SWE-bench Verified (было 80.8%) и 64.3% на SWE-bench Pro (было 53.4%). На GDPval-AA — 1753 Elo против GPT-5.4 (1674) и Gemini 3.1 Pro (1314). Цены прежние: $5/$25 за миллион input/output токенов. Из нового — команда /ultrareview в Claude Code, режим xhigh для более глубокого thinking, task budgets в public beta и зрение в 3× разрешении (до 2576px по длинной стороне).
14 апреля Anthropic перекроил десктоп Claude Code: боковая панель со всеми активными и недавними сессиями, drag-and-drop layout, встроенный терминал и редактор файлов, переработанный diff-viewer под большие чейнджсеты. Вторая новинка — Routines: агенты, которые запускаются без активной сессии — по расписанию, через API-вызов или по событию на GitHub (например, новый PR). Доступно на всех платных тарифах.
14 апреля OpenAI запустил GPT-5.4-Cyber — fine-tune флагмана, у которого опущен порог отказов по security-задачам. Умеет binary reverse engineering, анализ компилированного кода на уязвимости, написание defensive tooling. Доступ идёт через программу Trusted Access for Cyber (TAC) — тысячи верифицированных defenders и сотни команд. У Anthropic Glasswing — 9 партнёров.
Новые инструменты
Gemini Robotics-ER 1.6
Google DeepMind выпустил обновлённую reasoning-модель для робототехники. Pointing & counting — 80% (было 61%). Boston Dynamics Spot теперь читает аналоговые приборы с точностью 98% (было 23%). Если строите робота или ML-пайплайн со spatial reasoning — доступно через Gemini API и AI Studio.
DeepmindKimi K2.6 Code Preview
Moonshot AI раскатал K2.6 на всех подписчиков Kimi Code. В 5× дешевле на input ($0.60 vs $3) и в 6× на output ($2.50 vs $15) относительно Claude Sonnet 4.6. Глубже reasoning traces, надёжнее tool calls. Если жмёт бюджет на Claude Code — альтернатива.
KimiCloudflare Code Mode MCP Server
MCP-сервер с агрессивной экономией токенов: только два тула — search() и execute(). Модель пишет JavaScript под type-aware SDK и выполняет его в V8-изоляте, не загружая определения всех endpoint-ов в контекст. Для интеграций с большими API — стратегия must-try.
InfoqРецепт недели
Агент для код-ревью на Claude Agent SDK
Код-ревью — идеальная задача для AI-агента: нужно читать контекст, искать связанные файлы, применять разные критерии к разным участкам кода. Разбираем, как построить агента, который делает ревью как опытный инженер — с приоритизацией замечаний, поиском контекста и структурированным отчётом прямо в GitHub.
Полезная ссылка
We tested Anthropic's redesigned Claude Code desktop app and Routines (VentureBeat)
Живой hands-on обзор новой десктопной версии Claude Code и Routines — с конкретными сценариями: сколько агентов тянет в параллель, как ведут себя Routines при отказах, что всё ещё приходится чинить руками. Если собираетесь внедрять у себя — сохраняйте.
Цифра недели
$242 млрд — 80% глобального венчурного капитала в Q1 2026 — ушло в AI-компании (Crunchbase). Четыре из пяти крупнейших раундов в истории закрыты в этом квартале: OpenAI ($122B), Anthropic ($30B), xAI ($20B), Waymo ($16B). Похоже, в 2026 под «венчуром» по умолчанию уже имеется в виду AI.