Opus 4.7, Codex управляет ПК, TTS от Google, а бренд кроссовок переходит в ИИ

18.04.2026 • Хабр

Нейро-дайджест Хабра сводит в один выпуск ключевые AI-новости недели: новые модели Anthropic, Alibaba, Google и Baidu, апгрейд Codex до компьютерного агента и несколько показательных кейсов на стыке ИИ, прав и хайпа.

Anthropic выпустила Claude Opus 4.7 и Claude Design. Opus 4.7 сильнее в длинных кодовых пайплайнах, агентной работе и многошаговых задачах: результат на SWE-bench Pro вырос с 53,4% до 64,3%, vision подняли до 3,75 МП, появился режим рассуждений xhigh и бета-ограничитель Task Budgets. Цена API осталась $5 / $25 за миллион токенов, но новый токенизатор на том же тексте может расходовать до 35% больше токенов.

OpenAI обновила Codex: агент теперь умеет видеть экран, двигать курсор и работать через GUI на macOS, а несколько агентов могут действовать параллельно без перехвата фокуса пользователя. В Codex добавили браузер для localhost, генерацию изображений через gpt-image-1.5, 90+ плагинов, память и автоматизации по расписанию. Google представила Gemini 3.1 Flash TTS с 70+ языками, 30 голосами и audio tags вроде [cough] или [whispers], а Baidu открыла ERNIE Image — 8B-генератор картинок с сильным рендерингом текста, Prompt Enhancer и запуском на 24 ГБ VRAM.

Отдельная часть выпуска показывает, как AI-инструменты выходят за пределы бенчмарков. OpenClaw-агента настроили на поиск публичных признаний в неуплате налогов и отправку отчётов в IRS, хотя юристы сомневаются в применимости такой схемы. Allbirds продаёт обувной бизнес за $39 млн и хочет стать NewBird AI с GPU-as-a-Service, ИИ-кавер «Седой ночи» с голосом Канье попал на первое место Shazam Top 200, а выдуманная «биксонимания» успела попасть в цепочку научного цитирования после ошибок LLM и авторов статьи.

Коротко

Claude Opus 4.7 подняла результат SWE-bench Pro с 53,4% до 64,3%, получила vision до 3,75 МП, режим xhigh и Task Budgets.
Codex получил computer use на macOS: агент видит экран, двигает курсор, работает через GUI и поддерживает параллельные сессии.
Gemini 3.1 Flash TTS поддерживает 70+ языков, 30 голосов и 200+ audio tags; тестирование доступно через AI Studio и Vertex AI.
Baidu открыла ERNIE Image на 8B параметров: модель сильна в тексте внутри изображения и запускается на 24 ГБ VRAM.
Кейсы Allbirds, OpenClaw, AI-каверов и биксонимании показывают бытовое и спорное применение ИИ вне продуктовых анонсов.

FAQ

Зачем следить за этим выпуском, если большинство новостей кажется просто очередными AI-анонсами крупных платформ?

В одном дайджесте собраны не только релизы моделей, но и изменения в сценариях применения: компьютерные агенты, TTS, генерация изображений, дизайн-инструменты и спорные бытовые кейсы.

Чем обновление Codex отличается от обычного ассистента для кода и почему в тексте выделен computer use?

Codex теперь описан как агент, который работает через графический интерфейс: видит экран, двигает курсор и выполняет действия в приложениях. Пока computer use доступен только на macOS.

Какие ограничения или риски прямо названы для новых AI-инструментов и кейсов из дайджеста?

Для Opus 4.7 указаны возможный рост расхода токенов и буквальная интерпретация старых промптов. Для SynthID показан риск обхода водяных знаков, а кейсы OpenClaw и биксонимании демонстрируют слабые места автоматизации и проверки источников.

PubMag

Opus 4.7, Codex управляет ПК, TTS от Google, а бренд кроссовок переходит в ИИ

Коротко

FAQ

Зачем следить за этим выпуском, если большинство новостей кажется просто очередными AI-анонсами крупных платформ?

Чем обновление Codex отличается от обычного ассистента для кода и почему в тексте выделен computer use?

Какие ограничения или риски прямо названы для новых AI-инструментов и кейсов из дайджеста?

Читайте также