Opus 4.7, Codex управляет ПК, TTS от Google, а бренд кроссовок переходит в ИИ

Нейро-дайджест Хабра сводит в один выпуск ключевые AI-новости недели: новые модели Anthropic, Alibaba, Google и Baidu, апгрейд Codex до компьютерного агента и несколько показательных кейсов на стыке ИИ, прав и хайпа.

Anthropic выпустила Claude Opus 4.7 и Claude Design. Opus 4.7 сильнее в длинных кодовых пайплайнах, агентной работе и многошаговых задачах: результат на SWE-bench Pro вырос с 53,4% до 64,3%, vision подняли до 3,75 МП, появился режим рассуждений xhigh и бета-ограничитель Task Budgets. Цена API осталась $5 / $25 за миллион токенов, но новый токенизатор на том же тексте может расходовать до 35% больше токенов.

OpenAI обновила Codex: агент теперь умеет видеть экран, двигать курсор и работать через GUI на macOS, а несколько агентов могут действовать параллельно без перехвата фокуса пользователя. В Codex добавили браузер для localhost, генерацию изображений через gpt-image-1.5, 90+ плагинов, память и автоматизации по расписанию. Google представила Gemini 3.1 Flash TTS с 70+ языками, 30 голосами и audio tags вроде [cough] или [whispers], а Baidu открыла ERNIE Image — 8B-генератор картинок с сильным рендерингом текста, Prompt Enhancer и запуском на 24 ГБ VRAM.

Отдельная часть выпуска показывает, как AI-инструменты выходят за пределы бенчмарков. OpenClaw-агента настроили на поиск публичных признаний в неуплате налогов и отправку отчётов в IRS, хотя юристы сомневаются в применимости такой схемы. Allbirds продаёт обувной бизнес за $39 млн и хочет стать NewBird AI с GPU-as-a-Service, ИИ-кавер «Седой ночи» с голосом Канье попал на первое место Shazam Top 200, а выдуманная «биксонимания» успела попасть в цепочку научного цитирования после ошибок LLM и авторов статьи.

Коротко

  • Claude Opus 4.7 подняла результат SWE-bench Pro с 53,4% до 64,3%, получила vision до 3,75 МП, режим xhigh и Task Budgets.
  • Codex получил computer use на macOS: агент видит экран, двигает курсор, работает через GUI и поддерживает параллельные сессии.
  • Gemini 3.1 Flash TTS поддерживает 70+ языков, 30 голосов и 200+ audio tags; тестирование доступно через AI Studio и Vertex AI.
  • Baidu открыла ERNIE Image на 8B параметров: модель сильна в тексте внутри изображения и запускается на 24 ГБ VRAM.
  • Кейсы Allbirds, OpenClaw, AI-каверов и биксонимании показывают бытовое и спорное применение ИИ вне продуктовых анонсов.

FAQ

Зачем следить за этим выпуском, если большинство новостей кажется просто очередными AI-анонсами крупных платформ?

В одном дайджесте собраны не только релизы моделей, но и изменения в сценариях применения: компьютерные агенты, TTS, генерация изображений, дизайн-инструменты и спорные бытовые кейсы.

Чем обновление Codex отличается от обычного ассистента для кода и почему в тексте выделен computer use?

Codex теперь описан как агент, который работает через графический интерфейс: видит экран, двигает курсор и выполняет действия в приложениях. Пока computer use доступен только на macOS.

Какие ограничения или риски прямо названы для новых AI-инструментов и кейсов из дайджеста?

Для Opus 4.7 указаны возможный рост расхода токенов и буквальная интерпретация старых промптов. Для SynthID показан риск обхода водяных знаков, а кейсы OpenClaw и биксонимании демонстрируют слабые места автоматизации и проверки источников.

Читайте также

  1. Как Meta* убила Llama, чтобы спасти свой ИИ-бизнес
  2. Как я локально тестировал новый Qwen 3.6 и Gemma 4
  3. Дружба Linux и Windows, или как поиграться с ИИ-моделями на втором компьютере без видеокарты
  4. Когда, зачем и как правильно начинать новую сессию в Claude Code
  5. App Store снова растёт, и причиной может быть AI
Ключевые инсайты из новости (по версии ChatGPT)
  • Рост качества агентных моделей не отменяет контроля стоимости токенов: Claude Opus 4.7 показывает, что улучшение агентных и кодовых сценариев может сопровождаться скрытым ростом себестоимости. При той же цене API новый токенизатор может расходовать до 35% больше токенов на том же тексте, поэтому при обновлении модели нужно отдельно проверять фактический token usage на типовых задачах.
    [AI-инфраструктура и стоимость LLM]
Для получения полного доступа оформите подписку PubMag PRO.
Зарегистрированные пользователи видят только два тезиса.
Зарегистрироваться
Инсайты автоматически генерируются с помощью искусственного интеллекта на основе текста статьи.
← Назад в лентуЧитать оригинал →
✈️ Подписывайтесь на мой Telegram-канал — там еще больше интересного про AdTech, MarTech, AI и многое другое!