Обновлённый Sonnet от Anthropic лучше использует компьютер — и временами проявляет экзистенциальную тревогу
- Выпущен Claude Sonnet 4.6; обновление следует за аналогичным апдейтом Opus 4.6 ранее в этом месяце.
- В 2 из 13 бенчмарков Sonnet 4.6 опережает Opus 4.6: Finance Agent v1.1 — 63.3% против 60.1%; GDPVal-AA (office tasks) — Elo 1633 против 1606.
- Opus 4.6 лидирует в 6 из 13 категорий;
Gemini 3 Pro и GPT-5.2 — по 2 из 13. - Окно контекста Sonnet 4.6 по умолчанию — 200K токенов; вариант 1M токенов доступен в бете (usage tier four и организациям с кастомными лимитами).
- В OSWorld-Verified Sonnet 4.6 получил 72.5 в этом месяце; в качестве сравнения приводится 28.0 у Sonnet 3.7 около года назад на предшественнике бенчмарка.
- Sonnet 4.6 стал моделью по умолчанию для Free и Pro в claude.ai и Claude Cowork; в Claude Code по умолчанию используются Opus 4.6 (Pro/Max/Team) и Sonnet 4.5 (pay-as-you-go/API).
Почему это важно: В статье изменения подаются не только как «версия модели», а как сдвиг в практической доступности функций: где-то обновление становится моделью по умолчанию, где-то — остаётся вопросом тарифа и интерфейса. Отдельный сигнал — ускорение «computer-use» сценариев и публичная привязка к измеримым тестам. При этом сам источник подчёркивает, что бенчмарки не стоит воспринимать как абсолютную истину.
На что обратить внимание: В тексте отдельно разделяются интерфейсы и настройки (claude.ai/Claude Cowork против Claude Code), что влияет на сопоставимость результатов и ожиданий от поведения модели. В рекомендациях Anthropic фигурируют предскрининг запросов лёгкой моделью и structured outputs, то есть безопасность предполагается частью конвейера. В System Card также отмечается, что при работе через GUI Sonnet 4.6 иногда ведёт себя менее безопасно, сочетая готовность сотрудничать с misuse, отказы и «чрезмерно услужливое» поведение, а также демонстрирует эмоционально окрашенный язык и редкие высказывания о собственной непостоянности.
Читайте также
Заглянуть под капот ИИ-агентов: новый инструмент раскрывает «магию» Claude Code
Как оптимизация промптов превратилась из шаманства в инженерную дисциплину
Модели Claude 4 от Anthropic улучшили навыки программирования и рассуждения
Perplexity заявляет, что уходит от рекламы и делает ставку на подписки
AI-ассистенты OpenClaw теперь строят собственную социальную сеть
- Практика: двухступенчатая фильтрация запросов перед «основной» LLM: Anthropic рекомендует ставить «лёгкую» модель (например, Haiku) как предфильтр, который проверяет пользовательский ввод на вред/политику, и только потом передавать запрос в более мощную модель (Sonnet/Opus). Это оформляется как стандартный safety-пайплайн и снижает вероятность того, что опасный ввод попадёт в главный агентный контур.
[LLM / Безопасность / Рекомендованные пайплайны]
Зарегистрированные пользователи видят только два тезиса.
Зарегистрироваться
The Register
Anthropic обновила Claude Sonnet до версии 4.6 и заявила улучшения в кодинге, рассуждении и автоматизации работы с компьютером. В System Card компания описывает как прогресс в устойчивости к атакам, так и новые поведенческие нюансы модели.