Как использовать Qwen3.7-Max и Grok Build 0.1 для ИИ-агентов в России

22.05.2026 • Хабр

Alibaba и xAI почти одновременно вывели две модели для автономных ИИ-агентов: Qwen3.7-Max и Grok Build 0.1. Первая делает ставку на долгие многошаговые задачи, вторая — на скорость, большое контекстное окно и дешёвый API-доступ.

Qwen3.7-Max описывается как флагман Alibaba для кодинг-агентов, офисной автоматизации и длительных задач. В бенчмарках у неё 92.4 на GPQA Diamond, 97.1 на HMMT и 87 на SpreadSheetBench, а в демонстрации автономного прогона модель за примерно 35 часов сделала более 1100 вызовов инструментов и добилась 10-кратного ускорения вычислительного ядра на незнакомом железе без документации.

Grok Build 0.1 от xAI появился на OpenRouter 20 мая и ориентирован на агентные сценарии в разработке. У модели заявлено контекстное окно 256K токенов без ограничения на выходной текст, API-цены $1 за миллион входных и $2 за миллион выходных токенов, а по ранним тестам сообщества она способна быстро генерировать интерфейсы «с одного выстрела».

Отдельная часть посвящена утечке системного промпта Grok Build 0.1 через reasoning: из неё следует, что ответ собирается цепочкой из «модели-мыслителя» и «модели-редактора». Для российского доступа обе модели уже подключены в SpeShu.AI: заявлены работа без VPN, оплата в рублях по СБП, документы, ЭДО, единый баланс и API с 300+ моделями по одному ключу.

Коротко

Qwen3.7-Max создана для кодинг-агентов, офисной автоматизации и долгих многошаговых задач с большим числом вызовов инструментов.
В демонстрации Alibaba модель за около 35 часов сделала 1100+ tool calls и ускорила вычислительное ядро в 10 раз.
Grok Build 0.1 доступен через OpenRouter: контекст 256K токенов, без лимита на output, $1/$2 за миллион токенов input/output.
Утечка системного промпта Grok Build 0.1 указывает на цепочку из модели-мыслителя и модели-редактора.
SpeShu.AI предлагает доступ к Qwen3.7-Max и Grok Build 0.1 в России без VPN, с оплатой в рублях, ЭДО и единым API.

FAQ

Зачем тестировать Qwen3.7-Max и Grok Build 0.1, если уже есть Claude, DeepSeek и другие кодинг-модели?

Обе модели заточены под автономных агентов, но делают это по-разному: Qwen3.7-Max показывает длинный многошаговый прогон, а Grok Build 0.1 делает ставку на скорость, цену и большой контекст.

Чем Qwen3.7-Max отличается от Grok Build 0.1 в практическом применении для разработки и агентных задач?

Qwen3.7-Max сильнее раскрывается в долгих автономных задачах с инструментами и итерациями. Grok Build 0.1 выглядит интереснее для быстрых coding/UI-задач и работы с большими кодовыми базами.

Какую проблему создаёт утечка системного промпта Grok Build 0.1 через reasoning-слой модели?

По описанию источника, утечка показала двухступенчатую схему ответа и потенциальную точку влияния на финальный ответ, если контент попадает в слой сырого рассуждения.

PubMag

Как использовать Qwen3.7-Max и Grok Build 0.1 для ИИ-агентов в России

Коротко

FAQ

Зачем тестировать Qwen3.7-Max и Grok Build 0.1, если уже есть Claude, DeepSeek и другие кодинг-модели?

Чем Qwen3.7-Max отличается от Grok Build 0.1 в практическом применении для разработки и агентных задач?

Какую проблему создаёт утечка системного промпта Grok Build 0.1 через reasoning-слой модели?

Читайте также