«Holy shit»: Gemini 3 выигрывает гонку ИИ — по крайней мере сейчас
Google представила
Gemini 3 и сразу встроила модель в поиск, добившись рекордного старта: за первые 24 часа её протестировали более 1 млн пользователей в AI Studio и через Gemini API. Модель возглавила рейтинги LMArena, первой преодолела планку ~1500 баллов на текстовом лидерборде и показала лидерство в категориях кодинга, креативного письма и визуального понимания. На бенчмарке ARC-AGI-2 Gemini 3 почти вдвое опередила GPT-5 Pro при десятикратно меньшей стоимости задачи, а на SimpleQA показала более чем двукратный отрыв от GPT-5.1.
Крупные игроки рынка, включая Sam Altman, Elon Musk и Marc Benioff, публично признают технологический рывок: для части пользователей Gemini 3 становится новым «дейли драйвером». Однако интервью с корпоративными клиентами показывают, что в проде сохраняются мультимодельные стеки: компании продолжают использовать
Claude для кодинга, продукты
OpenAI для бизнес-логики и специализированные модели, обученные на узкоспециализированных датасетах (право, медицина, силовые ведомства). Gemini 3 воспринимается как мощный универсальный инструмент для широкого круга задач и потребительских сценариев, но не как замена всего стека, а как очередной шаг в «гонке с обгоном» между релизами новых LLM.
Читайте также
Apple выбирает Google Gemini для крупного обновления Siri
Apple проиграла гонку ИИ — теперь начинается настоящий вызов
Сравнение ChatGPT 5.2 Pro, Claude Sonnet 4.5 и Gemini 3 Pro: кто лучше пишет тексты
AI Inbox от Google может стать взглядом в будущее Gmail
Google запускает Gemini 3 с новым приложением для программирования и рекордными результатами в бенчмарках
- LMArena как краудсорсинговый лидерборд LLM: LMArena выступает как краудсорсинговый рейтинг LLM, где инженеры и энтузиасты массово сравнивают модели по реальным задачам, а не только по академическим бенчмаркам. Попадание модели в топ LMArena формирует восприятие «лидера гонки» и влияет на выбор стеков в компаниях, поэтому такие рейтинги стоит отслеживать наряду с классическими метриками.
[Оценка и бенчмарки AI-моделей]
Зарегистрированные пользователи видят только два тезиса.
Зарегистрироваться