«Holy shit»: Gemini 3 выигрывает гонку ИИ — по крайней мере сейчас

представила 3 и сразу встроила модель в поиск, добившись рекордного старта: за первые 24 часа её протестировали более 1 млн пользователей в AI Studio и через Gemini API. Модель возглавила рейтинги LMArena, первой преодолела планку ~1500 баллов на текстовом лидерборде и показала лидерство в категориях кодинга, креативного письма и визуального понимания. На бенчмарке ARC-AGI-2 Gemini 3 почти вдвое опередила GPT-5 Pro при десятикратно меньшей стоимости задачи, а на SimpleQA показала более чем двукратный отрыв от GPT-5.1.

Крупные игроки рынка, включая Sam Altman, Elon Musk и Marc Benioff, публично признают технологический рывок: для части пользователей Gemini 3 становится новым «дейли драйвером». Однако интервью с корпоративными клиентами показывают, что в проде сохраняются мультимодельные стеки: компании продолжают использовать для кодинга, продукты для бизнес-логики и специализированные модели, обученные на узкоспециализированных датасетах (право, медицина, силовые ведомства). Gemini 3 воспринимается как мощный универсальный инструмент для широкого круга задач и потребительских сценариев, но не как замена всего стека, а как очередной шаг в «гонке с обгоном» между релизами новых LLM.

Читайте также

  1. Google запускает Gemini 3 с новым приложением для программирования и рекордными результатами в бенчмарках
  2. Google запускает Gemini 3 — свою «самую умную» AI-модель
  3. Новый поиск Google Scholar Labs на базе ИИ помогает находить релевантные исследования
  4. Google Antigravity — «agent-first»-инструмент для разработки на базе Gemini 3
  5. Бизнес в России сможет создавать ИИ-агентов с интернет-поиском
Ключевые инсайты из новости (по версии ChatGPT)
  • LMArena как краудсорсинговый лидерборд LLM: LMArena выступает как краудсорсинговый рейтинг LLM, где инженеры и энтузиасты массово сравнивают модели по реальным задачам, а не только по академическим бенчмаркам. Попадание модели в топ LMArena формирует восприятие «лидера гонки» и влияет на выбор стеков в компаниях, поэтому такие рейтинги стоит отслеживать наряду с классическими метриками.
    [Оценка и бенчмарки AI-моделей]
Для получения полного доступа оформите подписку PubMag PRO.
Зарегистрированные пользователи видят только два тезиса.
Зарегистрироваться
Инсайты автоматически генерируются с помощью искусственного интеллекта на основе текста статьи.
← Назад в лентуЧитать оригинал →
✈️ Подписывайтесь на мой Telegram-канал — там еще больше интересного про AdTech, MarTech, AI и многое другое!