Как OpenAI стремится создать ИИ, который сделает всё за вас

OpenAI системно перестраивает ИИ от «случайного» успеха ChatGPT к агентам, способным выполнять задачи на компьютере как человек. Рубежом стала математика: команда MathGen подтянула рассуждения моделей до уровня «золота» IMO, что положило основу для модели рассуждений o1 (осень 2024) и программы по созданию универсальных агентов.

  • Техсдвиг: связка LLM + reinforcement learning + test-time computation и chain-of-thought («Strawberry», 2023), плюс масштабирование по двум осям — больше пост-тренировочного compute и больше compute на ответ.
  • Организация: команда Agents (Даниэль Селсам), лиды — Илья Суцкевер, Марк Чен, Якуб Пахоцки; ресурсы (GPU, таланты) выделялись под явные доказательства прогресса.
  • Рынок талантов: 1 переманила 5 исследователей о1 с пакетами >$100 млн; Шэнцзя Чжао стал chief scientist Meta Superintelligence Labs. У отрасли снижается отдача от классического масштабирования преобучения.
  • Ограничения: галлюцинации сохраняются; агенты слабы в субъективных задачах (шопинг, парковка) — это «датасетная» проблема.
  • Что дальше: общий RL для «непроверяемых» навыков, мультиагентные схемы (IMO-модель), ставка на GPT-5 и «интуитивных» агентов, которые сами выбирают инструменты и глубину размышления.

Главная интрига — сможет ли OpenAI закрепить доминирование раньше, чем Google, Anthropic, xAI или Meta реализуют собственное видение агентного будущего.

Читайте также

  1. Установки DuckDuckGo выросли на 30% на фоне отказа пользователей от навязанного AI-поиска Google
  2. В России начали учить топ-менеджеров системно внедрять ИИ
  3. Что массовые увольнения в ClickUp говорят о будущем работы
  4. Память на миллион токенов, а толку ноль: как ИИ-агента спасали от «тупости»
  5. GPT-5 может стать лидером в программировании — способна собирать проекты целиком
Ключевые инсайты из новости (по версии ChatGPT)
  • Сдвиг от масштабирования LLM к reasoning-подходу: Убывающая отдача от простого наращивания данных и параметров сместила фокус индустрии к связке RL, планирования и верификации шагов рассуждения. Для дорожной карты PubMag приоритет — не размер модели, а наличие reasoning-техник и их управляемых бюджетов.
    [процесс]
Для получения полного доступа оформите подписку PubMag PRO.
Зарегистрированные пользователи видят только два тезиса.
Зарегистрироваться
Инсайты автоматически генерируются с помощью искусственного интеллекта на основе текста статьи.
← Назад в лентуЧитать оригинал →
✈️ Подписывайтесь на мой Telegram-канал — там еще больше интересного про AdTech, MarTech, AI и многое другое!