Как OpenAI стремится создать ИИ, который сделает всё за вас

OpenAI системно перестраивает ИИ от «случайного» успеха ChatGPT к агентам, способным выполнять задачи на компьютере как человек. Рубежом стала математика: команда MathGen подтянула рассуждения моделей до уровня «золота» IMO, что положило основу для модели рассуждений o1 (осень 2024) и программы по созданию универсальных агентов.

  • Техсдвиг: связка LLM + reinforcement learning + test-time computation и chain-of-thought («Strawberry», 2023), плюс масштабирование по двум осям — больше пост-тренировочного compute и больше compute на ответ.
  • Организация: команда Agents (Даниэль Селсам), лиды — Илья Суцкевер, Марк Чен, Якуб Пахоцки; ресурсы (GPU, таланты) выделялись под явные доказательства прогресса.
  • Рынок талантов: 1 переманила 5 исследователей о1 с пакетами >$100 млн; Шэнцзя Чжао стал chief scientist Meta Superintelligence Labs. У отрасли снижается отдача от классического масштабирования преобучения.
  • Ограничения: галлюцинации сохраняются; агенты слабы в субъективных задачах (шопинг, парковка) — это «датасетная» проблема.
  • Что дальше: общий RL для «непроверяемых» навыков, мультиагентные схемы (IMO-модель), ставка на GPT-5 и «интуитивных» агентов, которые сами выбирают инструменты и глубину размышления.

Главная интрига — сможет ли OpenAI закрепить доминирование раньше, чем Google, Anthropic, xAI или Meta реализуют собственное видение агентного будущего.

Читайте также

  1. Анализ документов нейросетью с цитатами из источников: скилл research-docs для Claude Code
  2. Возвращаем к жизни связку OpenClaw и Claude
  3. Дайджест: OpenAI покупает TBPN, CNN строит agentic-инфраструктуру, а Grok хотят сделать обязательным в IPO SpaceX?
  4. Renga API: автоматизируем автоматизацию с помощью ИИ-агентов
  5. Компромисс с креативностью: что маркетологи рискуют потерять в эпоху AI
Ключевые инсайты из новости (по версии ChatGPT)
  • Сдвиг от масштабирования LLM к reasoning-подходу: Убывающая отдача от простого наращивания данных и параметров сместила фокус индустрии к связке RL, планирования и верификации шагов рассуждения. Для дорожной карты PubMag приоритет — не размер модели, а наличие reasoning-техник и их управляемых бюджетов.
    [процесс]
Для получения полного доступа оформите подписку PubMag PRO.
Зарегистрированные пользователи видят только два тезиса.
Зарегистрироваться
Инсайты автоматически генерируются с помощью искусственного интеллекта на основе текста статьи.
← Назад в лентуЧитать оригинал →
✈️ Подписывайтесь на мой Telegram-канал — там еще больше интересного про AdTech, MarTech, AI и многое другое!