Как OpenAI стремится создать ИИ, который сделает всё за вас
OpenAI системно перестраивает ИИ от «случайного» успеха
ChatGPT к агентам, способным выполнять задачи на компьютере как человек. Рубежом стала математика: команда MathGen подтянула рассуждения моделей до уровня «золота» IMO, что положило основу для модели рассуждений o1 (осень 2024) и программы по созданию универсальных агентов.
- Техсдвиг: связка LLM + reinforcement learning + test-time computation и chain-of-thought («Strawberry», 2023), плюс масштабирование по двум осям — больше пост-тренировочного compute и больше compute на ответ.
- Организация: команда Agents (Даниэль Селсам), лиды — Илья Суцкевер, Марк Чен, Якуб Пахоцки; ресурсы (GPU, таланты) выделялись под явные доказательства прогресса.
- Рынок талантов:
Meta переманила 5 исследователей о1 с пакетами >$100 млн; Шэнцзя Чжао стал chief scientist Meta Superintelligence Labs. У отрасли снижается отдача от классического масштабирования преобучения. - Ограничения: галлюцинации сохраняются; агенты слабы в субъективных задачах (шопинг, парковка) — это «датасетная» проблема.
- Что дальше: общий RL для «непроверяемых» навыков, мультиагентные схемы (IMO-модель), ставка на GPT-5 и «интуитивных» агентов, которые сами выбирают инструменты и глубину размышления.
Главная интрига — сможет ли OpenAI закрепить доминирование раньше, чем
Google,
Anthropic,
xAI или Meta реализуют собственное видение агентного будущего.
Читайте также
Обновлённый Sonnet от Anthropic лучше использует компьютер — и временами проявляет экзистенциальную тревогу
Протокольные войны agentic-commerce приходят в e-commerce; Perplexity говорит, что реклама подрывает доверие к AI
Как OpenAI похоронила традиционный BI — и что пришло ему на смену
Заглянуть под капот ИИ-агентов: новый инструмент раскрывает «магию» Claude Code
Как оптимизация промптов превратилась из шаманства в инженерную дисциплину
Ключевые инсайты из новости (по версии ChatGPT)
- Сдвиг от масштабирования LLM к reasoning-подходу: Убывающая отдача от простого наращивания данных и параметров сместила фокус индустрии к связке RL, планирования и верификации шагов рассуждения. Для дорожной карты PubMag приоритет — не размер модели, а наличие reasoning-техник и их управляемых бюджетов.
[процесс]
Для получения полного доступа оформите подписку PubMag PRO.
Зарегистрированные пользователи видят только два тезиса.
Зарегистрироваться
Зарегистрированные пользователи видят только два тезиса.
Зарегистрироваться
Инсайты автоматически генерируются с помощью искусственного интеллекта на основе текста статьи.
Подписывайтесь на мой Telegram-канал — там еще больше интересного про AdTech, MarTech, AI и многое другое!
TechCrunch