OpenAI запустила две «открытые» reasoning-модели ИИ

представила два «открытых» reasoning-моделя gpt-oss (120b и 20b) с открытыми весами на Hugging Face и лицензией Apache 2.0 — первый «open» релиз компании со времён GPT-2. 120b заявлен как запускаемый на одной GPU, 20b — на потребительском ноутбуке с 16 ГБ ОЗУ. Модели текстовые, но умеют вызывать инструменты (web-search, Python) и, при необходимости, проксировать сложные запросы в закрытые модели OpenAI. Архитектурно применён MoE: у 120b активируется ~5.1B параметров на токен из 117B; пост-тренировка — RL высокой вычислительной мощности.

По бенчмаркам gpt-oss лидирует среди open-weight: Codeforces (с инструментами) — 2622 у 120b и 2516 у 20b; HLE — 19% и 17.3% соответственно. При этом модели уступают o-серии (o3/o4-mini) и сильнее галлюцинируют: PersonQA — 49% (120b) и 53% (20b) против 16% у o1 и 36% у o4-mini. OpenAI не раскрывает обучающие датасеты; релиз несколько раз откладывался из-за safety-оценок (био-риски остаются ниже «high capability» порога).

  • Лицензирование: Apache 2.0 позволяет коммерческое использование без выплат; веса открыты, данные обучения — нет.
  • Производительность: Codeforces 2622/2516; HLE 19%/17.3% (опережают /Qwen, ниже o-серии).
  • Качество: повышенная доля галлюцинаций на PersonQA — 49%/53%.
  • Инфраструктура: MoE 117B total, ~5.1B активных параметров/токен; RL-посттренировка; вызов инструментов и агентов.
  • Контекст: ответ на давление open-экосистем Китая; политический запрос на бóльшую открытость.
Ключевые инсайты из новости (по версии ChatGPT)
  • gpt-oss: открытые reasoning-модели OpenAI (120b/20b): OpenAI выпустила две текстовые модели с открытыми весами: gpt-oss-120b и gpt-oss-20b. 120b декларируется как запускаемая на одной Nvidia GPU, 20b — на ноутбуке с 16 ГБ ОЗУ; обе поддерживают вызов инструментов и пригодны для агентных сценариев.
    [продукт/модели]
Для получения полного доступа оформите подписку PubMag PRO.
Зарегистрированные пользователи видят только два тезиса.
Зарегистрироваться
Инсайты автоматически генерируются с помощью искусственного интеллекта на основе текста статьи.
← Назад в лентуЧитать оригинал →
✈️ Подписывайтесь на мой Telegram-канал — там еще больше интересного про AdTech, MarTech, AI и многое другое!