OpenAI представила две open-weight-модели «gpt-oss», их можно скачать уже сегодня

выпустила две open-weight модели — gpt-oss-120b и gpt-oss-20b — доступные для локального запуска и кастомизации. Это первые открытые по весам модели компании со времён GPT-2 (2019). Обе — трансформеры с настраиваемым уровнем simulated reasoning (Chain-of-Thought: low/medium/high), который задаётся одной строкой в system prompt: низкие уровни быстрее и экономичнее, высокие дают лучшую точность. Поддерживаются tool use, глубокая настройка и контекстное окно 128 000 токенов.

  • Архитектура и ресурсы: gpt-oss-20b имеет 21B параметров с Mixture-of-Experts (активно ~3,6B на токен) и может работать на потребительской машине с 16 ГБ+ ОЗУ; gpt-oss-120b — 117B параметров (~5,1B на токен с MoE), требует ~80 ГБ памяти и помещается на один ускоритель уровня H100.
  • Производительность: 120b в большинстве тестов находится между проприетарными o3 и o4-mini (особенно близко в математике и коде); в Humanity’s Last Exam (с инструментами) o3 — 24,9%, gpt-oss-120b — 19%, для сравнения Deep Think — 34,8%.

Запуск подчёркивает стратегию OpenAI по расширению экосистемы self-hosted: модели можно скачать и разворачивать на собственной инфраструктуре, балансируя качество и затраты через CoT и MoE.

Ключевые инсайты из новости (по версии ChatGPT)
  • Open-weight модели OpenAI gpt-oss (20b/120b): ключевые возможности: OpenAI выпустила две открытые по весам модели gpt-oss-20b и gpt-oss-120b, доступные для скачивания и локального развёртывания. Обе поддерживают tool use, глубокую кастомизацию и работают с контекстным окном 128 000 токенов.
    [инструмент]
Для получения полного доступа оформите подписку PubMag PRO.
Зарегистрированные пользователи видят только два тезиса.
Зарегистрироваться
Инсайты автоматически генерируются с помощью искусственного интеллекта на основе текста статьи.
← Назад в лентуЧитать оригинал →
✈️ Подписывайтесь на мой Telegram-канал — там еще больше интересного про AdTech, MarTech, AI и многое другое!