OpenAI выпустила две open-weight модели — gpt-oss-120b и gpt-oss-20b — доступные для локального запуска и кастомизации. Это первые открытые по весам модели компании со времён GPT-2 (2019). Обе — трансформеры с настраиваемым уровнем simulated reasoning (Chain-of-Thought: low/medium/high), который задаётся одной строкой в system prompt: низкие уровни быстрее и экономичнее, высокие дают лучшую точность. Поддерживаются tool use, глубокая настройка и контекстное окно 128 000 токенов.Архитектура и ресурсы: gpt-oss-20b имеет 21B параметров с Mixture-of-Experts (активно ~3,6B на токен) и может работать на потребительской машине с 16 ГБ+ ОЗУ; gpt-oss-120b — 117B параметров (~5,1B на токен с MoE), требует ~80 ГБ памяти и помещается на один ускоритель уровня Nvidia H100.Производительность: 120b в большинстве тестов находится между проприетарными o3 и o4-mini (особенно близко в математике и коде); в Humanity’s Last Exam (с инструментами) o3 — 24,9%, gpt-oss-120b — 19%, для сравнения Gemini Deep Think — 34,8%.Запуск подчёркивает стратегию OpenAI по расширению экосистемы self-hosted: модели можно скачать и разворачивать на собственной инфраструктуре, балансируя качество и затраты через CoT и MoE.