OpenAI представила две open-weight-модели «gpt-oss», их можно скачать уже сегодня
OpenAI выпустила две open-weight модели — gpt-oss-120b и gpt-oss-20b — доступные для локального запуска и кастомизации. Это первые открытые по весам модели компании со времён GPT-2 (2019). Обе — трансформеры с настраиваемым уровнем simulated reasoning (Chain-of-Thought: low/medium/high), который задаётся одной строкой в system prompt: низкие уровни быстрее и экономичнее, высокие дают лучшую точность. Поддерживаются tool use, глубокая настройка и контекстное окно 128 000 токенов.
- Архитектура и ресурсы: gpt-oss-20b имеет 21B параметров с Mixture-of-Experts (активно ~3,6B на токен) и может работать на потребительской машине с 16 ГБ+ ОЗУ; gpt-oss-120b — 117B параметров (~5,1B на токен с MoE), требует ~80 ГБ памяти и помещается на один ускоритель уровня
Nvidia H100. - Производительность: 120b в большинстве тестов находится между проприетарными o3 и o4-mini (особенно близко в математике и коде); в Humanity’s Last Exam (с инструментами) o3 — 24,9%, gpt-oss-120b — 19%, для сравнения
Gemini Deep Think — 34,8%.
Запуск подчёркивает стратегию OpenAI по расширению экосистемы self-hosted: модели можно скачать и разворачивать на собственной инфраструктуре, балансируя качество и затраты через CoT и MoE.
Читайте также
Ретроспектива 2025: год LLM — практика, иллюзия и реальные сдвиги
«Вам нужны партнеры, а не подрядчики»: как запустить ИИ-проект, который принесет реальную пользу бизнесу
Lamoda запускает «Г(ии)д по стилю» для онлайн-примерки вещей
Тестовый стенд с автономным ИИ-агентом QA для тестирования бэкенда: концепция и пример
Лучшие практики работы с агентами для написания кода
Ключевые инсайты из новости (по версии ChatGPT)
- Open-weight модели OpenAI gpt-oss (20b/120b): ключевые возможности: OpenAI выпустила две открытые по весам модели gpt-oss-20b и gpt-oss-120b, доступные для скачивания и локального развёртывания. Обе поддерживают tool use, глубокую кастомизацию и работают с контекстным окном 128 000 токенов.
[инструмент]
Для получения полного доступа оформите подписку PubMag PRO.
Зарегистрированные пользователи видят только два тезиса.
Зарегистрироваться
Зарегистрированные пользователи видят только два тезиса.
Зарегистрироваться
Инсайты автоматически генерируются с помощью искусственного интеллекта на основе текста статьи.
Подписывайтесь на мой Telegram-канал — там еще больше интересного про AdTech, MarTech, AI и многое другое!
Ars Technica