DeepSeek обновила модель R1 для рассуждений и выложила её на Hugging Face
Китайский стартап DeepSeek выпустил обновленную версию своей модели рассуждений R1 на платформе Hugging Face. Новая версия R1, распространяющаяся под открытой MIT-лицензией, доступна для коммерческого использования и позиционируется как «незначительное» обновление по сравнению с предыдущей версией. Сам репозиторий на Hugging Face содержит только конфигурационные файлы и веса — то есть внутренние параметры модели, определяющие ее поведение.
Размер обновленной R1 впечатляет — 685 миллиардов параметров, что делает модель одной из крупнейших в публичном доступе. Однако из-за своей «тяжеловесности» R1 вряд ли сможет работать на потребительском оборудовании без дополнительной оптимизации.
- DeepSeek приобрел известность в начале 2024 года после релиза первой версии R1, которая соперничала с продуктами OpenAI.
- Стартап также столкнулся с критикой со стороны регуляторов США, которые считают, что технологии DeepSeek могут представлять угрозу национальной безопасности.
Читайте также
Гендиректор Klarna и Sutter Hill празднуют успех после сделки Jony Ive и OpenAI
ChatGPT тестирует загадочную новую функцию “Study Together”
OpenAI наняла команду стартапа AI-рекомендаций Crossing Minds
OpenAI разрывает контракт с Scale AI после сделки компании с Meta
OpenAI откладывает релиз открытой модели до конца лета
Подписывайтесь на мой Telegram-канал — там еще больше интересного про AdTech, MarTech, AI и многое другое!