DeepSeek обновила модель R1 для рассуждений и выложила её на Hugging Face

Китайский стартап DeepSeek выпустил обновленную версию своей модели рассуждений R1 на платформе Hugging Face. Новая версия R1, распространяющаяся под открытой MIT-лицензией, доступна для коммерческого использования и позиционируется как «незначительное» обновление по сравнению с предыдущей версией. Сам репозиторий на Hugging Face содержит только конфигурационные файлы и веса — то есть внутренние параметры модели, определяющие ее поведение.

Размер обновленной R1 впечатляет — 685 миллиардов параметров, что делает модель одной из крупнейших в публичном доступе. Однако из-за своей «тяжеловесности» R1 вряд ли сможет работать на потребительском оборудовании без дополнительной оптимизации.

  • DeepSeek приобрел известность в начале 2024 года после релиза первой версии R1, которая соперничала с продуктами OpenAI.
  • Стартап также столкнулся с критикой со стороны регуляторов США, которые считают, что технологии DeepSeek могут представлять угрозу национальной безопасности.
← Назад в лентуЧитать оригинал →