Отечественные Open Source-инструменты для ИИ-разработки

ICT.Moscow представил карту отечественных Open Source-инструментов для ИИ: 128 проектов, созданных с декабря 2022 года, от 41 команды. Темпы публикаций растут: по данным авторов, только за январь этого года выпущено столько же решений, сколько за весь 2020-й.

Категории охватывают весь стек: библиотеки/фреймворки (Py-Boost от Сбера с GPU-ускорением SketchBoost; AggMe для объединения разметок; Cloud ML SDK с интеграцией LangChain), бенчмарки (RuMT-Bench с оценкой GPT-4 по 10-балльной шкале против GPT-3.5 Turbo; MERA — независимый рейтинг русскоязычных LLM; RealCodeEval — 219 Python-функций из GitHub), датасеты (Slovo: 20 тыс. видео, 1000 жестов, 194 носителя РЖЯ; ∇²DFT: 1,9 млн молекул, 15,7 млн вариантов и 13 моделей; Skoltech3D: 1,4 млн снимков 107 объектов, архивы по 25 ГБ), методы (ReBRAC: обучение с подкреплением в 4 раза быстрее и +40% качества; PROWN — «водяной знак» для защиты моделей).

Среди архитектур и платформ отмечены AASIST3 для распознавания поддельных голосов и YTsaurus (MapReduce, поддержка ClickHouse и Spark, хранилище «Кипарис»). Топ-модели: Kandinsky 3.1 (10x быстрее, до 4K, >200 млн изображений с 2022), MiVOLOv2, mGPT (13B, 61 язык, 600 ГБ), Switti (на 20–30% быстрее при сопоставимом качестве со Stable Diffusion), T-Pro (32,8B, адаптация под русский, обучение на H100), AIpom (детекция ИИ-текста), Headless-AD (в 5 раз больше действий без дообучения).

Ключевые инсайты из новости (по версии ChatGPT)
  • Ландшафт российских OSS-инструментов ИИ (ICT.Moscow): В едином реестре зафиксировано 128 отечественных open-source проектов ИИ от 41 команды (декабрь 2022 — н.в.) с ускорением релизов до уровня «за месяц как за весь 2020». Реестр удобен как витрина поставщиков и технологий для импортонезависимых пилотов PubMag/MarTech и как база для конкурентной разведки.
    [исследование/рынок]
Для получения полного доступа оформите подписку PubMag PRO.
Зарегистрированные пользователи видят только два тезиса.
Зарегистрироваться
Инсайты автоматически генерируются с помощью искусственного интеллекта на основе текста статьи.
← Назад в лентуЧитать оригинал →
✈️ Подписывайтесь на мой Telegram-канал — там еще больше интересного про AdTech, MarTech, AI и многое другое!