Baidu открывает исходный код мультимодальных ИИ-моделей ERNIE 4.5 и запускает открытую экосистему вокруг PaddlePaddle

Китайская Baidu, часто называемая «китайским Яндексом», представила семейство из 10 мультимодальных ИИ-моделей ERNIE 4.5 с открытым исходным кодом. Ключевой особенностью является использование архитектуры Mixture of Experts (MoE), что позволяет объединять общие параметры с работой «экспертов» по каждой модальности данных (текст, изображения и др.). Это решение помогает избежать типичной проблемы, когда обучение на одной модальности ухудшает результаты в другой.

Семейство ERNIE 4.5 включает модели разного размера: самая крупная — 424 млрд параметров. Флагман ERNIE-4.5-300B-A47B-Base превзошёл -V3 в 22 из 28 ключевых бенчмарков. Все модели обучены на фреймворке глубокого обучения PaddlePaddle (Baidu), что позволило снизить издержки на тренировку и ускорить коммерциализацию.

Весь стек, включая инструменты дообучения (ERNIEKit) и деплоя (FastDeploy), выпущен под лицензией Apache 2.0 и доступен для коммерческого использования. Открытие кода и доступность мощных мультимодальных моделей создаёт экосистему вокруг PaddlePaddle и снижает барьеры для глобальных разработчиков и компаний.

Baidu усиливает конкуренцию с и , развивая собственную открытую экосистему, что может ускорить внедрение ИИ в индустрии и стимулирует развитие мирового AI-сообщества.

Читайте также

  1. Google выпустила Gemma 3n — локальную ИИ-модель для смартфонов и периферии без интернета
  2. Глава OpenAI: на один запрос ChatGPT уходит 1/15 чайной ложки воды и 0,34 Вт·ч энергии
  3. Лидеры Google: искусственный интеллект стал более рассудительным
  4. Alibaba снизила стоимость обучения поисковых ИИ-моделей на 88% благодаря методу ZeroSearch
  5. Исследование: студенты пишут более вовлекающие тексты, чем ChatGPT
← Назад в лентуЧитать оригинал →
✈️ Подписывайтесь на мой Telegram-канал — там еще больше интересного про AdTech, MarTech, AI и многое другое!