Почём ИИ для народа: тест платформы YADRO G4208P с восемью H100 NVL и RTX 4090 на 10 ИИ-моделях

Команда YADRO провела масштабное тестирование нового серверного решения G4208P G3 для задач искусственного интеллекта. Сервер поддерживает до восьми GPU (H100 NVL или RTX 4090), что позволяет заметно ускорить обучение и инференс ИИ-моделей. Для обучения GPT-2 (1,6 млрд параметров) теперь требуется всего 1,6 суток на одной платформе, а ранее аналогичная задача занимала недели на десятках V100. Система с 8x H100 NVL показала лучшее время тренировки, однако платформа с 8x RTX 4090 выигрывает по соотношению цена/производительность в ряде практических сценариев.

В бенчмарках MLCommons сервер G4208P G3 с H100 NVL в среднем в 2,7 раза опережает 4090 в задачах инференса LLM и более чем в 1,5 раза при использовании NVLink для крупных моделей. Конфигурация с 8x 4090 демонстрирует наилучшую эффективность затрат для задач компьютерного зрения и малых LLM до 2 млрд параметров, а также позволяет запускать широкий набор ML-задач за меньшие бюджеты. Выбор GPU зависит от профиля задач: H100 NVL — для крупных LLM и сложных нейросетей, 4090 — для массовых ML-задач с ограниченным бюджетом.

Тестирование подтверждает мировой уровень серверных решений YADRO и их пригодность как для предприятий, работающих с крупными языковыми моделями, так и для массового рынка внедрения ИИ. В следующей серии экспериментов компания планирует испытания с новыми GPU и deepseek-ai.

Читайте также

  1. ML Q & AI. Глава 2: Self-Supervised обучение
  2. Как внедрить AI-чат в бизнес: инструкция для роста среднего чека и лояльности
  3. ИИ развивается и меняет наше представление о реальности
  4. ИИ — помощник или конкурент? Практика внедрения нейросети в работу системного аналитика банка
  5. Эндрю Ын против “вайб-кодинга”: программирование с ИИ — это серьёзная работа, а не хобби
← Назад в лентуЧитать оригинал →
✈️ Подписывайтесь на мой Telegram-канал — там еще больше интересного про AdTech, MarTech, AI и многое другое!