Google выпустила новую модель Gemini для локальной работы на роботах

DeepMind представила новую модель Robotics On-Device, способную работать локально на роботах без подключения к интернету. Новая версия развивает успех Gemini Robotics, впервые анонсированной в марте, и теперь поддерживает не только управление движением, но и обучение с помощью естественного языка. Ключевой фокус — обработка задач непосредственно на устройстве, что важно для промышленной автоматизации и сценариев, требующих автономности.

По заявлениям Google, Gemini Robotics On-Device по эффективности почти не уступает облачной версии и превосходит прочие локальные модели (конкретные аналоги не указаны). В демонстрациях модель управляла роботами для выполнения бытовых и промышленных задач, включая распаковку сумок, сборку объектов на конвейере и работу с ранее незнакомыми предметами. Обучение новых действий реализовано на базе 50–100 показов в симуляторе MuJoCo.

Gemini Robotics On-Device изначально разрабатывалась для роботов ALOHA, но уже адаптирована для bi-arm Franka FR3 и Apollo (Apptronik). Кроме того, Google открывает Gemini Robotics SDK для разработчиков. На рынке также активизировались конкуренты: строит собственную платформу foundation-моделей для человекоподобных роботов, Hugging Face работает над open-source решениями и наборами данных, RLWRLD (Корея) — над новыми foundation-моделями для роботов.

← Назад в лентуЧитать оригинал →
✈️ Подписывайтесь на мой Telegram-канал — там еще больше интересного про AdTech, MarTech, AI и многое другое!