Google выпустила новую модель Gemini для локальной работы на роботах
Google DeepMind представила новую модель
Gemini Robotics On-Device, способную работать локально на роботах без подключения к интернету. Новая версия развивает успех Gemini Robotics, впервые анонсированной в марте, и теперь поддерживает не только управление движением, но и обучение с помощью естественного языка. Ключевой фокус — обработка задач непосредственно на устройстве, что важно для промышленной автоматизации и сценариев, требующих автономности.
По заявлениям Google, Gemini Robotics On-Device по эффективности почти не уступает облачной версии и превосходит прочие локальные модели (конкретные аналоги не указаны). В демонстрациях модель управляла роботами для выполнения бытовых и промышленных задач, включая распаковку сумок, сборку объектов на конвейере и работу с ранее незнакомыми предметами. Обучение новых действий реализовано на базе 50–100 показов в симуляторе MuJoCo.
Gemini Robotics On-Device изначально разрабатывалась для роботов ALOHA, но уже адаптирована для bi-arm Franka FR3 и Apollo (Apptronik). Кроме того, Google открывает Gemini Robotics SDK для разработчиков. На рынке также активизировались конкуренты:
Nvidia строит собственную платформу foundation-моделей для человекоподобных роботов, Hugging Face работает над open-source решениями и наборами данных, RLWRLD (Корея) — над новыми foundation-моделями для роботов.
Читайте также
Чат-бот Gemini от Google получил расширенные инструменты редактирования изображений
Рост использования AI-поиска Google: более 1,5 млрд пользователей в месяц
Google запустила Doppl — новое приложение для виртуальной примерки одежды с помощью ИИ
Суд раскрыл детали разработки AI-устройства OpenAI и io: новый форм-фактор, патентные споры и рынок “третих устройств”
Amazon запустил Alexa+ на базе генеративного ИИ: более миллиона пользователей, новые сценарии и планы монетизации