Что ждет поклонников ИИ на Google I/O: новые модели Gemini, генерация медиа и AI-агенты

17.05.2025 • Хабр

В преддверии Google I/O 2025, которое пройдет 20–21 мая, ожидается масштабный фокус на искусственный интеллект. Google продолжает активно конкурировать с OpenAI и Anthropic, а подразделение DeepMind готовит серию анонсов по новым языковым моделям. После релизов Gemini 2.5 Pro и 2.5 Flash, компания тестирует свыше десятка новых моделей (Moonhowler, Dragontail, Stargazer и др.), включая обновления под задачи программирования и потенциальный релиз Gemini 2.5 Ultra. Также на конференции может быть представлена опенсорс-модель Gemma (Cutiepie-75).

В сегменте генерации изображений и видео ожидается развитие Imagen 3.5, 4.0, а также видео-модели Veo 3. Google планирует усилить позиции на фоне лидерства ChatGPT и OpenAI в генеративной графике. Появились намеки на новую функцию — AI-агент Computer Use для автоматизации пользовательских задач на ПК, включая покупки и работу с программами. В Gemini App, которая отставала от конкурентов, появятся усовершенствования: память между чатами, интеграция с Gmail, Google Drive, Calendar и Photos, что усилит персонализацию.

Gemini Advanced предлагает расширенные тарифы с 20-долларовой подпиской и щедрыми лимитами на запросы к моделям и генерацию медиа, однако уже отмечены первые ограничения и возможные изменения в тарифах. Также ожидается полноценное приложение для NotebookLM и новые AI-интеграции для науки. Google стремится догонять OpenAI, делая ставку на открытость и привлекательные условия для пользователей.

PubMag

Что ждет поклонников ИИ на Google I/O: новые модели Gemini, генерация медиа и AI-агенты

Читайте также