Что ждет поклонников ИИ на Google I/O: новые модели Gemini, генерация медиа и AI-агенты
В преддверии
Google I/O 2025, которое пройдет 20–21 мая, ожидается масштабный фокус на искусственный интеллект. Google продолжает активно конкурировать с OpenAI и
Anthropic, а подразделение DeepMind готовит серию анонсов по новым языковым моделям. После релизов
Gemini 2.5 Pro и 2.5 Flash, компания тестирует свыше десятка новых моделей (Moonhowler, Dragontail, Stargazer и др.), включая обновления под задачи программирования и потенциальный релиз Gemini 2.5 Ultra. Также на конференции может быть представлена опенсорс-модель Gemma (Cutiepie-75).
В сегменте генерации изображений и видео ожидается развитие Imagen 3.5, 4.0, а также видео-модели Veo 3. Google планирует усилить позиции на фоне лидерства
ChatGPT и OpenAI в генеративной графике. Появились намеки на новую функцию — AI-агент Computer Use для автоматизации пользовательских задач на ПК, включая покупки и работу с программами. В Gemini App, которая отставала от конкурентов, появятся усовершенствования: память между чатами, интеграция с Gmail, Google Drive, Calendar и Photos, что усилит персонализацию.
Gemini Advanced предлагает расширенные тарифы с 20-долларовой подпиской и щедрыми лимитами на запросы к моделям и генерацию медиа, однако уже отмечены первые ограничения и возможные изменения в тарифах. Также ожидается полноценное приложение для NotebookLM и новые AI-интеграции для науки. Google стремится догонять OpenAI, делая ставку на открытость и привлекательные условия для пользователей.
Читайте также
Весна 2025 в ИИ: OpenAI и Google укрепляют позиции, Anthropic теряет долю рынка
ChatGPT vs Claude: опыт использования двух LLM в реальной работе
AI-пузырь: когда стартапы получают миллионы за обёртку над чужим ИИ
Anthropic и Google добились победы: Harvey начинает использовать их модели наряду с OpenAI
MIT и Кембридж: ChatGPT снижает креативность и память — как этого избежать