Роботы учатся видеть мир нашими глазами, пишут код и создают игры: топ-10 ИИ-исследований за май

28.07.2025 • Хабр

Майский обзор ИИ-исследований включает 10 ключевых разработок, меняющих подход к обучению, использованию и тестированию моделей. Проект INTELLECT-2 показал, что крупные языковые модели можно эффективно обучать децентрализованно через распределённые сети с методами PRIME-RL, SHARDCAST и TOPLOC, превзойдя лидеров среди открытых 32B LLM в математике и программировании за 2 недели. Платформа Hunyuan-Game использует диффузионные трансформеры и миллиарды игровых ассетов для генерации высококачественных ресурсов по текстовому описанию. Новый бенчмарк gg-bench измеряет обобщающую способность LLM через создание и освоение новых стратегических игр, а VideoGameBench проверяет навыки реального времени на играх 90-х (лучший результат — 0,48%). В программировании набирают популярность гибридные подходы vibe coding и agentic coding, а система WILLIAMT исправляет до 73,5% уязвимостей по $0,0026 за баг. Метод Synthetic Data RL повышает точность моделей в узких областях до 92% за счёт синтетических данных. EgoZero обучает роботов бытовым действиям по видео с умных очков (успех ~70%), а MetaMind улучшает социальный интеллект ИИ на 36%. Минималистичный агент Alita самостоятельно создаёт инструменты и достигает 75% успеха на GAIA, демонстрируя потенциал саморазвивающихся архитектур.

PubMag

Роботы учатся видеть мир нашими глазами, пишут код и создают игры: топ-10 ИИ-исследований за май

Читайте также