Роботы учатся видеть мир нашими глазами, пишут код и создают игры: топ-10 ИИ-исследований за май
Майский обзор ИИ-исследований включает 10 ключевых разработок, меняющих подход к обучению, использованию и тестированию моделей. Проект INTELLECT-2 показал, что крупные языковые модели можно эффективно обучать децентрализованно через распределённые сети с методами PRIME-RL, SHARDCAST и TOPLOC, превзойдя лидеров среди открытых 32B LLM в математике и программировании за 2 недели. Платформа Hunyuan-Game использует диффузионные трансформеры и миллиарды игровых ассетов для генерации высококачественных ресурсов по текстовому описанию. Новый бенчмарк gg-bench измеряет обобщающую способность LLM через создание и освоение новых стратегических игр, а VideoGameBench проверяет навыки реального времени на играх 90-х (лучший результат — 0,48%). В программировании набирают популярность гибридные подходы vibe coding и agentic coding, а система WILLIAMT исправляет до 73,5% уязвимостей по $0,0026 за баг. Метод Synthetic Data RL повышает точность моделей в узких областях до 92% за счёт синтетических данных. EgoZero обучает роботов бытовым действиям по видео с умных очков (успех ~70%), а MetaMind улучшает социальный интеллект ИИ на 36%. Минималистичный агент Alita самостоятельно создаёт инструменты и достигает 75% успеха на GAIA, демонстрируя потенциал саморазвивающихся архитектур.
Читайте также
Лучшие практики работы с агентами для написания кода
Ретроспектива 2025: год LLM — практика, иллюзия и реальные сдвиги
Тестовый стенд с автономным ИИ-агентом QA для тестирования бэкенда: концепция и пример
300 дней с AI-агентами: от руководителя к Full Cycle Engineer
Claude Code изнутри: как устроены ИИ-агенты для разработки
- Децентрализованное RL-обучение LLM: Проект INTELLECT-2 продемонстрировал возможность обучения крупных языковых моделей без централизованных дата-центров, используя распределённые вычислительные ресурсы участников сети. Ключевые технологии — PRIME-RL (асинхронное обучение), SHARDCAST (ускоренная передача данных) и TOPLOC (валидация на недоверенных узлах) обеспечивают стабильность и эффективность обучения.
[AI/Обучение моделей]
Зарегистрированные пользователи видят только два тезиса.
Зарегистрироваться