Когда команда ИИ-агентов помогает, а когда делает только хуже
Исследователи
Google и MIT в работе Towards a Science of Scaling Agent Systems проверили, когда мультиагентные системы (MAS) лучше одиночного агента (SAS) в «агентных» задачах. В экспериментах — 180 конфигураций, 4 бенчмарка, 5 архитектур (SAS + independent/centralized/decentralized/
hybrid), 3 семейства LLM (
OpenAI, Google,
Anthropic) при паритете инструментов, промптов и токен-бюджетов.
- Качество: Finance-Agent при centralized даёт до +80.9% к SAS; BrowseComp-Plus — до +9.2%; Workbench близок к нейтрали. PlanCraft (Minecraft) у всех MAS падает на −39%…−70% (плохо параллелится, координация не добавляет информации).
- Токен-накладные: +58% (independent), +263% (decentralized), +285% (centralized), до +515% (hybrid) — бюджет уходит в «переговоры».
- Ошибки: independent усиливал каскады в 17.2 раза относительно SAS; centralized сдерживал их лучше (до 4.4 раза) за счёт проверки через оркестратор.
- Выбор подхода: метрика «полезности команды» (R²=0.513) и порог: если SAS уже решает задачу на ≥45%, координация часто даёт убывающую/отрицательную отдачу; больше инструментов — выше координационные потери при фиксированном бюджете.
Вывод: MAS стоит применять там, где задача декомпозируется и допускает независимую верификацию; для строго последовательных сценариев команда часто становится медленнее, дороже и иногда хуже.
Читайте также
Обновлённый Sonnet от Anthropic лучше использует компьютер — и временами проявляет экзистенциальную тревогу
Что ждет поклонников ИИ на Google I/O: новые модели Gemini, генерация медиа и AI-агенты
Как оптимизация промптов превратилась из шаманства в инженерную дисциплину
Как OpenAI похоронила традиционный BI — и что пришло ему на смену
Новый AI-агент ChatGPT умеет пользоваться браузером и создавать презентации
Ключевые инсайты из новости (по версии ChatGPT)
- Критерий применимости мультиагентной системы: «порог полезности команды»: При выборе между одиночным агентом (SAS) и командой (MAS) можно использовать практическое правило: если сильный одиночный агент уже даёт около 45%+ успеха на задаче, добавление координации часто даёт убывающую или даже отрицательную отдачу. Это помогает не «усиливать сильного агента командой» по умолчанию, а сначала измерить baseline SAS и только затем оправдывать MAS.
[Регламенты проектирования AI-агентов]
Для получения полного доступа оформите подписку PubMag PRO.
Зарегистрированные пользователи видят только два тезиса.
Зарегистрироваться
Зарегистрированные пользователи видят только два тезиса.
Зарегистрироваться
Инсайты автоматически генерируются с помощью искусственного интеллекта на основе текста статьи.
Подписывайтесь на мой Telegram-канал — там еще больше интересного про AdTech, MarTech, AI и многое другое!