Когда команда ИИ-агентов помогает, а когда делает только хуже

Исследователи и MIT в работе Towards a Science of Scaling Agent Systems проверили, когда мультиагентные системы (MAS) лучше одиночного агента (SAS) в «агентных» задачах. В экспериментах — 180 конфигураций, 4 бенчмарка, 5 архитектур (SAS + independent/centralized/decentralized/), 3 семейства LLM (, Google, ) при паритете инструментов, промптов и токен-бюджетов.

  • Качество: Finance-Agent при centralized даёт до +80.9% к SAS; BrowseComp-Plus — до +9.2%; Workbench близок к нейтрали. PlanCraft (Minecraft) у всех MAS падает на −39%…−70% (плохо параллелится, координация не добавляет информации).
  • Токен-накладные: +58% (independent), +263% (decentralized), +285% (centralized), до +515% (hybrid) — бюджет уходит в «переговоры».
  • Ошибки: independent усиливал каскады в 17.2 раза относительно SAS; centralized сдерживал их лучше (до 4.4 раза) за счёт проверки через оркестратор.
  • Выбор подхода: метрика «полезности команды» (R²=0.513) и порог: если SAS уже решает задачу на ≥45%, координация часто даёт убывающую/отрицательную отдачу; больше инструментов — выше координационные потери при фиксированном бюджете.

Вывод: MAS стоит применять там, где задача декомпозируется и допускает независимую верификацию; для строго последовательных сценариев команда часто становится медленнее, дороже и иногда хуже.

Читайте также

  1. Что меня беспокоит в агентской разработке: заметки инженера в 2026 году
  2. Сравнение ChatGPT 5.2 Pro, Claude Sonnet 4.5 и Gemini 3 Pro: кто лучше пишет тексты
  3. В 2026 году ИИ перейдёт от хайпа к прагматизму
  4. Что ждет поклонников ИИ на Google I/O: новые модели Gemini, генерация медиа и AI-агенты
  5. Новый агент Optable призван снизить нагрузку на планирование рекламы у паблишеров
Ключевые инсайты из новости (по версии ChatGPT)
  • Критерий применимости мультиагентной системы: «порог полезности команды»: При выборе между одиночным агентом (SAS) и командой (MAS) можно использовать практическое правило: если сильный одиночный агент уже даёт около 45%+ успеха на задаче, добавление координации часто даёт убывающую или даже отрицательную отдачу. Это помогает не «усиливать сильного агента командой» по умолчанию, а сначала измерить baseline SAS и только затем оправдывать MAS.
    [Регламенты проектирования AI-агентов]
Для получения полного доступа оформите подписку PubMag PRO.
Зарегистрированные пользователи видят только два тезиса.
Зарегистрироваться
Инсайты автоматически генерируются с помощью искусственного интеллекта на основе текста статьи.
← Назад в лентуЧитать оригинал →
✈️ Подписывайтесь на мой Telegram-канал — там еще больше интересного про AdTech, MarTech, AI и многое другое!