IBM выпускает CUGA — open-source AI-агента, который выполняет больше половины задач

IBM выложила в open source AI-агента CUGA (Configurable Generalist Agent), ориентированного на автоматизацию многошаговых enterprise-воркфлоу через оркестрацию агентов, интеграции по API и генерацию кода. По данным IBM, на бенчмарках агент показывает «топовый для рынка» уровень: 61,7% успешных выполнений веб-задач в WebArena и 48,2% завершений сценариев API-задач в AppWorld. На фоне скепсиса к агентам (Gartner рекомендует блокировать agentic browsers и прогнозирует отмену ~40% агентных enterprise-проектов к 2027 году из-за недостатка бизнес-ценности) IBM делает ставку на практичность и контролируемость.

  • Лицензия: Apache 2.0; релиз доступен через HuggingFace.
  • Архитектура: слой диалога для извлечения намерения → планирование и контроль → «task ledger» с динамическим перепланированием → делегирование подзадач специализированным агентам (в т.ч. API-агент) с исполнением кода в защищённой песочнице → выдача policy-compliant результата.
  • Отдельный фокус на комплаенсе: ранее внутренние оценки агентов показывали, что при множестве политик доля policy-compliant завершений может падать до единиц процентов (в примере с 5+ политиками — 7,1%).
  • Интеграции/модели: поддержка Langflow и открытых моделей вроде gpt-oss-120b и Llama-4-Maverick-17B-128E-Instruct-fp8.

Публикация отмечает и «шероховатости» (например, баг с выходом из run loop), поэтому IBM фактически приземляет ожидания: даже при улучшении метрик агенты всё ещё ошибаются и требуют строгих guardrails в реальных бизнес-процессах.

Читайте также

  1. Opus 4.7, Codex управляет ПК, TTS от Google, а бренд кроссовок переходит в ИИ
  2. LLM-агент для поиска свободных доменов: автоматизация подбора
  3. Как Meta* убила Llama, чтобы спасти свой ИИ-бизнес
  4. Как я локально тестировал новый Qwen 3.6 и Gemma 4
  5. App Store снова растёт, и причиной может быть AI
Ключевые инсайты из новости (по версии ChatGPT)
  • CUGA: open-source generalist-агент IBM для enterprise-воркфлоу: IBM выпустила Configurable Generalist Agent (CUGA) как open-source инструмент для автоматизации многошаговых корпоративных задач через multi-agent orchestration, API-интеграции и генерацию кода. Важно: позиционирование — «настраиваемый generalist-агент» для knowledge workers с акцентом на безопасное и доверенное выполнение.
    [AI Agents]
Для получения полного доступа оформите подписку PubMag PRO.
Зарегистрированные пользователи видят только два тезиса.
Зарегистрироваться
Инсайты автоматически генерируются с помощью искусственного интеллекта на основе текста статьи.
← Назад в лентуЧитать оригинал →
✈️ Подписывайтесь на мой Telegram-канал — там еще больше интересного про AdTech, MarTech, AI и многое другое!