IBM выпускает CUGA — open-source AI-агента, который выполняет больше половины задач

IBM выложила в open source AI-агента CUGA (Configurable Generalist Agent), ориентированного на автоматизацию многошаговых enterprise-воркфлоу через оркестрацию агентов, интеграции по API и генерацию кода. По данным IBM, на бенчмарках агент показывает «топовый для рынка» уровень: 61,7% успешных выполнений веб-задач в WebArena и 48,2% завершений сценариев API-задач в AppWorld. На фоне скепсиса к агентам (Gartner рекомендует блокировать agentic browsers и прогнозирует отмену ~40% агентных enterprise-проектов к 2027 году из-за недостатка бизнес-ценности) IBM делает ставку на практичность и контролируемость.

  • Лицензия: Apache 2.0; релиз доступен через HuggingFace.
  • Архитектура: слой диалога для извлечения намерения → планирование и контроль → «task ledger» с динамическим перепланированием → делегирование подзадач специализированным агентам (в т.ч. API-агент) с исполнением кода в защищённой песочнице → выдача policy-compliant результата.
  • Отдельный фокус на комплаенсе: ранее внутренние оценки агентов показывали, что при множестве политик доля policy-compliant завершений может падать до единиц процентов (в примере с 5+ политиками — 7,1%).
  • Интеграции/модели: поддержка Langflow и открытых моделей вроде gpt-oss-120b и Llama-4-Maverick-17B-128E-Instruct-fp8.

Публикация отмечает и «шероховатости» (например, баг с выходом из run loop), поэтому IBM фактически приземляет ожидания: даже при улучшении метрик агенты всё ещё ошибаются и требуют строгих guardrails в реальных бизнес-процессах.

Читайте также

  1. AI-агенты обещают 'управлять бизнесом', но кто отвечает, если что-то пойдет не так?
  2. Как мы построили AI-экзоскелет для QA-инженера: от идеи до 11 автономных агентов
  3. Дайджест: OpenAI покупает TBPN, CNN строит agentic-инфраструктуру, а Grok хотят сделать обязательным в IPO SpaceX?
  4. Прощайте, менеджеры среднего звена. Здравствуйте, «играющие тренеры» и «орг-лиды».
  5. Renga API: автоматизируем автоматизацию с помощью ИИ-агентов
Ключевые инсайты из новости (по версии ChatGPT)
  • CUGA: open-source generalist-агент IBM для enterprise-воркфлоу: IBM выпустила Configurable Generalist Agent (CUGA) как open-source инструмент для автоматизации многошаговых корпоративных задач через multi-agent orchestration, API-интеграции и генерацию кода. Важно: позиционирование — «настраиваемый generalist-агент» для knowledge workers с акцентом на безопасное и доверенное выполнение.
    [AI Agents]
Для получения полного доступа оформите подписку PubMag PRO.
Зарегистрированные пользователи видят только два тезиса.
Зарегистрироваться
Инсайты автоматически генерируются с помощью искусственного интеллекта на основе текста статьи.
← Назад в лентуЧитать оригинал →
✈️ Подписывайтесь на мой Telegram-канал — там еще больше интересного про AdTech, MarTech, AI и многое другое!