IBM выпускает CUGA — open-source AI-агента, который выполняет больше половины задач
IBM выложила в open source AI-агента CUGA (Configurable Generalist Agent), ориентированного на автоматизацию многошаговых enterprise-воркфлоу через оркестрацию агентов, интеграции по API и генерацию кода. По данным IBM, на бенчмарках агент показывает «топовый для рынка» уровень: 61,7% успешных выполнений веб-задач в WebArena и 48,2% завершений сценариев API-задач в AppWorld. На фоне скепсиса к агентам (Gartner рекомендует блокировать agentic browsers и прогнозирует отмену ~40% агентных enterprise-проектов к 2027 году из-за недостатка бизнес-ценности) IBM делает ставку на практичность и контролируемость.
- Лицензия: Apache 2.0; релиз доступен через HuggingFace.
- Архитектура: слой диалога для извлечения намерения → планирование и контроль → «task ledger» с динамическим перепланированием → делегирование подзадач специализированным агентам (в т.ч. API-агент) с исполнением кода в защищённой песочнице → выдача policy-compliant результата.
- Отдельный фокус на комплаенсе: ранее внутренние оценки агентов показывали, что при множестве политик доля policy-compliant завершений может падать до единиц процентов (в примере с 5+ политиками — 7,1%).
- Интеграции/модели: поддержка Langflow и открытых моделей вроде gpt-oss-120b и Llama-4-Maverick-17B-128E-Instruct-fp8.
Публикация отмечает и «шероховатости» (например, баг с выходом из run loop), поэтому IBM фактически приземляет ожидания: даже при улучшении метрик агенты всё ещё ошибаются и требуют строгих guardrails в реальных бизнес-процессах.
Читайте также
AI-агенты обещают 'управлять бизнесом', но кто отвечает, если что-то пойдет не так?
Как мы построили AI-экзоскелет для QA-инженера: от идеи до 11 автономных агентов
Дайджест: OpenAI покупает TBPN, CNN строит agentic-инфраструктуру, а Grok хотят сделать обязательным в IPO SpaceX?
Прощайте, менеджеры среднего звена. Здравствуйте, «играющие тренеры» и «орг-лиды».
Renga API: автоматизируем автоматизацию с помощью ИИ-агентов
- CUGA: open-source generalist-агент IBM для enterprise-воркфлоу: IBM выпустила Configurable Generalist Agent (CUGA) как open-source инструмент для автоматизации многошаговых корпоративных задач через multi-agent orchestration, API-интеграции и генерацию кода. Важно: позиционирование — «настраиваемый generalist-агент» для knowledge workers с акцентом на безопасное и доверенное выполнение.
[AI Agents]
Зарегистрированные пользователи видят только два тезиса.
Зарегистрироваться