IBM выпускает CUGA — open-source AI-агента, который выполняет больше половины задач
IBM выложила в open source AI-агента CUGA (Configurable Generalist Agent), ориентированного на автоматизацию многошаговых enterprise-воркфлоу через оркестрацию агентов, интеграции по API и генерацию кода. По данным IBM, на бенчмарках агент показывает «топовый для рынка» уровень: 61,7% успешных выполнений веб-задач в WebArena и 48,2% завершений сценариев API-задач в AppWorld. На фоне скепсиса к агентам (Gartner рекомендует блокировать agentic browsers и прогнозирует отмену ~40% агентных enterprise-проектов к 2027 году из-за недостатка бизнес-ценности) IBM делает ставку на практичность и контролируемость.
- Лицензия: Apache 2.0; релиз доступен через HuggingFace.
- Архитектура: слой диалога для извлечения намерения → планирование и контроль → «task ledger» с динамическим перепланированием → делегирование подзадач специализированным агентам (в т.ч. API-агент) с исполнением кода в защищённой песочнице → выдача policy-compliant результата.
- Отдельный фокус на комплаенсе: ранее внутренние оценки агентов показывали, что при множестве политик доля policy-compliant завершений может падать до единиц процентов (в примере с 5+ политиками — 7,1%).
- Интеграции/модели: поддержка Langflow и открытых моделей вроде gpt-oss-120b и Llama-4-Maverick-17B-128E-Instruct-fp8.
Публикация отмечает и «шероховатости» (например, баг с выходом из run loop), поэтому IBM фактически приземляет ожидания: даже при улучшении метрик агенты всё ещё ошибаются и требуют строгих guardrails в реальных бизнес-процессах.
Читайте также
Обновлённый Sonnet от Anthropic лучше использует компьютер — и временами проявляет экзистенциальную тревогу
Заглянуть под капот ИИ-агентов: новый инструмент раскрывает «магию» Claude Code
Протокольные войны agentic-commerce приходят в e-commerce; Perplexity говорит, что реклама подрывает доверие к AI
Запуск gpt-oss на 20B и 120B параметров на Core i9: сравнение инференса на CPU и GPU (RTX 4090)
В графиках: состояние сектора маркетинговых агентств
- CUGA: open-source generalist-агент IBM для enterprise-воркфлоу: IBM выпустила Configurable Generalist Agent (CUGA) как open-source инструмент для автоматизации многошаговых корпоративных задач через multi-agent orchestration, API-интеграции и генерацию кода. Важно: позиционирование — «настраиваемый generalist-агент» для knowledge workers с акцентом на безопасное и доверенное выполнение.
[AI Agents]
Зарегистрированные пользователи видят только два тезиса.
Зарегистрироваться