Как сделать AI-агентов безопасными: новые рекомендации OWASP

29.07.2025 • Хабр

28 июля OWASP опубликовал новое руководство по безопасности AI-агентов, разработанное при участии экспертов Microsoft, Oracle, NIST, Еврокомиссии и других организаций. Документ охватывает архитектурные шаблоны — от RAG до мультиагентных систем — и содержит рекомендации для всех этапов жизненного цикла: проектирование, разработка, эксплуатация.

Ключевые меры включают: строгие ограничения доступа агентов к API и базам данных, изоляцию при выполнении кода, использование RBAC и доверенных хранилищ секретов, регулярное обновление системных промптов для защиты от манипуляций, а также обязательное применение Human-in-the-loop для критических решений. Отдельно подчеркивается необходимость учета рисков галлюцинаций моделей и каскадных ошибок.

Руководство рекомендует тестирование систем с помощью репрезентативных выборок, автоматизированные и ручные методы редтиминга, интеграцию безопасности в CI/CD и постоянный мониторинг. Особое внимание уделяется угрозам: отравление данных, состязательные атаки, утечки, DoS и злоупотребление автономией. Таким образом, OWASP формирует основу для стандартизации безопасной разработки AI-агентов.

PubMag

Как сделать AI-агентов безопасными: новые рекомендации OWASP

Читайте также