Вам не нужен OpenClaw

Никита Пастухов, автор FastStream и мейнтейнер AG2, разбирает устройство личных AI-агентов на примере OpenClaw и сводит их к практической формуле: LLM плюс Harness. Главный тезис: под универсальным агентом нет магии, а своего специализированного агента можно собрать из контекста, инструментов, памяти, сабагентов, скиллов и cron-задач.

OpenClaw описан как личный AI-агент в мессенджере: он может разбирать почту, вести соцсети, писать код и деплоить сервисы. Автор считает, что универсальный агент хуже специализированного: если агент нужен для одной рабочей задачи, ему не стоит давать доступ ко всем сервисам, кодовой базе и деплою. Так уменьшается поверхность атаки, проще контролировать поведение и точнее закрываются реальные процессы пользователя.

Базовая схема агента — Agent = LLM + Harness. LLM в этой модели работает как stateless HTTP-ручка, которая получает JSON и возвращает JSON, а Harness отвечает за управление контекстом, инструменты, память, скиллы, мультиагентную логику и интеграции. Контекст — это история сообщений, которую приходится передавать в каждый запрос; когда она разрастается, её сжимают: отбрасывают старые сообщения, фильтруют типы сообщений или сворачивают диалог в summary с помощью отдельной LLM.

Инструменты дают агенту возможность действовать вне чата: вызывать функции, ходить в интернет, работать с файлами, базами данных, Google Docs, Notion, Maps или операционной системой. MCP в этой логике — такие же инструменты, только вынесенные в отдельный процесс по HTTP или сокету; память — тоже набор инструментов для чтения, записи и поиска знаний, а RAG отличается в основном тем, что вместо файловой системы использует векторную базу. Сабагенты помогают не забивать основной контекст промежуточными вызовами, скиллы подгружают большие инструкции и скрипты по требованию, а фоновые задачи сводятся к scheduler toolkit и cron, который вызывает агента по расписанию.

Главное ограничение — безопасность. Если агент читает письма, веб-страницы или документы, вредоносный текст может попасть в контекст и сработать как prompt injection, поэтому входящие данные нужно валидировать. Второй принцип — минимальные права: агенту для почты не нужен деплой, агенту для поиска фактов не нужен доступ ко всей файловой системе, а для надёжности такие системы лучше запускать в sandbox или контейнере.

Коротко

  • Автор сводит AI-агента к схеме LLM плюс Harness: модель отвечает JSON, а обвязка управляет контекстом, инструментами и памятью.
  • OpenClaw разобран как пример универсального личного агента, но автор советует писать узких агентов под конкретные рабочие процессы.
  • Контекст агента растёт с каждым запросом, поэтому нужны политики compaction: удаление старых сообщений или сжатие истории в summary.
  • MCP, память, RAG, сабагенты и скиллы описаны как вариации одного паттерна: инструментов, которые агент вызывает через JSON-схемы.
  • Для безопасности предлагаются два базовых правила: минимальные права для агента и защита от prompt injection из внешних источников.

FAQ

Зачем писать своего AI-агента, если уже есть универсальные решения вроде OpenClaw для почты, соцсетей, кода и деплоя?

Автор считает, что специализированный агент лучше решает узкую задачу и требует меньше прав. Это снижает риск ошибок и уменьшает поверхность атаки.

Чем MCP отличается от обычных инструментов агента в описанной архитектуре LLM плюс Harness?

Для модели разницы почти нет: MCP тоже выглядит как набор вызываемых инструментов. Отличие в том, что MCP-сервер живёт отдельно и может обслуживать много агентов.

Как сабагенты и скиллы помогают не перегружать основной контекст AI-агента лишними данными и инструментами?

Сабагент решает подзадачу в отдельном контексте и возвращает только итог. Скилл подгружает большую инструкцию или скрипты только тогда, когда они нужны.

Читайте также

  1. От RAG-прототипа к агенту в продакшн: путь по метрикам, а не по моде
  2. Самохостный AI-агент на почте, systemd и LLM
  3. Конец бесплатного кремния: как Google AI Studio превратилась из рая для инженеров в симулятор смены аккаунтов
  4. Тестируем MVP в 4 раза быстрее: как нейросети изменили жизнь предпринимателей
  5. Генеральное исследование рынка ИИ-агентов и Zero-Employee Company
Ключевые инсайты из новости (по версии ChatGPT)
  • Архитектура AI-агента как LLM плюс Harness: AI-агента удобно проектировать как связку LLM и управляющей обвязки Harness. Модель принимает и возвращает JSON, а реальная продуктовая ценность появляется в слое вокруг неё: контекст, инструменты, память, скиллы, интеграции, права доступа и правила безопасности.
    [AI-агенты и автоматизация]
Для получения полного доступа оформите подписку PubMag PRO.
Зарегистрированные пользователи видят только два тезиса.
Зарегистрироваться
Инсайты автоматически генерируются с помощью искусственного интеллекта на основе текста статьи.
← Назад в лентуЧитать оригинал →
✈️ Подписывайтесь на мой Telegram-канал — там еще больше интересного про AdTech, MarTech, AI и многое другое!