Собираем LLM-агента на Python

Команда Python for Devs перевела материал о том, как в LangChain 1.0 собирать продакшен-LLM-агентов через middleware. Главный вывод: отдельные прослойки для контекста, безопасности и контроля делают поведение агента более управляемым.

  • LangChain 1.0 вводит компонуемую архитектуру middleware вместо сложных pre/post-хуков, с которыми часто сталкивались в LangChain v0.x.
  • Каждый middleware — изолированный компонент, который решает одну задачу, тестируется независимо и комбинируется через стандартный интерфейс.
  • Выделены четыре категории middleware: Monitor, Modify, Control и Enforce.
  • Разобраны пять компонентов: SummarizationMiddleware, PIIMiddleware, HumanInTheLoopMiddleware, TodoListMiddleware и LLMToolSelectorMiddleware.
  • В демонстрации суммирования порог — 400 токенов и сохранение последних 5 сообщений; отдельно отмечено, что в продакшене обычно используют 4000 токенов и 20 сообщений.
  • В примере диалога показано снижение входных токенов до 184 вместо оценочных 705 (−74%) после включения суммирования по порогу.

Почему это важно: Паттерн middleware переносит ключевые «обвязочные» функции агента в отдельные, проверяемые блоки и снижает связанность кода. Это упрощает сочетание подходов вроде суммирования истории, обработки чувствительных данных и контроля критичных действий в одном сценарии. В тексте это сопоставляется с веб-middleware подходам и практикам и подчёркивает переиспользуемость компонентов.

На что обратить внимание: В примерах значения порогов и настроек намеренно занижены для демонстрации, поэтому перенос в продакшен подразумевает подбор параметров под реальные диалоги и модели. Отдельно показано, что фильтрация чувствительных данных применяется до обработки сообщения моделью, а чувствительные действия могут требовать паузы и продолжения из сохранённого состояния. Как следующий шаг для более сложных сценариев в материале упоминается LangGraph для координации и работы с общим состоянием.

Читайте также

  1. RLM: почему LLM-агент забывает цель и как это исправить
  2. Claude Code изнутри: как устроены ИИ-агенты для разработки
  3. Универсальный AI-агент с поддержкой skills и практические сценарии
  4. Агентные системы для продакшена
  5. ИИ-агенты: как мы сделали DeepResearch по корпоративным данным и кодовой базе
Ключевые инсайты из новости (по версии ChatGPT)
  • LangChain 1.0: middleware вместо pre/post-хуков для продакшен-агентов: В LangChain 1.0 предлагается компонуемая архитектура middleware, которая упрощает масштабирование и тестирование агента по сравнению с подходом pre/post-хуков в v0.x. Каждый middleware решает одну задачу, тестируется отдельно и комбинируется со стандартным интерфейсом.
    [Инструменты и архитектура]
Для получения полного доступа оформите подписку PubMag PRO.
Зарегистрированные пользователи видят только два тезиса.
Зарегистрироваться
Инсайты автоматически генерируются с помощью искусственного интеллекта на основе текста статьи.
← Назад в лентуЧитать оригинал →
✈️ Подписывайтесь на мой Telegram-канал — там еще больше интересного про AdTech, MarTech, AI и многое другое!