Наглядный пример, зачем нужны AI-агенты

26.04.2026 • Хабр

Разработчик описывает, как новостной RAG-поисковик за полгода вырос из семантического прототипа в систему, где сервис становится источником знаний и инструментом для AI-агента. Главная мысль: персонализацию и работу с источниками лучше отдавать агенту, а надежность поиска держать в модели данных и связей.

Изначальная задача была простой: пользователь задает список источников и пожелания, а система в выбранный интервал присылает сводку новостей и отвечает на вопросы. За 1–2 месяца появился прототип с семантическим поиском, LLM-ответами и открытием найденных постов, но сложные запросы и имена собственные быстро показали пределы семантической близости: длинные формулировки размывались, аббревиатуры вроде ЦБ РФ распознавались нестабильно, а причинные связи между событиями не находились.

Вместо плоского RAG автор перешел к модели ARTICLE — EVENT — ENTITY: статья фиксирует состояние объектов в момент времени, события описывают отношения объектов, а сущности живут отдельно от текстов и событий. Тексты новостей, события и объекты разнесены по разным «плоскостям»; связи между плоскостями считаются жесткими, а связи внутри плоскостей могут пересчитываться динамически. Это должно помогать находить не только похожие тексты, но и связанный контекст: например, выйти от Ливана к Ормузскому проливу через общее событие и набор сущностей.

Рабочая система собирала посты из открытых Telegram-каналов, нормализовала их, фильтровала рекламность, выделяла через LLM события и объекты, сохраняла тексты в векторную БД, а связи — в SQL. На поиске она перефразировала запрос, выделяла временной интервал, делала несколько запросов к базе, добавляла связанные события и суммаризировала найденные статьи. Затем автор решил не наращивать сервис как универсальный «швейцарский нож», а разделить ответственность: агент отвечает за персонализацию, выбор источников, парсинг и расписание запросов, а сервис становится авторизованным хранилищем, MCP-сервером и набором контролируемых инструментов.

Коротко

Прототип новостного анализатора был собран за 1–2 месяца и работал через семантический поиск, LLM-ответы и открытие найденных постов.
Главная проблема обычного RAG в кейсе автора — слабое понимание длинных запросов, имен собственных и связей между событиями.
Модель ARTICLE — EVENT — ENTITY разделяет тексты, события и сущности по разным плоскостям, чтобы не строить один разросшийся граф.
Система сохраняет тексты в векторную БД, а связи между постами, событиями и объектами — в обычную SQL-таблицу.
В новой архитектуре агент сам выбирает запросы, временные фильтры и источники, а сервис выступает хранилищем и набором инструментов.

FAQ

Зачем автору понадобились AI-агенты, если новостной RAG-поисковик уже умел искать и суммаризировать статьи?

Агенты нужны для персонализации: они могут сами выбирать источники, расписание, фильтры и дополнительные действия под конкретного пользователя. Сервис при этом остается более простым и контролируемым.

Чем предложенная схема ARTICLE — EVENT — ENTITY отличается от обычного семантического поиска по новостям?

Она хранит отдельно статьи, события и сущности, а связи между ними использует как дополнительный контекст. Поэтому поиск может выходить на связанные события, а не только на похожие по тексту документы.

Какие ограничения у описанного подхода остаются нерешенными даже после перехода к агентной модели?

Автор отдельно отмечает риск внешнего заполнения источников мусорным или вредным контентом. Также не решена проблема памяти: входной точкой поиска все еще остается семантический поиск.

PubMag

Наглядный пример, зачем нужны AI-агенты

Коротко

FAQ

Зачем автору понадобились AI-агенты, если новостной RAG-поисковик уже умел искать и суммаризировать статьи?

Чем предложенная схема ARTICLE — EVENT — ENTITY отличается от обычного семантического поиска по новостям?

Какие ограничения у описанного подхода остаются нерешенными даже после перехода к агентной модели?

Читайте также