Наглядный пример, зачем нужны AI-агенты

Разработчик описывает, как новостной RAG-поисковик за полгода вырос из семантического прототипа в систему, где сервис становится источником знаний и инструментом для AI-агента. Главная мысль: персонализацию и работу с источниками лучше отдавать агенту, а надежность поиска держать в модели данных и связей.

Изначальная задача была простой: пользователь задает список источников и пожелания, а система в выбранный интервал присылает сводку новостей и отвечает на вопросы. За 1–2 месяца появился прототип с семантическим поиском, LLM-ответами и открытием найденных постов, но сложные запросы и имена собственные быстро показали пределы семантической близости: длинные формулировки размывались, аббревиатуры вроде ЦБ РФ распознавались нестабильно, а причинные связи между событиями не находились.

Вместо плоского RAG автор перешел к модели ARTICLE — EVENT — ENTITY: статья фиксирует состояние объектов в момент времени, события описывают отношения объектов, а сущности живут отдельно от текстов и событий. Тексты новостей, события и объекты разнесены по разным «плоскостям»; связи между плоскостями считаются жесткими, а связи внутри плоскостей могут пересчитываться динамически. Это должно помогать находить не только похожие тексты, но и связанный контекст: например, выйти от Ливана к Ормузскому проливу через общее событие и набор сущностей.

Рабочая система собирала посты из открытых Telegram-каналов, нормализовала их, фильтровала рекламность, выделяла через LLM события и объекты, сохраняла тексты в векторную БД, а связи — в SQL. На поиске она перефразировала запрос, выделяла временной интервал, делала несколько запросов к базе, добавляла связанные события и суммаризировала найденные статьи. Затем автор решил не наращивать сервис как универсальный «швейцарский нож», а разделить ответственность: агент отвечает за персонализацию, выбор источников, парсинг и расписание запросов, а сервис становится авторизованным хранилищем, MCP-сервером и набором контролируемых инструментов.

Коротко

  • Прототип новостного анализатора был собран за 1–2 месяца и работал через семантический поиск, LLM-ответы и открытие найденных постов.
  • Главная проблема обычного RAG в кейсе автора — слабое понимание длинных запросов, имен собственных и связей между событиями.
  • Модель ARTICLE — EVENT — ENTITY разделяет тексты, события и сущности по разным плоскостям, чтобы не строить один разросшийся граф.
  • Система сохраняет тексты в векторную БД, а связи между постами, событиями и объектами — в обычную SQL-таблицу.
  • В новой архитектуре агент сам выбирает запросы, временные фильтры и источники, а сервис выступает хранилищем и набором инструментов.

FAQ

Зачем автору понадобились AI-агенты, если новостной RAG-поисковик уже умел искать и суммаризировать статьи?

Агенты нужны для персонализации: они могут сами выбирать источники, расписание, фильтры и дополнительные действия под конкретного пользователя. Сервис при этом остается более простым и контролируемым.

Чем предложенная схема ARTICLE — EVENT — ENTITY отличается от обычного семантического поиска по новостям?

Она хранит отдельно статьи, события и сущности, а связи между ними использует как дополнительный контекст. Поэтому поиск может выходить на связанные события, а не только на похожие по тексту документы.

Какие ограничения у описанного подхода остаются нерешенными даже после перехода к агентной модели?

Автор отдельно отмечает риск внешнего заполнения источников мусорным или вредным контентом. Также не решена проблема памяти: входной точкой поиска все еще остается семантический поиск.

Читайте также

  1. Практическое руководство по инжинирингу контекста для AI-ассистентов
  2. Контекстная амнезия: три агента, три IDE, ноль общей памяти
  3. Как тимлид заменил десятки вкладок на файловую систему и Claude Code
  4. Как я пришёл в аналитику, устроился в бигтех и понял, что рабочих задач недостаточно для роста
  5. «ИИ, найди факты, а я подумаю»: почему гибридный подход не работает для форсайта
Ключевые инсайты из новости (по версии ChatGPT)
  • Ограничения плоского RAG-поиска в новостях: Семантический поиск хорошо находит похожие тексты, но плохо работает с длинными причинно-следственными запросами, нестабильными именами собственными и аббревиатурами. Для новостной аналитики этого недостаточно: важны не только похожие формулировки, но и связи между событиями, объектами и временным контекстом.
    [AI / RAG / Поиск]
Для получения полного доступа оформите подписку PubMag PRO.
Зарегистрированные пользователи видят только два тезиса.
Зарегистрироваться
Инсайты автоматически генерируются с помощью искусственного интеллекта на основе текста статьи.
← Назад в лентуЧитать оригинал →
✈️ Подписывайтесь на мой Telegram-канал — там еще больше интересного про AdTech, MarTech, AI и многое другое!