Кейс: GraphRAG — AI-ассистент, понимающий Жилищный кодекс РФ
Кейс GPTunneL на
Хабре показывает, как GraphRAG (архитектура
Microsoft) можно адаптировать для нормативных баз: команда построила объяснимый граф знаний по Жилищному кодексу
РФ для запроса крупной корпорации (NDA). Проблематика классического RAG в праве — потеря связей и контекста: до 37% значимых связей пропускаются, до 20% ответов оказываются некорректными/неполными, а аудит ответа юристом может занимать до 4 часов. Масштаб задачи — 800 000+ документов в РФ и 100 000+ правок ежегодно — требует структурной модели знаний.
В решении узлы — статьи, законы, роли и организации; связи — «ссылается/регулирует/дополняет/исключает». Граф строится через извлечение сущностей и триплетов, доменную и языковую адаптацию промптов (Law, русский), после чего граф кластеризуется алгоритмом Лейдена и индексируется. Ключевая инженерная проблема — «гиперузлы» (например, узел «Кодекс»), которые «смазывают» модульность и ухудшают Community Reports и поиск.
- Оптимизации: Stop-Entity Filter, Degree Cap & Split, k-NN Edge Pruning (k≈15), порог по весам рёбер, нормализация сущностей, повторный индекс и пересборка отчётов.
- Результат: тематически чистые кластеры («Договор соцнайма», «Капремонт», «ЖСК» и др.), рост релевантности Global/Local/DRIFT-поиска, объяснимые ответы с прослеживаемостью до норм.
- Бизнес-эффект: масштабируемое управление знаниями для регламентов (ГОСТ, ISO, ESG, внутренние политики) и ответы по документам, выходящим за пределы контекстного окна.
Читайте также
- GraphRAG для регламентных корпусов: Классический RAG теряет значимые связи и контекст на нормативных массивах; для таких корпусов лучше применять графовую схему знаний с явными сущностями и отношениями. GraphRAG даёт объяснимые ответы и масштабируется на десятки миллионов символов, что критично для корпоративных политик, стандартов и compliance.
[Архитектура]
Зарегистрированные пользователи видят только два тезиса.
Зарегистрироваться

