Мультиагентные системы в LegalTech: как симуляция судебного процесса повышает точность прогнозов (разбор SimCourt)

25.01.2026 • Хабр

Препринт исследователей Университета Цинхуа (декабрь 2025) описывает SimCourt — мультиагентную систему (MAS) для симуляции судебного разбирательства, где LLM (большие языковые модели) «судят» друг друга. В разборе утверждается, что role-playing симуляция и спор ролей повышают точность предсказаний по сравнению с одиночным прогоном.

Работа «Chinese Court Simulation with LLM-Based Agent System» (декабрь 2025) описывает архитектуру SimCourt как мультиагентную систему для моделирования суда.
Система следует процедурному пайплайну уголовного процесса КНР из 5 стадий и моделирует участников (судья, прокурор, адвокат) как автономных агентов.
У каждого агента описаны модуль профиля (жесткие ролевые установки), модуль памяти и модуль стратегии (planning & strategy) для проактивного планирования аргументов.
Память реализована двухуровнево: Short-Term Memory для текущей стадии и Long-Term Memory, куда после каждой стадии добавляется саммари (summarize).
Агенты имеют доступ к LegalOne (база судебных кейсов) и полному тексту УК через RAG (retrieval-augmented generation).
В ablation study отключение стадии симуляции увеличивает Relative Error в предсказании тюремного срока; оценивание описано как blind review по стенограммам, базовая модель — DeepSeek-v3.

Почему это важно: Текст описывает попытку решить ограничения single-shot inference за счет того, что вывод формируется через конфликт нескольких агентов, а не внутри одной модели. Это подчеркивает переход в Legal AI от «оберток над API» и промптов к инженерному проектированию агентных архитектур для роста метрик точности. Механика спора выступает как встроенная проверка аргументов и снижает риск confirmation bias, о котором говорится в разборе.

На что обратить внимание: Симуляция жестко привязана к процедурному пайплайну уголовного процесса КНР, и в тексте не утверждается, что выводы автоматически переносятся на другие юрисдикции или форматы разбирательств. Для продакшена отдельно отмечается барьер юнит-экономики и UX: полная симуляция требует тысяч последовательных запросов к LLM на один кейс и кратно усложняет оркестрацию и поддержку пяти взаимодействующих агентов. В качестве следующего шага в одном из проектов упоминается компромиссный подход consensus вместо simulation, где модели валидируют друг друга асинхронно.

Коротко

В тексте проблема single-shot вывода объясняется через confirmation bias: без внешнего критика модель цепляется за первую гипотезу и игнорирует противоречия.
SimCourt использует конфликт ролей как проверку аргументов: в таких схемах ошибки и выдуманные факты чаще всплывают на этапе спора, а не в финальном ответе.
Для продакшена автор подчеркивает компромисс между точностью и UX: полная симуляция ведет к длинным цепочкам вызовов LLM и усложняет стейт-менеджмент.
В одном из проектов вместо симуляции упоминается consensus: параллельный ансамбль, где модели валидируют друг друга асинхронно, снижая риск галлюцинаций.
Отдельный сигнал текста — рост прикладных agentic-экспериментов в Азии: исследование из Китая подается как пример сдвига в сторону инженерных архитектур.

FAQ

Зачем LegalTech-командам разбираться в SimCourt и мультиагентной симуляции суда, если сейчас многие решения строятся вокруг одного LLM + RAG-пайплайна?

Текст утверждает, что одного линейного прогона часто недостаточно для качества вывода, и предлагает архитектурный путь повышения точности через спор ролей. Это подается как ответ на рост требований рынка к метрикам точности.

Как SimCourt отличается от классического линейного пайплайна «фабула → RAG → LLM → вердикт» и какую роль играет имитация спора между агентами?

Вместо одиночного вывода используется многоступенчатая role-playing симуляция с судьями/сторонами как автономными агентами. Спор ролей в тексте рассматривается как способ выявлять логические ошибки и «фильтровать» галлюцинации.

Какие результаты и ограничения авторы отмечают при сравнении симуляции со стенограммами реальных судов: где система сильнее, а где уступает человеческим юристам?

В разборе отмечены сильные стороны в цитировании законов и удержании процедурной структуры, а также в логической согласованности. Среди слабых мест названы эмоциональная аргументация и случаи наводящих вопросов, связанных с тонкостями процессуальной этики.

Почему полная симуляция может быть проблемой для B2C-сервиса и какой компромисс между simulation и consensus описывается в проекте «неШемяки!»?

Указывается, что симуляция требует тысяч последовательных запросов к LLM на кейс и ведет к высокой задержке и себестоимости, а также усложняет оркестрацию. В качестве компромисса описан consensus-подход: параллельный ансамбль, где модели валидируют друг друга асинхронно.

PubMag