Мультиагентные системы в LegalTech: как симуляция судебного процесса повышает точность прогнозов (разбор SimCourt)

Препринт исследователей Университета Цинхуа (декабрь 2025) описывает SimCourt — мультиагентную систему (MAS) для симуляции судебного разбирательства, где LLM (большие языковые модели) «судят» друг друга. В разборе утверждается, что role-playing симуляция и спор ролей повышают точность предсказаний по сравнению с одиночным прогоном.

  • Работа «Chinese Court Simulation with LLM-Based Agent System» (декабрь 2025) описывает архитектуру SimCourt как мультиагентную систему для моделирования суда.
  • Система следует процедурному пайплайну уголовного процесса КНР из 5 стадий и моделирует участников (судья, прокурор, адвокат) как автономных агентов.
  • У каждого агента описаны модуль профиля (жесткие ролевые установки), модуль памяти и модуль стратегии (planning & strategy) для проактивного планирования аргументов.
  • Память реализована двухуровнево: Short-Term Memory для текущей стадии и Long-Term Memory, куда после каждой стадии добавляется саммари (summarize).
  • Агенты имеют доступ к LegalOne (база судебных кейсов) и полному тексту УК через RAG (retrieval-augmented generation).
  • В ablation study отключение стадии симуляции увеличивает Relative Error в предсказании тюремного срока; оценивание описано как blind review по стенограммам, базовая модель — -v3.

Почему это важно: Текст описывает попытку решить ограничения single-shot inference за счет того, что вывод формируется через конфликт нескольких агентов, а не внутри одной модели. Это подчеркивает переход в Legal AI от «оберток над API» и промптов к инженерному проектированию агентных архитектур для роста метрик точности. Механика спора выступает как встроенная проверка аргументов и снижает риск confirmation bias, о котором говорится в разборе.

На что обратить внимание: Симуляция жестко привязана к процедурному пайплайну уголовного процесса КНР, и в тексте не утверждается, что выводы автоматически переносятся на другие юрисдикции или форматы разбирательств. Для продакшена отдельно отмечается барьер юнит-экономики и UX: полная симуляция требует тысяч последовательных запросов к LLM на один кейс и кратно усложняет оркестрацию и поддержку пяти взаимодействующих агентов. В качестве следующего шага в одном из проектов упоминается компромиссный подход consensus вместо simulation, где модели валидируют друг друга асинхронно.

Читайте также

  1. Универсальный AI-агент с поддержкой skills и практические сценарии
  2. 15+ лучших инструментов и гайдов Яндекса по ИИ
  3. SoftMax: как нейросети превращают логиты в уверенные вероятности — разбор с примерами и математикой
  4. Когда ИИ не понимает бизнес-контексты
  5. Агентные системы для продакшена
Ключевые инсайты из новости (по версии ChatGPT)
  • Role-playing simulation вместо single-shot inference для снижения confirmation bias: Линейный пайплайн «ввод → RAG → LLM → вывод» уязвим к confirmation bias: модель закрепляется на первой гипотезе и начинает игнорировать или выдумывать противоречащие факты ради связности ответа. Альтернатива из статьи — многошаговая role-playing симуляция, где вывод формируется через конфликт ролей (внешний критик/оппонент), а не через один прогон модели.
    [LLM-архитектуры и качество вывода]
Для получения полного доступа оформите подписку PubMag PRO.
Зарегистрированные пользователи видят только два тезиса.
Зарегистрироваться
Инсайты автоматически генерируются с помощью искусственного интеллекта на основе текста статьи.
← Назад в лентуЧитать оригинал →
✈️ Подписывайтесь на мой Telegram-канал — там еще больше интересного про AdTech, MarTech, AI и многое другое!