Контекстная амнезия: три агента, три IDE, ноль общей памяти

10.04.2026 • Хабр

Основатель CortexAlly описывает CoAlly как общий слой памяти для AI-агентов и IDE, который должен убрать постоянный пересказ контекста между Claude Code, Cursor и Windsurf. Сервис задуман как способ автоматически сохранять решения, причины изменений и историю задач, а затем возвращать их агенту в нужный момент через MCP.

Проблема, которую автор пытается решить, — разрыв контекста между сессиями, инструментами и людьми. По его оценке, на повторное объяснение уже известной информации уходит от 30% до 50% полезного времени и токенов, а привычные варианты вроде CLAUDE.md, .cursorrules, Memory Bank и локального RAG либо статичны, либо живут внутри одного инструмента, либо требуют ручной синхронизации. CoAlly предлагается как общая долгосрочная память, где агент сам сохраняет значимые решения, баги и причины изменений, а потом запрашивает их без ручного пересбора контекста.

Под капотом у сервиса векторная база, мультиязычные локальные эмбеддинги, семантический поиск по cosine similarity, HNSW-индекс и асинхронная запись, чтобы не тормозить рабочий процесс. В статье перечислены практические сценарии: передача контекста между разными IDE, онбординг нового разработчика, сохранение истории проекта после ухода ключевого сотрудника и командный шаринг находок без созвонов и пересказов. Для enterprise заявлены on-premise, изоляция организаций, шифрование контента и работа данных внутри корпоративного контура.

Автор отдельно приводит примерную экономику: потеря контекста при замене senior-разработчика в Европе оценивается в €17-50K, повторное объяснение контекста в команде из 10 человек — в €60K в год, а лишние пересказы агентам — примерно в €9,375 в год на одного разработчика. При этом CoAlly не подаётся как замена документации: если агент сохраняет мусор, то мусор останется и в памяти, а сами агенты могут игнорировать инструкции. В roadmap упомянуты гибридный поиск с BM25 и RRF, GraphRAG и A2A, а бесплатный тариф рассчитан на два проекта без ограничения по времени.

Коротко

Автор оценивает потери на повторный пересказ контекста для AI-агентов в 30–50% полезного времени и токенов.
CoAlly подключается через MCP и должен автоматически сохранять решения, баги, причины изменений и связанный контекст проекта.
Под капотом описаны векторная база, локальные мультиязычные эмбеддинги, cosine similarity, HNSW-индекс и асинхронная запись.
Среди сценариев названы перенос контекста между IDE, онбординг, шаринг знаний в команде и сохранение истории после увольнений.
Для enterprise заявлены on-premise, изоляция организаций, шифрование контента, а бесплатный тариф ограничен двумя проектами.

FAQ

Зачем нужен CoAlly, если у команды уже есть CLAUDE.md, .cursorrules, Memory Bank и локальный RAG для хранения контекста?

По версии автора, эти инструменты плохо шарят знания между разными агентами и часто требуют ручного обновления. CoAlly задуман как единая память, которая работает поверх разных IDE и сессий.

Как сервис находит нужную запись по задаче, если в сохранённом контексте нет точного совпадения слов из нового запроса?

В статье сказано, что CoAlly использует семантический поиск по векторной базе: запрос и записи сравниваются по близости эмбеддингов, а ускорение даёт HNSW-индекс.

Какие ограничения автор прямо признаёт у CoAlly и почему сервис не подаётся как полная замена документации и процессов?

Автор пишет, что CoAlly не заменяет документацию, не думает за пользователя и зависит от качества сохранённого контекста. Кроме того, агент может не всегда корректно запросить память в нужный момент.

PubMag

Контекстная амнезия: три агента, три IDE, ноль общей памяти

Коротко

FAQ

Зачем нужен CoAlly, если у команды уже есть CLAUDE.md, .cursorrules, Memory Bank и локальный RAG для хранения контекста?

Как сервис находит нужную запись по задаче, если в сохранённом контексте нет точного совпадения слов из нового запроса?

Какие ограничения автор прямо признаёт у CoAlly и почему сервис не подаётся как полная замена документации и процессов?

Читайте также