Контекстная амнезия: три агента, три IDE, ноль общей памяти

Основатель CortexAlly описывает CoAlly как общий слой памяти для AI-агентов и IDE, который должен убрать постоянный пересказ контекста между Claude Code, Cursor и Windsurf. Сервис задуман как способ автоматически сохранять решения, причины изменений и историю задач, а затем возвращать их агенту в нужный момент через MCP.

Проблема, которую автор пытается решить, — разрыв контекста между сессиями, инструментами и людьми. По его оценке, на повторное объяснение уже известной информации уходит от 30% до 50% полезного времени и токенов, а привычные варианты вроде CLAUDE.md, .cursorrules, Memory Bank и локального RAG либо статичны, либо живут внутри одного инструмента, либо требуют ручной синхронизации. CoAlly предлагается как общая долгосрочная память, где агент сам сохраняет значимые решения, баги и причины изменений, а потом запрашивает их без ручного пересбора контекста.

Под капотом у сервиса векторная база, мультиязычные локальные эмбеддинги, семантический поиск по cosine similarity, HNSW-индекс и асинхронная запись, чтобы не тормозить рабочий процесс. В статье перечислены практические сценарии: передача контекста между разными IDE, онбординг нового разработчика, сохранение истории проекта после ухода ключевого сотрудника и командный шаринг находок без созвонов и пересказов. Для enterprise заявлены on-premise, изоляция организаций, шифрование контента и работа данных внутри корпоративного контура.

Автор отдельно приводит примерную экономику: потеря контекста при замене senior-разработчика в Европе оценивается в €17-50K, повторное объяснение контекста в команде из 10 человек — в €60K в год, а лишние пересказы агентам — примерно в €9,375 в год на одного разработчика. При этом CoAlly не подаётся как замена документации: если агент сохраняет мусор, то мусор останется и в памяти, а сами агенты могут игнорировать инструкции. В roadmap упомянуты гибридный поиск с BM25 и RRF, GraphRAG и A2A, а бесплатный тариф рассчитан на два проекта без ограничения по времени.

Коротко

  • Автор оценивает потери на повторный пересказ контекста для AI-агентов в 30–50% полезного времени и токенов.
  • CoAlly подключается через MCP и должен автоматически сохранять решения, баги, причины изменений и связанный контекст проекта.
  • Под капотом описаны векторная база, локальные мультиязычные эмбеддинги, cosine similarity, HNSW-индекс и асинхронная запись.
  • Среди сценариев названы перенос контекста между IDE, онбординг, шаринг знаний в команде и сохранение истории после увольнений.
  • Для enterprise заявлены on-premise, изоляция организаций, шифрование контента, а бесплатный тариф ограничен двумя проектами.

FAQ

Зачем нужен CoAlly, если у команды уже есть CLAUDE.md, .cursorrules, Memory Bank и локальный RAG для хранения контекста?

По версии автора, эти инструменты плохо шарят знания между разными агентами и часто требуют ручного обновления. CoAlly задуман как единая память, которая работает поверх разных IDE и сессий.

Как сервис находит нужную запись по задаче, если в сохранённом контексте нет точного совпадения слов из нового запроса?

В статье сказано, что CoAlly использует семантический поиск по векторной базе: запрос и записи сравниваются по близости эмбеддингов, а ускорение даёт HNSW-индекс.

Какие ограничения автор прямо признаёт у CoAlly и почему сервис не подаётся как полная замена документации и процессов?

Автор пишет, что CoAlly не заменяет документацию, не думает за пользователя и зависит от качества сохранённого контекста. Кроме того, агент может не всегда корректно запросить память в нужный момент.

Читайте также

  1. Память на миллион токенов, а толку ноль: как ИИ-агента спасали от «тупости»
  2. Наглядный пример, зачем нужны AI-агенты
  3. От RAG-прототипа к агенту в продакшн: путь по метрикам, а не по моде
  4. Тестируем MVP в 4 раза быстрее: как нейросети изменили жизнь предпринимателей
  5. Практическое руководство по инжинирингу контекста для AI-ассистентов
Ключевые инсайты из новости (по версии ChatGPT)
  • Контекстная амнезия как операционная проблема AI-агентов: При работе сразу с несколькими AI-агентами и IDE значимая часть времени уходит не на реализацию, а на повторную передачу уже известного контекста. Для внутренних процессов это отдельная категория потерь: стоит считать не только токены, но и ручное восстановление решений из Jira, wiki, чатов и коммитов.
    [Процессы AI-разработки]
Для получения полного доступа оформите подписку PubMag PRO.
Зарегистрированные пользователи видят только два тезиса.
Зарегистрироваться
Инсайты автоматически генерируются с помощью искусственного интеллекта на основе текста статьи.
← Назад в лентуЧитать оригинал →
✈️ Подписывайтесь на мой Telegram-канал — там еще больше интересного про AdTech, MarTech, AI и многое другое!