Статья описывает «живое знание» как управляемый движок импорта данных, где решения принимают детерминированные правила, а LLM выступает ассистентом. В центре — Онто как модель знаний (DatasetSignature, DatasetClass, PipelineTemplate, RecognitionResult), MCP как оркестратор шагов и связка MinIO → Airflow (единый DAG csv_ingest_pg) → Postgres. Подход “storage-first” и presigned PUT/GET исключают проксирование тяжёлых данных, снижают TCO и риски.Сигнатуры датасетов (нормализованный хедер, хэши, тип