Материал даёт практическую карту по Retrieval-Augmented Generation (RAG) — архитектуре, совмещающей поиск и генерацию для актуальных и проверяемых ответов. Подход предложен в 2020 году как альтернатива «запеканию» знаний в параметры LLM: данные хранятся во внешней базе и подтягиваются на лету.Архитектура: офлайн-ингест и индексирование (разбиение на фрагменты с оверлэпом, эмбеддинги), векторные БД (Faiss, Milvus, Qdrant, Pinecone, Weaviate, Chroma, pgVector/OpenSearch), онлайн-retrieval (top-K,