Кейс: автоматизация FAQ-поддержки без генеративного ИИ с помощью семантического поиска по базе «Вопрос–Ответ». Все вопросы FAQ и входящий запрос кодируются в эмбеддинги (SentenceTransformers, ruBERT cointegrated/rubert-tiny2), релевантность определяется косинусной близостью. Сервер — Python/Flask (CORS), деплой через Nginx+Gunicorn; REST-интерфейс принимает JSON с полем question, отдаёт most_similar_question, answer, similarity. Эмбеддинги базы считаются один раз при загрузке, поэтому хватает CPU; система может работать в закрытом контуре без ключей и токенов.Практики качества: эмпирическая настройка порога близости (~0.7–0.8) под каждую базу; журналирование Q/A; фиксация кейсов с низкой близостью для расширения FAQ; опция пользовательской оценки ответа.Ограничения: нет учёта истории диалога; возможны ошибки на проф. терминах.Масштабирование: разнести расчёт эмбеддингов и выдачу; хранить в векторной БД; рассмотреть top-k для ассиста оператору; протестировать матчинги по ответам как альтернативу.RAG/LLM: признаны перспективными, но указываются риски ИБ и стоимости (GPU/токены); вынесены в отдельный проект.Итог: недорогая, воспроизводимая схема семантического FAQ, пригодная для сайтов, мессенджеров и e-mail-каналов.