RAG и Ragas: как обучить AI-помощника без галлюцинаций
Cloud.ru построил AI-помощника по своим онлайн-курсам на архитектуре RAG, чтобы разгрузить кураторов и давать ответы на вопросы слушателей в реальном времени. Контент курсов и документация хранятся в S3, индексируются в Qdrant, поверх работает гибридный поиск (OpenSearch + эмбеддинги) с Qwen3-Embedding-0.6B и Qwen3-Reranker-0.6B, а ответы генерирует GigaChat-2-Max; безопасность усиливают GuardRails.
Качество системы оценивают с помощью Ragas и графа знаний: инструмент автоматически генерирует вопросы и проверяет ответы по метрикам context precision/recall, faithfulness и answer relevancy для разных типов запросов (single-hop, multi-hop, конкретных и абстрактных). Авторы подчёркивают важность адаптации метрик, корректного русскоязычного сегментатора, few-shot-примеров для промптов и аккуратного описания function calling.
По итогам внедрения 57% слушателей отметили, что AI-агент помог им быстрее проходить курс, CSI вырос на 6%, а completion rate увеличился в 1,5 раза — при том, что помощник работает только на этапе изучения материалов и не вмешивается в тестирование и оценку.
Читайте также
Анализ документов нейросетью с цитатами из источников: скилл research-docs для Claude Code
ИИ для управления проектами. Для чего его на самом деле применяют российские организации
Renga API: автоматизируем автоматизацию с помощью ИИ-агентов
Возвращаем к жизни связку OpenClaw и Claude
Как мы построили AI-экзоскелет для QA-инженера: от идеи до 11 автономных агентов
- Референс-архитектура RAG-помощника в корпоративной инфраструктуре: Cloud.ru описывает рабочий стек RAG-помощника: S3 как хранилище сырого контента (курсы и документация), Qdrant как векторная БД, OpenSearch для полнотекстового поиска, связка эмбеддера и реранкера Qwen3 и генеративная модель GigaChat-2-Max. Безопасность усиливается GuardRails, который фильтрует промпт-инъекции и «ломающие» запросы. Это пример полноценно онлайновой архитектуры, пригодной для внутренних знаний крупных компаний.
[архитектура RAG-систем и AI-помощников]
Зарегистрированные пользователи видят только два тезиса.
Зарегистрироваться