Обзор книги «RAG и генеративный ИИ»
Обзор книги Дэниса Ротмана «RAG и генеративный ИИ», написанный инженером YADRO Кириллом Колодяжным, описывает её как практичное введение в архитектуру Retrieval-Augmented Generation. Автор книги по шагам разбирает построение RAG-конвейера: работу с эмбеддингами и векторными БД, использование sentence-transformers и LlamaIndex, настройку промптов, мультимодальные сценарии (текст, изображения, видео), кластеризацию клиентских данных, графовые представления знаний и метрики качества ответов.
Отдельный плюс — внимание к работе с «сырыми» датасетами, визуализации, организации обратной связи от пользователей и примеры локального запуска моделей, а также идеи переноса статических данных в модель через fine-tuning и семантического поиска по видео. При этом есть серьёзные ограничения: сильная завязка на зарубежные облачные сервисы и API, поверхностное описание алгоритмов векторного поиска и трансформеров, ориентация на ноутбуки вместо продакшен-кода и почти полное отсутствие разговора про безопасность и юридические риски передачи корпоративных данных в облако. Для
российских команд книга скорее даёт концептуальный каркас и обзор экосистемы инструментов, но требует заметной адаптации и подбора локальных альтернатив.
Читайте также
Агентные системы для продакшена
«Вам нужны партнеры, а не подрядчики»: как запустить ИИ-проект, который принесет реальную пользу бизнесу
Lamoda запускает «Г(ии)д по стилю» для онлайн-примерки вещей
Ретроспектива 2025: год LLM — практика, иллюзия и реальные сдвиги
Подборка ИИ-инструментов для системного аналитика
- Исследовательский этап и работа с сырыми данными перед запуском RAG: Перед построением RAG-конвейера необходимо закладывать полноценный исследовательский этап: изучение распределений, аномалий, пропусков и дубликатов в данных, включая зашумленные источники вроде HTML-страниц, логов и новостных лент. Только после описания и визуализации датасетов имеет смысл выбирать стратегию индексации и генерации, иначе система будет масштабировать хаос.
[RAG-системы: конвейер данных и разработка]
Зарегистрированные пользователи видят только два тезиса.
Зарегистрироваться