Как за вечер собрать простую RAG-систему на PHP с Neuron AI
Хабр описывает пошаговый пример сборки простой RAG-системы на PHP с использованием легковесного фреймворка Neuron AI как proof of concept для корпоративного чат-бота по внутренней документации.
Автор объясняет принцип RAG (retrieval + generation): векторный поиск по базе знаний, нарезка документов на чанки и подача найденных фрагментов в LLM для снижения галлюцинаций и упрощенного обновления знаний без переобучения модели.
В примере используются PHP 8.2, Composer, Neuron AI, FileVectorStore на файловой системе, embeddings OpenAI text-embedding-3-small с размерностью 1536 и модель gpt-4o-mini; из четырех Markdown-документов формируется восемь векторных чанков, по которым бот отвечает на вопросы и возвращает ссылки на наиболее релевантные файлы.
Отдельно разбирается роль параметра topK при выборе числа ближайших векторов, а также намечены направления развития для продакшена: перенос векторного стора в PostgreSQL, Pinecone или Qdrant, автоиндексация новых документов, кэширование, логирование запросов, добавление переранжирования и модульная архитектура с отделением пайплайнов embeddings и RAG.
Читайте также
От localhost до сервера: деплой Telegram-бота за 8 минут
Как я локально тестировал новый Qwen 3.6 и Gemma 4
LLM-агент для поиска свободных доменов: автоматизация подбора
Как писать промпты для разработки: опыт, который экономит часы
Распознавание реквизитов из карточек контрагентов: как устроен API для извлечения данных из документов
- RAG для внутренних баз знаний и онбординга: RAG-подход хорошо подходит для корпоративных чатов по документации, внутренних help-ботов и голосовых ассистентов: модель сначала ищет релевантные фрагменты во внутренней базе (Wiki, Confluence, БД), а уже затем генерирует ответ. Такой паттерн особенно полезен для онбординга новых сотрудников, для которых документация выглядит как "terra incognita".
[RAG-подход]
Зарегистрированные пользователи видят только два тезиса.
Зарегистрироваться