Как за вечер собрать простую RAG-систему на PHP с Neuron AI
Хабр описывает пошаговый пример сборки простой RAG-системы на PHP с использованием легковесного фреймворка Neuron AI как proof of concept для корпоративного чат-бота по внутренней документации.
Автор объясняет принцип RAG (retrieval + generation): векторный поиск по базе знаний, нарезка документов на чанки и подача найденных фрагментов в LLM для снижения галлюцинаций и упрощенного обновления знаний без переобучения модели.
В примере используются PHP 8.2, Composer, Neuron AI, FileVectorStore на файловой системе, embeddings
OpenAI text-embedding-3-small с размерностью 1536 и модель gpt-4o-mini; из четырех Markdown-документов формируется восемь векторных чанков, по которым бот отвечает на вопросы и возвращает ссылки на наиболее релевантные файлы.
Отдельно разбирается роль параметра topK при выборе числа ближайших векторов, а также намечены направления развития для продакшена: перенос векторного стора в PostgreSQL, Pinecone или Qdrant, автоиндексация новых документов, кэширование, логирование запросов, добавление переранжирования и модульная архитектура с отделением пайплайнов embeddings и RAG.
Читайте также
Как создать мощного ИИ-агента с долговременной памятью на базе LangGraph, RAG и веб-скрапера
Автоматизация поддержки клиентов на основе контекстной близости вопросов
Способы сегментации партнёрской сети для развития канальных продаж в IT
Перформанс-маркетинг для начинающих
ИИ для PHP-разработчиков: практика без Python и науки о данных
- RAG для внутренних баз знаний и онбординга: RAG-подход хорошо подходит для корпоративных чатов по документации, внутренних help-ботов и голосовых ассистентов: модель сначала ищет релевантные фрагменты во внутренней базе (Wiki, Confluence, БД), а уже затем генерирует ответ. Такой паттерн особенно полезен для онбординга новых сотрудников, для которых документация выглядит как "terra incognita".
[RAG-подход]
Зарегистрированные пользователи видят только два тезиса.
Зарегистрироваться