Как за вечер собрать простую RAG-систему на PHP с Neuron AI

15.11.2025 • Хабр

Хабр описывает пошаговый пример сборки простой RAG-системы на PHP с использованием легковесного фреймворка Neuron AI как proof of concept для корпоративного чат-бота по внутренней документации.

Автор объясняет принцип RAG (retrieval + generation): векторный поиск по базе знаний, нарезка документов на чанки и подача найденных фрагментов в LLM для снижения галлюцинаций и упрощенного обновления знаний без переобучения модели.

В примере используются PHP 8.2, Composer, Neuron AI, FileVectorStore на файловой системе, embeddings OpenAI text-embedding-3-small с размерностью 1536 и модель gpt-4o-mini; из четырех Markdown-документов формируется восемь векторных чанков, по которым бот отвечает на вопросы и возвращает ссылки на наиболее релевантные файлы.

Отдельно разбирается роль параметра topK при выборе числа ближайших векторов, а также намечены направления развития для продакшена: перенос векторного стора в PostgreSQL, Pinecone или Qdrant, автоиндексация новых документов, кэширование, логирование запросов, добавление переранжирования и модульная архитектура с отделением пайплайнов embeddings и RAG.

Как за вечер собрать простую RAG-систему на PHP с Neuron AI

Читайте также