Как за вечер собрать простую RAG-систему на PHP с Neuron AI

описывает пошаговый пример сборки простой RAG-системы на PHP с использованием легковесного фреймворка Neuron AI как proof of concept для корпоративного чат-бота по внутренней документации.

Автор объясняет принцип RAG (retrieval + generation): векторный поиск по базе знаний, нарезка документов на чанки и подача найденных фрагментов в LLM для снижения галлюцинаций и упрощенного обновления знаний без переобучения модели.

В примере используются PHP 8.2, Composer, Neuron AI, FileVectorStore на файловой системе, embeddings text-embedding-3-small с размерностью 1536 и модель gpt-4o-mini; из четырех Markdown-документов формируется восемь векторных чанков, по которым бот отвечает на вопросы и возвращает ссылки на наиболее релевантные файлы.

Отдельно разбирается роль параметра topK при выборе числа ближайших векторов, а также намечены направления развития для продакшена: перенос векторного стора в PostgreSQL, Pinecone или Qdrant, автоиндексация новых документов, кэширование, логирование запросов, добавление переранжирования и модульная архитектура с отделением пайплайнов embeddings и RAG.

Читайте также

  1. Как создать мощного ИИ-агента с долговременной памятью на базе LangGraph, RAG и веб-скрапера
  2. Превращаем любой текст в модель знаний — и почему это удобно
  3. Google показала Code Wiki: можно ли доверить ИИ документацию репозитория?
  4. GitHub SpecKit: вайб-кодинг на основе спецификаций
  5. Пишем код, который живёт долго: принципы SOLID, DRY, KISS и YAGNI
Ключевые инсайты из новости (по версии ChatGPT)
  • RAG для внутренних баз знаний и онбординга: RAG-подход хорошо подходит для корпоративных чатов по документации, внутренних help-ботов и голосовых ассистентов: модель сначала ищет релевантные фрагменты во внутренней базе (Wiki, Confluence, БД), а уже затем генерирует ответ. Такой паттерн особенно полезен для онбординга новых сотрудников, для которых документация выглядит как "terra incognita".
    [RAG-подход]
Для получения полного доступа оформите подписку PubMag PRO.
Зарегистрированные пользователи видят только два тезиса.
Зарегистрироваться
Инсайты автоматически генерируются с помощью искусственного интеллекта на основе текста статьи.
← Назад в лентуЧитать оригинал →
✈️ Подписывайтесь на мой Telegram-канал — там еще больше интересного про AdTech, MarTech, AI и многое другое!