Чат-бот с LLM в облаке: опыт НГУ и пошаговая инструкция по запуску

Новосибирский государственный университет (НГУ) разработал и внедрил собственного чат-бота на базе LLM для с интеграцией в корпоративные базы знаний. Проект поддержан грантом «Приоритет 2030» и реализован командой лаборатории прикладных цифровых технологий мехмата НГУ.

Чат-бот Meno-Tiny (1,5 млрд параметров, лидер русскоязычного бенчмарка МЕРА) интегрируется с внутренними БД и предоставляет студентам, сотрудникам и абитуриентам быстрые ответы по учебе, поступлению, инфраструктуре и жизни университета. Ключевые задачи: автоматизация поддержки, сокращение времени поиска информации, снижение нагрузки на сотрудников.

Особенности реализации:

  • Использование собственной LLM для безопасной работы с чувствительными данными и адаптации ответов под реалии.
  • Архитектура на базе виртуальной машины Cloud.ru Evolution (4 vCPU, 64 ГБ RAM, 1 GPU V100) с возможностью масштабирования под нагрузку.
  • Интеграция эмбеддеров для семантического поиска, переиспользование принципов Retrieval Augmented Generation (RAG), внедрение собственных решений (GraphRAG, RAGU, smart chunker) для работы с графом знаний и повышения качества диалога.
  • Внедрение механизмов токсичности, контекстной анафоры и модерации данных.
  • Рекомендации для запуска LLM-бота в облаке: уделять внимание архитектуре, масштабируемости, грамотному менеджменту, не создавать техдолг, совмещать готовые фреймворки с собственными доработками.

В планах — развитие мультизадачных и мультимодальных функций (например, искусственный семинарист, модерация данных), открытие библиотеки для графовых БД и расширение сотрудничества с другими вузами.

Ключевые инсайты из новости (по версии ChatGPT)
  • Семантический поиск и работа с контекстом в чат-ботах: Использование эмбеддеров и векторных баз данных позволяет чат-ботам проводить семантический поиск и восстанавливать контекст диалога, что существенно повышает релевантность и точность ответов, особенно при работе с уточняющими вопросами и местоимениями.
    [Технологии поиска и работы с данными]
Для получения полного доступа оформите подписку PubMag PRO.
Зарегистрированные пользователи видят только два тезиса.
Зарегистрироваться
Инсайты автоматически генерируются с помощью искусственного интеллекта на основе текста статьи.
← Назад в лентуЧитать оригинал →
✈️ Подписывайтесь на мой Telegram-канал — там еще больше интересного про AdTech, MarTech, AI и многое другое!