Чат-бот с LLM в облаке: опыт НГУ и пошаговая инструкция по запуску
Новосибирский государственный университет (НГУ) разработал и внедрил собственного чат-бота на базе LLM для
Telegram с интеграцией в корпоративные базы знаний. Проект поддержан грантом «Приоритет 2030» и реализован командой лаборатории прикладных цифровых технологий мехмата НГУ.
Чат-бот Meno-Tiny (1,5 млрд параметров, лидер русскоязычного бенчмарка МЕРА) интегрируется с внутренними БД и предоставляет студентам, сотрудникам и абитуриентам быстрые ответы по учебе, поступлению, инфраструктуре и жизни университета. Ключевые задачи: автоматизация поддержки, сокращение времени поиска информации, снижение нагрузки на сотрудников.
Особенности реализации:
- Использование собственной LLM для безопасной работы с чувствительными данными и адаптации ответов под
российские реалии. - Архитектура на базе виртуальной машины Cloud.ru Evolution (4 vCPU, 64 ГБ RAM, 1 GPU V100) с возможностью масштабирования под нагрузку.
- Интеграция эмбеддеров для семантического поиска, переиспользование принципов Retrieval Augmented Generation (RAG), внедрение собственных решений (GraphRAG, RAGU, smart chunker) для работы с графом знаний и повышения качества диалога.
- Внедрение механизмов токсичности, контекстной анафоры и модерации данных.
- Рекомендации для запуска LLM-бота в облаке: уделять внимание архитектуре, масштабируемости, грамотному менеджменту, не создавать техдолг, совмещать готовые фреймворки с собственными доработками.
В планах — развитие мультизадачных и мультимодальных функций (например, искусственный семинарист, модерация данных), открытие библиотеки для графовых БД и расширение сотрудничества с другими вузами.
Читайте также
Lamoda запускает «Г(ии)д по стилю» для онлайн-примерки вещей
Бот для публикации и обратной связи в Telegram: разработка и запуск
«Крестный отец» машинного обучения Амари Шуничи получил Премию Киото: вклад в развитие искусственного интеллекта
Как выбрать AI-курс для менеджера: подробный разбор рынка и рекомендации
Геймификация Википедии и возвращение интереса к знаниям в эпоху ИИ: кейс телеграм-бота «Жабарий»
- Семантический поиск и работа с контекстом в чат-ботах: Использование эмбеддеров и векторных баз данных позволяет чат-ботам проводить семантический поиск и восстанавливать контекст диалога, что существенно повышает релевантность и точность ответов, особенно при работе с уточняющими вопросами и местоимениями.
[Технологии поиска и работы с данными]
Зарегистрированные пользователи видят только два тезиса.
Зарегистрироваться