Введение
Программные комплексы типа ERP применяются для ведения учета и управления кадрами. Они имеют сложную структуру, поэтому сотрудники постоянно нуждаются в подсказках по их работе. Стандартные формы поддержки через операторов создают лишнюю нагрузку на людей и требуют много времени на решение каждого вопроса.
Успехи в сфере искусственного интеллекта дают возможность создавать на базе больших языковых моделей виртуальных помощников нового типа. Данные алгоритмы умеют разбирать человеческую речь и вести полноценный диалог. При этом у обычных моделей есть серьезный минус. Они используют только те сведения, которые были заложены в них при создании. Такие системы не знают специфику конкретной фирмы и не видят текущие внутренние приказы [2].
Для исправления этой проблемы применяется метод генерации с дополненной выборкой. Эта технология связывает языковую модель с внешней базой знаний организации. Благодаря этому ответы базируются на проверенной информации и позволяют наладить процесс обучения системы. В текущей работе изучаются основы функционирования RAG и нейросетей. Также здесь приводится обоснование для создания на их основе модуля самообучения виртуального консультанта.
Большие языковые модели как основа интеллектуальных систем поддержки
Большие языковые модели являются сложными нейронными сетями. Их обучают на огромных массивах текстовых данных. В основе большинства актуальных моделей лежит архитектура трансформера. Она позволяет качественно анализировать контекст и находить смысловые связи между отдельными словами. После завершения обучения система вычисляет вероятности появления последовательностей в языке. Благодаря этому она может создавать логически связные тексты [3; 7].
С формальной точки зрения классическую генерацию ответа языковой моделью можно представить, как задачу максимизации условной вероятности (формула 1).
P(y | x), (1)
где
x - входной запрос пользователя;
y - сгенерированный ответ модели.
Использование больших языковых моделей в технической поддержке систем управления предприятием дает возможность автоматизировать ответы на обычные вопросы. Эти запросы часто касаются внешнего вида программы или правил подготовки отчетов. Однако работа только с базовой моделью создает определенные трудности. В ответах могут возникать ошибки и вымышленные факты. Точность информации падает, так как система не учитывает особенности конкретной версии софта.
По этой причине для реальной работы нейросетей в компаниях нужно расширять их архитектуру. Это необходимо для подключения внешних баз знаний и правильного обновления данных. Такой подход позволяет лучше контролировать качество предоставляемых сведений.
Технология Retrieval Augmented Generation и ее архитектурные особенности
Технология генерации с дополнением из поиска выступает как метод расширения возможностей нейросети. При таком подходе формирование ответа дополняется поиском нужных данных в сторонней базе знаний. Это отличает методику от стандартных способов работы языковых моделей. Система RAG позволяет применять свежую и специализированную информацию. При этом нет необходимости заново настраивать или менять внутренние параметры основной модели [5].
Архитектура RAG включает три ключевых компонента:
- механизм векторизации текстов (эмбеддинги);
- хранилище векторных представлений (векторная база данных);
- языковую модель, которая использует извлеченные фрагменты при формировании ответа.
Функционирование системы RAG стартует с перевода запроса пользователя в числовой вектор. После этого программа ищет в базе знаний документы со схожим смыслом. Найденные данные передаются языковой модели в качестве дополнительного контекста. Создание итогового ответа происходит на основе этой информации. Данный метод помогает сделать результат более точным и надежным.
С математической точки зрения модель генерации в RAG может быть представлена следующим образом (формула 2).
P(y | x) = Σ P(y | x, d) · P(d | x), (2)
где d ∈ D.
Здесь P(d | x) представляет собой вероятность релевантности документа d пользовательскому запросу x, а P(y | x, d) - это вероятность генерации ответа y с учетом извлеченного документа. Таким образом, генерация ответа осуществляется на основе запроса и с учетом релевантных знаний, которые хранятся во внешнем источнике [5].
Представленная формализация отражает основное различие между технологией RAG и традиционной моделью LLM. Финальный результат создается не только за счет внутренних параметров системы. Процесс генерации обязательно включает использование внешних данных, которые предварительно прошли процедуру проверки.
Сравнительный анализ вариантов использования LLM в сервисной поддержке ERP-систем
В рамках исследования был проведен эксперимент по сравнительному анализу различных вариантов применения языковых моделей для поддержки пользователей ERP-системы. Рассматривались следующие подходы:
- базовая LLM без подключения внешней базы знаний;
- зарубежная языковая модель без локального размещения данных;
- отечественная модель GigaChat без RAG;
- модель GigaChat с интеграцией технологии RAG [1].
Для оценки эффективности использовались метрики точности ответов, среднего времени отклика, доли галлюцинаций и контекстной релевантности. Результаты сравнения представлены в таблице 1.
Таблица 1.
Сравнение вариантов использования LLM
|
Показатель |
LLM без RAG |
Зарубежная LLM |
GigaChat без RAG |
GigaChat + RAG |
|
Точность ответов, % |
68 |
75 |
78 |
92 |
|
Среднее время ответа, сек |
1,2 |
1,5 |
1,3 |
1,6 |
|
Доля галлюцинаций, % |
21 |
18 |
15 |
4 |
|
Контекстная релевантность |
низкая |
средняя |
высокая |
очень высокая |
|
Соответствие требованиям госсектора |
нет |
нет |
да |
да |
Полученные данные подтверждают, что наилучшие результаты достигаются при использовании отечественной LLM совместно с технологией RAG. Существенное снижение доли галлюцинаций и рост точности объясняются использованием проверенной корпоративной информации при генерации ответов [1].
RAG как основа интеллектуального модуля самообучения
Одной из главных сильных сторон RAG считается опция настройки контролируемого обучения системы. При этом веса языковой модели остаются прежними. Наполнение базы знаний происходит через использование проверенных ответов и уточненных формулировок. Также применяются внутренние документы компании. Любые правки сохраняются в реестре данных. После этого обновленная информация учитывается при обработке новых обращений [6].
В таблице 2 приведено сравнение качества работы консультанта при использовании и отсутствии RAG.
Таблица 2.
Влияние RAG на качество консультаций
|
Показатель |
LLM без RAG |
LLM + RAG |
|
Точность ответов, % |
78 |
92 |
|
Среднее время ответа, сек |
1,3 |
1,6 |
|
Доля некорректных ответов, % |
15 |
4 |
|
Количество уточняющих запросов |
высокое |
низкое |
|
Уровень доверия пользователей |
средний |
высокий |
Применение технологии RAG дает возможность гарантировать открытость процесса обучения. Также обеспечивается соблюдение стандартов информационной безопасности. Данный аспект имеет особое значение для работы государственных структур. Благодаря такому методу виртуальный помощник перестает быть обычным чат-ботом. Он превращается в развитый интеллектуальный компонент для поддержки работы ERP-системы.
Заключение
В рамках представленной статьи были изучены теоретические и прикладные вопросы использования больших языковых моделей. Также рассматривалась технология Retrieval Augmented Generation. Эти инструменты применялись для создания умного модуля самообучения цифрового ассистента в рамках систем управления предприятием.
В ходе работы было доказано, что интеграция LLM и RAG дает возможность значительно повысить точность выдаваемой информации. При этом сокращается количество ложных данных и укрепляется доверие со стороны пользователей. Установленные факты доказывают пользу от внедрения такого метода в работу частных компаний и государственных структур. Эти выводы служат базой для совершенствования сервисов интеллектуальной поддержки в будущем.
Список литературы
- Вендров А. М. Проектирование программного обеспечения экономических информационных систем. - Финансы и статистика, 2023. - 544 с.
- Гниденко И. Г., Павлов Ф. Ф., Федоров Д. Ю. Технология разработки программного обеспечения: учебное пособие для вузов. - М.: Юрайт, 2022. - 235 с.
- Постолит А. В. Основы искусственного интеллекта в примерах на Python: самоучитель. - СПб.: БХВ-Петербург, 2021. - 496 с.
- Богатенков С. Разработка сайтов и веб-приложений: учебное пособие. - СПб.: Лань, 2024. - 270 с.
- Стружкин Н. П., Годин В. В. Базы данных: проектирование: учебник для вузов. - М.: Юрайт, 2023. - 477 с.
- Гудфеллоу Я., Бенджио И., Курвилль А. Глубокое обучение. - М.: ДМК Пресс, 2023. - 654 с.
- Кузнецов И. О., Сидорова А. В. Оптимизация процессов сопровождения программного обеспечения: современные подходы и инструменты // Программная инженерия и технологии: научный журнал, 2024


