Журнал «Научный лидер» выпуск #20 (273), Май ‘26

ПОЧЕМУ НЕЙРОСЕТИ ПЛОХО РАБОТАЮТ С ФАКТАМИ: РОЛЬ RAG В ПОВЫШЕНИИ ДОСТОВЕРНОСТИ ОТВЕТОВ ИИ

Авторы публикации

Юданов Дмитрий Алексеевич

Рубрика

Информационные технологии

Просмотры

146

Журнал

Журнал «Научный лидер» выпуск # 20 (273), Май ‘26

Статья рассматривает ограничения традиционных больших языковых моделей — склонность к галлюцинациям, устаревание встроенных знаний и невозможность доступа к закрытым корпоративным данным. Эти факторы стали предпосылкой для появления архитектуры Retrieval-Augmented Generation (RAG), объединяющей генеративные возможности ИИ с целевым поиском по внешним источникам информации. На основе практических примеров из юриспруденции, медицины и корпоративных информационных систем показано, что использование RAG существенно снижает вероятность недостоверных ответов, обеспечивает актуальность и проверяемость данных и делает применение ИИ более надёжным и эффективным в бизнес-среде и задачах с повышенной ответственностью.

большие языковые модели

NLP

галлюцинации ИИ

достоверность данных

Retrieval-Augmented Generation

RAG

поиск по знаниям

корпоративные данные

Большие языковые модели (LLM), такие как GPT, BERT и T5, обучаются на огромных массивах данных, но сталкиваются с тремя критическими проблемами, которые делают их непригодными для корпоративного использования в критически важных областях [1].

Галлюцинации — уверенная ложь. LLM генерируют правдоподобные, но полностью выдуманные факты с частотой от 1,8% (antgroup/finix_s1_32b) до 24,2% (mistralai/minitral-3-3b-2512) [2]. Модели статистически предсказывают следующее слово, а не ищут истину. Когда у модели недостаточно информации или она сталкивается с пробелами в обучающих данных, она просто изобретает правдоподобно звучащие ответы.

Проблема знания с «датой истечения срока». Все LLM имеют фиксированную дату среза знаний (knowledge cutoff date) — момент, когда завершилось их обучение. GPT-4, например, обучена на данных до конца 2023 года. Это означает, что модель не знает о событиях, технологиях или изменениях, произошедших после этой даты. Переобучение модели для обновления знаний требует огромных вычислительных ресурсов и времени, что делает его крайне дорогим.

Невозможность доступа к внутренним данным компании. Традиционные LLM обучаются на публичных данных интернета. Они не имеют доступа к корпоративным документам, внутренним базам знаний, политикам безопасности, клиентским данным или другой проприетарной информации. Это делает их бесполезными для специфических бизнес-задач, где требуется работа с внутренними данными организации.

Причины низкой фактической надёжности больших языковых моделей напрямую связаны с принципом их функционирования. Несмотря на распространённое представление о том, что такие системы «знают» информацию, на практике они оперируют статистическими зависимостями между словами и выражениями. Обучение модели направлено на минимизацию ошибки предсказания следующего элемента текста, а не на проверку истинности утверждений.

В результате корректность ответа возникает лишь тогда, когда вероятностные закономерности совпадают с реальными фактами. Если же запрос требует точного знания, отсутствующего в обучающих данных или представленного в них неоднозначно, модель стремится сохранить связность высказывания, даже если для этого приходится достраивать недостающие сведения. Пользователь при этом получает грамматически правильный и убедительный текст, который внешне не отличается от достоверного ответа.

Подобное поведение особенно заметно в ситуациях, где требуется конкретика: ссылки на документы, числовые показатели, даты изменений или специализированные термины. Модель не обладает встроенным механизмом сомнения и редко сигнализирует о недостатке информации, поскольку её задача — продолжить текст наиболее вероятным образом.

Ещё одной особенностью LLM является фиксированность знаний, полученных на этапе обучения. После завершения тренировочного процесса параметры модели остаются неизменными, и вся новая информация оказывается вне её внутреннего представления [3].

Для повседневных задач это может быть незаметно, однако в профессиональной среде последствия становятся существенными. Законодательство регулярно обновляется, корпоративные регламенты пересматриваются, а технические стандарты изменяются значительно быстрее, чем происходит переобучение крупных моделей. Попытка постоянно обновлять модель путём нового обучения экономически и технически нецелесообразна из-за высокой стоимости вычислений и сложности процесса.

Таким образом, даже при корректной работе модель неизбежно начинает воспроизводить устаревшие сведения, что ограничивает её применение в задачах, требующих актуальности информации.

Практическое использование языковых моделей в организациях сталкивается с дополнительным препятствием — отсутствием доступа к внутренним источникам знаний. Основная часть корпоративной информации хранится в закрытых системах: методических материалах, инструкциях, регламентах и внутренних базах данных.

Поскольку стандартные LLM обучаются преимущественно на открытых интернет-данных, они не способны учитывать специфику конкретной компании. Ответы оказываются обобщёнными и нередко противоречат реальным рабочим процессам. В результате модель может быть полезна для объяснения общих принципов, но оказывается недостаточно точной для выполнения прикладных задач сотрудников.

Это противоречие стало одной из ключевых причин поиска архитектурных решений, позволяющих объединить генеративные возможности ИИ с доступом к актуальным источникам информации.

Архитектура Retrieval-Augmented Generation возникла как попытка компенсировать описанные ограничения без изменения самой языковой модели. Основная идея заключается в том, чтобы перед генерацией ответа предоставить модели релевантные фрагменты данных, извлечённые из внешнего хранилища знаний.

В отличие от традиционного сценария, где модель опирается исключительно на параметры, сформированные во время обучения, RAG вводит дополнительный этап поиска. Тем самым генерация перестаёт быть полностью автономной и начинает опираться на конкретный информационный контекст.

Такой подход фактически разделяет две задачи: поиск фактов и формирование связного текста. Первая решается средствами информационного поиска, вторая — языковой моделью.

Процесс формирования ответа в RAG можно рассматривать как последовательность взаимосвязанных этапов. Пользовательский запрос сначала преобразуется в векторное представление, отражающее его смысловое содержание. Затем выполняется поиск схожих фрагментов в базе знаний, где документы заранее представлены в аналогичном виде.

Найденные фрагменты добавляются к запросу и передаются языковой модели как дополнительный контекст. Генерация ответа происходит уже с учётом этой информации, что существенно ограничивает пространство возможных интерпретаций. Модель не вынуждена «догадываться», поскольку необходимые сведения присутствуют во входных данных.

Важной особенностью является то, что обновление знаний достигается не переобучением модели, а изменением самой базы документов. Это делает систему значительно более гибкой в эксплуатации.

Наибольший эффект подход демонстрирует в сферах, где требуется высокая точность информации. В юридической практике RAG позволяет формировать ответы с опорой на конкретные нормативные акты и их актуальные редакции. В медицинских системах модель может использовать проверенные клинические рекомендации, снижая риск появления недостоверных советов.

В корпоративных информационных системах технология фактически превращает базу знаний организации в интерактивный инструмент поиска. Сотрудник формулирует вопрос на естественном языке, а система извлекает нужные фрагменты внутренних документов и формирует объяснение, соответствующее реальным рабочим процессам.

Несмотря на очевидные преимущества, применение RAG требует внимательной инженерной реализации. Качество ответа напрямую зависит от структуры базы знаний и корректности поиска. Ошибки или устаревшие данные в источниках неизбежно отражаются в результатах генерации.

Кроме того, при работе с корпоративной информацией возникает необходимость строгого разграничения прав доступа и контроля использования данных. Система должна учитывать политики безопасности, иначе преимущества интеллектуального поиска могут сопровождаться рисками утечки информации.

Проблемы работы больших языковых моделей с фактами обусловлены их вероятностной природой и отсутствием прямого доступа к актуальным источникам знаний. Retrieval-Augmented Generation предлагает практический компромисс между гибкостью генеративных моделей и требованиями к достоверности информации.

Объединение механизмов поиска и генерации позволяет существенно повысить проверяемость ответов без необходимости дорогостоящего переобучения моделей. В условиях роста требований к надёжности интеллектуальных систем именно такие гибридные архитектуры становятся основой внедрения ИИ в профессиональные и корпоративные процессы.

Список литературы

Seven Failure Points When Engineering a Retrieval Augmented Generation System. [Электронный ресурс]. URL: https://arxiv.org/html/2401.05856v1#S4.SS2 (дата обращения: 09.03.2026)
Vectara. Hallucination Leaderboard. [Электронный ресурс]. URL: https://github.com/vectara/hallucination-leaderboard (дата обращения: 09.03.2026)
Galileo AI. How Much Does LLM Training Cost? [Электронный ресурс]. URL: https://galileo.ai/blog/llm-model-training-cost (дата обращения: 09.03.2026)