Введение
В университетской образовательной программе результаты обучения фиксируются через дисциплины и профессиональные компетенции. Каждая компетенция разбита на индикаторы, которые распределены по дисциплинам и конкретным занятиям. Преподаватель соотносит занятия с индикаторами, оценка ставится за задания, затем результаты агрегируются: от занятий — к индикаторам, от индикаторов - к проценту сформированности компетенции и итоговой оценке по дисциплине. В личном кабинете накапливается структурированная картина успеваемости.
Такая модель позволяет формально отслеживать прогресс, однако студент видит в основном итоговые баллы и общий процент по компетенциям. Средний результат по дисциплине может скрывать слабые места в отдельных индикаторах, а снижение процента компетенции не показывает, какие именно элементы требуют доработки.
Для более содержательного анализа данных целесообразно рассматривать структуру образовательной среды как совокупность автономных компонентов, взаимодействующих между собой, что типично для многоагентных систем [4]. Такие системы изучаются в контексте распределённого анализа и координации задач в сложных средах [5]. На этой основе в работе предлагается интеграция многоагентной интеллектуальной системы в личный кабинет студента. В ней выделены четыре агента: агент анализа профиля (работа с индикаторами и компетенциями), агент-собеседник (диалоговая диагностика), агент рекомендаций (соотнесение проблемных зон с материалами) и агент-наставник (пояснение сложных тем). В результате личный кабинет перестаёт быть просто витриной оценок и начинает поддерживать осмысленное сопровождение образовательной траектории студента.
Обзор агентных ИИ-систем
Что такое агент. В литературе несколько трактовок. Ранние работы определяли агента через способность воздействовать на среду без внешнего управления. Современные обзоры — через способность самостоятельно определять порядок действий для достижения цели. Агент не исполняет жесткий сценарий, а решает, какой инструмент взять, когда остановиться, нужно ли уточнить запрос.
Для нашей системы значимы обе трактовки. Агенты обязаны действовать в жесткой структуре (индикаторы, компетенции), но внутри нее принимать решения: какой пробел критический, что предложить первым, как объяснять. Автономность ограничена предметной областью.
Одноагентные vs мультиагентные подходы. Принципиальная развилка: одна LLM со связкой инструментов или распределение функций между модулями.
Одноагентный подход внешне проще, но у него слабое место. Например: агент должен был собрать новости по нескольким категориям, но взял только одну и сделал отчет из последнего источника [1]. Проблема в отсутствии контроля полноты: LLM оптимизирует ответ под формально выполненный запрос, а не под содержательную полноту.
В нашей задаче это недопустимо. Поэтому мы выбрали мультиагентную архитектуру с жестким разделением функций. Каждый агент отвечает за свой класс задач и имеет только нужные инструменты. Агент анализа не генерирует текст, наставник не диагностирует. Это дает предсказуемость.
Автономность и роль LLM. Авторы предостерегают от отождествления агентности с обязательным применением LLM [6]. Агент определяется наличием цели, памяти и способности влиять на среду; способ принятия решений может быть любым.
Мы занимаем эту позицию. YandexGPT выполняет строго ограниченные функции: семантический анализ, генерация текста. Все педагогические решения — что считать пробелом, как углубляться, какой пример привести — принимают агенты на основе конечных автоматов и правил преподавателей. Образовательная логика не должна быть черным ящиком.
Проблема оркестрации. Когда агентов много, сложность смещается на согласованность их работы. Каждый должен учитывать общий контекст сессии.
Решение — централизованный оркестратор. У нас это единая точка входа: хранит контекст в Redis, при каждом вызове передает агенту актуальную информацию. Это дает связность и возможность развернуть историю от текущего запроса до исходной диагностики.
Выводы для архитектуры. Агенты узкоспециализированны. Нагрузить один модуль и диагностикой, и рекомендациями, и объяснениями — значит получить непредсказуемое поведение. Четыре агента — вынужденная декомпозиция. LLM не отвечает за педагогическую стратегию. Оценка, классификация пробелов, выбор метода объяснения — в коде агента на основе знаний преподавателей. Без общего контекста мультиагентность — хаос. Оркестратор и Redis — ядро, а не периферия.
Есть альтернативы (коллаборативные схемы без координатора [1]), но для образования с его требованиями к предсказуемости наш подход более обоснованный.
Архитектура мультиагентной системы для образования
Система строится на микросервисной архитектуре, что обеспечивает независимость разработки, развертывания и масштабирования компонентов:
- Сервис учебного процесса (C#). Отвечает за управление всеми академическими данными: журналом оценок, компетенциями студентов, учебными планами, дисциплинами, индикаторами и тп. В рамках проекта в его интерфейс интегрируется новый фронтенд-модуль для взаимодействия с ИИ-агентами.
- Сервис искусственного интеллекта (Python). Инкапсулирует всю интеллектуальную логику. Он содержит в себе машинное обучение, ии-агенты анализа профиля студента, рекомендаций, собеседования и наставления. Его изоляция позволяет использовать оптимальный для задач ML и работы с нейросетями технологический стек.
Таблица 1.
Организация микросервиса ИИ
|
Модуль |
Назначение |
Технологии |
|
ML-движок |
Обеспечивает векторизацию текста, семантический поиск, классификацию уверенности, ранжирование рекомендаций. Дообучается на корпусе IT-задач. |
Sentence‑Transformers, scikit‑learn, PyTorch, Qdrant/pgvector |
|
Оркестратор |
Принимает запросы от C#‑сервиса, управляет последовательностью вызовов, хранит контекст сессии в Redis, организует совместную работу агентов |
Redis, Pydantic, gRPC |
|
Агент анализа |
Анализирует компетенции и индикаторы студента, строит векторный профиль |
Sentence‑Transformers, scikit‑learn, Qdrant/pgvector |
|
Агент собеседований |
Ведёт диагностическое интервью, оценивает ответы, выявляет пробелы на разных уровнях |
State machine + YandexGPT API |
|
Агент наставлений |
Генерирует персонализированные разъяснения, отвечает на уточняющие вопросы |
YandexGPT API + кэш Redis |
|
Агент рекомендаций |
Выполняет семантический поиск учебных материалов по векторным эмбеддингам |
Qdrant / pgvector, Sentence‑Transformers |
YandexGPT используется исключительно как инструмент для обработки естественного языка – семантический анализ ответов студента, генерации связного текста вопросов и объяснений. Это позволяет не тратить ресурсы на создание собственных NLP-моделей и не содержать дорогостоящую GPU-инфраструктуру. Все стратегические и педагогические решения – выбор сценария опроса, диагностика пробелов, формирование индивидуальной траектории, целевая навигация в сторону отечественного ПО (1С, BPMSoft, и др.) – принимаются нашими ИИ-агентами.
Стек: .NET 8 (ASP.NET Core), React, Python 3.12 (FastAPI), gRPC, REST, PostgreSQL, Qdrant, Redis, RabbitMQ, YandexGPT API, Sentence‑Transformers, scikit‑learn, Docker.
Агент анализа профиля студента
Агент анализа профиля работает внутри уже заданной модели: занятия связаны с индикаторами, индикаторы с компетенциями, оценки агрегируются в проценты освоения. Он не добавляет новых метрик и не использует внешние данные, а переосмысливает то, что уже накоплено в личном кабинете. Анализ ведется на уровне индикаторов, потому что именно они показывают внутреннюю структуру компетенции. Даже при хорошем общем проценте возможны перекосы - часть индикаторов освоена стабильно, часть проседает.
Диагностика строится через выявление дисбалансов, устойчивых зон и рисков внутри одной компетенции. Используются стандартные данные образовательной программы: проценты по индикаторам, агрегированные показатели по компетенциям, распределение оценок по занятиям и их динамика.
Интерпретируемость обеспечивается прозрачной логикой: любой вывод можно развернуть от компетенции к конкретным индикаторам и занятиям. В результате формируется структурная «картина профиля» студента, отражающая реальное состояние освоения профессиональных компетенций.
Агент рекомендаций обучения
Агент рекомендаций переводит диагностические данные от агента анализа и агента-интервьюера в персонализированную подборку учебных ресурсов. Он работает на стыке двух контуров: диагностического (профиль компетенций, список устойчивых пробелов) и ресурсного (база материалов, размеченная по темам, типам, уровням сложности). Его задача — выдать не абстрактный перечень «что почитать», а подборку, обоснованную структурой конкретных дефицитов студента.
Классические рекомендательные системы опираются на историю взаимодействий или поведение похожих пользователей. В образовательном контуре это дает сбои: студент может никогда не открывать материалы по проблемному индикатору не из-за отсутствия интереса, а потому что система раньше не сигнализировала о пробеле. Отсутствие истории не равно отсутствию потребности [7; 8]. Агент исходит не из прошлого поведения, а из текущей структуры пробелов. Если зафиксировано устойчивое снижение по индикатору, он сразу формирует запрос в векторное хранилище, используя семантическое представление проблемной зоны, а не название дисциплины.
Учет контекста. Формально агент использует Sentence‑Transformers и Qdrant, но надстройкой является контекст. Тот же запрос «индексы в БД» для новичка отфильтрует материалы базового уровня, для готовящегося к собеседованию — поднимет в топ BRIN, GiST, покрывающие индексы. Ранжирование учитывает релевантность, тип контента, сложность, новизну; веса настраиваются под образовательную задачу [7].
Данные и логика. Вход — структурированное описание проблемной зоны (тема, уровень, приоритет), профиль студента, фильтры. Агент формирует векторный запрос, ищет в Qdrant, ранжирует, исключает дубликаты. Состояние не хранит — это функция оркестратора (Redis), что исключает «застревание» уже изученных материалов.
Роль LLM. YandexGPT в работе агента не участвует — отбор и ранжирование сугубо инженерные задачи. Добавление LLM создало бы риск галлюцинаций (несуществующие источники, потеря релевантности), что для образования неприемлемо. Эксперименты с генеративными рекомендациями отнесены к перспективам [7].
Ограничения. Агент работает только с предварительно размеченными материалами.
Агент-интервьюер (тренажёр)
Ключевая функция агента заключается в анализе текстового ответа студента с целью выявления недостаточно раскрытых или пропущенных ключевых аспектов темы. Для этого используются методы обработки естественного языка (NLP), позволяющие сопоставить ответ студента с эталонной моделью знаний по заданной теме. На основе выявленных проблем агент автоматически генерирует серию уточняющих вопросов, направленных на проверку понимания.
В процессе диалога агент строит детализированную карту знаний студента, отмечая темы, которые были раскрыты полностью, частично или не затронуты. Итоговым продуктом работы агента является структурированный список проблемных зон. Этот список служит точными диагностическими данными, которые передаются агенту-наставнику и агенту рекомендаций для формирования персонализированного плана обучения. Таким образом, агент-интервьюер выполняет в системе важную функцию сбора и верификации данных, обеспечивая основу для обоснованных решений о дальнейшей образовательной траектории студента.
Агент-наставник
Агент-наставник объясняет материал и помогает устранить пробел, выявленный в ходе собеседования. В отличие от собеседника, он не задаёт вопросы, а разъясняет, приводит примеры и отвечает на уточнения. Агент может сначала обратиться к агенту рекомендаций, для подбора материалов студенту (по запросу пользователя). Если собеседование проводится на тему зарубежного инструмента, то в ходе диалога агент при удобном случае будет освещать преимущества наших систем и недостатки зарубежных, а также может упомянуть про запросы рынка.
После генерации ответ наставника отправляется студенту. Студент может продолжить интервью (переход на собеседника), а может задать наставнику дополнительные вопросы если не понимает материал. Таким образом, студент может начать с простого определения баз данных, затем через серию уточнений дойти до более низкоуровневых вопросов как принцип работы BRIN-индекса и др., тем самым устраняя пробел на любом уровне.
Агент-наставник даёт студенту персонального тьютора с фокусом на отечественные технологии, университету — снятие рутинной нагрузки и аналитику пробелов, государству — масштабируемый механизм подготовки кадров под импортозамещение, что ускоряет переход на российское ПО, сокращает дефицит специалистов и укрепляет технологический суверенитет.
Взаимодействие агентов в системе
Агент собеседований в ходе диагностики может вызвать агента анализа, чтобы получить уточненный векторный профиль компетенций студента. При низкой близости эталона ответа направляет структурированный запрос во внешний NLP-модуль, но интерпретация результата и решение о дальнейших действиях принимаются исключительно агентом собеседований на основе конечного автомата.
Агент-наставник при объяснении темы может обратиться к агенту рекомендаций для подборки релевантных учебных материалов из Qdrant, а также к агенту анализа — чтобы адаптировать глубину объяснения под текущий уровень студента. Если студент запрашивает подборку материалов вместо диалога, агент-наставник напрямую вызывает агента рекомендаций.
Агент анализа работает как в фоновом режиме (периодическое обновление профилей по данным из C#-сервиса), так и по запросу других агентов. Он предоставляет унифицированный интерфейс для работы с векторными эмбеддингами и метаданными профилей.
Агент рекомендаций выполняет семантический поиск в Qdrant по запросу любого агента, ранжирует результаты (MMR, scikit-learn) и возвращает структурированный список.
Все агенты функционируют как равноправные модули, взаимодействующие исключительно через оркестратор.
Практические сценарии использования
Ниже приведены типовые ситуации, в которых система используется не как отчётность, а как инструмент поддержки решений. Формат выбран простой и понятный - «было - стало», чтобы было видно изменение логики работы с данными.
1. Низкий прогресс.
Раньше студент видел просевшие дисциплины и падающий процент по компетенциям - без понимания, это случайность или системная проблема..
После подключения системы картина раскладывается по индикаторам: становится видно, что просадка повторяется в конкретном типе задач или навыков. Появляется не абстрактное «плохо учусь», а конкретная зона риска. Дальше уже можно работать точечно.
2. Перекос в навыках.
Высокие оценки по предметам создают ощущение, что всё в порядке. Но внутри одной компетенции возможен перекос: теория сильная, практика слабее - или наоборот. Средний балл это сглаживает.
Агент показывает структуру, а не среднее. Видно, где профиль устойчивый, а где неравномерный. Это позволяет скорректировать усилия до того, как слабое место даст о себе знать на практике.
3. Подготовка к собеседованию.
Без анализа студент повторяет дисциплины списком - по памяти, по ощущениям.
С профилем прогресса по компетенциям подготовка становится адресной: внимание уходит на нестабильные или слабые индикаторы. Опора уже не на перечень предметов, а на реальную структуру освоения.
4. Выбор траектории.
Обычно решение о специализации строится на интересе и общих оценках.
Система добавляет фактуру: где зона силы, где фундамент ещё шаткий. Можно осознанно углубляться в сильное направление или сначала закрыть пробелы.
Во всех случаях система не принимает решений за человека. Она просто делает структуру компетенций видимой — и на этом основании легче выбирать следующий шаг.
Обсуждение ограничений и рисков
Ограничения по входным данным. Агент анализа зависит от качества разметки: если занятие формально закрывает десять индикаторов, профиль студента становится гладким и бесполезным. Агент не исправляет разметку, он интерпретирует то, что есть. Зачет «сдал — не сдал» дает слишком грубое зерно для выделения устойчивых пробелов.
Риски LLM. YandexGPT ограничен семантическим анализом и генерацией, но вероятностная природа никуда не уходит. Возможны ложные срабатывания (пробел там, где неудачная формулировка) и пропуск цели (ошибка не распознана). Мультиагентная конфигурация может усиливать ошибки: один некорректно классифицировал, второй принял за истину. Мы снижаем риск обменом структурированными данными (векторы, идентификаторы, пороги), но исключить наследование ошибок нельзя.
Педагогические риски. Если наставник объясняет слишком хорошо, студент перестает осмыслять самостоятельно. Возникает иллюзия понимания — запомненная формулировка без способности воспроизвести логику в другом контексте. Мы закладываем сценарии с уточнениями, но измерить грань между поддержкой и интеллектуальной «подушкой» пока не умеем.
Организационные ограничения. Система — надстройка над LMS. Если учет компетенций не автоматизирован или данные в несвязанных таблицах, агент анализа не получает исходной информации. Технически проблему не решить, только институционально — изменением практик. В пилоте спасает ручное сопровождение, при масштабировании станет критично.
Этические контуры. Система не принимает решений об аттестации — только диагностирует, рекомендует, объясняет. Это снимает значительную часть рисков. Но зона неопределенности остается: кто отвечает за рекомендацию, уводящую в неверную траекторию? Юридически — образовательная организация. Мы реализуем прозрачность через развертку решений до исходных оценок. Для пилота достаточно, для полноценного внедрения потребуется формализованная модель ответственности.
Не серебряная пуля. Мультиагентный подход не универсален. Там, где решение принимается по четкому алгоритму, агент не нужен. Отчеты, уведомления, ведомости остаются в монолитном C#-сервисе. Разделение — по линии неопределенности. Это прагматично, но ограничивает применимость в слабоструктурированных областях.
Перспективы развития системы
Предложенная архитектура фиксирует текущее состояние, но не является финальной. Дальнейшее движение видится в нескольких направлениях, которые сегодня обсуждаются в исследовательском поле и одновременно согласуются с логикой нашей разработки.
Самоадаптация через обучение с подкреплением. Сейчас логика агентов жестко задана правилами и порогами. Это прозрачно, но негибко. В работах последнего года поверх мультиагентной системы надстраивают RL-метаагента, который учится выбирать, какого специализированного агента активировать в зависимости от состояния пользователя [2]. В нашей системе эту роль мог бы взять оркестратор, адаптируя маршрут: при незначительном отклонении по индикатору направлять сразу к наставнику, минуя полномасштабное собеседование. Это снизило бы нагрузку и ускорило реакцию.
Состязательный контроль диагностики. Уязвимое место любой LLM-системы — склонность подтверждать неверные рассуждения студента. В современных исследованиях предлагаются механизмы иерархического надзора, где несколько критиков анализируют ответ, а оппонент оспаривает каждую позицию, вынуждая предъявлять более строгие обоснования [3]. В нашей системе агент-интервьюер сегодня единолично решает, что тема не усвоена. Дополнение его состязательным критиком повысило бы надежность диагностики в спорных случаях.
Долговременная память. Сейчас профиль студента обновляется только агрегированными показателями компетенций; история диалогов теряется. Подходы к персонализации предлагают вести иерархическую самоадаптирующуюся память: сырые взаимодействия кластеризуются в эпизоды, эпизоды обобщаются в принципы, и вся конструкция динамически реорганизуется под новые данные [11]. Для нас это переход от плоского профиля к обогащенной модели: агент-наставник помнит, какой пример оказался понятным, агент рекомендаций учитывает предпочитаемые форматы материалов.
Новые агентные роли. Четыре агента закрывают базовый контур, но образовательная траектория шире. В международной практике уже появляются реализации агентов-проектировщиков индивидуальных учебных планов и агентов-тьюторов по развитию долгосрочных компетенций [8]. Видится потенциал в адаптации этих ролей под нашу архитектуру. Они надстраиваются над существующими, используя те же диагностические данные, но решая более стратегические задачи.
Заключение
В работе описана многоагентная система, встроенная в личный кабинет студента и работающая на основе уже существующей модели: занятия - индикаторы - компетенции. Структура оценивания не меняется, меняется способ интерпретации данных. Оценки перестают быть просто итоговыми числами и начинают использоваться для анализа структуры освоения.
Функции распределены между агентами: один выявляет профиль и внутренние перекосы, другой уточняет проблемные зоны, третий помогает с диагностикой через диалог, четвертый сопровождает разбор сложных тем. Вместе они связывают анализ с последующими действиями.
Система не принимает решений за студента. Она делает компетентностную модель прозрачной и помогает увидеть реальную картину освоения, чтобы дальнейшие шаги в обучении были осознанными, а не интуитивными.
Список литературы
- Как правильно мыслить и учиться: гайд по развитию навыков [Электронный ресурс] / Habr.com. — Режим доступа: https://habr.com/ru/companies/otus/articles/904470/ (Accessed: 13 Feb 2026)
- Preprint 2506.11083 [Электронный ресурс] / arXiv. — Режим доступа: https://arxiv.org/abs/2506.11083 (Accessed: 13 Feb 2026)
- Preprint 2601.06377 [Электронный ресурс] / arXiv. — Режим доступа: https://arxiv.org/abs/2601.06377 (Accessed: 13 Feb 2026)
- Machine learning preprint [Электронный ресурс] / arXiv. — Режим доступа: https://arxiv.org/abs/2402.01680 (Accessed: 13 Feb 2026)
- AI research preprint 2505.10468 [Электронный ресурс] / arXiv. — Режим доступа: https://arxiv.org/abs/2505.10468 (Accessed: 13 Feb 2026)
- Preprint 2506.01463 [Электронный ресурс] / arXiv. — Режим доступа: https://arxiv.org/abs/2506.01463 (Accessed: 13 Feb 2026)
- Tolis D., Mystakidis S., Hatzilygeroudis I., Siozopoulos K. Generative AI Agents for Instructional Co-design: A Sequential Agent-Based Approach Using a Low-Code/No-Code Platform [Электронный ресурс] / ResearchGate. — Режим доступа: https://www.researchgate.net/publication/394090687_Generative_AI_Agents_for_Instructional_Co-design_A_Sequential_Agent-Based_Approach_Using_a_Low-CodeNo-Code_Platform (Accessed: 13 Feb 2026)
- Hal repository document [Электронный ресурс] / CNRS HAL. — Режим доступа: https://cnrs.hal.science/hal-05482677v1 (Accessed: 13 Feb 2026)


