СРАВНИТЕЛЬНЫЙ АНАЛИЗ ЯЗЫКОВЫХ МОДЕЛЕЙ ДЛЯ АВТОМАТИЗАЦИИ HR-ПРОЦЕСОВ

СРАВНИТЕЛЬНЫЙ АНАЛИЗ ЯЗЫКОВЫХ МОДЕЛЕЙ ДЛЯ АВТОМАТИЗАЦИИ HR-ПРОЦЕСОВ

Авторы публикации

Рубрика

Менеджмент и управление

Просмотры

36

Журнал

Журнал «Научный лидер» выпуск # 16 (269), Апрель ‘26

Поделиться

В данной статье рассматриваются возможности современных языковых моделей, таких как «DeepSeek», «YandexGPT» и «GigaChat» для автоматизации HR-процессов, в частности, генерации текстов вакансий для различных кадровых сегментов. Для сравнительного анализа были использованы методы анкетирования и экспертной оценки, результаты оценок представлены в таблицах. В результате исследования были определены сильные и слабые стороны каждой модели, а также сформулированы выводы и даны рекомендации по выбору и внедрению LLM в HR-процессы.

В условиях цифровой экономики компании все чаще внедряют в свои бизнес-процессы технологии искусственного интеллекта для снижения издержек и оптимизации процессов, чтобы сохранить конкурентоспособность на рынке. Такая трансформация ведет к изменению фокуса HR-специалистов от рутинных задач к стратегическому управлению и становится все более актуальной [1]. Компании в 2026 году в условиях доступности нейросетевых технологий используют LLM также в сфере HR, например, в написании вакансий, позволяя специалистам экономить и использовать время для более стратегических задач, а также это дает возможность находить более эффективные варианты формулировок.

Цель исследования - сравнить эффективность LLM моделей в генерации текстов вакансий для различных кадровых сегментов.

Для проведения исследования в генерации текстов для вакансий были выбраны три популярные модели LLM, которыми активно пользуются в РФ: «DeepSeek», «YandexGPT» и «GigaChat» [2-3]. Данные модели были выбраны, так как пользователи из РФ могут использовать их беспрепятственно, соответственно исключая необходимость использования дополнительных инструментов для обхода блокировок, таких как VPN-сервисы. Сравнительный анализ моделей проводился с помощью двух промтов для трех выбранных моделей, то есть это означает, что каждая LLM на входе получала два отдельных промта для генерации вакансий технического (вакансия «специалист по автоматизации тестирования») и нетехнического (вакансия «врача-терапевт») кадрового сегмента.

Оценивание результатов происходило с помощью метода экспертной оценки c привлечением профильных специалистов, таких как ведущий рекрутер, ведущий специалист по автоматизации тестирования и медицинский специалист. Для каждого специалиста-эксперта был разработан опрос с критериями. HR-эксперт оценивал такие критерии как полнота структуры, конкретность описания вакансии, привлекательность, конкурентоспособность, соответствие трендам, реалистичность требований. Технический эксперт оценивал точность технологического стека, корректность задач, соответствие грейду и отсутствие ошибок. Оценка проводилась по 5-балльной шкале.

Результаты оценок, полученных экспертами при оценке сгенерированной вакансии на специалиста по автоматизации тестирования на python представлены в таблице 1.

Таблица 1.

Результаты оценки вакансии технического кадрового сегмента, сгенерированной LLM

Критерий

«GigaChat»

«DeepSeek»

«YandexGPT»

1. Экспертная оценка HR

1.1

Полнота структуры

3

4

5

1.2

Конкретность описания позиции

2

4

5

1.3

Привлекательность

3

3

5

1.4

Конкурентоспособность

3

4

4

1.5

Соответствие трендам

2

4

4

1.6

Реалистичность в требованиях

3

4

5

Средний балл

2,7

3,8

4,7

2. Экспертная оценка технического специалиста

2.1

Точность требований

3

4

4

2.2

Корректность задач

3

4

4

2.3

Соответствие уровню позиции

4

5

5

2.4

Отсутствие предметных ошибок

4

5

4

2.5

Профессиональная привлекательность задач

3

4

4

Средний балл

3,4

4,4

4,2

Итоговый рейтинг

3,05

4,1

4,45

 

Экспертная оценка вакансии технического кадрового сегмента выявила различия в эффективности трех языковых моделях. Наивысший итоговый рейтинг получила модель «YandexGPT», получив самые высокие баллы от HR-эксперта. Модель «DeepSeek» в рейтинге получила самый высокий балл от технического эксперта, но более низкие баллы по экспертной оценке от HR, что говорит о том, что модель более специализирована на техническую точность и менее на маркетинговую составляющую. Модель «GigaChat» показала наименьшие результаты по оценке, что делает ее менее предпочтительной при выборе модели для генерации текстов технических вакансий.

Для сравнения эффективности LLM в генерации вакансий для нетехнического кадрового сегмента была выбрана вакансия «Врач-терапевт». Генерация проводилась также при едином промте для трех моделей. Оценивание проводилось двумя профильными экспертами: HR-специалистом и медицинским специалистом. Результаты оценок, полученных экспертами, представлены в таблице 2.

Таблица 2.

Результаты оценки вакансии нетехнического кадрового сегмента, сгенерированной LLM

Критерий

«GigaChat»

«DeepSeek»

«YandexGPT»

1. Экспертная оценка HR

1.1

Полнота структуры

3

4

5

1.2

Конкретность описания позиции

3

4

5

1.3

Привлекательность

2

3

5

1.4

Конкурентоспособность

2

3

5

1.5

Соответствие трендам

3

3

4

1.6

Реалистичность в требованиях

4

4

4

Средний балл

2,83

3,5

4,67

2. Экспертная оценка медицинского специалиста

2.1

Фактическая точность требований

5

4

5

2.2

Корректность задач

4

5

5

2.3

Соответствие уровню позиции

5

5

5

2.4

Отсутствие предметных ошибок

4

5

5

2.5

Профессиональная привлекательность задач

5

5

5

Средний балл

4,6

4,8

5

Итоговый рейтинг

3,72

4,15

4,84

 

При проведении экспертной оценки вакансии медицинского кадрового сегмента из табл. 2 видно, что лидирующую позицию также заняла модель «YandexGPT», получив самые высокие баллы как от HR-специалиста, так и от медицинского специалиста. Модель «DeepSeek» и «GigaChat» также получили высокие оценки от медицинского эксперта, однако «GigaChat» получила самые низкие баллы от HR, тем самым в итоговом рейтинге определило ее последнее место.

Проведение сравнительного анализа трех языковых моделей путем экспертной оценки позволяет сделать вывод, что эффективность в генерации текста для вакансий во многом зависит от кадрового сегмента. Модель «YandexGPT» наиболее оптимальна для задач в создании более привлекательных и убедительных текстов, а модель «DeepSeek» наиболее эффективна для обеспечения технической корректности описания. Таким образом, использование языковых моделей может являться эффективным инструментом для генерации вакансий, позволяющим перейти от создания текста с нуля к его быстрому редактированию. Для достижения наилучшего результата рекомендуется использовать и комбинировать модели: применять «YandexGPT» для создания стилистической части вакансии, «DeepSeek» для написания технической стороны вакансии. Также критически важным остается экспертный надзор специалистов для финальной проверки содержательной корректности сгенерированного текста.

Список литературы

  1. Панова Е. А., Опарина Н. Н. ЦИФРОВЫЕ ТЕХНОЛОГИИ В ПОДБОРЕ И ОТБОРЕ КАНДИДАТОВ: ОТ РУЧНЫХ ОПЕРАЦИЙ К ФОРМИРОВАНИЮ ЗАДАНИЙ // УПИРР. 2023. № 5. URL: https://cyberleninka.ru/article/n/tsifrovye-tehnologii-v-podbore-i-otbore-kandidatov-ot-ruchnyh-operatsiy-k-formirovaniyu-zadaniy (дата обращения: 16.04.2026)
  2. Мыльников Л.А., Сторчевой М.А., Чернышев В.В. и др. Оценка моделей LLM по степени готовности решать задачи управления в области ESG // Публикации НИУ ВШЭ. 2025. URL: https://publications.hse.ru/pubs/share/direct/1085466832.pdf (дата обращения: 15.04.2026)
  3. Русскоязычные LLM: отечественные разработки в сравнении с глобальными адаптациями // Habr / Korus Consulting. 2025. 6 марта. URL: https://habr.com/ru/companies/korus_consulting/articles/888568/ (дата обращения: 14.04.2026)
Справка о публикации и препринт статьи
предоставляется сразу после оплаты
Прием материалов
c по
Осталось 5 дней до окончания
Размещение электронной версии
Загрузка материалов в elibrary
Публикация за 24 часа
Узнать подробнее
Акция
Cкидка 20% на размещение статьи, начиная со второй
Бонусная программа
Узнать подробнее