В условиях цифровой экономики компании все чаще внедряют в свои бизнес-процессы технологии искусственного интеллекта для снижения издержек и оптимизации процессов, чтобы сохранить конкурентоспособность на рынке. Такая трансформация ведет к изменению фокуса HR-специалистов от рутинных задач к стратегическому управлению и становится все более актуальной [1]. Компании в 2026 году в условиях доступности нейросетевых технологий используют LLM также в сфере HR, например, в написании вакансий, позволяя специалистам экономить и использовать время для более стратегических задач, а также это дает возможность находить более эффективные варианты формулировок.
Цель исследования - сравнить эффективность LLM моделей в генерации текстов вакансий для различных кадровых сегментов.
Для проведения исследования в генерации текстов для вакансий были выбраны три популярные модели LLM, которыми активно пользуются в РФ: «DeepSeek», «YandexGPT» и «GigaChat» [2-3]. Данные модели были выбраны, так как пользователи из РФ могут использовать их беспрепятственно, соответственно исключая необходимость использования дополнительных инструментов для обхода блокировок, таких как VPN-сервисы. Сравнительный анализ моделей проводился с помощью двух промтов для трех выбранных моделей, то есть это означает, что каждая LLM на входе получала два отдельных промта для генерации вакансий технического (вакансия «специалист по автоматизации тестирования») и нетехнического (вакансия «врача-терапевт») кадрового сегмента.
Оценивание результатов происходило с помощью метода экспертной оценки c привлечением профильных специалистов, таких как ведущий рекрутер, ведущий специалист по автоматизации тестирования и медицинский специалист. Для каждого специалиста-эксперта был разработан опрос с критериями. HR-эксперт оценивал такие критерии как полнота структуры, конкретность описания вакансии, привлекательность, конкурентоспособность, соответствие трендам, реалистичность требований. Технический эксперт оценивал точность технологического стека, корректность задач, соответствие грейду и отсутствие ошибок. Оценка проводилась по 5-балльной шкале.
Результаты оценок, полученных экспертами при оценке сгенерированной вакансии на специалиста по автоматизации тестирования на python представлены в таблице 1.
Таблица 1.
Результаты оценки вакансии технического кадрового сегмента, сгенерированной LLM
|
№ |
Критерий |
«GigaChat» |
«DeepSeek» |
«YandexGPT» |
|
1. Экспертная оценка HR |
||||
|
1.1 |
Полнота структуры |
3 |
4 |
5 |
|
1.2 |
Конкретность описания позиции |
2 |
4 |
5 |
|
1.3 |
Привлекательность |
3 |
3 |
5 |
|
1.4 |
Конкурентоспособность |
3 |
4 |
4 |
|
1.5 |
Соответствие трендам |
2 |
4 |
4 |
|
1.6 |
Реалистичность в требованиях |
3 |
4 |
5 |
|
Средний балл |
2,7 |
3,8 |
4,7 |
|
|
2. Экспертная оценка технического специалиста |
||||
|
2.1 |
Точность требований |
3 |
4 |
4 |
|
2.2 |
Корректность задач |
3 |
4 |
4 |
|
2.3 |
Соответствие уровню позиции |
4 |
5 |
5 |
|
2.4 |
Отсутствие предметных ошибок |
4 |
5 |
4 |
|
2.5 |
Профессиональная привлекательность задач |
3 |
4 |
4 |
|
Средний балл |
3,4 |
4,4 |
4,2 |
|
|
Итоговый рейтинг |
3,05 |
4,1 |
4,45 |
|
Экспертная оценка вакансии технического кадрового сегмента выявила различия в эффективности трех языковых моделях. Наивысший итоговый рейтинг получила модель «YandexGPT», получив самые высокие баллы от HR-эксперта. Модель «DeepSeek» в рейтинге получила самый высокий балл от технического эксперта, но более низкие баллы по экспертной оценке от HR, что говорит о том, что модель более специализирована на техническую точность и менее на маркетинговую составляющую. Модель «GigaChat» показала наименьшие результаты по оценке, что делает ее менее предпочтительной при выборе модели для генерации текстов технических вакансий.
Для сравнения эффективности LLM в генерации вакансий для нетехнического кадрового сегмента была выбрана вакансия «Врач-терапевт». Генерация проводилась также при едином промте для трех моделей. Оценивание проводилось двумя профильными экспертами: HR-специалистом и медицинским специалистом. Результаты оценок, полученных экспертами, представлены в таблице 2.
Таблица 2.
Результаты оценки вакансии нетехнического кадрового сегмента, сгенерированной LLM
|
№ |
Критерий |
«GigaChat» |
«DeepSeek» |
«YandexGPT» |
|
1. Экспертная оценка HR |
||||
|
1.1 |
Полнота структуры |
3 |
4 |
5 |
|
1.2 |
Конкретность описания позиции |
3 |
4 |
5 |
|
1.3 |
Привлекательность |
2 |
3 |
5 |
|
1.4 |
Конкурентоспособность |
2 |
3 |
5 |
|
1.5 |
Соответствие трендам |
3 |
3 |
4 |
|
1.6 |
Реалистичность в требованиях |
4 |
4 |
4 |
|
Средний балл |
2,83 |
3,5 |
4,67 |
|
|
2. Экспертная оценка медицинского специалиста |
||||
|
2.1 |
Фактическая точность требований |
5 |
4 |
5 |
|
2.2 |
Корректность задач |
4 |
5 |
5 |
|
2.3 |
Соответствие уровню позиции |
5 |
5 |
5 |
|
2.4 |
Отсутствие предметных ошибок |
4 |
5 |
5 |
|
2.5 |
Профессиональная привлекательность задач |
5 |
5 |
5 |
|
Средний балл |
4,6 |
4,8 |
5 |
|
|
Итоговый рейтинг |
3,72 |
4,15 |
4,84 |
|
При проведении экспертной оценки вакансии медицинского кадрового сегмента из табл. 2 видно, что лидирующую позицию также заняла модель «YandexGPT», получив самые высокие баллы как от HR-специалиста, так и от медицинского специалиста. Модель «DeepSeek» и «GigaChat» также получили высокие оценки от медицинского эксперта, однако «GigaChat» получила самые низкие баллы от HR, тем самым в итоговом рейтинге определило ее последнее место.
Проведение сравнительного анализа трех языковых моделей путем экспертной оценки позволяет сделать вывод, что эффективность в генерации текста для вакансий во многом зависит от кадрового сегмента. Модель «YandexGPT» наиболее оптимальна для задач в создании более привлекательных и убедительных текстов, а модель «DeepSeek» наиболее эффективна для обеспечения технической корректности описания. Таким образом, использование языковых моделей может являться эффективным инструментом для генерации вакансий, позволяющим перейти от создания текста с нуля к его быстрому редактированию. Для достижения наилучшего результата рекомендуется использовать и комбинировать модели: применять «YandexGPT» для создания стилистической части вакансии, «DeepSeek» для написания технической стороны вакансии. Также критически важным остается экспертный надзор специалистов для финальной проверки содержательной корректности сгенерированного текста.
Список литературы
- Панова Е. А., Опарина Н. Н. ЦИФРОВЫЕ ТЕХНОЛОГИИ В ПОДБОРЕ И ОТБОРЕ КАНДИДАТОВ: ОТ РУЧНЫХ ОПЕРАЦИЙ К ФОРМИРОВАНИЮ ЗАДАНИЙ // УПИРР. 2023. № 5. URL: https://cyberleninka.ru/article/n/tsifrovye-tehnologii-v-podbore-i-otbore-kandidatov-ot-ruchnyh-operatsiy-k-formirovaniyu-zadaniy (дата обращения: 16.04.2026)
- Мыльников Л.А., Сторчевой М.А., Чернышев В.В. и др. Оценка моделей LLM по степени готовности решать задачи управления в области ESG // Публикации НИУ ВШЭ. 2025. URL: https://publications.hse.ru/pubs/share/direct/1085466832.pdf (дата обращения: 15.04.2026)
- Русскоязычные LLM: отечественные разработки в сравнении с глобальными адаптациями // Habr / Korus Consulting. 2025. 6 марта. URL: https://habr.com/ru/companies/korus_consulting/articles/888568/ (дата обращения: 14.04.2026)


