Применение алгоритмов машинного обучения в профориентации

Применение алгоритмов машинного обучения в профориентации

В статье рассматриваются популярные профориентационные тесты, а также алгоритмы машинного обучения, с помощью которых можно создать основанный на данных тест.

Авторы публикации

Рубрика

ПРОЧЕЕ

Журнал

Журнал «Научный лидер» выпуск # 19 (64), май ‘22

Поделиться

  1. Введение

Свобода выбора профессии влечёт за собой страх ответственности, боязнь ошибиться. Ежегодно тысячи старшеклассников вынуждены принимать серьёзные решения о дальнейшем профессиональном развитии. Часто они прибегают за помощью к тестам по профориентации, многие из которых основаны на психологических теориях и придуманы ещё в прошлом веке. В последние десятилетия при выборе фильма, книги или товара нам часто помогает идея, лежащая в основе коллаборативной фильтрации рекомендательных систем. Она говорит о том, что новые действия пользователей, уже совершивших похожие действия, скорее всего будут снова похожи. Что, если похожую идею применить в профориентации, давая абитуриентам увидеть, какую профессию выбрали максимально похожие на них люди?

  1. Профориентационные тесты сегодня 

Тесты, предлагаемые в профориентационных центрах, основаны на пяти классических теориях: теории Джона Льюиса Холланда, «я-концепции» в теории карьерного развития Дональда Сьюпера, теории адаптации к работе, теории исключений и компромисса Линды Готтфредсон, социально-когнитивной карьерной теории. Они были разработаны ещё в XX веке и представляют собой теории, которые сложно доказать или опровергнуть с помощью строгих математических выкладок или данных.

В работе [1] предлагают следующий алгоритм для составления профориентационного теста:

1) составить перечень требований и противопоказаний к профессии,

2) отобрать характеристики личности человека, которые важно учитывать,

3) определить методы измерения этих характеристик и способы сравнения их с нормой.

На 1 и 2 шагах велика роль автора теста: в зависимости от того, кто и как составлял перечень требований и противопоказаний и важные характеристики личности, результаты тестируемых могут изменяться.

Одной из самых известных теорий профессионального выбора является концепция Дж. Холланда. Он полагает, что все люди делятся на 6 типов: артистический, реалистичный, конвенциональный, социальный, предприимчивый, интеллектуальный. В тесте нужно выбрать из 43 пар профессий (например, инженер-технолог или инженер-конструктор) ту, которой ты с большей вероятностью хотел бы заниматься.

Похожие результаты и в тесте Е.А. Климова: человек – человек, человек – природа, человек – знаковая система, человек – техника, человек – художественный образ. В каждом вопросе тестируемому опять нужно выбрать один из видов деятельности, который близок к определённой профессии.

Ещё один популярный тест – карта интересов Голомштока. Ответив на 174 вопроса по типу «Нравится ли вам/Хотели бы вы знакомиться с жизнью растений и животных?», тестируемый получает список из 29 сфер деятельности, рядом с каждой из которых стоит степень интереса к ней.

Все популярные профориентационные тесты объединяют:

  1. обоснование с помощью теорий психологии,
  2. вопросы, так или иначе связанные с профессией, то есть возможность получить желаемый результат, а не истинный.

Второй пункт плох тем, что на ответы тестируемого могут повлиять традиции, мнение родителей, мнение общества о престиже профессии. Возможность получить в результатах профессию, которую тестируемый думает, что хочет, но не хочет действительно, может ухудшить точность теста. Чтобы бороться с этим, в вопросах мы предлагаем уйти в сторону черт характера и предпочтений (например, в культуре). Также в качестве признаков можно использовать независимые факторы (например, оценки тестируемого).

Идея о том, что в профориентационном тесте мы можем избежать прямых вопросов про профессию или профессиональную деятельность, базируется на следующем допущении: люди, которые похожи друг на друга, будут выбирать похожие профессии.

  1. Алгоритмы машинного обучения для классификации

Определение профессиональной области – это задача классификации в машинном обучении. Для её решения можно использовать следующие алгоритмы: метод k ближайших соседей, деревья решений и случайный лес, линейные классификаторы (в том числе нейронные сети), наивный байесовский классификатор. Рассмотрим некоторые из них.

Метод k ближайших соседей использует в расчётах метрику, поэтому перед началом алгоритма нужно нормализовать признаки. Идея – найти k ближайших по расстоянию к тестируемому объектов и вычислить преобладающий среди них класс. Параметр k – входной и должен быть оптимально настроен. Для этого нужно найти k, при котором ошибки на тестовой выборке минимальны. Этот алгоритм лёгок в использовании, но неустойчив к выбросам и начинает работать хуже при сильном увеличении количества признаков.

Случайный лес – это множество решающих деревьев. Для каждого дерева нужно:

  1. выбрать обучающую выборку размера n,
  2. просмотреть k случайных признаков,
  3. выбрать наилучший признак и расщепление по нему (по заранее заданному критерию).

В итоге каждое дерево выдаст свой вариант классификации тестируемого, нужно выбрать преобладающий класс.

По теореме Кондорса о присяжных: если каждый член жюри присяжных имеет независимое мнение, и если вероятность правильного решения члена жюри больше 0.5, то тогда вероятность правильного решения присяжных в целом возрастает с увеличением количества членов жюри, и стремится к единице. Это говорит о том, что если точность классификации для каждого алгоритма на тестовой выборке окажется больше 0.5, то стоит использовать их ансамбль, то есть в качестве результата выдать преобладающий среди алгоритмов класс. Также можно использовать взвешенное решение, а в качестве веса – точность алгоритма.

В качестве классов мы предлагаем использовать перечень укрупненных групп, установленный приказами Министерства образования и науки Российской Федерации от 12 сентября 2013 г. N 1061 "Об утверждении перечней специальностей и направлений подготовки высшего образования"[3] и от 29 октября 2013 г. N 1199 "Об утверждении перечней профессий и специальностей среднего профессионального образования"[4]. Там можно выбрать либо 9 групп (математические и естественные науки; инженерное дело, технологии и технические науки; здравоохранение и медицинские науки; сельское хозяйство и сельскохозяйственные науки; науки об обществе; образование и педагогические науки; гуманитарные науки; искусство и культура; военные науки), либо 57 групп, на которые разбиваются первые 9. Выбор будет зависеть от количества данных, которое удастся собрать.

  1. Заключение

Конечно, никакой тест не заменит работу со специалистом в области профориентации. Тем не менее профориентационный тест, сильно отличающийся по вопросам и методам обработки данных от всех самых популярных конкурентов, сможет помочь тестируемому взглянуть на выбор профессии под другим углом. Минусы предложенного нами механизма состоят в необходимости сбора большого количества данных, без них построить алгоритм не получится.

Список литературы

  1. Давыдова, Е.Н. Построение компьютерной системы профориентации выпускников средних образовательных заведений на базе генетического алгоритмы / Е.Н. Давыдова, А.П. Сергушичева // Открытое образование – 2020, - Т.24 №3. – С. 33-43.
  2. Ильин, И.П. Дифференциальная психология профессиональной деятельностию. - СПб.: Питер, 2008. – 432 с.
  3. Приказ Министерства образования и науки РФ от 12 сентября 2013г. N 1061 “Об утверждении перечней специальностей и направлений подготовки высшего образования” [Электронный ресурс] – URL: https://base.garant.ru/70480868/ (Дата обращения: 03.05.2022)
  4. Приказ Министерства образования и науки РФ от 29 октября 2013г. N 1199 “Об утверждении перечней профессий и специальностей среднего профессионального образования” [Электронный ресурс] – URL: https://base.garant.ru/70558310/ (Дата обращения: 03.05.2022)
  5. Сегеран, Т. Программируем коллективный разум. – Пер. с англ. – СПб.: Символ-плюс, 2008. – 368 с.
  6. Югова, Е. Могут ли тесты на профориентацию помочь определиться со специальностью. – [Электронный ресурс] – URL: https://trends.rbc.ru/trends/education/60d093d39a79476354353585 (Дата обращения: 02.05.2022)

Предоставляем бесплатную справку о публикации,  препринт статьи — сразу после оплаты.

Прием материалов
c по
Размещение электронной версии
Загрузка материалов в elibrary