Для добавления нового события в календарь есть обязательные и необязательные поля:
Обязательные поля:
- Дата (может быть задана числом, днем недели или относительным словом (завтра/послезавтра и т. д.))
- Время начала (в 24-х часовом формате, в 12-и часовом, с указанием минут)
Необязательные поля:
- Название события
- Продолжительность/ время окончания
- Контакт
Таким образом, самый короткий вариант фразы будет состоять из 7 слогов. Например, «Добавь встречу завтра в семь».
Самый длинный вариант фразы без учёта названия события и группы людей – 58 слогов.
Название события и группу людей ограничено 200 символами каждое (Системное ограничение). Так как среднее число букв в слоге 2 [9], 400 символов – это 200 слогов
Таким образом, задача ограничивается до следующей формулировки:
«Ввод в календарь события с помощью голосового помощника фразой длиной от 7 до 258 слогов и сравнение времени ввода со стандартным вводом»
- Исходные данные
Пользователь: человек, являющийся сотрудником в IT-сфере крупного банка РФ. (уверенный пользователь ПК)
Операционная система: MacOS
Исходное состояние системы: рабочий стол без работающих программ.
Цель: установить в системном календаре событие на определенную дату с определённым временем и описанием двумя способами: стандартным и с помощью голосового помощника.
2. Алгоритм действий пользователя
Алгоритм действий пользователя для стандартного ввода:
- Открыть Launchpad
- Найти календарь (с помощью строки поиска или пролистывая)
- Нажать правой кнопкой мыши на нужной дате и выбрать «новое событие»
- Заполнить необходимые поля (Название, участников, время начала и окончания)
- Нажать Enter
Блок-схема алгоритма приведена на рисунке 2.
Рисунок 2. Блок-схема алгоритма добавления события
Для голосового помощника алгоритм короче:
- Вызвать ГП
- Фразой уточнить параметры события
- Подтвердить, если подтребуется
Блок-схема алгоритма на рисунке 4.
Рисунок 4. Блок-схема алгоритма для ГП
Теоретический расчет времени ввода
Формула для стандартного ввода:
T=Tp+Tc+Tin |
(1) |
Где T – общее время, затраченное на достижение цели,
Tp – Время поиска приложения «Календарь»
Tc – Время создания нового события
Tin – Время ввода необходимой информации о событии
Время ввода информации о событии состоит из количества переключений и нескольких текстовых наборов.
Tin=Tt+n*Ts |
(2) |
Где Tt – время набора текста,
N – количество переключений между полями ввода
Ts – Время на одно переключение
Tt=Nw*Sav |
(3) |
Где Nw – количество слогов, необходимых для задания события,
Sav – средняя скорость набора слов
По данным исследований ученых из Кембриджского университета (Великобритания) и Универститета Аальто (Финляндия) [3][4], средняя скорость ввода составляет 52 слога в минуту.
Время Tp складывается из времени открытия Launchpad, времени ввода слова и открытия
Tp=Tin1+Tin2+Tin3 |
(4) |
Tin1 – время нажатия сочетания клавиш для открытия Launchpad (1 слог)
Tin2 – время набора слова «Календарь» (3 слога)
Tin3 – время нажатия клавиши «Enter» для открытия программы (1 слог)
Итоговая формула для подсчета времени ввода события:
T=5Sav+Tan+NcSav+n⋅Ts |
(5) |
Голосовой ввод:
Tv=Tvin+Tp+Tlag |
(6) |
Где Tv – общее время для ввода события,
Tvin – время голосового ввода (диктовка)
Tlag – время распознавания речи голосовым помощником
Tp – время подтверждения (если оно будет необходимо) – Фраза «Да» из одного слога
Tvin=NcTavv |
(7) |
Где Nc – количество слогов во фразе (7-258),
Savv – скорость голосового ввода (Определен ГОСТ Р 53452-2009 и равняется 3-5 слогов в секунду)[5]
Tp –
Tlag – время обработки запроса.
Tlag=ω⋅Nc |
(8) |
Где ω – коэффициент, отвечающий за скорость распознавания речи голосовым помощником.
В компьютерах Mac голосовой ввод анализируется на GPU (от 1 до 8 ядер), а согласно данным из [3], на распознавание 1 секунды речи на GPU требуется от 66мс 490мс, поэтому мы можем взять среднее значение.
Итоговая формула:
Tv=Nc+1Savv+ω⋅NcSavv |
(9) |
Сравнение двух способов ввода
В предыдущей части работы мы получили 2 теоретические формулы для расчета времени ввода события в календарь. Сравним их.
T=5+NcSav+Tan+n⋅Ts |
(10) |
Tv=Nc⋅(ω+1)+1Savv |
(11) |
Коэффициент ω мы установили равным 0.278
Sav приблизительно равно 0,86 слогов в секунду
Savv равен 4
Исходя из этих данных мы можем сделать вывод, что голосовой ввод будет быстрее стандартного способа ввода.
Список литературы
- Исследование скорости печати [Электронный ресурс] URL: https://www.aalto.fi/en/news/smartphone-typing-speeds-catching-up-with-keyboards (дата обращения: 21.02.2021)
- Исследование скорости печати [Электронный ресурс] URL: https://www.cam.ac.uk/research/news/what-makes-a-faster-typist (дата обращения: 21.02.2021)
- Распознавание речи [Электронный ресурс] URL: Learnkart Technology Private Limited. Speech Recognition A-Z with Hands-On, 2020, ISBN: 9781800561700, O’Reilly Media, inc
- Cathy Pearl. Designing Voice User Interfaces, 2016, ISBN: 9781491955413, O’Reilly Media, inc
- ГОСТ Р 53452-2009 Эргономика. Проектирование и применение испытаний речевых технологий
- ОСОБЕННОСТИ ЗРИТЕЛЬНОГО ВОСПРИЯТИЯ И ОКУЛОМОТОРНОЙ АКТИВНОСТИ У ПЕРВОКЛАССНИКОВ ПРИ ЧТЕНИИ ТЕКСТОВ РАЗЛИЧНОЙ СЛОЖНОСТИ, М.М.Безруких*,О.Н.Адамовская,В.В.Иванов – ФИЗИОЛОГИЯ ЧЕЛОВЕКА, 2017, том 43, No 2
- Распознавание речи [Электронный ресурс] [2021]. UR: https://ru.bmstu.wiki/Распознавание_речи (дата обращения: 21.02.2021)