Теоретическое сравнение голосового и стандартного ввода событий в календарь

Теоретическое сравнение голосового и стандартного ввода событий в календарь

Авторы публикации

Рубрика

IT-Технологии

Просмотры

9

Журнал

Журнал «Научный лидер» выпуск # 6 (8), март ‘21

Дата публикации 30.03.2021

Поделиться

Цель данной работы – сравнение голосового помощника – Siri от компании «Apple», со стандартным способом взаимодействия с ПК (клавиатура + мышь) и выбор лучшего варианта. Сравнение производится с целью оптимизации рабочего времени.

В качестве задачи для пользователя выбрано создание нового события в календаре (напоминание о встрече).

Для добавления нового события в календарь есть обязательные и необязательные поля:

Обязательные поля:

  • Дата (может быть задана числом, днем недели или относительным словом (завтра/послезавтра и т. д.))
  • Время начала (в 24-х часовом формате, в 12-и часовом, с указанием минут)

Необязательные поля:

  • Название события
  • Продолжительность/ время окончания
  • Контакт

Таким образом, самый короткий вариант фразы будет состоять из 7 слогов. Например, «Добавь встречу завтра в семь».

Самый длинный вариант фразы без учёта названия события и группы людей – 58 слогов.

Название события и группу людей ограничено 200 символами каждое (Системное ограничение). Так как среднее число букв в слоге 2 [9], 400 символов – это 200 слогов

Таким образом, задача ограничивается до следующей формулировки:

«Ввод  в календарь события с помощью голосового помощника фразой длиной от 7 до 258 слогов и сравнение времени ввода со стандартным вводом»

  1. Исходные данные

Пользователь: человек, являющийся сотрудником в IT-сфере крупного банка РФ. (уверенный пользователь ПК)

Операционная система: MacOS

Исходное состояние системы: рабочий стол без работающих программ.

Цель: установить в системном календаре событие на определенную дату с определённым временем и описанием двумя способами: стандартным и с помощью голосового помощника.

2. Алгоритм действий пользователя

Алгоритм действий пользователя для стандартного ввода:

  1. Открыть Launchpad
  2. Найти календарь (с помощью строки поиска или пролистывая)
  3. Нажать правой кнопкой мыши на нужной дате и выбрать «новое событие»
  4. Заполнить необходимые поля (Название, участников, время начала и окончания)
  5. Нажать Enter

Блок-схема алгоритма приведена на рисунке 2.

pasted-image.jpeg

Рисунок 2. Блок-схема алгоритма добавления события

Для голосового помощника алгоритм короче:

  1. Вызвать ГП
  2. Фразой уточнить параметры события
  3. Подтвердить, если подтребуется

Блок-схема алгоритма на рисунке 4.

pasted-image.jpeg

 

Рисунок 4. Блок-схема алгоритма для ГП

Теоретический расчет времени ввода

Формула для стандартного ввода:

T=Tp+Tc+Tin

(1)

 

Где T – общее время, затраченное на достижение цели,

Tp – Время поиска приложения «Календарь»

Tc – Время создания нового события

Tin – Время ввода необходимой информации о событии

Время ввода информации о событии состоит из количества переключений и нескольких текстовых наборов.

Tin=Tt+n*Ts

(2)

 

Где Tt – время набора текста,

N – количество переключений между полями ввода

Ts – Время на одно переключение

Tt=Nw*Sav

(3)

 

Где Nw – количество слогов, необходимых для задания события,

Sav – средняя скорость набора слов

По данным исследований ученых из Кембриджского университета (Великобритания) и Универститета Аальто (Финляндия) [3][4], средняя скорость ввода составляет 52 слога в минуту.

Время Tp складывается из времени открытия Launchpad, времени ввода слова и открытия

Tp=Tin1+Tin2+Tin3

(4)

 

Tin1 – время нажатия сочетания клавиш для открытия Launchpad (1 слог)

Tin2 – время набора слова «Календарь» (3 слога)

Tin3 – время нажатия клавиши «Enter» для открытия программы (1 слог)

Итоговая формула для подсчета времени ввода события:

T=5Sav+Tan+NcSav+n⋅Ts

(5)

 

Голосовой ввод:

Tv=Tvin+Tp+Tlag

(6)

 

Где Tv – общее время для ввода события,

Tvin – время голосового ввода (диктовка)

Tlag – время распознавания речи голосовым помощником

Tp –  время подтверждения (если оно будет необходимо) – Фраза «Да» из одного слога

Tvin=NcTavv

(7)

 

 

Где Nc – количество слогов во фразе (7-258),

Savv – скорость голосового ввода (Определен ГОСТ Р 53452-2009 и равняется 3-5 слогов в секунду)[5]

Tp –

Tlag – время обработки запроса.

Tlag=ω⋅Nc

(8)

 

 

Где ω – коэффициент, отвечающий за скорость распознавания речи голосовым помощником.

В компьютерах Mac голосовой ввод анализируется на GPU (от 1 до 8 ядер), а согласно данным из [3], на распознавание 1 секунды речи на GPU требуется от 66мс 490мс, поэтому мы можем взять среднее значение.

Итоговая формула:

Tv=Nc+1Savv+ω⋅NcSavv

(9)

 

 

Сравнение двух способов ввода

В предыдущей части работы мы получили 2 теоретические формулы для расчета времени ввода события в календарь. Сравним их.

T=5+NcSav+Tan+n⋅Ts

(10)

 

 

Tv=Nc⋅(ω+1)+1Savv

(11)

 

 

Коэффициент ω мы установили равным 0.278
Sav приблизительно равно 0,86 слогов в секунду

Savv равен 4

Исходя из этих данных мы можем сделать вывод, что голосовой ввод будет быстрее стандартного способа ввода.

Список литературы

  1. Исследование скорости печати [Электронный ресурс] URL: https://www.aalto.fi/en/news/smartphone-typing-speeds-catching-up-with-keyboards (дата обращения: 21.02.2021)
  2. Исследование скорости печати [Электронный ресурс] URL: https://www.cam.ac.uk/research/news/what-makes-a-faster-typist (дата обращения: 21.02.2021)
  3. Распознавание речи [Электронный ресурс] URL: Learnkart Technology Private Limited. Speech Recognition A-Z with Hands-On, 2020, ISBN: 9781800561700, O’Reilly Media, inc
  4. Cathy Pearl. Designing Voice User Interfaces, 2016, ISBN: 9781491955413, O’Reilly Media, inc
  5. ГОСТ Р 53452-2009 Эргономика. Проектирование и применение испытаний речевых технологий
  6. ОСОБЕННОСТИ ЗРИТЕЛЬНОГО ВОСПРИЯТИЯ И ОКУЛОМОТОРНОЙ АКТИВНОСТИ У ПЕРВОКЛАССНИКОВ ПРИ ЧТЕНИИ ТЕКСТОВ РАЗЛИЧНОЙ СЛОЖНОСТИ, М.М.Безруких*,О.Н.Адамовская,В.В.Иванов – ФИЗИОЛОГИЯ ЧЕЛОВЕКА, 2017, том 43, No 2
  7. Распознавание речи [Электронный ресурс] [2021]. UR: https://ru.bmstu.wiki/Распознавание_речи (дата обращения: 21.02.2021)
Справка о публикации и препринт статьи
предоставляется сразу после оплаты
Прием материалов
c по
Осталось 2 дня до окончания
Размещение электронной версии
Загрузка материалов в elibrary
Публикация за 24 часа
Узнать подробнее
Акция
Cкидка 20% на размещение статьи, начиная со второй
Бонусная программа
Узнать подробнее