Голосовое управление ПК Борисов В.А. – преподаватель информатики КАСК – филиала РАНХ и ГС Красноармейск 2012
Cлайд 2
Введение В настоящее время попытки создания интеллектуального речевого интерфейса “человек-машина” все более перемещаются в реальную жизнь, а соответствующие системы стремятся занять свое место под солнцем в кабинах самолетов, рубках кораблей, трубках мобильных телефонов и т.д.
Cлайд 3
Электронные приборы как бытовые, так и используемые в различной профессиональной деятельности людей, продолжают “обрастать” все новыми многофункциональными кнопками, значения которых не в состоянии быстро запомнить и эффективно использовать, особенно в условиях возможного дефицита времени, ни один нормальный человек. Актуальность
Cлайд 4
Позволит легко открывать необходимое приложение вместо длительного и скучного процесса поиска нужных файлов в различных системных директориях компьютера. Поможет работе с ПК людям с различными патологиями (например: зрения и др.). Облегчит работу с ПК в ситуациях, когда руки пользователя заняты. Актуальность
Cлайд 5
Еще лет 30 назад, а может быть и более, специалисты предрекали блестящее будущее подобным системам. Но предсказания не оправдались, несмотря на значительные успехи в области повышения надежности распознавания речи, в особенности команд из ограниченного набора. Актуальность
Cлайд 6
Причины Существенную зависимость надежности распознавания от индивидуальных особенностей диктора Подчиненность результатов распознавания текущему психофизиологическому состоянию человека Сильное влияние акустических помех, присутствующих в ситуациях реальной жизни Наличие пользовательского стереотипа управления
Cлайд 7
Принципы работы Технология распознавания позволяет организовать одновременное распознавание 100-200 команд в дикторозависимом режиме. То есть, пользователь должен обучить каждую команду на свой голос, прежде чем система начнет работать. И 30-50 команд в дикторонезависимом режиме, но только для неизменного набора команд, для которого предварительно собирается база эталонов этих команд.
Cлайд 8
При этом пользователю не обязательно обучать систему перед началом работы. При правильном структурировании использования словаря, то есть когда на каждом уровне доступно 20-30 команд, возможно использование словарей практически неограниченного объема. Принципы работы
Cлайд 9
Ошибки распознавания 1) “Неизвестная команда --> известная недоступная команда” - (оператор ошибся, машина не смогла распознать ошибку); 2) “Неизвестная команда --> известная доступная команда ” - (оператор ошибся, машина не смогла распознать ошибку); 3) “Известная доступная команда ---> неизвестная команда ” (ошиблась машина);
Cлайд 10
4) “Известная недоступная команда --> неизвестная команда ” - (оператор ошибся, машина не смогла распознать ошибку); 5) “Известная доступная команда --> известная недоступная команда ” (ошиблась машина); 6) “Известная доступная команда --> известная доступная команда распознана неправильно ” (ошиблась машина). Ошибки распознавания
Cлайд 11
Чтобы поведение машины выглядело дружелюбным и “интеллектуальным” возможны следующие основные варианты ее реакции: промолчать и ничего не делать; сообщить человеку о возможной ошибке и попросить повторить команду; предложить помощь, произнося доступные в данном режиме команды. Реакция компьютера
Cлайд 12
Совсем не лишним будет заранее “договориться” с машиной о том, как она будет интерпретировать молчание хозяина: молчит - выполнить команду; молчит - не выполнять команду; молчит - у хозяина отказали мозги или пропал голос, запрошу еще раз, а там видно будет… Реакция компьютера
Cлайд 13
Программы для голосового управления компьютером
Cлайд 14
DragonDictate for Windows 3.0 Программа для контроля за работой и предоставления возможности диктования для Microsoft Windows 95, Windows NT и Windows 3.x. Пакет позволяет виртуально поддерживать многие приложения Windows, включая Corel WordPerfect Suite, Lotus SmartSuite и Microsoft Office. Вы можете также осуществить поддержку других программ, использовать мощный редактор макросов. DragonDictate позволяет диктовать в любом приложении, а также поддерживать широкий набор голосовых команд редактирования и навигации.
Cлайд 15
Voice Systems Listen 3.0 for Windows Программа предоставляет список предусмотренных команд, который изменяется в зависимости от контекста речевой акции и приложения, в котором используется. Предусмотрена возможность добавлять новые команды. Следует отметить несколько сложный процесс тренировки, предусматривающий, в частности, голосовой контроль размера шрифта от 1 до 99. Утешением может служить то, что это придется делать лишь единожды.
Cлайд 16
Simply Speaking Gold Программа для голосового контроля, предусматривающая также возможность дискретного диктования. Прежде чем дать голосовую команду, следует прекратить диктование. Есть возможность использовать подсказку "Что я могу сказать?", открывающую окно со списком команд, работающим в данном приложении. Сопутствующая документация очень слаба, однако ее расширенный вариант доступен через Интернет.
Cлайд 17
VoicePlus Программа для голосовых команд. Вы можете использовать ее для диктования в различных Windows-приложениях, а открыв специальное окно, произвести побуквенную транскрипцию слов. Новая программа компании L&H Voice Xpress поддерживает режим непрерывной речи и полный набор голосовых команд.
Cлайд 18
VoiceCommands Разработана специально для Microsoft Word. Она не поддерживает режим диктования вообще, однако имеет широкий набор команд редактирования и форматирования.
Cлайд 19
Горыныч Программа распознавания русской речи. Программный комплекс "Горыныч" – первая русскоязычная система автоматического распознавания речи. Программа для диктовки и голосового управления компьютером по-русски.
Cлайд 20
ввод текста с голоса на русском и английском языке; голосовое управление периферийным оборудованием; голосовое управление отдельными функциями операционных систем Microsoft Windows; голосовое управление функциями текстовых редакторов и прикладных программ; позволяет оформлять документы, дипломные работы (включая формулы) для школьников, абитуриентов, студентов.
Cлайд 21
Заключение Предложенный подход к созданию систем речевого управления в части психолого-эргономических аспектов проектирования интерфейса “человек – машина” для работы на ограниченном наборе речевых команд был достаточно успешно апробирован при создании компьютерных прототипов систем речевого управления общего назначения с использованием собственного оригинального программного обеспечения процедуры распознавания.