Способ двухрежимного голосового управления, устройство и терминал пользователя

Изобретение относится к области вычислительной техники. Технический результат заключается в обеспечении двухрежимного голосового управления голосовым вводом. Технический результат достигается за счет определения, исполнил ли пользователь операцию активации режима определения остановки оперировать-чтобы-говорить в интерфейсе голосового ввода, причем прекращение голосового ввода во время режима определения остановки оперировать-чтобы-говорить определяется на основе операции окончания режима определения остановки оперировать-чтобы-говорить; в ответ на определение того, что пользователь исполнил операцию активации режима определения остановки оперировать-чтобы-говорить, определения, находится ли микрофон в состоянии занятости; и в ответ на определение того, что микрофон находится в состоянии занятости, переключения голосового режима с режима автоматического определения остановки непосредственно-говорить на режим определения остановки оперировать-чтобы-говорить, при этом перед тем, как пользователь исполняет операцию активации режима определения остановки оперировать-чтобы-говорить, голосовой режим находится в режиме автоматического определения остановки непосредственно-говорить, если микрофон находится в состоянии занятости. 6 н. и 12 з.п. ф-лы, 23 ил.

 

ПЕРЕКРЕСТНАЯ ССЫЛКА НА РОДСТВЕННЫЕ ЗАЯВКИ

[0001] Настоящая заявка основана на и испрашивает приоритет Китайской Заявки № 201510900408.9, поданной 08 декабря 2015г., которая во всей своей полноте включена в настоящее описание посредством ссылки.

ОБЛАСТЬ ТЕХНИКИ, К КОТОРОЙ ОТНОСИТСЯ ИЗОБРЕТЕНИЕ

[0002] Настоящее раскрытие относится к области технологии управления, и, в частности, способам двухрежимного голосового управления, устройствам, и терминалам пользователя.

УРОВЕНЬ ТЕХНИКИ

[0003] С непрерывной популяризацией и развитием мобильных терминалов, постепенно становится тенденцией осуществление доступа к сети Интернет с помощью мобильных терминалов. В настоящее время многие мобильные терминалы поддерживают функцию распознавания голоса, которая была реализована, главным образом, следующими двумя путями: (1) нажатие кнопки микрофона, чтобы запустить голосовой ввод, и отпускание кнопки микрофона, чтобы окончить голосовой ввод; и (2) используя автоматическое распознавание VAD (Обнаружение Голосовой Активности), и запуск голосового ввода после входа в интерфейс голосового ввода.

[0004] Вышеупомянутые два способа распознавания голосового ввода соответствуют привычкам оперирования разных пользователей и применяются соответственно к разным сценариям. Существующие разнообразные браузеры и прикладное программное обеспечение поддерживают только один из способов реализации, и не поддерживают выбор режима и переключение в сценариях приложения, где поддерживаются оба способа голосового ввода.

СУЩНОСТЬ ИЗОБРЕТЕНИЯ

[0005] Настоящее раскрытие предоставляет способы двухрежимного голосового управления, устройства и терминалы пользователя, решающие проблемы, описанные в существующих браузерах и приложениях, чтобы добиться гибкого выбора и переключения между двумя режимами голосового ввода из оперировать-чтобы-говорить (operate-to-speak) и непосредственно-говорить (directly-speak).

[0006] В первом аспекте некоторые варианты осуществления настоящего раскрытия предоставляют способ двухрежимного голосового управления. Способ может содержать этапы, на которых: определяют, исполнил ли пользователь операцию активации режима определения остановки оперировать-чтобы-говорить в интерфейсе голосового ввода; в ответ на определение того, что пользователь исполнил операцию активации режима определения остановки оперировать-чтобы-говорить, определяют, находится ли микрофон в состоянии занятости; и в ответ на определение того, что микрофон находится в состоянии занятости, переключают голосовой режим с режима автоматического определения остановки непосредственно-говорить на режим определения остановки оперировать-чтобы-говорить, при этом перед тем, как пользователь исполняет операцию активации режима определения остановки оперировать-чтобы-говорить, голосовой режим находится в режиме автоматического определения остановки непосредственно-говорить, если микрофон находится в состоянии занятости.

[0007] В другом аспекте некоторые варианты осуществления настоящего раскрытия предоставляют, что: этап, на котором определяют, исполнил ли пользователь операцию активации режима определения остановки оперировать-чтобы-говорить в интерфейсе голосового ввода, может содержать этапы, на которых: определяют, исполнил ли пользователь операцию запуска активации режима определения остановки оперировать-чтобы-говорить в интерфейсе голосового ввода; в ответ на обнаружение операции запуска, отслеживают продолжительность времени, в течение которого пользователь исполняет операцию запуска; и в ответ на определение того, что продолжительность времени достигает предварительно установленной пороговой величины, определяют, что в интерфейсе голосового ввода обнаруживается операция активации режима определения остановки оперировать-чтобы-говорить.

[0008] В другом аспекте некоторые варианты осуществления настоящего раскрытия предоставляют, что: этап, на котором определяют, исполнил ли пользователь операцию активации режима определения остановки оперировать-чтобы-говорить в интерфейсе голосового ввода, содержит этапы, на которых: определяют, исполнил ли пользователь операцию запуска активации режима определения остановки оперировать-чтобы-говорить в интерфейсе голосового ввода; в ответ на определение операции запуска, определяют, находится ли микрофон в состоянии незанятости; и в ответ на определение того, что микрофон находится в состоянии незанятости, устанавливают режим автоматического определения остановки непосредственно-говорить в качестве голосового режима, отслеживают продолжительность времени, в течение которого пользователь исполняет операцию запуска, и в ответ на определение того, что продолжительность времени достигает предварительно установленной пороговой величины, определяют, что в интерфейсе голосового ввода обнаруживается операция активации режима определения остановки оперировать-чтобы-говорить.

[0009] В другом аспекте некоторые варианты осуществления настоящего раскрытия предоставляют то, что способ двухрежимного голосового управления может дополнительно включать в себя этапы, на которых: захватывают голосовую информацию, выражаемую пользователем в интерфейсе голосового ввода; отслеживают операцию окончания режима определения остановки оперировать-чтобы-говорить посредством пользователя в интерфейсе голосового ввода; в ответ на определение того, что пользователь исполнил операцию окончания режима определения остановки оперировать-чтобы-говорить, определяют, является ли в настоящий момент активным режим автоматического определения остановки непосредственно-говорить или режим определения остановки оперировать-чтобы-говорить; в ответ на определение того, что в настоящий момент активен режим автоматического определения остановки непосредственно-говорить, продолжают захватывать голосовую информацию, выражаемую пользователем; и в ответ на определение того, что в настоящий момент активен режим определения остановки оперировать-чтобы-говорить, останавливают захват голосовой информации, выражаемой пользователем.

[0010] В другом аспекте некоторые варианты осуществления настоящего раскрытия предоставляют способ двухрежимного голосового управления. Способ может включать в себя этапы, на которых: определяют, исполнил ли пользователь операцию запуска операции активации режима определения остановки оперировать-чтобы-говорить в интерфейсе голосового ввода; в ответ на обнаружение операции запуска, определяют, находится ли микрофон в состоянии незанятости; в ответ на определение того, что микрофон находится в состоянии незанятости, устанавливают режим автоматического определения остановки непосредственно-говорить в качестве голосового режима, и отслеживают продолжительность времени, в течение которого пользователь исполняет операцию запуска; и в ответ на определение того, что продолжительность времени достигает предварительно установленной пороговой величины, определяют, что в интерфейсе голосового ввода обнаруживается операция активации режима определения остановки оперировать-чтобы-говорить, и переключают голосовой режим с режима автоматического определения остановки непосредственно-говорить на режим определения остановки оперировать-чтобы-говорить.

[0011] В другом аспекте некоторые варианты осуществления настоящего раскрытия предоставляют устройство двухрежимного голосового управления, оперируемое в терминале пользователя. Устройство может содержать процессор и не временную машиночитаемую память, хранящую инструкции, которые, когда исполняются посредством процессора, предписывают процессору: отслеживать, исполнил ли пользователь операцию активации режима определения остановки оперировать-чтобы-говорить в интерфейсе голосового ввода; и в ответ на определение того, что пользователь исполнил операцию активации режима определения остановки оперировать-чтобы-говорить, определять, находится ли микрофон в состоянии занятости, и в ответ на определение того, что микрофон находится в состоянии занятости, переключать голосовой режим с режима автоматического определения остановки непосредственно-говорить на режим определения остановки оперировать-чтобы-говорить, при этом перед тем, как пользователь исполняет операцию активации режима определения остановки оперировать-чтобы-говорить, голосовой режим находится в режиме автоматического определения остановки непосредственно-говорить, если микрофон находится в состоянии занятости.

[0012] В другом аспекте некоторые варианты осуществления настоящего раскрытия предоставляют устройство двухрежимного голосового управления, оперируемое в терминале пользователя. Устройство может содержать процессор и не временную машиночитаемую память, хранящую инструкции, которые, когда исполняются посредством процессора, предписывают процессору: определять, исполнил ли пользователь операцию запуска активации режима определения остановки оперировать-чтобы-говорить в интерфейсе голосового ввода; и в ответ на определение операции запуска, определять, находится ли микрофон в состоянии незанятости, в ответ на определение того, что микрофон находится в состоянии не занятости, устанавливать режим автоматического определения остановки непосредственно-говорить в качестве голосового режима, отслеживать продолжительность времени, в течение которого пользователь исполняет операцию запуска, и когда продолжительность времени достигает предварительно установленной пороговой величины, определять, что в интерфейсе голосового ввода обнаруживается операция активации режима определения остановки оперировать-чтобы-говорить, и переключать голосовой режим с режима автоматического определения остановки непосредственно-говорить на режим определения остановки оперировать-чтобы-говорить.

[0013] В другом аспекте некоторые варианты осуществления настоящего раскрытия предоставляют терминал пользователя. Терминал может включать в себя микрофон, экран касания, не временную машиночитаемую память, и процессор. Память может хранить инструкции, которые, когда исполняются посредством процессора, предписывают терминалу пользователя: отслеживать, исполнил ли пользователь операцию активации режима определения остановки оперировать-чтобы-говорить в интерфейсе голосового ввода; и в ответ на определение того, что пользователь исполнил операцию активации режима определения остановки оперировать-чтобы-говорить, определять, находится ли микрофон в состоянии занятости, и в ответ на определение того, что микрофон находится в состоянии занятости, переключать голосовой режим с режима автоматического определения остановки непосредственно-говорить на режим определения остановки оперировать-чтобы-говорить, при этом перед тем, как пользователь исполняет операцию активации режима определения остановки оперировать-чтобы-говорить, голосовой режим находится в режиме автоматического определения остановки непосредственно-говорить, если микрофон находится в состоянии занятости.

[0014] В другом аспекте некоторые варианты осуществления настоящего раскрытия предоставляют терминал пользователя. Терминал может включать в себя микрофон, экран касания, не временную машиночитаемую память, и процессор. Память может хранить инструкции, которые, когда исполняются посредством процессора, предписывают терминалу пользователя: определять, исполнил ли пользователь операцию запуска активации режима определения остановки оперировать-чтобы-говорить в интерфейсе голосового ввода; и в ответ на определение операции запуска, определять, находится ли микрофон в состоянии незанятости, в ответ на определение того, что микрофон находится в состоянии незанятости, устанавливать режим автоматического определения остановки непосредственно-говорить в качестве голосового режима, отслеживать продолжительность времени, в течение которого пользователь исполняет операцию запуска, и когда продолжительность времени достигает предварительно установленной пороговой величины, определять, что в интерфейсе голосового ввода обнаруживается операция активации режима определения остановки оперировать-чтобы-говорить, и переключать голосовой режим с режима автоматического определения остановки непосредственно-говорить на режим определения остановки оперировать-чтобы-говорить.

[0015] Способ двухрежимного голосового управления, устройство двухрежимного голосового управления и терминал пользователя, предоставленные некоторыми вариантами осуществления настоящего раскрытия, применимы в сценариях применения, где поддерживаются оба режима голосового ввода из «оперировать-чтобы-говорить» и «непосредственно-говорить», при этом режим автоматического определения остановки непосредственно-говорить или режим определения остановки оперировать-чтобы-говорить могут быть выбраны или переключаться гибко и надежно посредством отслеживания поведения операции пользователя и состояния микрофона так, что можно реализовать адаптацию к голосовым вводам пользователей с разными поведенческими привычками, значительно улучшаются удобство и гибкость голосового ввода пользователя, и улучшается восприятие голосового ввода.

КРАТКОЕ ОПИСАНИЕ ЧЕРТЕЖЕЙ

[0016] Предпочтительные и неограничивающие варианты осуществления раскрытия могут быть более легко поняты посредством обращения к сопроводительным чертежам, на которых:

[0017] Фиг. 1 показывает с структурную схему структуры терминала пользователя, согласующуюся с примерными вариантами осуществления настоящего раскрытия.

[0018] Фиг. 2 показывает принципиальную блок-схему способа двухрежимного голосового управления, согласующегося с примерными вариантами осуществления настоящего раскрытия.

[0019] Фиг. 3 показывает принципиальную блок-схему другого способа двухрежимного голосового управления, согласующегося с примерными вариантами осуществления настоящего раскрытия.

[0020] Фиг. 4 показывает принципиальную блок-схему другого способа двухрежимного голосового управления, согласующегося с примерными вариантами осуществления настоящего раскрытия.

[0021] Фиг. 5 показывает принципиальную блок-схему способа управления окончания режима определения остановки оперировать-чтобы-говорить, согласующегося c примерными вариантами осуществления настоящего раскрытия.

[0022] Фиг. 6 показывает принципиальную блок-схему способа двухрежимного голосового управления, согласующегося с примерными вариантами осуществления настоящего раскрытия.

[0023] Фиг. 7 показывает структурную схему структуры устройства двухрежимного голосового управления, согласующегося с примерными вариантами осуществления настоящего раскрытия.

[0024] Фиг. 8 показывает структурную схему структуры другого устройства двухрежимного голосового управления, согласующегося с примерными вариантами осуществления настоящего раскрытия.

[0025] Фиг. 9 показывает структурную схему структуры другого устройства двухрежимного голосового управления, согласующегося с примерными вариантами осуществления настоящего раскрытия.

[0026] Фиг. 10 показывает структурную схему структуры другого устройства двухрежимного голосового управления, согласующегося с примерными вариантами осуществления настоящего раскрытия.

[0027] Фиг. 11 показывает структурную схему структуры устройства двухрежимного голосового управления, согласующегося с примерными вариантами осуществления настоящего раскрытия.

[0028] Фиг. 12 показывает структурную схему структуры другого устройства двухрежимного голосового управления, согласующегося с примерными вариантами осуществления настоящего раскрытия.

[0029] Фиг. 13 показывает принципиальную схему взаимодействующего интерфейса для запуска режима определения остановки оперировать-чтобы-говорить в состоянии незанятости микрофона, согласующегося c примерными вариантами осуществления настоящего раскрытия.

[0030] Фиг. 14 показывает принципиальную схему взаимодействующего интерфейса для окончания режима определения остановки оперировать-чтобы-говорить, согласующегося c примерными вариантами осуществления настоящего раскрытия.

[0031] Фиг. 15 показывает принципиальную схему взаимодействующего интерфейса для запуска режима определения остановки оперировать-чтобы-говорить в состоянии занятости микрофона, согласующегося c примерными вариантами осуществления настоящего раскрытия.

[0032] Фиг. 16 показывает принципиальную схему другого взаимодействующего интерфейса для запуска режима определения остановки оперировать-чтобы-говорить в состоянии незанятости микрофона, согласующегося c примерными вариантами осуществления настоящего раскрытия.

[0033] Фиг. 17 показывает принципиальную схему другого взаимодействующего интерфейса для окончания режима определения остановки оперировать-чтобы-говорить, согласующегося c примерными вариантами осуществления настоящего раскрытия.

[0034] Фиг. 18 показывает принципиальную схему другого взаимодействующего интерфейса для запуска режима определения остановки оперировать-чтобы-говорить в состоянии незанятости микрофона, согласующегося c примерными вариантами осуществления настоящего раскрытия.

[0035] Фиг. 19 показывает принципиальную схему другого взаимодействующего интерфейса для окончания режима определения остановки оперировать-чтобы-говорить, согласующегося c примерными вариантами осуществления настоящего раскрытия.

[0036] Фиг. 20 показывает принципиальную схему другого взаимодействующего интерфейса для запуска режима определения остановки оперировать-чтобы-говорить в состоянии занятости микрофона, согласующегося c примерными вариантами осуществления настоящего раскрытия.

[0037] Фиг. 21 показывает принципиальную схему другого взаимодействующего интерфейса для запуска режима определения остановки оперировать-чтобы-говорить в состоянии незанятости микрофона, согласующегося c примерными вариантами осуществления настоящего раскрытия.

[0038] Фиг. 22 показывает принципиальную схему другого взаимодействующего интерфейса для окончания режима определения остановки оперировать-чтобы-говорить, согласующегося c примерными вариантами осуществления настоящего раскрытия.

[0039] Фиг. 23 показывает принципиальную схему другого взаимодействующего интерфейса для запуска режима определения остановки оперировать-чтобы-говорить в состоянии занятости микрофона, согласующегося c примерными вариантами осуществления настоящего раскрытия.

[0040] Должно быть понятно, что вышеприведенное общее описание и нижеследующее подробное описание являются лишь примерными и пояснительными, и не являются ограничивающими раскрытие, как заявлено.

ПОДРОБНОЕ ОПИСАНИЕ НЕКОТОРЫХ ВАРИАНТОВ ОСУЩЕСТВЛЕНИЯ

[0041] Теперь подробно обратимся к примерным вариантам осуществления, примеры которых иллюстрируются на сопроводительных чертежах. Нижеследующее описание относится к сопроводительным чертежам, на которых одни и те же числа на разных чертежах представляют одни и те же или сходные элементы, если только не представлено обратное. Реализации, излагаемые в нижеследующем описании примерных вариантов осуществления, согласующиеся с настоящим изобретением, не представляют собой всех реализаций, согласующихся с изобретением. Наоборот, они являются лишь примерами систем и способов, согласующихся с аспектами, относящимися к изобретению.

[0042] Также следует отметить, что понятия, включающие в себя «первый», «второй» и подобное в описаниях, формуле изобретения и на сопроводительных чертежах настоящего раскрытия используются для того, чтобы различать сходные объекты, а не для описания конкретных последовательностей или приоритетов. Должно быть понятно, что в случае необходимости может быть осуществлен обмен данными, так что некоторые варианты осуществления настоящего раскрытия, описываемые в данном документе, могут быть реализованы в последовательностях отличных от тех, что иллюстрируются или описываются в данном документе. Более того, понятие «включать в себя», «обладать» и любой их вариант предназначены охватывать неисключительное включение, например, процессы, способы, системы, продукты или устройства, включающие в себя ряд этапов или блоков, не ограничиваются этими четко перечисленными этапами или блоками, а могут включать в себя те, что не перечислены или другие неотъемлемые этапы или блоки процессов, способов, продуктов или устройств.

[0043] Способ двухрежимного голосового управления и устройство двухрежимного голосового управления, предоставленные некоторыми вариантами осуществления настоящего раскрытия, могут быть применены к терминалу 100 пользователя. В некоторых вариантах осуществления настоящего раскрытия, терминал 100 пользователя является оборудованием мобильного терминала, например, интеллектуальным телефоном, планшетным компьютером, устройством для чтения электронных книг, портативным компьютером класса лэптоп, монтируемым на транспортном средстве компьютером, носимым мобильным терминалом, и т.д.

[0044] Фиг. 1 показывает структурную схему структуры терминала 100 пользователя, согласующегося с примерными вариантами осуществления настоящего раскрытия. Как показано на Фиг. 1, терминал 100 пользователя включает в себя память 102, контроллер 104 памяти, один или более (несмотря на то, что только один показан на фигуре) процессоры 106, периферийный интерфейс 108, радиочастотный модуль 110, аудио модуль 112, экран 114 касания, и т.д. Компоненты осуществляют связь друг с другом через одну или более шины связи/сигнальные линии 116.

[0045] Память 102 может быть использована для хранения программ и модулей программного обеспечения, например, соответствующих инструкций/модулей программы способа двухрежимного голосового управления и устройства, раскрываемых в данном документе. И процессор 106 выполняет программы и модули программного обеспечения, хранящиеся в памяти 102, чтобы исполнять разнообразные функциональные приложения, например, двухрежимное голосовое управление, раскрываемое в данном документе.

[0046] Память 102 может включать в себя высокоскоростную произвольную память, и/или энергонезависимую память, например, одно или более магнитные запоминающие устройства, флэш-память, или другую энергонезависимую твердотельную память. Процессор 106 и другие возможные компоненты могут осуществлять доступ к памяти 102 под управлением контроллера 104 памяти.

[0047] Периферийный интерфейс 108 связывает разнообразные устройства ввода/вывода с процессором 106 и памятью 102. В некоторых вариантах осуществления, периферийный интерфейс 108, процессор 106 и контроллер 104 памяти могут быть реализованы в едином чипе. В некоторых других вариантах осуществления, они могут быть реализованы соответственно посредством независимых чипов.

[0048] Радиочастотный модуль 110 используется для приема и передачи электромагнитных волн, и реализации взаимного преобразования между электромагнитными волнами и электрическими сигналами, тем самым осуществляя связь с сетью связи и другим оборудованием.

[0049] Аудио модуль 112 предоставляет аудио интерфейс для пользователя, и может включать в себя один или более микрофоны, один или более громкоговорители, и аудио схему.

[0050] Экран 114 касания предоставляет интерфейс вывода и ввода между терминалом 100 пользователя и пользователем. Например, экран 114 касания отображает условия голосового ввода, содержимое web-страницы, и подобное пользователю.

[0051] Может быть понятно, что структура, показанная на Фиг. 1, является лишь схематичной, и терминал 100 пользователя также может включать в себя больше или меньше компонентов, чем на Фиг. 1, или обладать конфигурацией отличной от той, что на Фиг. 1. Компоненты, показанные на Фиг. 1, могут быть реализованы посредством аппаратного обеспечения, программного обеспечения, или их сочетания.

[0052] Некоторые варианты осуществления настоящего раскрытия предоставляют двухрежимное голосовое управление, основанное на сценариях мобильного приложения, которое может быть лучше адаптировано к поведению пользователя применительно к голосовому вводу. Соответственно, пользователи могут непосредственно говорить и/или осуществлять операцию, чтобы вводить голос. Посредством отслеживания поведения пользователя и состояния микрофона, два режима голосового ввода могут быть выбраны по отдельности и переключаться гибким образом, чтобы предоставлять более удобную и надежную услугу голосового ввода.

[0053] В некоторых вариантах осуществления настоящего раскрытия, в соответствии с режимом голосового ввода, выбранным пользователем, голосовой режим, главным образом, включает в себя режим определения остановки оперировать-чтобы-говорить и режим автоматического определения остановки непосредственно-говорить. Правило определения остановки у режима определения остановки оперировать-чтобы-говорить состоит в том, что остановка (например, случай операции ввода) определяется, когда обнаруживается операция окончания режима определения остановки оперировать-чтобы-говорить (в противоположность операции активации режима определения остановки оперировать-чтобы-говорить). Например, остановка определяется, при обнаружении того, что палец или электромагнитное перо, отпускает кнопку нажать-чтобы-говорить, осуществляется щелчок отменяющий выбор кнопки микрофона, кнопка микрофона сдвигается в начальную точку, и подобное, безотносительно того выполняет ли пользователь языковое описание. Используя операцию нажатия кнопки нажать-чтобы-говорить, чтобы запустить голосовой ввод, и отпускания кнопки нажать-чтобы-говорить, чтобы окончить голосовой ввода, в качестве примера, в данном режиме определения остановки оперировать-чтобы-говорить, при условии что пользователь продолжает нажимать кнопку разговора, голосовой режим находится в состоянии непрерывного захвата голосовой информации пользователя, безотносительно того, выполняет ли пользователь голосовой ввод.

[0054] Правило определения остановки режима автоматического определения остановки непосредственно-говорить, состоит в том, что остановка (например, случай операции ввода) определяется, если голосовой ввод не обнаруживается в течение некоторой продолжительности времени безотносительно тому, выполняет ли пользователь операцию.

[0055] Фиг. 2 показывает способ двухрежимного голосового управления, согласующийся с примерными вариантами осуществления настоящего раскрытия. Обращаясь к Фиг. 2, раскрывается способ управления. Способ может быть направлен на браузер в терминале пользователя или модуль голосовой функции, такой как аудио модуль в прикладном программном обеспечении. Способ включает в себя следующие этапы.

[0056] Этап S200 включает в себя: определение, исполнил ли пользователь операцию активации режима определения остановки оперировать-чтобы-говорить в интерфейсе голосового ввода.

[0057] Пользователь в интерфейсе поиска может выбирать, входить ли в интерфейс голосового ввода. Простой путь входа в интерфейс голосового ввода может быть определен, например, посредством того, что пользователь щелкает по кнопке «голосовой ввод» в интерфейсе взаимодействия экрана, выполняет предварительно определенный жест, такой как жест «V», и т.д. Конечно, по умолчанию может быть непосредственный вход в интерфейс голосового ввода. Описанным выше является пример входа в интерфейс голосового ввода, и может быть понятно, что реализация настоящего раскрытия этим не ограничивается.

[0058] После входа в интерфейс голосового ввода, пользователь может непосредственно говорить, чтобы вводить голос, или выполнять операцию, чтобы вводить голос, в соответствии с привычками без выбора режима голосового ввода.

[0059] Операция активации режима определения остановки оперировать-чтобы-говорить посредством пользователя относится к операции, непосредственно инициирующей режим определения остановки оперировать-чтобы-говорить. Может существовать много операций активации режима определения остановки оперировать-чтобы-говорить, и они будут проиллюстрированы в качестве примера в нижеследующем описании.

[0060] Этап S201 включает в себя: в ответ на определение того, что пользователь исполнил операцию активации режима определения остановки оперировать-чтобы-говорить, определение, находится ли микрофон в состоянии занятости, и если так, то исполняется этап S202: переключение голосового режима с режима автоматического определения остановки непосредственно-говорить на режим определения остановки оперировать-чтобы-говорить. Перед тем, как пользователь исполняет операцию активации режима определения остановки оперировать-чтобы-говорить, если микрофон находится в состоянии занятости, голосовой режим находится в режиме автоматического определения остановки непосредственно-говорить. В противном случае, выполняется этап S203: устанавливают режим определения остановки оперировать-чтобы-говорить в качестве голосового режима.

[0061] В некоторых вариантах осуществления, микрофон в состоянии занятости указывает состояние записи, при котором микрофон принимает голоса пользователя, и соответственно, микрофон в состоянии незанятости указывает состояние не записи, когда микрофон не принимает голоса пользователя. Для того, чтобы позволить пользователю удобным образом распознавать состояние микрофона, пиктограмма записи микрофона появляется в середине экрана, чтобы указать состояние занятости, как показано на Фиг. 14, 15, 17, 19, 20, 22 и 23.

[0062] Находится ли микрофон в состоянии занятости, может быть определено многими способами. В одной примерной реализации, терминал пользователя включает в себя машину состояния микрофона для захвата состояния микрофона, терминал пользователя отправляет инструкцию захвата состояния микрофона к машине состояния микрофона при определении того, что пользователь исполнил операцию активации режима определения остановки оперировать-чтобы-говорить, и машина состояния микрофона захватывает состояние микрофона.

[0063] В некоторых вариантах осуществления, когда микрофон находится в состоянии занятости, микрофон находится в состоянии приема и записи голоса пользователя, и голосовой режим находится в режиме автоматического определения остановки непосредственно-говорить или режиме определения остановки оперировать-чтобы-говорить. Если определяется, что пользователь исполнил операцию активации режима определения остановки оперировать-чтобы-говорить, когда микрофон находится в состоянии занятости, это указывает на то, что голосовой режим не был в режиме определения остановки оперировать-чтобы-говорить перед тем, как исполняется операция активации режима определения остановки оперировать-чтобы-говорить. Таким образом, при определении того, что пользователь исполнил операцию активации режима определения остановки оперировать-чтобы-говорить, когда микрофон находится в состоянии занятости, текущий голосовой режим должен находиться в режиме автоматического определения остановки непосредственно-говорить. При обнаружении того, что пользователь исполнил операцию активации режима определения остановки оперировать-чтобы-говорить в режиме автоматического определения остановки непосредственно-говорить, может быть определено, что пользователь готовится к переключению голосового режима, и затем голосовой режим переключается с режима автоматического определения остановки непосредственно-говорить на режим определения остановки оперировать-чтобы-говорить, чтобы реализовать переключение режима, адаптируясь к поведению голосового ввода пользователя. Соответственно, если микрофон находится в состоянии незанятости при обнаружении того, что пользователь исполнил операцию активации режима определения остановки оперировать-чтобы-говорить в режиме автоматического определения остановки непосредственно-говорить, он непосредственно переходит в режим определения остановки оперировать-чтобы-говорить.

[0064] Разнообразные способы могут быть использованы, чтобы определять, исполнил ли пользователь операцию активации режима определения остановки оперировать-чтобы-говорить в интерфейсе голосового ввода. Ниже предоставляются два способа определения, и может быть понятно, что реализация настоящего раскрытия этим не ограничивается.

[0065] В первом способе определения, как показано на Фиг. 3, отслеживание того, выполнил ли пользователь операцию активации режима определения остановки оперировать-чтобы-говорить в интерфейсе голосового ввода этапа 200, описанного выше, включает в себя следующие этапы:

[0066] Этап S300: определение, исполнил ли пользователь операцию запуска активации режима определения остановки оперировать-чтобы-говорить в интерфейсе голосового ввода.

[0067] В некоторых вариантах осуществления, пользователь исполняет операцию запуска активации режима определения остановки оперировать-чтобы-говорить, например, операцией запуска является операция нажатия кнопки нажать-чтобы-говорить, как показано на Фиг. 13 и 15; в качестве другого примера, операцией запуска является операция щелчка по кнопке микрофона, как показано на Фиг. 16; в качестве дополнительного примера, операцией запуска является операция сдвига из начальной позиции в конечную позицию, например, сдвиг слева направо, и т.д.

[0068] Операция запуска активации режима определения остановки оперировать-чтобы-говорить реализуется разнообразными путями из начальной позиции в конечную позицию, например, операцией запуска является жест, например, палец пользователя сдвигается из любой позиции в левой стороне экрана в любую позицию в правой стороне экрана, как показано на Фиг. 21 и 23. В качестве другого примера, экран имеет кнопку микрофона и ползун для сдвига кнопки микрофона, при этом операцией запуска активации режима определения остановки оперировать-чтобы-говорить является перетаскивание кнопки микрофона из одной позиции в другую в ползуне, как показано на Фиг. 18 и 20.

[0069] Кнопка микрофона может иметь несколько форм. Например, кнопка микрофона может выглядеть как пиктограмма кнопки микрофона, например, пиктограмма микрофона устанавливается в середине зоны, и голосовой ввод может начинаться посредством длительного нажатия или выбора пиктограммы микрофона, как показано на Фиг. 16 и 17. В качестве другого примера, кнопка микрофона может выглядеть в качестве кнопки длительного нажатия, у которой ярлык нажать-чтобы-говорить или подобный нанесен на прямоугольную кнопку, и голосовой ввод может начинаться посредством длительного нажатия кнопки, как показано на Фиг. 13 и 15.

[0070] Во время реализации, если пользователь выбирает режим голосового ввода оперировать-чтобы-говорить, пользователь может исполнять операцию запуска активации режима определения остановки оперировать-чтобы-говорить; когда пользователь исполняет операцию запуска активации режима определения остановки оперировать-чтобы-говорить, терминал пользователя отслеживает операцию запуска активации режима определения остановки оперировать-чтобы-говорить, например, осуществление щелчка по кнопке микрофона, нажатие кнопки длительного нажатия, перетаскивание кнопки микрофона, сдвиг по экрану, и т.д., при которой палец пользователя или электромагнитное перо, которым оперирует пользователь, касается экрана или кнопки микрофона на экране. Таким образом, поведение действия, такое что палец пользователя или электромагнитное перо, которым оперирует пользователь, щелкает по кнопке микрофона, нажимает кнопку длительного нажатия, перетаскивает кнопку микрофона или сдвигается по экрану, может быть выбрано в качестве операции запуска, которая должна отслеживаться, или действие контакта между пальцем пользователя или электромагнитным пером, которым оперирует пользователь, и экраном или кнопкой микрофона на экране может быть выбрано в качестве операции запуска, которая должна отслеживаться.

[0071] Из вышеприведенного описания может быть известно, что операция запуска активации режима определения остановки оперировать-чтобы-говорить, используется в качестве узла для улавливания поведения пользователя в некоторых вариантах осуществления.

[0072] Этап S301 включает в себя: при обнаружении операции запуска, отслеживание продолжительности времени, в течение которого пользователь исполняет операцию запуска, и когда продолжительность времени достигает предварительно установленной пороговой величины, определение, что в интерфейсе голосового ввода обнаруживается операция активации режима определения остановки оперировать-чтобы-говорить.

[0073] В некоторых вариантах осуществления, обнаружение операции запуска указывает возникновение операции пользователя активации режима определения остановки оперировать-чтобы-говорить. Взяв в качестве примера режим операции нажать-чтобы-говорить, обнаружение операции запуска на данном этапе указывает момент, когда палец пользователя нажимает кнопку микрофона, и пользователь не оперировал кнопкой микрофона до того, как палец нажимает кнопку микрофона.

[0074] Учитывая возможные ложные операции в практических приложениях, взяв в качестве примера то, что пользователь осуществляет длительное нажатие кнопки микрофона для голосового ввода (как показано на Фиг. 13) и отпускает кнопку микрофона, чтобы окончить голосовой ввод (как показано на Фиг. 14), в приложении существует ситуация, что пользователь случайно оперирует кнопкой микрофона. В такой ситуации, при обнаружении того, что пользователь исполнил операцию запуска активации режима определения остановки оперировать-чтобы-говорить, например, при нажатии кнопки микрофона, определяется, что в интерфейсе голосового ввода обнаруживается операция активации режима определения остановки оперировать-чтобы-говорить, и что режим определения остановки оперировать-чтобы-говорить устанавливается в качестве голосового режима. Сходным образом, когда палец пользователя отпускает кнопку микрофона, определяется окончание голосового ввода в соответствии с правилом определения остановки режима определения остановки оперировать-чтобы-говорить. Такой процесс может вызвать проблему, состоящую в том, что информация, описываемая голосом пользователя, не может быть полностью захвачена.

[0075] Таким образом, чтобы преодолеть ограничение предшествующего уровня техники, в некоторых вариантах осуществления, ложная операция определяется посредством отслеживания продолжительности времени, которое затрачивает пользователь, чтобы исполнить операцию запуска, например, продолжительность времени, в течение которого пользователь нажимает кнопку микрофона. Когда определяется, что продолжительность времени, которое затрачивает пользователь, чтобы исполнить операцию запуска, например, продолжительность времени, в течение которого пользователь нажимает кнопку микрофона, достигает предварительно установленной пороговой величины, может быть определена корректная операция. Затем, пользователь может быть определен исполнившим операцию активацию режима определения остановки оперировать-чтобы-говорить в интерфейсе голосового ввода, и определяется состояние микрофона. Если микрофон находится в состоянии занятости, голосовой режим переключается с режима автоматического определения остановки непосредственно-говорить на режим определения остановки оперировать-чтобы-говорить; и если микрофон находится в состоянии незанятости, режим определения остановки оперировать-чтобы-говорить устанавливается в качестве голосового режима. С другой стороны, если продолжительность времени, которое затрачивает пользователь, чтобы исполнить операцию запуска, не достигает предварительно установленной пороговой величины, определяется, что пользователь исполнил ложную операцию вместо операции активации режима определения остановки оперировать-чтобы-говорить в интерфейсе голосового ввода, и голосовой режим не переключается.

[0076] Во втором способе определения, как показано на Фиг. 4, отслеживание того, исполнил ли пользователь операцию активации режима определения остановки оперировать-чтобы-говорить в интерфейсе голосового ввода этапа 200, описанного выше, включает в себя следующие этапы:

[0077] Этап S400: определение, исполнил ли пользователь операцию запуска активации режима определения остановки оперировать-чтобы-говорить в интерфейсе голосового ввода.

[0078] На данном этапе, пользователь может исполнять операцию запуска подобно тому, как на этапе S300, что здесь не повторяется.

[0079] Этап S401 включает в себя: в ответ на определение того, что пользователь исполнил операцию запуска активации режима определения остановки оперировать-чтобы-говорить, определение, находится ли микрофон в состоянии незанятости. Если да, исполняется этап S402: установка режима автоматического определения остановки непосредственно-говорить в качестве голосового режима; после которого исполняется этап S403: отслеживание продолжительности времени, которое затрачивает пользователь, чтобы исполнить операцию запуска; и когда продолжительность времени достигает предварительно установленной пороговой величины, определение, что в интерфейсе голосового ввода обнаруживается операция активации режима определения остановки оперировать-чтобы-говорить. В противном случае, исполняется этап S404: когда продолжительность времени исполнения операции запуска достигает предварительно установленной пороговой величины, переключение голосового режима с режима автоматического определения остановки непосредственно-говорить на режим определения остановки оперировать-чтобы-говорить.

[0080] На данном этапе, отслеживание операции запуска является точно таким же, как то что на этапе S301, которое здесь не повторяется.

[0081] Состояние незанятости микрофона указывает состояние не записи, когда не принимается голосовое описание пользователя. В некоторых вариантах осуществления, на экране отсутствует пиктограмма записи микрофона, когда микрофон находится в состоянии незанятости.

[0082] В некоторых вариантах осуществления, если микрофон находится в состоянии незанятости, текущий голосовой режим находится ни в режиме автоматического определения остановки непосредственно-говорить, ни в режиме определения остановки оперировать-чтобы-говорить. Отслеживание операции запуска активации режима определения остановки оперировать-чтобы-говорить в состоянии незанятости микрофона указывает на то, что пользователь готовится к голосовому вводу.

[0083] На основании тех же соображений, что и на этапе S301, может существовать ложная операция пользователя. Таким образом, на данном этапе, когда обнаруживается пользователь исполняющий операцию запуска, например, когда кнопка микрофона нажимается и микрофон находится в состоянии незанятости, режим автоматического определения остановки непосредственно-говорить устанавливается в качестве голосового режима, и затем голосовая информация, описываемая пользователем, захватывается в режиме автоматического определения остановки непосредственно-говорить, так что можно избежать любого конфликта, вызываемого ложной операцией, и голосовая информация, описываемая пользователем, может быть полностью захвачена.

[0084] Когда обнаруживается операция запуска и микрофон находится в состоянии незанятости, ложная операция определяется посредством отслеживания продолжительности времени, которое пользователь нажимает кнопку микрофона, в то время как режим автоматического определения остановки непосредственно-говорить установлен в качестве голосового режима. Когда продолжительность времени, которое затрачивает пользователь, чтобы исполнить операцию запуска, например, продолжительность времени, в течение которого пользователь нажимает кнопку микрофона, определяется как достигающая предварительно установленной пороговой величины, операция может быть определена не как ложная операция. Тогда, определяется, что пользователь исполнил операцию активации режима определения остановки оперировать-чтобы-говорить в интерфейсе голосового ввода, и определяется состояние микрофона. Если микрофон находится в состоянии занятости, голосовой режим переключается с режима автоматического определения остановки непосредственно-говорить на режим определения остановки оперировать-чтобы-говорить; и если микрофон находится в состоянии незанятости, режим определения остановки оперировать-чтобы-говорить устанавливается в качестве голосового режима. С другой стороны, если продолжительность времени, которое затрачивает пользователь, чтобы исполнить операцию запуска, не достигает предварительно установленной пороговой величины, определяется ложная операция, определяется, что в интерфейсе голосового ввода не обнаруживается пользователь, исполняющий операцию активации режима определения остановки оперировать-чтобы-говорить, и голосовой режим не переключается.

[0085] Способ управления, предоставленный в данном варианте осуществления, может быть применен в разнообразных сценариях операции запуска режима определения остановки оперировать-чтобы-говорить. Например, если операцией запуска активации режима определения остановки оперировать-чтобы-говорить является операция нажатия кнопки микрофона, то операцией активации режима определения остановки оперировать-чтобы-говорить является нажатие кнопки микрофона в пределах предварительно установленной пороговой величины, и предварительно установленная пороговая величина является продолжительностью времени нажатия кнопки микрофона. В качестве другого примера, если операцией запуска активации режима определения остановки оперировать-чтобы-говорить является операция щелчка по кнопке микрофона, то операцией активации режима определения остановки оперировать-чтобы-говорить является осуществление щелчка по кнопке микрофона в пределах предварительно установленной пороговой величины, и предварительно установленная пороговая величина является продолжительностью времени осуществления щелчка по кнопке микрофона. В качестве дополнительного примера, если операцией запуска активации режима определения остановки оперировать-чтобы-говорить является операция сдвига кнопки микрофона слева на правую сторону экрана, то операцией активации режима определения остановки оперировать-чтобы-говорить является удержание кнопки микрофона в правой стороне экрана в пределах предварительно установленной пороговой величины, и предварительно установленная пороговая величина является продолжительностью времени удержания кнопки микрофона в правой стороне экрана.

[0086] Во время реализации, предварительно установленная пороговая величина может быть гибко установлена, предварительно установленные пороговые величины, соответствующие разным операциям запуска режима определения остановки оперировать-чтобы-говорить могут быть разными, например, предварительно установленной пороговой величиной продолжительности времени нажатия кнопки микрофона может быть 1 секунда; предварительно установленной пороговой величиной продолжительности времени осуществления щелчка по кнопке микрофона может быть 2 секунды; и предварительной установленной пороговой величиной продолжительности времени сдвига кнопки микрофона может быть 3 секунды, и т.д.

[0087] В данном варианте осуществления, операция запуска окончания режима определения остановки оперировать-чтобы-говорить используется в качестве узла для улавливания поведения пользователя, в то время как операция запуска активации режима определения остановки оперировать-чтобы-говорить используется в качестве другого узла для улавливания поведения пользователя.

[0088] Как показано на Фиг. 5, способ дополнительно включает в себя следующие этапы.

[0089] Этап S500 включает в себя: захват голосовой информации, выражаемой пользователем в интерфейсе голосового ввода.

[0090] Когда пользователь вводит голос в интерфейсе голосового ввода, микрофон находится в состоянии занятости, голосовой режим находится в режиме определения остановки оперировать-чтобы-говорить или режиме автоматического определения остановки непосредственно-говорить, и захватывается голосовая информация, выражаемая пользователем в режиме определения остановки оперировать-чтобы-говорить или режиме автоматического определения остановки непосредственно-говорить.

[0091] Этап S501 включает в себя: отслеживание операции окончания режима определения остановки оперировать-чтобы-говорить посредством пользователя в интерфейсе голосового ввода.

[0092] В некоторых вариантах осуществления, в соответствии с разными операциями запуска, исполняемыми пользователем, чтобы запустить режим определения остановки оперировать-чтобы-говорить, операция окончания режима определения остановки оперировать-чтобы-говорить может быть реализована разнообразными путями. Например, если операцией запуска является операция нажатия кнопки нажать-чтобы-говорить, как показано на Фиг. 13, режимом голосового ввода оперировать-чтобы-говорить является нажатие кнопки нажать-чтобы-говорить для голосового ввода. Соответственно, операцией окончания режима определения остановки оперировать-чтобы-говорить является отпускание кнопки нажать-чтобы-говорить, как показано на Фиг. 14. В качестве другого примера, если операцией запуска активации режима определения остановки оперировать-чтобы-говорить является операция щелчка по кнопке микрофона, как показано на Фиг. 16, режимом голосового ввода оперировать-чтобы-говорить является щелчок по кнопке микрофона для голосового ввода. Соответственно, операцией окончания режима определения остановки оперировать-чтобы-говорить является щелчок для отмены выбранной кнопки микрофона, как показано на Фиг. 17. В качестве дополнительного примера, если операцией запуска активации режима определения остановки оперировать-чтобы-говорить является сдвиг из начальной позиции в конечную позицию, например, сдвиг слева направо, режимом голосового ввода оперировать-чтобы-говорить является выполнение голосового ввода после сдвига слева направо. Соответственно, операцией окончания режима определения остановки оперировать-чтобы-говорить является сдвиг из конечной позиции в начальную позицию, например, сдвиг справа налево.

[0093] Операцией запуска активации режима определения остановки оперировать-чтобы-говорить является сдвиг из начальной позиции в конечную позицию в нескольких режимах реализации, например, операцией запуска является жест, например, палец пользователя или электромагнитное перо, которым оперирует пользователь, сдвигается из любой позиции в левой стороне экрана в любую позицию в правой стороне экрана, как показано на Фиг. 21. Соответственно, операция окончания режима определения остановки оперировать-чтобы-говорить реализуется, когда палец пользователя или электромагнитное перо сдвигается из любой позиции в правой стороне экрана в любую позицию в левой стороне экрана, как показано на Фиг. 22. В качестве другого примера, экран имеет кнопку микрофона и ползунок для сдвига кнопки микрофона, операцией запуска активации режима определения остановки оперировать-чтобы-говорить является перетаскивание кнопки микрофона из одной позиции в ползунке в другую позицию, как показано на Фиг. 18. Соответственно, операцией окончания режима определения остановки оперировать-чтобы-говорить является перетаскивание кнопки микрофона в начальную позицию, как показано на Фиг. 19.

[0094] Этап S502 включает в себя: в ответ на обнаружение того, что пользователь исполнил операцию окончания режима определения остановки оперировать-чтобы-говорить, определение, является ли в настоящий момент активным режим автоматического определения остановки непосредственно-говорить или режим определения остановки оперировать-чтобы-говорить. Этап S503 включает в себя: если в настоящий момент активен режим автоматического определения остановки непосредственно-говорить, продолжение захвата голосовой информации, выражаемой пользователем; и этап S504 включает в себя: если в настоящий момент активен режим определения остановки оперировать-чтобы-говорить, остановка захвата голосовой информации, выражаемой пользователем.

[0095] В некоторых вариантах осуществления, Фиг. 15, 20, и 23 являются принципиальными схемами, описывающими то, что пользователь исполняет операцию запуска активации режима определения остановки оперировать-чтобы-говорить в состоянии занятости микрофона.

[0096] В некоторых вариантах осуществления, когда пользователь входит в интерфейс голосового ввода и перед тем как обнаруживается голосовой ввод пользователя, голосовой режим может быть не установлен. Т.е., когда голосовой ввод пользователя не обнаружен, голосовой режим не является ни режимом автоматического определения остановки непосредственно-говорить, ни режимом определения остановки оперировать-чтобы-говорить. Когда обнаруживается голос пользователя, голосовой режим устанавливается в соответствии с тем, исполнил ли пользователь операцию активации режима определения остановки оперировать-чтобы-говорить. Если голос обнаруживается, а операция активации режима определения остановки оперировать-чтобы-говорить не обнаруживается, режим автоматического определения остановки непосредственно-говорить устанавливается в качестве голосового режима; если обнаруживается голос и обнаруживается операция активации режима определения остановки оперировать-чтобы-говорить, режим определения остановки оперировать-чтобы-говорить устанавливается в качестве голосового режима.

[0097] Для того, чтобы предотвратить ложную операцию и гарантировать целостность захваченной голосовой информации, в другом режиме, когда голос пользователя обнаруживается в интерфейсе голосового ввода, режим автоматического определения остановки непосредственно-говорить устанавливается в качестве голосового режима безотносительно того, оперирует ли пользователь кнопкой микрофона. Таким образом, устройство также может быть установлено по умолчанию во время реализации, например, когда пользователь входит в интерфейс голосового ввода, режим автоматического определения остановки непосредственно-говорить устанавливается по умолчанию в качестве голосового режима, затем отслеживаются, исполнил ли пользователь операцию запуска активации режима определения остановки оперировать-чтобы-говорить, и продолжительность времени исполнения операции запуска, голосовой режим переключается с режима автоматического определения остановки непосредственно-говорить на режим определения остановки оперировать-чтобы-говорить, когда продолжительность времени достигает предварительно установленной пороговой величины, в противном случае, продолжается режим автоматического определения остановки непосредственно-говорить.

[0098] В способе двухрежимного голосового управления, описанном выше, текущее поведение голосового ввода пользователя точно улавливается через два узла, двумя узлами соответственно являются операция запуска активации режима определения остановки оперировать-чтобы-говорить и окончание режима определения остановки оперировать-чтобы-говорить. И голосовой режим автоматически переключается на соответствующую поддержку голосового ввода в соответствии с состоянием микрофона и режимом голосового ввода, когда обнаруживаются разные операции, так что происходит адаптация к привычкам голосового ввода разных пользователей, и могут быть удовлетворены требования использования голоса разных поведений.

[0099] В способе двухрежимного голосового управления, предоставленном в первом варианте осуществления, когда обнаруживается операция запуска активации режима определения остановки оперировать-чтобы-говорить, голосовой режим переходит в режим автоматического определения остановки непосредственно-говорить, и когда продолжительность времени исполнения операции запуска достигает предварительно установленной пороговой величины, голосовой режим переключается с режима автоматического определения остановки непосредственно-говорить на режим определения остановки оперировать-чтобы-говорить, так что гарантируется целостность захваченной голосовой информации и эффективно избегают последствий ложной операции.

[0100] Фиг. 6 показывает способ двухрежимного голосового управления, предоставленный некоторыми вариантами осуществления настоящего раскрытия. Как показано на Фиг. 6, поток способа управления может быть реализован посредством браузера в терминале пользователя или модуля голосовой функции, такого как аудио модуль в прикладном программном обеспечении, и способ включает в себя следующие этапы:

[0101] Этап S600 включает в себя: отслеживают, исполнил ли пользователь операцию запуска активации режима определения остановки оперировать-чтобы-говорить в интерфейсе голосового ввода.

[0102] В некоторых вариантах осуществления, пользователь может исполнять операцию запуска активации режима определения остановки оперировать-чтобы-говорить в нескольких реализациях. Например, операцией запуска является операция нажатия кнопки нажать-чтобы-говорить, как показано на Фиг. 13. В качества другого примера, операцией запуска является операция щелчка по кнопке микрофона, как показано на Фиг. 16. В качестве дополнительного примера, операцией запуска является операция сдвига из начальной позиции в конечную позицию, например, сдвиг слева направо, и т.д.

[0103] Кнопка микрофона показана в нескольких формах, например, показана в качестве пиктограммы кнопки микрофона, например, пиктограмма микрофона устанавливается в середине зоны, и голосовой ввод может начинаться посредством длительного нажатия или выбора пиктограммы микрофона, как показано на Фиг. 16 и 17; в качестве другого примера, показана в качестве кнопки длительного нажатия, у которой ярлык нажать-чтобы-говорить или подобный нанесен на прямоугольную кнопку, и голосовой ввод может начинаться посредством длительного нажатия кнопки, как показано на Фиг. 13 и 15.

[0104] Может быть известно из описанного выше, что операция запуска активации режима определения остановки оперировать-чтобы-говорить может быть использована в качестве узла для улавливания поведения пользователя.

[0105] Этап S601 включает в себя: в ответ на обнаружение операции запуска, определение, находится ли микрофон в состоянии незанятости; если да, исполняется этап S602: установка режима автоматического определения остановки непосредственно-говорить в качестве голосового режима; этап S603 включает в себя: отслеживание продолжительности времени, которое затрачивает пользователь, чтобы исполнить операцию запуска; и этап S604 включает в себя: когда продолжительность времени достигает предварительно установленной пороговой величины, определение, что в интерфейсе голосового ввода обнаруживается операция активации режима определения остановки оперировать-чтобы-говорить, и переключение голосового режима с режима автоматического определения остановки непосредственно-говорить на режим определения остановки оперировать-чтобы-говорить. Если ответом на этап S601 является нет, исполняется этап S605: когда продолжительность времени исполнения операции запуска достигает предварительно установленной пороговой величины, переключение голосового режима с режима автоматического определения остановки непосредственно-говорить на режим определения остановки оперировать-чтобы-говорить.

[0106] Обнаружение операции запуска указывает момент, когда возникает операция пользователя активации режима определения остановки оперировать-чтобы-говорить. Взяв в качестве примера режим операции нажать-чтобы-говорить, обнаружение операции запуска на данном этапе указывает момент, когда палец пользователя нажимает кнопку микрофона, и пользователь не оперировал кнопкой микрофона перед моментом, когда палец пользователя нажал кнопку микрофона.

[0107] Состояние незанятости микрофона указывает состояние не записи, когда не принимается голосовое описание. В некоторых вариантах осуществления, на экране отсутствует пиктограмма записи микрофона в состоянии незанятости микрофона.

[0108] В некоторых вариантах осуществления, если микрофон находится в состоянии незанятости, текущий голосовой режим не является ни режимом автоматического определения остановки непосредственно-говорить, ни режимом определения остановки оперировать-чтобы-говорить. Отслеживание операции запуска активации режима определения остановки оперировать-чтобы-говорить в состоянии незанятости указывает на то, что пользователь готовится к голосовому вводу.

[0109] Поскольку может существовать ложная операция, на данном этапе, когда обнаруживается операция запуска, например, когда кнопка микрофона нажимается и микрофон находится в состоянии незанятости, режим автоматического определения остановки непосредственно-говорить устанавливается в качестве голосового режима, и затем голосовая информация, описываемая пользователем, захватывается в режиме автоматического определения остановки непосредственно-говорить, так что можно избежать любого конфликта, вызываемого ложной операцией, и голосовая информация может быть полностью захвачена.

[0110] Когда обнаруживается операция запуска и микрофон находится в состоянии незанятости, ложная операция определяется посредством отслеживания продолжительности времени, в течение которого пользователь исполняет операцию запуска, например, продолжительности времени, которое пользователь нажимает кнопку микрофона, в то время как режим автоматического определения остановки непосредственно-говорить установлен в качестве голосового режима. Когда продолжительность времени в течение которой пользователь исполняет операцию запуска, например, продолжительность времени в течение которого пользователь нажимает кнопку микрофона, определяется как достигающая предварительно установленной пороговой величины, может быть определена корректная операция, затем определяется, что пользователь исполнил операцию активации режима определения остановки оперировать-чтобы-говорить в интерфейсе голосового ввода, и голосовой режим переключается с режима автоматического определения остановки непосредственно-говорить на режим определения остановки оперировать-чтобы-говорить. С другой стороны, если продолжительность времени, в течение которого пользователь исполняет операцию запуска, не достигает предварительно установленной пороговой величины, определяется ложная операция, определяется, что пользователь не исполнил операцию активации режима определения остановки оперировать-чтобы-говорить в интерфейсе голосового ввода, и голосовой режим не переключается.

[0111] В некоторых вариантах осуществления, операция пользователя окончания режима определения остановки оперировать-чтобы-говорить используется в качестве другого узла для улавливания поведения пользователя.

[0112] Способ дополнительно включает в себя: захват голосовой информации, выражаемой пользователем в интерфейсе голосового ввода; отслеживание операции окончания режима определения остановки оперировать-чтобы-говорить посредством пользователя в интерфейсе голосового ввода; при обнаружении того, что пользователь исполняет операцию окончания режима определения остановки оперировать-чтобы-говорить, определение, является ли в настоящий момент активным режим автоматического определения остановки непосредственно-говорить или режим определения остановки оперировать-чтобы-говорить; если в настоящий момент активен режим автоматического определения остановки непосредственно-говорить, продолжение захвата голосовой информации, выражаемой пользователем; и если в настоящий момент активен режим определения остановки оперировать-чтобы-говорить, остановку захвата голосовой информации, выражаемой пользователем, как показано на Фиг. 5.

[0113] В некоторых вариантах осуществления, в соответствии с разными операциями запуска, исполняемыми пользователем, активации режима определения остановки оперировать-чтобы-говорить, операция окончания режима определения остановки оперировать-чтобы-говорить реализуется разнообразными путями. Например, если операцией является операция нажатия кнопки нажать-чтобы-говорить, как показано на Фиг. 13, режимом голосового ввода оперировать-чтобы-говорить является нажатие кнопки нажать-чтобы-говорить для голосового ввода. Соответственно, операцией окончания режима определения остановки оперировать-чтобы-говорить является отпускание кнопки нажать-чтобы-говорить, как показано на Фиг. 14. В качестве другого примера, если операцией запуска активации режима определения остановки оперировать-чтобы-говорить является операция щелчка по кнопке микрофона, как показано на Фиг. 16, режимом голосового ввода оперировать-чтобы-говорить является щелчок по кнопке микрофона для голосового ввода. Соответственно, операцией окончания режима определения остановки оперировать-чтобы-говорить является операция щелчка для отмены выбранной кнопки микрофона, как показано на Фиг. 17. В качестве дополнительного примера, если операцией запуска активации режима определения остановки оперировать-чтобы-говорить является сдвиг из начальной позиции в конечную позицию, например, сдвиг слева направо, режимом голосового ввода оперировать-чтобы-говорить является выполнение голосового ввода после сдвига слева направо. Соответственно, операцией окончания режима определения остановки оперировать-чтобы-говорить является сдвиг из конечной позиции в начальную позицию, например, сдвиг справа налево.

[0114] Операция запуска активации режима определения остановки оперировать-чтобы-говорить посредством сдвига из начальной позиции в конечную позицию имеет несколько режимов реализации. Например, операцией запуска является действие жеста, например, палец пользователя или электромагнитное перо, которым оперирует пользователь, сдвигается из любой позиции в левой стороне экрана в любую позицию в правой стороне экрана, как показано на Фиг. 21, и соответственно, операция окончания режима определения остановки оперировать-чтобы-говорить реализуется, когда палец пользователя или электромагнитное перо сдвигается из любой позиции в правой стороне экрана в любую позицию в левой стороне экрана, как показано на Фиг. 22. В качестве другого примера, экран имеет кнопку микрофона и ползунок для сдвига кнопки микрофона, операцией запуска активации режима определения остановки оперировать-чтобы-говорить является перетаскивание кнопки микрофона из одной позиции в ползунке в другую позицию, как показано на Фиг. 18. Соответственно, операцией окончания режима определения остановки оперировать-чтобы-говорить является перетаскивание кнопки микрофона в начальную позицию, как показано на Фиг. 19.

[0115] В некоторых вариантах осуществления, правило определения остановки у режима определения остановки оперировать-чтобы-говорить состоит в том, что остановка определяется, когда обнаруживается операция окончания режима определения остановки оперировать-чтобы-говорить в противоположность операции активации режима определения остановки оперировать-чтобы-говорить, например, остановка определяется, когда отслеживаются операции, такие как палец или электромагнитное перо, отпускает кнопку нажать-чтобы-говорить, осуществляется щелчок отменяющий выбор кнопки микрофона, кнопка микрофона сдвигается в начальную точку, и подобное, безотносительно того, вводит ли пользователь голосовое описание. Используя операцию нажатия кнопки нажать-чтобы-говорить, чтобы ввести голос, и отпускания кнопки нажать-чтобы-говорить, чтобы окончить голосовой ввод, в данном режиме определения остановки оперировать-чтобы-говорить, при условии что пользователь нажимает кнопку разговора, голосовой режим находится в состоянии захвата голосовой информации, описываемой пользователем всякий раз, безотносительно того, вводит ли пользователь голос.

[0116] Правило определения остановки у режима автоматического определения остановки непосредственно-говорить, состоит в том, что остановка определяется, если голосовая информация, описываемая пользователем, не обнаруживается в течение некоторой продолжительности времени, безотносительно того, выполняет ли пользователь операцию.

[0117] В способе двухрежимного голосового управления, описанном выше, когда обнаруживается пользователь, исполняющий операцию запуска активации режима определения остановки оперировать-чтобы-говорить, голосовой режим переходит в режим автоматического определения остановки непосредственно-говорить, и когда продолжительность времени исполнения операции запуска достигает предварительно установленной пороговой величины, голосовой режим переключается с режима автоматического определения остановки непосредственно-говорить на режим определения остановки оперировать-чтобы-говорить, так что гарантируется целостность захваченной голосовой информации и эффективно избегают последствий ложных операций.

[0118] В некоторых вариантах осуществления в отношении способов входа в интерфейс голосового ввода, инициирования режима определения остановки оперировать-чтобы-говорить, исполнения операции запуска, установки и переключения голосового режима и подобного, можно обратиться к описаниям в первом варианте осуществления, которые здесь не повторяются.

[0119] Фиг. 7 показывает структурную схему структуры устройства 70 двухрежимного голосового управления, предоставленного некоторыми вариантами осуществления настоящего раскрытия. Как показано на Фиг. 7, устройство 70 может быть реализовано в качестве браузера в терминале пользователя или модуле голосовой функции, таком как аудио модуль в прикладном программном обеспечении. Устройство 70 двухрежимного голосового управления поддерживает режим автоматического определения остановки непосредственно-говорить и режим определения остановки оперировать-чтобы-говорить во время голосового ввода, и устройство включает в себя:

[0120] модуль 700 отслеживания операции активации, выполненный с возможностью определения, исполнил ли пользователь операцию активации режима определения остановки оперировать-чтобы-говорить в интерфейсе голосового ввода; и

[0121] модуль 701 определения состояния, выполненный с возможностью, когда модуль 700 отслеживания операции активации определяет, что пользователь исполнил операцию активации режима определения остановки оперировать-чтобы-говорить, определения, находится ли микрофон в состоянии занятости, и если так, переключения голосового режима с режима автоматического определения остановки непосредственно-говорить на режим определения остановки оперировать-чтобы-говорить. И перед тем как пользователь исполняет операцию активации режима определения остановки оперировать-чтобы-говорить, если микрофон находится в состоянии занятости, голосовым режимом является режим автоматического определения остановки непосредственно-говорить.

[0122] В некоторых вариантах осуществления, как показано на Фиг. 8, модуль 700 отслеживания операции активации может включать в себя:

[0123] первый подмодуль 801 отслеживания операции запуска, выполненный с возможностью отслеживания, исполнил ли пользователь операцию запуска активации режима определения остановки оперировать-чтобы-говорить в интерфейсе голосового ввода; и

[0124] подмодуль 802 определения операции активации, выполненный с возможностью, когда первый подмодуль 801 отслеживания операции запуска обнаруживает операцию запуска, отслеживания продолжительности времени, в течение которого пользователь исполняет операцию запуска, и когда продолжительность времени достигает предварительно установленной пороговой величины, определения того, что в интерфейсе голосового ввода обнаруживается операция активации режима определения остановки оперировать-чтобы-говорить.

[0125] В некоторых вариантах осуществления, как показано на Фиг. 9, модуль 700 отслеживания операции активации может включать в себя:

[0126] второй подмодуль 803 отслеживания операции запуска, выполненный с возможностью, отслеживания, исполнил ли пользователь операцию запуска активации режима определения остановки оперировать-чтобы-говорить в интерфейсе голосового ввода; и

[0127] подмодуль 804 определения операции запуска и установки режима, выполненный с возможностью, когда второй подмодуль 803 отслеживания операции запуска обнаруживает операцию запуска, определения, находится ли микрофон в состоянии незанятости, и если так, установки режима автоматического определения остановки непосредственно-говорить в качестве голосового режима, отслеживания продолжительности времени, в течение которого пользователь исполняет операцию запуска, и когда продолжительность времени достигает предварительно установленной пороговой величины, определения того, что в интерфейсе голосового ввода обнаруживается операция активации режима определения остановки оперировать-чтобы-говорить.

[0128] Кроме того, как показано на Фиг. 10, устройство 70 двухрежимного голосового управления дополнительно включает в себя:

[0129] первый модуль 702 захвата информации, выполненный с возможностью захвата голосовой информации, выражаемой пользователем в интерфейсе голосового ввода;

[0130] первый модуль 703 отслеживания операции окончания, выполненный с возможностью отслеживания операции окончания режима определения остановки оперировать-чтобы-говорить посредством пользователя в интерфейсе голосового ввода; и

[0131] первый модуль 704 определения режима, выполненный с возможностью, когда первый модуль 703 отслеживания операции окончания определяет, что пользователь исполнил операцию окончания режима определения остановки оперировать-чтобы-говорить, определения, является ли в настоящий момент активным режим автоматического определения остановки непосредственно-говорить или режим определения остановки оперировать-чтобы-говорить. Если в настоящий момент активен режим автоматического определения остановки непосредственно-говорить, первый модуль 702 захвата информации продолжает захватывать голосовую информацию, выражаемую пользователем; и если в настоящий момент активен режим определения остановки оперировать-чтобы-говорить, первый модуль 702 захвата информации останавливает захват голосовой информации, выражаемой пользователем.

[0132] Принцип реализации и технические последствия устройства 70 двухрежимного голосового управления, предоставленного вариантами осуществления настоящего раскрытия, являются сходными с описанными выше вариантами осуществления.

[0133] Фиг. 11 показывает структурную схему структуры устройства 90 двухрежимного голосового управления, предоставленного некоторыми вариантами осуществления настоящего раскрытия. Как показано на Фиг. 11, устройство 90 может быть реализовано в качестве браузера в терминале пользователя или модуля голосовой функции, такого как аудио модуль в прикладном программном обеспечении. Устройство 90 двухрежимного голосового управления поддерживает режим автоматического определения остановки непосредственно-говорить и режим определения остановки оперировать-чтобы-говорить во время голосового ввода, и устройство в данном варианте осуществления включает в себя:

[0134] модуль 900 отслеживания операции запуска, выполненный с возможностью, отслеживания, исполняет ли пользователь операцию запуска активации режима определения остановки оперировать-чтобы-говорить в интерфейсе голосового ввода; и

[0135] модуль 901 переключения и установки режима, выполненный с возможностью, когда модуль 900 отслеживания операции запуска обнаруживает операцию запуска, определения, находится ли микрофон в состоянии незанятости, и если так, то установки режима автоматического определения остановки непосредственно-говорить в качестве голосового режима, позволяя модулю 900 отслеживания операции запуска отслеживать продолжительность времени, в течение которого пользователь исполняет операцию запуска, и когда продолжительность времени достигает предварительно установленной пороговой величины, определения того, что в интерфейсе голосового ввода обнаруживается операция активации режима определения остановки оперировать-чтобы-говорить, и переключения голосового режима с режима автоматического определения остановки непосредственно-говорить на режим определения остановки оперировать-чтобы-говорить.

[0136] Кроме того, как показано на Фиг. 12, устройство 90 двухрежимного голосового управления дополнительно включает в себя:

[0137] второй модуль 902 захвата информации, выполненный с возможностью захвата голосовой информации, выражаемой пользователем в интерфейсе голосового ввода;

[0138] второй модуль 903 отслеживания операции окончания, выполненный с возможностью отслеживания операции окончания режима определения остановки оперировать-чтобы-говорить посредством пользователя в интерфейсе голосового ввода; и

[0139] второй модуль 904 определения режима, выполненный с возможностью, когда второй модуль 903 отслеживания операции окончания обнаруживает, что пользователь исполнил операцию окончания режима определения остановки оперировать-чтобы-говорить, определения, является ли в настоящий момент активным режим автоматического определения остановки непосредственно-говорить или режим определения остановки оперировать-чтобы-говорить; если в настоящий момент активен режим автоматического определения остановки непосредственно-говорить, второй модуль 902 захвата информации продолжает захватывать голосовую информацию, выражаемую пользователем; и если в настоящий момент активен режим определения остановки оперировать-чтобы-говорить, второй модуль 902 захвата информации останавливает захват голосовой информации, выражаемой пользователем.

[0140] Принципы реализации и технические последствия устройства 90 двухрежимного голосового управления, предоставленного вариантами осуществления настоящего раскрытия, сходны с описанными выше вариантами осуществления.

[0141] В дополнение, блок-схемы и структурные схемы на сопроводительных чертежах показывают архитектуры системы, функции и операции, которые могут быть достигнуты в соответствии с устройствами, способами и компьютерными программными продуктами нескольких вариантов осуществления настоящего раскрытия. В этой связи, каждый блок на блок-схемах или структурных схемах может представлять собой часть модуля, сегмент программы или код, и часть модуля, сегмент программы или код включает в себя одну или более исполняемые инструкции для реализации логических функций. В некоторых альтернативных реализациях, функции, поименованные в блоках, также могут происходить в последовательности отличной от той, что на чертежах. Например, два продолжающихся блока могут быть исполнены по существу параллельно или иногда исполнены в противоположной последовательности, что зависит от включенных функций. В некоторых вариантах осуществления, каждый блок в структурных схемах и/или блок-схемах и сочетание блоков в структурных схемах и/или блок-схемах может быть реализован посредством предназначенной основанной на аппаратном обеспечении системы для исполнения функций или действий, или реализован посредством сочетания предназначенного аппаратного обеспечения и компьютерных инструкций.

[0142] Компьютерные программные продукты, предоставляемые некоторыми вариантами осуществления настоящего раскрытия, включают в себя машиночитаемые запоминающие носители информации, хранящие программные коды, при этом инструкции, включенные в программные коды, могут быть использованы для исполнения способов в вышеприведенных вариантах осуществления способа, и можно обратиться к вариантами осуществления способа в отношении реализаций, которые не повторяются в данном документе.

[0143] В некоторых вариантах осуществления, предоставленных в настоящей заявке, должно быть понятно, что раскрываемые устройства и способы могут быть реализованы в других режимах. Описанные выше варианты осуществления устройства являются лишь примерными, например, деление на модули является лишь логическим функциональным делением, на практике могут быть применены другие режимы деления, в качестве другого примера, множество модулей или компонентов может быть объединено или интегрировано в другое устройство, или некоторые характеристики могут быть опущены или не исполняться. С другой точки зрения, отображенные или рассмотренные взаимные связывания или непосредственные связывания или соединение связи могут быть опосредованным связыванием или соединением связи устройств или модулей через некоторые интерфейсы связи, и также могут быть в электрической, механической или других формах.

[0144] Модули, иллюстрируемые в качестве отдельных компонентов, могут быть или могут не быть физически отдельными, и компоненты, отображенные в качестве модулей, могут быть или могут не быть физическими модулями, т.е. компоненты могут быть расположены в одном месте или также могут быть распределены по множеству сетевых модулей. Цели решений некоторых вариантов осуществления могут быть осуществлены посредством выбора части из всех из модулей в соответствии с фактическими потребностями.

[0145] В дополнение, в разнообразных вариантах осуществления настоящего раскрытия, функциональные модули могут быть интегрированы в одном модуле обработки, или функциональные модули могут существовать отдельно и физически, или два или более модуля могут быть интегрированы в одном модуле.

[0146] Когда функции достигаются в форме функциональных модулей программного обеспечения и продаются или используются в качестве независимых продуктов, функции могут быть сохранены на машиночитаемом запоминающем носителе информации. На основании такого понимания, технические решения настоящего раскрытия, по существу, или часть настоящего раскрытия, или часть технических решения может быть воплощена в форме продукта программного обеспечения, и компьютерный продукт программного обеспечения хранится на запоминающем носителе информации, который включает в себя множество инструкций, позволяющих компьютерному оборудованию (которое может быть персональным компьютером, сервером, или сетевым оборудованием и подобным) исполнять все или часть из этапов в способах некоторых вариантов осуществления настоящего раскрытия. Вышеупомянутый запоминающий носитель информации включает в себя: разнообразные носители информации, выполненные с возможностью хранения программных кодов, такие как U диск, мобильный жесткий диск, постоянная память (RAM), память с произвольным доступом (RAM), диск или оптический диск.

[0147] Следует отметить, что в описании, такие понятия отношения, как первый и второй используются лишь для того, чтобы отличать один объект или операцию от другого объекта и операции, а не для того, чтобы требовать или намекать на конкретное отношение или последовательность среди этих объектов или операций. Более того, понятия «содержать», «включать в себя» или любые другие варианты предназначены для того, чтобы охватывать неисключительное включение, так что процессы, способы, изделия или устройства, включающие в себя ряд факторов, включают в себя не только эти факторы, но также включают в себя другие факторы перечисленные неявным образом, или дополнительно включают в себя неотъемлемые факторы процессов, способов, изделий или терминальных устройств. При отсутствии дополнительных ограничений, факторы, определенные утверждением «включает в себя одно…» не исключает других идентичных факторов в процессах, способах, изделиях или терминальных устройствах, включающих в себя упомянутые факторы.

[0148] Выше описаны лишь варианты осуществления настоящего раскрытия, и настоящее раскрытие этим не ограничивается. Разнообразные модификации и изменения могут быть выполнены в отношении настоящего раскрытия специалистами в соответствующей области техники. Любая модификация, эквивалентная замена, улучшение и подобное, выполненное в рамках сущности и принципа настоящего раскрытия, должна лежать в рамках объема правовой защиты настоящего раскрытия. Следует отметить, что сходные знаки и буквы выражают сходные элементы на нижеследующих сопроводительных чертежах, таким образом, раз некоторый элемент определен на одном чертеже, в отношении него не требуется дальнейшее определение или толкование на последующих чертежах.

1. Способ двухрежимного голосового управления, содержащий этапы, на которых:

определяют, исполнил ли пользователь операцию активации режима определения остановки оперировать-чтобы-говорить в интерфейсе голосового ввода, причем прекращение голосового ввода во время режима определения остановки оперировать-чтобы-говорить определяется на основе операции окончания режима определения остановки оперировать-чтобы-говорить;

в ответ на определение того, что пользователь исполнил операцию активации режима определения остановки оперировать-чтобы-говорить, определяют, находится ли микрофон в состоянии занятости; и

в ответ на определение того, что микрофон находится в состоянии занятости, переключают голосовой режим с режима автоматического определения остановки непосредственно-говорить на режим определения остановки оперировать-чтобы-говорить, при этом

перед тем как пользователь исполняет операцию активации режима определения остановки оперировать-чтобы-говорить, голосовой режим находится в режиме автоматического определения остановки непосредственно-говорить, если микрофон находится в состоянии занятости.

2. Способ по п. 1, в котором этап, на котором определяют, исполнил ли пользователь операцию активации режима определения остановки оперировать-чтобы-говорить в интерфейсе голосового ввода, содержит этапы, на которых:

определяют, исполнил ли пользователь операцию запуска активации режима определения остановки оперировать-чтобы-говорить в интерфейсе голосового ввода;

в ответ на обнаружение операции запуска отслеживают продолжительность времени, в течение которого пользователь исполняет операцию запуска; и

в ответ на определение того, что продолжительность времени достигает предварительно установленной пороговой величины, определяют, что в интерфейсе голосового ввода обнаруживается операция активации режима определения остановки оперировать-чтобы-говорить.

3. Способ по п. 1, в котором этап, на котором определяют, исполнил ли пользователь операцию активации режима определения остановки оперировать-чтобы-говорить в интерфейсе голосового ввода, содержит этапы, на которых:

определяют, исполнил ли пользователь операцию запуска активации режима определения остановки оперировать-чтобы-говорить в интерфейсе голосового ввода;

в ответ на определение операции запуска определяют, находится ли микрофон в состоянии незанятости; и

в ответ на определение того, что микрофон находится в состоянии незанятости, устанавливают режим автоматического определения остановки непосредственно-говорить в качестве голосового режима, отслеживают продолжительность времени, в течение которого пользователь исполняет операцию запуска, и в ответ на определение того, что продолжительность времени достигает предварительно установленной пороговой величины, определяют, что в интерфейсе голосового ввода обнаруживается операция активации режима определения остановки оперировать-чтобы-говорить.

4. Способ по п. 3, дополнительно содержащий этапы, на которых:

захватывают голосовую информацию, выражаемую пользователем в интерфейсе голосового ввода;

отслеживают операцию окончания режима определения остановки оперировать-чтобы-говорить посредством пользователя в интерфейсе голосового ввода;

в ответ на определение того, что пользователь исполнил операцию окончания режима определения остановки оперировать-чтобы-говорить, определяют, является ли в настоящий момент активным режим автоматического определения остановки непосредственно-говорить или режим определения остановки оперировать-чтобы-говорить;

в ответ на определение того, что в настоящий момент активен режим автоматического определения остановки непосредственно-говорить, продолжают захватывать голосовую информацию, выражаемую пользователем; и

в ответ на определение того, что в настоящий момент активен режим определения остановки оперировать-чтобы-говорить, останавливают захват голосовой информации, выражаемой пользователем.

5. Способ двухрежимного голосового управления, содержащий этапы, на которых:

определяют, исполнил ли пользователь операцию запуска операции активации режима определения остановки оперировать-чтобы-говорить в интерфейсе голосового ввода, причем прекращение голосового ввода во время режима определения остановки оперировать-чтобы-говорить определяется на основе операции окончания режима определения остановки оперировать-чтобы-говорить;

в ответ на обнаружение операции запуска определяют, находится ли микрофон в состоянии незанятости;

в ответ на определение того, что микрофон находится в состоянии незанятости, устанавливают режим автоматического определения остановки непосредственно-говорить в качестве голосового режима и отслеживают продолжительность времени, в течение которого пользователь исполняет операцию запуска; и

в ответ на определение того, что продолжительность времени достигает предварительно установленной пороговой величины, определяют, что в интерфейсе голосового ввода обнаруживается операция активации режима определения остановки оперировать-чтобы-говорить, и переключают голосовой режим с режима автоматического определения остановки непосредственно-говорить на режим определения остановки оперировать-чтобы-говорить.

6. Способ по п. 5, дополнительно содержащий этапы, на которых:

захватывают голосовую информацию, выражаемую пользователем в интерфейсе голосового ввода;

отслеживают операцию окончания режима определения остановки оперировать-чтобы-говорить посредством пользователя в интерфейсе голосового ввода;

в ответ на определение того, что пользователь исполнил операцию окончания режима определения остановки оперировать-чтобы-говорить, определяют, является ли в настоящий момент активным режим автоматического определения остановки непосредственно-говорить или режим определения остановки оперировать-чтобы-говорить;

в ответ на определение того, что в настоящий момент активен режим автоматического определения остановки непосредственно-говорить, продолжают захват голосовой информации, выражаемой пользователем; и

в ответ на определение того, что в настоящий момент активен режим определения остановки оперировать-чтобы-говорить, останавливают захват голосовой информации, выражаемой пользователем.

7. Устройство двухрежимного голосового управления, оперируемое в терминале пользователя, при этом устройство содержит:

процессор; и

не временную машиночитаемую память, хранящую инструкции, которые, когда исполняются посредством процессора, предписывают процессору:

отслеживать, исполнил ли пользователь операцию активации режима определения остановки оперировать-чтобы-говорить в интерфейсе голосового ввода, причем прекращение голосового ввода во время режима определения остановки оперировать-чтобы-говорить определяется на основе операции окончания режима определения остановки оперировать-чтобы-говорить; и

в ответ на определение того, что пользователь исполнил операцию активации режима определения остановки оперировать-чтобы-говорить, определять, находится ли микрофон в состоянии занятости, и в ответ на определение того, что микрофон находится в состоянии занятости, переключать голосовой режим с режима автоматического определения остановки непосредственно-говорить на режим определения остановки оперировать-чтобы-говорить, при этом перед тем как пользователь исполняет операцию активации режима определения остановки оперировать-чтобы-говорить, голосовой режим находится в режиме автоматического определения остановки непосредственно-говорить, если микрофон находится в состоянии занятости.

8. Устройство по п. 7, в котором, чтобы отслеживать, исполнил ли пользователь операцию активации режима определения остановки оперировать-чтобы-говорить в интерфейсе голосового ввода, инструкции, когда исполняются посредством процессора, выполнены с возможностью предписания процессору:

определять, исполнил ли пользователь операцию запуска активации режима определения остановки оперировать-чтобы-говорить в интерфейсе голосового ввода; и

в ответ на определение операции запуска отслеживать продолжительность времени, в течение которого пользователь исполняет операцию запуска, и когда продолжительность времени достигает предварительно установленной пороговой величины, определять, что в интерфейсе голосового ввода обнаруживается операция активации режима определения остановки оперировать-чтобы-говорить.

9. Устройство по п. 7, в котором, чтобы отслеживать, исполнил ли пользователь операцию активации режима определения остановки оперировать-чтобы-говорить в интерфейсе голосового ввода, инструкции, когда исполняются посредством процессора, выполнены с возможностью предписания процессору:

определять, исполнил ли пользователь операцию запуска активации режима определения остановки оперировать-чтобы-говорить в интерфейсе голосового ввода;

в ответ на определение операции запуска определять, находится ли микрофон в состоянии незанятости; и

в ответ на определение того, что микрофон находится в состоянии незанятости, устанавливать режим автоматического определения остановки непосредственно-говорить в качестве голосового режима, отслеживать продолжительность времени, в течение которого пользователь исполняет операцию запуска, и когда продолжительность времени достигает предварительно установленной пороговой величины, определять, что в интерфейсе голосового ввода обнаруживается операция активации режима определения остановки оперировать-чтобы-говорить.

10. Устройство по п. 9, в котором инструкции, когда исполняются посредством процессора, дополнительно выполнены с возможностью предписания процессору:

захватывать голосовую информацию, выражаемую пользователем в интерфейсе голосового ввода;

отслеживать операцию окончания режима определения остановки оперировать-чтобы-говорить посредством пользователя в интерфейсе голосового ввода;

в ответ на определение того, что пользователь исполнил операцию окончания режима определения остановки оперировать-чтобы-говорить, определять, является ли в настоящий момент активным режим автоматического определения остановки непосредственно-говорить или режим определения остановки оперировать-чтобы-говорить;

в ответ на определение того, что в настоящий момент активен режим автоматического определения остановки непосредственно-говорить, продолжать захватывать голосовую информацию, выражаемую пользователем; и

в ответ на определение того, что в настоящий момент активен режим определения остановки оперировать-чтобы-говорить, останавливать захват голосовой информации, выражаемой пользователем.

11. Устройство двухрежимного голосового управления, оперируемое в терминале пользователя, при этом устройство содержит:

процессор; и

не временную машиночитаемую память, хранящую инструкции, которые, когда исполняются посредством процессора, предписывают процессору:

определять, исполнил ли пользователь операцию запуска активации режима определения остановки оперировать-чтобы-говорить в интерфейсе голосового ввода, причем прекращение голосового ввода во время режима определения остановки оперировать-чтобы-говорить определяется на основе операции окончания режима определения остановки оперировать-чтобы-говорить; и

в ответ на определение операции запуска определять, находится ли микрофон в состоянии незанятости, в ответ на определение того, что микрофон находится в состоянии не занятости, устанавливать режим автоматического определения остановки непосредственно-говорить в качестве голосового режима, отслеживать продолжительность времени, в течение которого пользователь исполняет операцию запуска, и когда продолжительность времени достигает предварительно установленной пороговой величины, определять, что в интерфейсе голосового ввода обнаруживается операция активации режима определения остановки оперировать-чтобы-говорить, и переключать голосовой режим с режима автоматического определения остановки непосредственно-говорить на режим определения остановки оперировать-чтобы-говорить.

12. Устройство по п. 11, в котором инструкции, когда исполняются посредством процессора, дополнительно выполнены с возможностью предписания процессору:

захватывать голосовую информацию, выражаемую пользователем в интерфейсе голосового ввода;

отслеживать операцию окончания режима определения остановки оперировать-чтобы-говорить посредством пользователя в интерфейсе голосового ввода;

в ответ на определение того, что пользователь исполнил операцию окончания режима определения остановки оперировать-чтобы-говорить, определять, является ли в настоящий момент активным режим автоматического определения остановки непосредственно-говорить или режим определения остановки оперировать-чтобы-говорить;

в ответ на определение того, что в настоящий момент активен режим автоматического определения остановки непосредственно-говорить, продолжать захват голосовой информации, выражаемой пользователем; и

в ответ на определение того, что в настоящий момент активен режим определения остановки оперировать-чтобы-говорить, останавливать захват голосовой информации, выражаемой пользователем.

13. Терминал пользователя, содержащий:

микрофон, экран касания, не временную машиночитаемую память и процессор, при этом:

память хранит инструкции, которые, когда исполняются посредством процессора, предписывают терминалу пользователя:

отслеживать, исполнил ли пользователь операцию активации режима определения остановки оперировать-чтобы-говорить в интерфейсе голосового ввода, причем прекращение голосового ввода во время режима определения остановки оперировать-чтобы-говорить определяется на основе операции окончания режима определения остановки оперировать-чтобы-говорить; и

в ответ на определение того, что пользователь исполнил операцию активации режима определения остановки оперировать-чтобы-говорить, определять, находится ли микрофон в состоянии занятости, и в ответ на определение того, что микрофон находится в состоянии занятости, переключать голосовой режим с режима автоматического определения остановки непосредственно-говорить на режим определения остановки оперировать-чтобы-говорить, при этом перед тем как пользователь исполняет операцию активации режима определения остановки оперировать-чтобы-говорить, голосовой режим находится в режиме автоматического определения остановки непосредственно-говорить, если микрофон находится в состоянии занятости.

14. Терминал пользователя по п. 13, в котором, чтобы отслеживать, исполнил ли пользователь операцию активации режима определения остановки оперировать-чтобы-говорить в интерфейсе голосового ввода, память хранит инструкции, которые, когда исполняются посредством процессора, предписывают терминалу пользователя:

определять, исполнил ли пользователь операцию запуска активации режима определения остановки оперировать-чтобы-говорить в интерфейсе голосового ввода; и

в ответ на определение операции запуска отслеживать продолжительность времени, в течение которого пользователь исполняет операцию запуска, и когда продолжительность времени достигает предварительно установленной пороговой величины, определять, что в интерфейсе голосового ввода обнаруживается операция активации режима определения остановки оперировать-чтобы-говорить.

15. Терминал пользователя по п. 13, в котором, чтобы отслеживать, исполнил ли пользователь операцию активации режима определения остановки оперировать-чтобы-говорить в интерфейсе голосового ввода, память хранит инструкции, которые, когда исполняются посредством процессора, предписывают терминалу пользователя:

определять, исполнил ли пользователь операцию запуска активации режима определения остановки оперировать-чтобы-говорить в интерфейсе голосового ввода;

в ответ на определение операции запуска определять, находится ли микрофон в состоянии незанятости; и

в ответ на определение того, что микрофон находится в состоянии незанятости, устанавливать режим автоматического определения остановки непосредственно-говорить в качестве голосового режима, отслеживать продолжительность времени, в течение которого пользователь исполняет операцию запуска, и когда продолжительность времени достигает предварительно установленной пороговой величины, определять, что в интерфейсе голосового ввода обнаруживается операция активации режима определения остановки оперировать-чтобы-говорить.

16. Терминал пользователя по п. 13, в котором память хранит инструкции, которые, когда исполняются посредством процессора, предписывают терминалу пользователя:

захватывать голосовую информацию, выражаемую пользователем в интерфейсе голосового ввода;

отслеживать операцию окончания режима определения остановки оперировать-чтобы-говорить посредством пользователя в интерфейсе голосового ввода;

в ответ на определение того, что пользователь исполнил операцию окончания режима определения остановки оперировать-чтобы-говорить, определять, является ли в настоящий момент активным режим автоматического определения остановки непосредственно-говорить или режим определения остановки оперировать-чтобы-говорить;

в ответ на определение того, что в настоящий момент активен режим автоматического определения остановки непосредственно-говорить, продолжать захватывать голосовую информацию, выражаемую пользователем; и

в ответ на определение того, что в настоящий момент активен режим определения остановки оперировать-чтобы-говорить, останавливать захват голосовой информации, выражаемой пользователем.

17. Терминал пользователя, содержащий:

микрофон, экран касания, не временную машиночитаемую память и процессор, при этом:

память хранит инструкции, которые, когда исполняются посредством процессора, предписывают терминалу пользователя:

определять, исполнил ли пользователь операцию запуска активации режима определения остановки оперировать-чтобы-говорить в интерфейсе голосового ввода, причем прекращение голосового ввода во время режима определения остановки оперировать-чтобы-говорить определяется на основе операции окончания режима определения остановки оперировать-чтобы-говорить; и

в ответ на определение операции запуска определять, находится ли микрофон в состоянии незанятости, в ответ на определение того, что микрофон находится в состоянии незанятости, устанавливать режим автоматического определения остановки непосредственно-говорить в качестве голосового режима, отслеживать продолжительность времени, в течение которого пользователь исполняет операцию запуска, и когда продолжительность времени достигает предварительно установленной пороговой величины, определять, что в интерфейсе голосового ввода обнаруживается операция активации режима определения остановки оперировать-чтобы-говорить, и переключать голосовой режим с режима автоматического определения остановки непосредственно-говорить на режим определения остановки оперировать-чтобы-говорить.

18. Терминал пользователя по п. 17, в котором память хранит инструкции, которые, когда исполняются посредством процессора, дополнительно предписывают терминалу пользователя:

захватывать голосовую информацию, выражаемую пользователем в интерфейсе голосового ввода;

отслеживать операцию окончания режима определения остановки оперировать-чтобы-говорить посредством пользователя в интерфейсе голосового ввода; и

в ответ на определение того, что пользователь исполнил операцию окончания режима определения остановки оперировать-чтобы-говорить, определять, является ли в настоящий момент активным режим автоматического определения остановки непосредственно-говорить или режим определения остановки оперировать-чтобы-говорить; в ответ на определение того, что в настоящий момент активен режим автоматического определения остановки непосредственно-говорить, продолжать захват голосовой информации, выражаемой пользователем; и в ответ на определение того, что в настоящий момент активен режим определения остановки оперировать-чтобы-говорить, останавливать захват голосовой информации, выражаемой пользователем.



 

Похожие патенты:

Изобретение относится к области распознавания речи. Технический результат - обеспечение надежной оценки вариативности парольных фраз.

Изобретение относится к области распознавания речи. Техническим результатом является сокращение объема элементов памяти, необходимого для хранения предустановленного словаря, и снижение сложности вычислительного процесса распознавания.

Изобретение относится к устройству отображения, интерактивному серверу и способу обеспечения ответной информации. Техническим результатом является повышение точности ответной информации относительно различной высказанной речи пользователя.

Изобретение относится к управлению внешним вводом, распознаванию голоса пользователя в интерактивной системе распознавания голоса. Техническим результатом является обеспечение активации разъема внешнего ввода посредством использования функции распознавания голоса.

Изобретение относится к медицине, а именно к биометрической идентификации и диагностике органов речевого аппарата. Способ адаптивной обработки речевых сигналов в условиях нестабильной работы речевого аппарата состоит в том, что осуществляют регистрацию речевых сигналов, сегментацию речевых сигналов, вычисляют значения энергии информативной области, сравнивают вычисленное значение с пороговым и делают диагностическое заключение о стадии нестабильной работы органов речевого аппарата.

Изобретение относится к области распознавания речи. Техническими результатами являются уменьшение задержки распознавания речи, увеличение точности распознавания речи, а также увеличение общего грамматического охвата в распознавании речи.

Изобретение относится к способу использования распознавателей для обработки произнесения на основании документа на языке разметки. Технический результат заключается в ускорении процесса распознавания.

Изобретение относится к вычислительной технике. Технический результат заключается в распознавании речи злектронно-вычислительным устройством, используя чтение по губам.

Изобретение относится к средствам распознавания эмоций человека по голосу. Технический результат заключается в повышении точности определения эмоционального состояния русскоязычного абонента.

Изобретение относится к способам кодирования и декодирования аудиосигнала без потерь. Техническим результатом является повышение эффективности кодирования и снижение требуемого для кодирования объема памяти.

Изобретение относится к способам и средствам мониторинга и оценки производительности человека. Средство мониторинга включает в себя: сбор данных о состоянии водителя от датчиков электроэнцефалограммы и видеокамеры, сбор данных о характере движения транспортного средства, голосовой опрос водителя, интеллектуальное отслеживание пороговых значений и динамики данных, активацию устройств, активацию бортовых приборов транспортного средства.

Изобретение относится к мобильному терминалу с поддержкой функции голосового общения и способу управления голосовым общением. Технический результат заключается в расширении арсенала средств.

Изобретение относится к способу диалога между машиной и человеческим существом. Технический результат заключается в обеспечении более естественного диалога с машиной, адаптированного к собеседнику (не стереотипного).

Группа изобретений относится к системе, управляемой вычислительными устройствами. Способ для управления интеллектуальным устройством заключается в следующем.

Изобретение относится к вводу данных в электронное устройство и обработке голосового запроса, введенного в электронное устройство. Технический результат - обеспечение обработки голосовых запросов пользователя для заполнения частей интерфейса в пользовательских приложениях с помощью понимания естественного языка (NLU) текста, который был распознан в голосовом запросе пользователя, без необходимости вручную выбирать, какую конкретно часть интерфейса пользователь хочет заполнить с помощью голоса.

Изобретение относится к средствам управления устройством отображения. Технический результат заключается в минимизации временного интервала для распознавания команды пользователя и выполнении операции.

При обнаружении опасного состояния у водителя в транспортном средстве с помощью интерфейса распознавания голоса (18) принимают от водителя первый звуковой сигнал, представляющий собой одно слово, когда водитель не находится в опасном состоянии.

Изобретение относится к области человеко-машинного взаимодействия, а именно к голосовой связи на естественном языке между человеком и устройством. Технический результат состоит в обеспечении обработки пользовательских голосовых вводов на морфологически богатых языках без вычислительно затратных операций, связанных с большим количеством применимых правил.

Изобретение относится к информационным технологиям, в частности к способу обучения информационной диалоговой системы пользователем на основе естественного языка.

Изобретение относится к информационным технологиям, в частности к способу коммуникации пользователя с информационной диалоговой системой, и может быть использовано для организации взаимодействия пользователя с информационной диалоговой системой на основе естественного языка.

Изобретение относится к средствам поддержки паноптически визуализируемого документа. Технический результат заключается в уменьшении времени распечатки документов.
Наверх