Цифровой сотовый телефон с функцией опознавания речи и способ управления им

 

Изобретение относится к цифровому сотовому телефону и, в частности, к цифровому сотовому телефону, имеющему возможность опознавания речи, и к способу управления этим телефоном. Цифровой сотовый телефон содержит вокодер, который сжимает речевой сигнал, поступающий из микрофона, в выходные пакетные данные и соответствующие им характерные данные. Устройство опознавания речи выделяет характерные данные из пакетных данных, выводимых из вокодера, и сравнивает эти характерные данные с характерными данными, зарегистрированными в энергонезависимой памяти, для обнаружения зарегистрированных характерных данных, аналогичных входным характерным данным, и значения разницы между ними, чтобы определить, произошло ли успешное опознавание входного речевого сигнала, в зависимости от этого значения разницы. Технический результат, достигаемый при реализации изобретения, состоит в том, что сотовый телефон имеет интегральные возможности опознавания речи. 2 с. и 11 з.п.ф-лы, 4 ил.

1. Область техники Настоящее изобретение относится к цифровому сотовому телефону и, в частности, к цифровому сотовому телефону, имеющему возможность опознавания речи, и к способу управления этим телефоном.

2. Описание известного уровня техники В общем, устройство опознавания речи выделяет такие характерные свойства, как частота, из входного речевого сигнала, чтобы опознать входящую речь. Такое устройство опознавания речи требует значительной обрабатывающей мощности, чтобы обрабатывать большой объем речевых сигналов. Требуемый объем обрабатывающей мощности будет излишне перегружать цифровой сотовый телефон обычного типа. Поэтому обычное устройство опознавания речи не соответствует цифровому сотовому телефону обычного типа.

Известный способ опознавания речи, применяемый для решения проблемы излишней перегрузки цифрового сотового телефона, использует автоматический комплект, выполняющий функцию опознавания речи. Автоматический комплект содержит процессор цифрового сигнала (ПЦС) и энергонезависимую память (например, флэш-память или ЭСППЗУ (электрически стираемое программируемое постоянное запоминающее устройство). ПЦС в автоматическом комплекте обрабатывает сжатый речевой сигнал или первоначальный речевой сигнал, чтобы опознать входящую речь, и направляет опознанный речевой сигнал в сотовый телефон. Таким образом автоматический комплект опознает речь для телефонного номера, произнесенного пользователем, и сотовый телефон набирает телефонный номер согласно опознанному речевому сигналу, направленному из автоматического комплекта.

Фиг. 1 изображает блок-схему обычного устройства опознавания речи, которое можно установить в автоматическом комплекте. Согласно этой иллюстрации, аналоговый входной сигнал из микрофона 30 преобразуют в цифровой сигнал ИКМ (импульсно-кодовой модуляции) посредством аналого-цифрового преобразователя 20 и направляют в процессор 10, который выполняет функцию опознавания речи. Процессор 10 может быть реализован в виде кристалла 80186 или кристалла ПЦС.

Это обычное устройство опознавания речи имеет следующие недостатки: 1) значительная нагрузка обработки, из-за которой это устройство становится непригодным для применения в цифровом сотовом телефоне; 2) требования по обработке устройства опознавания речи создают серьезную обработочную нагрузку для сотового телефона, и это может препятствовать работе сотового телефона; 3) для устройства опознавания речи требуется отдельное запоминающее устройство для выполнения функции опознавания речи. Поэтому для автоматического комплекта требуется отдельное энергонезависимое запоминающее устройство, такое как ЭСППЗУ; 4) для устройства опознавания речи требуется отдельный процессор, такой как ПЦС, для реализации функции опознавания речи; и 5) если устройство опознавания речи установлено в автоматическом комплекте, то опознавание речи можно осуществлять только с помощью автоматического комплекта. Поэтому без автоматического комплекта сотовый телефон не может опознавать речь.

Краткое описание сущности изобретения В связи с вышеизложенным технической задачей настоящего изобретения является обеспечение цифрового сотового телефона с функцией опознавания речи, обладающего возможностью опознавания речевого сигнала с помощью имеющейся в нем аппаратуры, и способ управления этим телефоном.

Для реализации указанного объекта данное изобретение обеспечивает сотовый телефон с функцией опознавания речи и имеющий вокодер для сжатия речевого сигнала, поступающего из микрофона, в выходные пакетные данные. В сотовом телефоне энергонезависимое запоминающее устройство запоминает пакетные данные и соответствующие им характерные данные. Блок пользовательского интерфейса служит для выбора режима регистрации речи или режима опознавания речи и имеет соответствующие клавиши. Устройство опознавания речи выделяет характерные данные из пакетных данных, выходящих из вокодера, и сравнивает эти характерные данные с характерными данными, зарегистрированными в энергонезависимой памяти, для обнаружения зарегистрированных характерных данных, аналогичных входным характерным данным, и значения разницы между ними.

Микропроцессор запоминает пакетные данные и характерные данные в энергонезависимой памяти в режиме регистрации речи и принимает некоторый индекс для аналогичных характерных данных и значение разницы из устройства опознавания речи в режиме опознавания речи, чтобы определить, успешно ли произошло опознавание входного речевого сигнала.

Краткое описание чертежей Указанные выше и другие задачи, признаки и преимущества данного изобретения станут более очевидными из следующего ниже подробного описания совместно с прилагаемыми чертежами, на которых: фиг.1 - блок-схема обычного устройства опознавания речи; фиг. 2 - блок-схема цифрового сотового телефона с функцией опознавания речи согласно осуществлению данного изобретения; фиг. 3 - схема распределения памяти первого запоминающего устройства (60), изображенного на фиг.2; и фиг. 4 - схема последовательности операций для регистрирования и опознавания речевого сигнала согласно осуществлению данного изобретения.

Подробное описание предпочтительных воплощений Предпочтительное воплощение настоящего изобретения далее описывается подробно со ссылкой на сопровождающие чертежи. Для всестороннего понимания данного изобретения его описание здесь в качестве иллюстрации ограничивается конкретным осуществлением.

Нужно отметить, что данное изобретение может быть осуществлено любым специалистом данной области техники с помощью этого описания. В следующем ниже описании хорошо известные функции или конструкции, которые могут перегружать изложение данного изобретения ненужными подробностями, подробно не описываются. Например, на фиг.2 изображен цифровой сотовый телефон с функцией опознавания речи в соответствии с осуществлением данного изобретения. Радиочастотная (РЧ) схема и ДТМЧ (двухтональная многочастотная) схема могут быть включены в фиг. 2, но они не показаны, поскольку не относятся к сути данного изобретения.

Обращаясь к фиг.2: аналоговый речевой сигнал, входящий из микрофона 30, преобразуют в цифровой ИКМ-сигнал посредством аналого-цифрового преобразователя 20. Вокодер 45 сжимает ИКМ-сигнал, выходящий из аналого-цифрового преобразователя 20, и выводит пакетные данные РКТ. В сотовом телефоне МДКРК (множественный доступ с кодовым разделением каналов) вокодер 45 можно реализовать кодером "линейного предсказания на основе кода "Квэлкомм 8 кб/с"", таким же кодером 13 кб/с или кодером "усовершенствованного кодирования переменной скорости 8 кб/с". В сотовом телефоне GSM (глобальная система связи с подвижными объектами) вокодер 45 может быть реализован с помощью кодера "упорядоченного импульсного возбуждения с долгосрочным предсказанием".

Пакетные данные РКТ, выводимые из вокодера 45, прилагают к микропроцессору 50, который управляет всеми операциями сотового телефона. Первое запоминающее устройство 60, являющееся энергонезависимым запоминающим устройством (например, флэш-память или ЭСППЗУ), запоминает данные и компьютерные программы, включая программу управления и исходные служебные данные.

Второе запоминающее устройство 65 является запоминающим устройством с произвольной выборкой (ЗУПВ) для временного запоминания данных, включая пакетные данные для речевого сигнала, регистрируемого или опознаваемого, и различные данные, формируемые во время работы сотового телефона. Устройство опознавания речи 85 выделяет характерные данные из входных речевых сигналов и выводит характерные данные, предпочтительно на скорости передачи, составляющей от нескольких десятков до нескольких сотен байтов в секунду. Характерные данные содержат данные частоты и напряженности поля входного речевого сигнала.

Устройство опознавания речи 85 можно реализовать либо в аппаратуре, либо в средствах программного обеспечения. Если устройство опознавания речи 85 реализуют с помощью средств программного обеспечения, то программу для реализации устройства опознавания речи 85 можно запомнить в первом запоминающем устройстве 60. Микропроцессор 50 направляет пакетные данные РКТ, выведенные из вокодера 45, в устройство опознавания речи 85. Устройство опознавания речи формирует и выводит характерные данные в микропроцессор 50. Микропроцессор 50 выделяет эталонные характерные данные, ранее зарегистрированные или запомненные в первом запоминающем устройстве 60, и сравнивает их с характерными данными из устройства опознавания речи 85. На основании этого сравнения микропроцессор определяет и набирает телефонный номер, соответствующий выбранным эталонным характерным данным. Определение по этому сравнению предпочтительно основывается на значении разницы между этими двумя совокупностями характерных данных. Затем микропроцессор 50 запоминает пакетные данные, выводимые из вокодера 50, в специальной области памяти первого запоминающего устройства 60, и считывает их из первого запоминающего устройства 60, уведомляя пользователя о том, что опознавание речи завершено. Для удобства считанные пакетные данные называют данными воспроизведения речи ВР. Вокодер 45 преобразует данные воспроизведения речи ВР в ИКМ-сигнал и прилагает его к цифроаналоговому преобразователю 75, который преобразует входной ИКМ-сигнал в аналоговый сигнал, и выводит преобразованный аналоговый сигнал в громкоговоритель 80. Вместо данных воспроизведения речи ВР речевое сообщение, уведомляющее о завершении опознавания речи, можно также запомнить в первом запоминающем устройстве 60. Соединитель 500 автоматического комплекта соединяет автоматический комплект с сотовым телефоном для пересылки речевого сигнала, вводимого из микрофона автоматического комплекта, в вокодер 45 через аналого-цифровой преобразователь 20. Затем, после соединения с автоматическим комплектом, соединитель 500 автоматического комплекта прерывает тракт сигнала между микрофоном сотового телефона и вокодером 45.

Фиг. 3 изображает схему распределения памяти 60 согласно осуществлению данного изобретения. В соответствии с этим изображением, первое запоминающее устройство 60 разделяют на первую область памяти SA1 для управляющей программы, вторую область памяти SA2 для характерных данных, третью область памяти SA3 для данных воспроизведения речи, четвертую область памяти SA4 для телефонного номера и пятую область памяти для речевого сообщения. Ссылочное обозначение ADD обозначает адресный сигнал, вводимый из микропроцессора 50.

Фиг. 4 представляет схему последовательности операций регистрирования и опознавания речевого сигнала согласно осуществлению данного изобретения. Для того, чтобы набрать телефонный номер голосом, пользователь сотового телефона нажимает клавишу речевого набора на блоке пользовательского интерфейса. При обнаружении клавишных данных для речевого набора номера микропроцессор 50 введет режим опознавания речи на этапе 4а. После нажатия клавиши речевого набора номера пользователь нажмет клавишу регистрации речи для регистрации незарегистрированного имени в первом запоминающем устройстве 60 или нажмет на блоке пользовательского интерфейса клавишу опознавания речи, чтобы набрать голосом телефонный номер для зарегистрированного имени, с которым он желает соединиться. Затем микропроцессор 50 определяет на этапе 4b, какая именно из этих клавиш нажата пользователем. Если пользователь нажал клавишу регистрации речи, то микропроцессор 50 проверяет на этапе 4с, введены ли из вокодера 45 действительные пакетные данные для голоса пользователя. Если введены действительные пакетные данные, то микропроцессор 50 направляет входные пакетные данные в устройство опознавания речи 85 на этапе 4d и запоминает пакетные данные в третьей области памяти SA3 первого запоминающего устройства 60 в качестве данных воспроизведения речи ВР на этапе 4е. Затем микропроцессор 50 проверяет на этапе 4f, введены ли из устройства опознавания речи 85 характерные данные для входной речи. Если характерные данные введены, то микропроцессор 50 запоминает входные характерные данные во второй области памяти SA2 первого запоминающего устройства 60. Необходимо отметить, что последовательность этапов 4е и 4f может быть обращена, либо эти два этапа можно выполнять параллельно.

Если пользователь нажал клавишу опознавания речи на блоке пользовательского интерфейса на этапе 4b, то микропроцессор 50 проверяют на этапе 4h, введены ли из вокодера 45 действительные пакетные данные для голоса пользователя. Если действительные пакетные данные введены, то микропроцессор 50 направляет входные пакетные данные в устройство опознавания речи 85 на этапе 4i. После этого микропроцессор 50 проверяет на этапе 4j, введены ли характерные данные для входной речи из устройства опознавания речи 85. После приема характерных данных микропроцессор 50 временно запоминает их во втором запоминающем устройстве 65. Затем на этапе 4j микропроцессор 50 проверяет, введены ли из устройства опознавания речи 85 индекс для аналогичных характерных данных и значение разницы. Здесь индекс для аналогичных характерных данных обозначает индекс для характерных данных, зарегистрированных в первом запоминающем устройстве 60, которые аналогичны характерным данным для вводимой в данное время речи, а значение разницы обозначает значение разницы между зарегистрированными характерными данными и характерными данными из устройства опознавания речи 85. После приема индекса и значения разницы микропроцессор 50 на этапе 4k проверяет, имеет ли значение разницы величину, меньшую, чем пороговое значение, или оно находится в допустимом диапазоне ошибки. Если значение разницы меньше порогового значения, то микропроцессор 50 выводит данные воспроизведения речи в громкоговоритель 80 согласно индексу на этапе 41, тем самым решая, что входная речь опознана правильно. Но если значение разницы равно пороговому значению или превышает пороговое значение, то микропроцессор 50 считывает из пятой области памяти SA5 первого запоминающего устройства 60 речевое сообщение, уведомляющее о том, что входная речь не зарегистрирована в сотовом телефоне и направляет считанное сообщение речи в вокодер 45 на этапе 4m. Затем речевое сообщение, считанное из первого запоминающего устройства 60, обрабатывают вокодером 45, преобразуют в аналоговый сигнал цифроаналоговым преобразователем 75 и выводят в громкоговоритель 80.

При этом во время процесса регистрирования речи соответствующий телефонный номер также регистрируют в четвертой области памяти SA4 первого запоминающего устройства 60, в результате чего микропроцессор 50 может считывать и набирать зарегистрированный телефонный номер посредством схемы ДТИЧ (не изображена), когда пользователь вводит зарегистрированную речь.

Предпочтительно устройство опознавания речи 85 может выделять две или более совокупностей характерных данных для одного и того же голоса и запоминать их во второй области памяти SA2 первого запоминающего устройства 60, что повышает надежность функции опознавания речи.

Как указывалось выше, сотовый телефон данного изобретения применяет пакетные данные, выводимые из вокодера, в результате чего он может посредством простой операции опознавать речь. Сотовый телефон использует встроенный вокодер и запоминающее устройство для опознавания речи. Сотовый телефон предпочтительно имеет интегрированные возможности опознавания речи, которые можно компактно выполнить. Внешний автоматический комплект можно по усмотрению установить внутри телефона.

Несмотря на то, что данное изобретение описывается со ссылкой на считающееся сейчас наиболее практическим и предпочтительным осуществление, подразумевается, что оно не ограничивается раскрываемым здесь осуществлением и может включать в себя различные изменения в рамках формулы изобретения.


Формула изобретения

1. Цифровой сотовый телефон, имеющий вокодер для сжатия речевого сигнала, вводимого через микрофон, отличающийся тем, что содержит устройство опознавания речи для приема пакетных данных в качестве входного сигнала от вокодера и для выделения характерных данных из пакетных данных для сравнения выделенных характерных данных с зарегистрированными в энергонезависимом запоминающем устройстве характерными данными с целью определения, что зарегистрированные характерные данные аналогичны выделенным характерным данным, и определения значения разности между выделенными характерными данными и зарегистрированными характерными данными, и микропроцессор для регистрации в энергонезависимом запоминающем устройстве выделяемых характерных данных для сравнения зарегистрированных характерных данных с характерными данными для входного речевого сигнала и для опознавания входного речевого сигнала, если зарегистрированные характерные данные аналогичны характерным данным для входного речевого сигнала.

2. Цифровой сотовый телефон по п.1, отличающийся тем, что также содержит энергонезависимое запоминающее устройство для запоминания пакетных данных, соответствующих входным речевым сигналам, и характерных данных, выделенных из упомянутых пакетных данных в режиме регистрации, и блок интерфейса пользователя для выбора режима регистрации речи или режима опознавания речи.

3. Цифровой сотовый телефон по п.1, отличающийся тем, что устройство опознавания речи соединено с энергонезависимым запоминающим устройством через микропроцессор, микропроцессор сравнивает выделенные характерные данные с зарегистрированными характерными данными в энергонезависимом запоминающем устройстве для обнаружения зарегистрированных характерных данных, аналогичных выделяемым характерным данным, и значения разницы между выделяемыми характерными данными и зарегистрированными характерными данными.

4. Цифровой сотовый телефон по п.3, отличающийся тем, что микропроцессор управляет запоминанием пакетных данных и характерных данных в энергонезависимом запоминающем устройстве в режиме регистрации речи, и принимает индекс для аналогичных характерных данных и значение разницы между выделенными характерными данными и зарегистрированными характерными данными из устройства опознавания речи в режиме опознавания речи, чтобы определить, произошло ли опознавание входного речевого сигнала успешно.

5. Цифровой сотовый телефон по п.2, отличающийся тем, что содержит соединитель автоматического комплекта для обеспечения вывода речевого сигнала из микрофона автоматического комплекта на аналого-цифровой преобразователь, в котором речевой сигнал преобразуют в цифровой сигнал импульсно-кодовой модуляции (ИКМ-сигнал) и затем преобразуют ИКМ-сигнал в пакетные данные для пересылки в устройство опознавания речи через микропроцессор, при этом при соединении к автоматическому комплекту соединитель автоматического комплекта прерывает тракт сигнала между микрофоном сотового телефона и вокодером.

6. Цифровой сотовый телефон по п.5, отличающийся тем, что содержит аналого-цифровой преобразователь для преобразования речевого сигнала, выводимого из микрофона автоматического комплекта и микрофона сотового телефона, в цифровой сигнал, и для выведения преобразованного цифрового сигнала в вокодер; и цифро-аналоговый преобразователь для преобразования цифрового сигнала, выводимого из вокодера, в аналоговый сигнал, и для выведения преобразованного аналогового сигнала в громкоговоритель.

7. Цифровой сотовый телефон по п.4, отличающийся тем, что энергонезависимое запоминающее устройство запоминает данные телефонного номера, соответствующие пакетным данным, для входного речевого сигнала.

8. Цифровой сотовый телефон по п.7, отличающийся тем, что микропроцессор осуществляет управление набором телефонного номера, соответствующего данным телефонного номера, если входной речевой сигнала опознан успешно.

9. Цифровой сотовый телефон по п.4, отличающийся тем, что микропроцессор считывает данные воспроизведения речи из энергонезависимого запоминающего устройства согласно индексу для аналогичных характерных данных и направляет считанные данные воспроизведения речи в вокодер для воспроизведения входного речевого сигнала через громкоговоритель.

10. Цифровой сотовый телефон по п.4, отличающийся тем, что микропроцессор считывает речевое сообщение, информирующее об успешном или неуспешном опознании речи, из энергонезависимой памяти, и направляет считанное речевое сообщение в вокодер, чтобы вывести речевое сообщение через громкоговоритель.

11. Способ управления сотовым телефоном с функцией опознавания речи, отличающийся тем, что содержит этапы, согласно которым: переключают операционный режим сотового телефона, находящегося в режиме ожидания, на режим опознавания речи; проверяют, нажимает ли пользователь клавишу регистрации речи или клавишу опознавания речи; если пользователь нажимает клавишу регистрации речи, направляют пакетные данные для входного речевого сигнала из вокодера в устройство опознавания речи, запоминают данные воспроизведения речи в энергонезависимой памяти и регистрируют характерные данные для пакетных данных, принимаемых из устройства опознавания речи, в энергонезависимой памяти; и, если пользователь нажимает клавишу опознавания речи, направляют пакетные данные для входного речевого сигнала в устройство опознавания речи, выделяют характерные данные для пакетных данных из устройства опознавания речи, считывают зарегистрированные характерные данные, аналогичные характерным данным для пакетных данных, и значение разницы между ними из энергонезависимой памяти, и определяют, успешно ли совершено опознавание входного речевого сигнала, в зависимости от значения разницы.

12. Способ по п.11, отличающийся тем, что регистрируют телефонный номер, соответствующий входному речевому сигналу в энергонезависимой памяти в режиме регистрации, и набирают телефонный номер, зарегистрированный в энергонезависимой памяти в режиме опознавания, если входной речевой сигнал успешно опознан.

13. Способ по п. 11, отличающийся тем, что содержит этап переключения операционного режима на режим ожидания, если опознавание речи успешно не произведено.

РИСУНКИ

Рисунок 1, Рисунок 2, Рисунок 3, Рисунок 4



 

Похожие патенты:

Изобретение относится к области беспроводной передачи информации о местоположении и полезной информации и к приемопередающему устройству

Изобретение относится к системе связи с расширенным спектром, в частности к устройству и способу для осуществления первоначальной синхронизации и синхронизации кадров с использованием расширяющего кода для мобильной станции в системе связи МДКР

Изобретение относится к последовательному способу поиска для демодуляции обратного канала в системе связи с мобильными объектами

Изобретение относится к технике связи и может быть использовано в сетях передачи данных

Изобретение относится к системам телекоммуникации и может быть использовано для улучшения эффективности или, соответственно, "производительности" физических каналов в системах телекоммуникации с беспроводной связью между мобильными и/или стационарными приемопередающими устройствами в зависимости от скорости передачи данных в канале, окружающей среды системы, загрузки системы и удаления между приемопередающими устройствами так, чтобы в передатчике и/или приемнике в приемопередающих устройствах не требовалось никаких схемно-технических изменений

Изобретение относится к системе мобильной связи и, в частности к способу синхронизации состояний между базовой станцией и мобильной станцией с уменьшенными непроизводительными расходами на сигнализацию во время пакетной передачи данных на подуровне управления доступом к среде передачи (УДС) в системе мобильной связи множественного доступа с кодовым разделением каналов (МДКРК)

Изобретение относится к устройству и способу управления передачей в обратной линии связи системы мобильной связи, основанным на использовании уровня принимаемого сигнала в прямой линии связи

Изобретение относится к передаче при радиосвязи из одной точки к множеству точек и может быть использовано, в частности, хотя и не обязательно, в соответствии с протоколом услуги пакетной радиосвязи общего назначения (УПРОН), предложенному для мобильной радиосвязи

Изобретение относится к способу, устройству и телекоммуникационной сети для устранения наложения сигналов при проведении двусторонней связи с временным разделением, когда сообщения передаются в первом направлении связи в первом временном сегменте и во втором направлении связи во втором временном сегменте

Изобретение относится к системам связи с расширенным спектром, обеспечивающим возможность множеству передатчиков совместно использовать один канал с мультиплексной передачей с кодовым разделением (МПКР) или канал с множественным доступом с кодовым разделением (МДКР) путем использования в этих каналах ортогональных передаваемых сигналов

Изобретение относится к схеме соединений для системы мобильной связи, в частности к системе мобильной связи, имеющей схему для осуществления соединений, основанных на режиме асинхронной передачи (РАП), между контроллером и подсистемой приемопередатчика базовой станции, а также между базовой станцией и коммутационным центром мобильной связи

Изобретение относится к системам подвижной связи

Изобретение относится к регулирующим, предупреждающим или подобным предохранительным устройствам, действующим между вагонами, в частности к системам внутрипоездной связи
Наверх