Устройство для распознавания речи

Авторы патента:

G10L19/02 - с использованием спектрального анализа, например преобразовательные вокодеры, вокодеры с поддиапазонами

00 544990

Сею Советских

Социалистических

Республик (61) Дополнительное к авт. свид-ву (22) Заявлено 08.04.74 (21) 2016330/24 (51) М. Кл, G 101 1/08 с присоединением заявки №

Государственный комитет

Совета Министров СССР (23) Приоритет

Опубликовано 30.01.77. Бюллетень ¹ 4

Дата о публикования описания 24.02.77 (53) VglK 681.32(088.8) по делам изобретений и открытий (72) Авторы изобретения

В. Л. Могильницкая, Л. М. Могильницкий и М. Л. Ханин (71) Заявитель (54) УСТРОЙСТВО ДЛЯ РАСПОЗНАВАНИЯ РЕЧИ

Изобретение относится к области вычислительной техники и автоматики и может быть использовано для ввода речевой информации в вычислительные машины, исполнительные автоматы и т. д.

Известны устройства для автоматического распознавания звуков речи, в которых инвариантные признаки получают в результате сопоставления энергий частотных полос речевого спектра. В этих устройствах звуковой сигнал посредством микрофона преобразуется в электрический, усиливается усилителем, подвергается компрессии, спектральному анализу гребенкой фильтров. Затем выделяется огибающая полученных полос спектра и после временной обработки проводится их сопоставление (обычно попарно) в блоках сравнения.

По результатам сопоставления уровней судят о наличии того или иного инвариантного признака. Инвариантные признаки, полученные как описанным методом, т. е. путем сопоставления энергетических уровней разных спектральных полос речевого сигнала, так и на основе других параметров речи, поступают на блоки решения о фонемах. Так, например, в одном из устройств звуковой сигнал, преобразованный в электрический, подается на избирательный усилитель с автоматической регулировкой усиления, где усиливается, ограничивается и сжимается по динамическому диапазону, после чего анализируются частотновременные характеристики.

Динамический диапазон несет определенную информацию о звуках речи и достигает значительной величины (с учетом возможных интонационных изменений и перемещений диктора вЂ” свыше 80 дб). Ограничение и сжатие динамического диапазона приводит к потере части информации. Кроме того, в блоках усиления и временной обработки IIp;I большом динамическом диапазоне возникают нелинейные искажения. Все это, как следствие, снижает достоверность распознавания.

Наиболее близким к пзобретеншо является

15 устройство для распознавания речи, содержащее блоки принятия решения и микрофон, подключенный к Гp) ппе фильтров, каждый из которых последовательно соединен с первым усилителем и основным блоком детектпрова20 ния, попарно подключенными к основным блокам сравнения.

Однако такое устройство не обеспечивает достаточной достоверности распознавания речевых сигналов.

25 Цель изобретения вЂ” повышение достоверности распознавания речи за счет устранения влияния инерционности цепей регулирования и исключения как потери части информации при компрессии динамического диапазона ре30 I II, т а к и искажений, воз н и к а ю щ II. I II p I i о бр а 544990

40 ботке сигналов с широким динамическим диапазоном, Для этого в устройство введены дополнительные блоки сравнения, группы элементов

ИЛИ, последовательно соединенные вторые усилители, подключенные к первым усилителям, и дополнительные блоки детектирования, попарно подключенные к дополнительным блокам сравнения, соединенным с первыми входами группы элементов ИЛИ, вторые входы которых связаны с основными блоками сравнения, а выходы вЂ” с блоками принятия решения.

На чертеже приведена блок-схема предлагаемого устройства.

Оно состоит из микрофона 1, группы фильтров 2, первых усилителей 3, основных блоков

4 детектирования, вторых усилителей 5, дополнительных блоков 6 детектирования, основных 7 и дополнительных 8 блоков сравнения, групп элементов ИЛИ 9 и блоков 10 прин ятия р е шеи и я.

Микрофоном 1 звуковой сигнал преобразуется в электрический и подается на частотноанализирующую гребенку из группы фильтров 2 разных частот (fi, f>, f ... ;). К каждому из выходов группы фильтров 2 подключены усилители 3, с которых выделенные полосы спектров поступают на основной 4 и дополнительный 6 блоки детектирования через усилители 5. Полученные напряжения определенных уровней с блоков 4 и 6 детектирования разных фильтров, например f> и fq, подаются соответственно на основной 7 и дополнительный 8 блоки сравнения, а результирующие сигналы с них попадают на группы элементов

ИЛИ 9, которые отрегулированы таким образом, чтобы они срабатывали только при наличии уровня определенной полярности, хотя бы на выходе одного из основного или дополнительного блоков сравнения. Срабатывание группы элементов ИЛИ 9 свидетельствует о выработке инвариантного признака, но для этого с выходов блоков 7 и 8 (или одного из них) должны поступать сигналы определенной полярности и по своему уровню превосходить порог срабатывания элемента ИЛИ в группе элементов ИЛИ 9. Полярность выходных сигналов блоков 7 и 8 определяется соотношением сравниваемых уровней.

Для нормальной работы устройства коэффициент усиления усилителей 5 должен быть по своей величине равен заданному динамическому диапазону. Уменьшение коэффициента усиления усилителей 5 ниже величины динамического диапазона приводит к сужению динамического диапазона устройства.

Предлагаемое устройство выгодно отличается от известных возможностью исключить влияние нелинейных искажений, возникающих при распознавании речи с широким динамическим диапазоном, что способствует повышению достоверности распознавания.

Формула изобретения

Устройство для распознавания речи, содержащее блоки принятия решения и микрофон, подключенный к группе фильтров, каждый из которых последовательно соединен с первым усилителем и основным блоком детектирования, которые попарно подключены к основным блокам сравнения, отличающееся тем, что, с целью повышения достоверности распознавания, в него введены дополнительные блоки сравнения, группы элементов ИЛИ, последовательно соединенные вторые усилители, подключенные к первым усилителям, и дополнительные блоки детектирования, попарно подключенные к дополнительным блокам сравнения, соединенным с первыми входами группы элементов ИЛИ, вторые входы которых подключены к основным блокам сравнения, а выходы вЂ” к блокам принятия решения.

544990

Корректор Н. Аук

Редактор В. Зенкевич

Заказ 114/20 Изд. ¹ 146 Тираж 524 Подписное

ЦНИИПИ Государственного комитета Совета Министров С(. СР по делам изобретений и открытий

113035, Москва, Я-35, Раушская наб., д. 4/5

Типография, пр. Сапунова, 2

Составитель А. Иванов

Техред А. Камышникова г !

Способ измерения формантной частоты речевого сигнала // 535592

Синтезатор речи // 533966

Преобразователь речи в импульсную последовательность, синхронную с основным тоном // 530340

Полосной полувокодер // 517040

Устройство для разделения сигналов тонального вызова и речи // 489144

Устройство для распознавания радиосигналов // 481054

Способ измерения периода формантных колебаний речевых сигналов // 453731

Устройство передачи и приема речевых сигналов // 447853

Устройство для распознавания звуков речи // 441585

Способ сжатия звуковой информации и система для его реализации // 2144222

Изобретение относится к области передачи и хранения акустической информации и может быть использовано при проектировании систем цифровой радиосвязи, радио и телевидения, телефонии, систем цифровой звукозаписи и звуковоспроизведения

Способ обнаружения и коррекции аномальных цифровых ошибок при передаче речи методом импульсно-кодовой модуляции // 2148277

Изобретение относится к технике цифровой обработки речевых сигналов, передаваемых по линиям связи методом импульсно-кодовой модуляции (ИКМ) , и может быть использовано для повышения помехозащищенности многоканальных систем передачи цифровой телефонии

Устройство обнаружения и коррекции аномальных цифровых ошибок при передаче речи методом импульсно-кодовой модуляции // 2159470

Изобретение относится к технике цифровой обработки речевых сигналов, передаваемых по линиям связи методом импульсно-кодовой модуляции (ИКМ), и может быть использовано для повышения помехозащищенности многоканальных систем передачи цифровой телефонии