Способ распознавания речевого сигнала
ОП ИСАНИЕ
ИЗОБРЕТЕНИЯ
К АВТОРСКОМУ СВИДЕТЕЛЬСТВУ
Союз Советских
Социалистических
Республик
Государственный коинтет С С С P по делам нзобретеннй e ll OTKpbltkA (23) Приоритет— РЗ1УДК 621. 391 ° 18 (088.8) Опубликовано 23.0183. Бюллетень НоЗ Дата опубликования описания 2mi.83 г 3 %абаков-КушйаренЫо с (1 {72) Авторы изобретения М.Ф. Бондаренко, A.ß. Дрюченко и Харьковский институт радиоэлектр (71) Заявитель (54) СПОСОБ РАСПОЗНАВАНИЯ РЕЧЕВОГО СИГНАЛ Изобретение относится к приборостроению и может быть использовано в акустике, а именно в системах распознавания речевых сигналов, например при речевом вводе информации в вычислительные машины. Известен способ распознавания речевых сигналов, заключающийся в том, Что производят преобразование ре чевого сигнала путем квантования его по эталонным значениям напряжения, измерения времени существования и времени отсутствия напряжения на каждом уровне эталонного значения напряжения речевого сигнала, запо- минания результатов измерения и сравнения их с эталонными значениями напряжения речевого сигнала f1). Недостатком данного способа является невысокая надежность и недостаточное быстродействие распознавания речевого сигнала. Наиболее близким техническим ре шением к изобретению является реализованный в устройстве способ распознавания речевого сигнала путем его преобразования в последовательность импульсов с учетом заданной элементарной площади под кривой сигнала, запоминания и сравнения с эталонньвчи значениями 2 . Недостатком известного способа является невысокая надежность распоз-, навания речевого. сигнала нри наличии помех, Изменение Формы речевого сигнала, а также флуктуации амплитуды сигнала из-за наложенной на него 1 0 аддитнвной помехи оказывают,отрицательное влияние на результат распознавания. Кроме того, недостатком способа является невысокое быстродействие распознавания вследствие того, что речевой сигнал не нормируется. Это ведет к необходимости перебора большого .числа реализаций одного и того же образа с большими временными затратами. Цель изобретения - повышение на дежности и быстродействия распознавания речевого сигнала. Поставленная цель достигается тем, согласно способу распознавания рече вого сигнала путем его преобразова25 ния в последовательность импульсов с учетом заданной элементарной площади под кривой сигнала, запоминания и сравнения с эталонньвки значениями, в котором производят нормализацию 30 входного сигнала по уровню на квази 991492 50 стационарных участках, а также преобразуют последовательность импульсов в бинарную форму относительно тактовой последовательности импульсов и выделяют стационарные блоки единицнепрерывные последовательности единиц, если их число превышает некоторое заданное число, стационарные бло-, ки нулей — .непрерывные последовательности нулей, если их число превышает некоторое заданное число, и не- t0 .стационарные блоки — произвольные последовательности бинарных элементов, а также разрывы стационарных бло. ков единиц, по стационарным блокам единиц определяют границы элементарных сегментов и используют содержащуюся в них информацию для принятия решения о фонетической принадлежности звука. На фиг.1 изображено устройство 20 для осуществления предложенного способа распознавания речевого сигнала, на фиг.2 — осцилдограмма речевого сигнала и преобраэование речевого сигнала в систему признаков, пред- ъ5 ставленных в бинарной форме. устройство, осуществляющее предлагаемый способ распознавания речево го сигнала, содержит микрофон 1, микрофонный усилитель 2 динамический нормализатор уровня 3, рецептор 4, блок памяти 5, анализатор 6 и классифйкатор 7. Микрофон 1 через микрофонный усилитель 2 соединен с динамическим нормализатором уровня 3, выход кото- 35 рого подключен к входу рецептора 4, связанного с блоком памяти 5. Выход блока памяти 5 через анализатор б соединен с классификатором 7. Распознавание речевых сигналов 40 осуществляется следующим образом. Речевой сигнал нормируется по уровню на квазистационарных участках. Этим минимизируется пространство признаков описания распознаваемого 45 образа. Затем преобразуют речевой сигнал {фиг.2) с учетом психофизического эффекта сглаживания в слухе в систему признаков, представленных в бинарной форме на определенном интервале времени (выборке, например 20mS). Из структур бинарных элементов выделяют базовые блоки, т.е. стационарные блоки единиц У(11), стационарные блоки нулей й(00), нестационарные блоки Х!01), а также признак BY При этом для маркировки границ элементарного сегмента используют признак Y{11). Затем измеряют временные значения признаков Y(11), К(00), BY и в результате анализа этих значений в зависимости от требуемой надежности распознают речевой сигнал по одному или более элементарным сегментам. Предлагаемый способ распознавания повышает надежность и быстродействие обработки речевого сигнала. Формула изобретения Способ распознавания речевого сигнала путем его преобразования в последовательность импульсов с учетом заданной элементарной площади под кривой сигнала, запоминания и сравнения с эталонными значениями, отличающийся тем,что, с целью повышения надежности и быстродействия распознавания, производят нормализацию входного сигнала по уров-. ню на квазистационарных участках, а также преобразуют последовательность импульсов в бинарную форму относительно тактовой последовательности и выделяют стационарные блоки единиц — непрерывные последовательности единиц-, если их число превышает некоторое заданное число, стационарные блоки нулей — непрерывные последовательности нулей, если их число превышает некоторое заданное число, и нестационарные блоки — про» извольные последовательности бинарных элементов, а также разрывы стационарных блоков единиц, по стационарным блокам единиц определяют границы элементарных сегментов и исполь-зуют содержащуюся в них информацию для принятия решения о фонетической принадлежности звука. Источники информации, принятые во внимание при экспертизе 1. Авторское свидетельство СССР 9 б14461, кл. G 10 L 1/02, 1977. 2. Авторское свидетельство СССР 9 830521, кл. G 10 L 1/02, 1981. 991492 Составитель В. Суханов Редактор В. Данко Техред A.A÷ Корректор E. Pmnco акаэ 45 7 Тираж О Подписное ВНИИПИ Государственного комитета СССР по делам иэобретений и открытий 113035, Носква, Ж-35, Раушская наб., д. 4/5 филиал ППП Патент, r. Ужгород, ул. Проектная,