Способ распознавания речевого сигнала

 

ОП ИСАНИЕ

ИЗОБРЕТЕНИЯ

К АВТОРСКОМУ СВИДЕТЕЛЬСТВУ

Союз Советских

Социалистических

Республик

Государственный коинтет

С С С P по делам нзобретеннй

e ll OTKpbltkA (23) Приоритет—

РЗ1УДК 621. 391 ° 18 (088.8) Опубликовано 23.0183. Бюллетень НоЗ

Дата опубликования описания 2mi.83 г

3 %абаков-КушйаренЫо с (1

{72) Авторы изобретения

М.Ф. Бондаренко, A.ß. Дрюченко и

Харьковский институт радиоэлектр (71) Заявитель (54) СПОСОБ РАСПОЗНАВАНИЯ РЕЧЕВОГО

СИГНАЛ

Изобретение относится к приборостроению и может быть использовано в акустике, а именно в системах распознавания речевых сигналов, например при речевом вводе информации в вычислительные машины.

Известен способ распознавания речевых сигналов, заключающийся в том, Что производят преобразование ре чевого сигнала путем квантования его по эталонным значениям напряжения, измерения времени существования и времени отсутствия напряжения на каждом уровне эталонного значения напряжения речевого сигнала, запо- минания результатов измерения и сравнения их с эталонными значениями напряжения речевого сигнала f1).

Недостатком данного способа является невысокая надежность и недостаточное быстродействие распознавания речевого сигнала.

Наиболее близким техническим ре шением к изобретению является реализованный в устройстве способ распознавания речевого сигнала путем его преобразования в последовательность импульсов с учетом заданной элементарной площади под кривой сигнала, запоминания и сравнения с эталонньвчи значениями 2 .

Недостатком известного способа является невысокая надежность распоз-, навания речевого. сигнала нри наличии помех, Изменение Формы речевого сигнала, а также флуктуации амплитуды сигнала из-за наложенной на него

1 0 аддитнвной помехи оказывают,отрицательное влияние на результат распознавания. Кроме того, недостатком способа является невысокое быстродействие распознавания вследствие того, что речевой сигнал не нормируется. Это ведет к необходимости перебора большого .числа реализаций одного и того же образа с большими временными затратами.

Цель изобретения - повышение на дежности и быстродействия распознавания речевого сигнала.

Поставленная цель достигается тем, согласно способу распознавания рече вого сигнала путем его преобразова25 ния в последовательность импульсов с учетом заданной элементарной площади под кривой сигнала, запоминания и сравнения с эталонньвки значениями, в котором производят нормализацию

30 входного сигнала по уровню на квази

991492

50 стационарных участках, а также преобразуют последовательность импульсов в бинарную форму относительно тактовой последовательности импульсов и выделяют стационарные блоки единицнепрерывные последовательности единиц, если их число превышает некоторое заданное число, стационарные бло-, ки нулей — .непрерывные последовательности нулей, если их число превышает некоторое заданное число, и не- t0 .стационарные блоки — произвольные последовательности бинарных элементов, а также разрывы стационарных бло. ков единиц, по стационарным блокам единиц определяют границы элементарных сегментов и используют содержащуюся в них информацию для принятия решения о фонетической принадлежности звука.

На фиг.1 изображено устройство 20 для осуществления предложенного способа распознавания речевого сигнала, на фиг.2 — осцилдограмма речевого сигнала и преобраэование речевого сигнала в систему признаков, пред- ъ5 ставленных в бинарной форме. устройство, осуществляющее предлагаемый способ распознавания речево го сигнала, содержит микрофон 1, микрофонный усилитель 2 динамический нормализатор уровня 3, рецептор 4, блок памяти 5, анализатор 6 и классифйкатор 7.

Микрофон 1 через микрофонный усилитель 2 соединен с динамическим нормализатором уровня 3, выход кото- 35 рого подключен к входу рецептора 4, связанного с блоком памяти 5. Выход блока памяти 5 через анализатор б соединен с классификатором 7.

Распознавание речевых сигналов 40 осуществляется следующим образом.

Речевой сигнал нормируется по уровню на квазистационарных участках.

Этим минимизируется пространство признаков описания распознаваемого 45 образа. Затем преобразуют речевой сигнал {фиг.2) с учетом психофизического эффекта сглаживания в слухе в систему признаков, представленных в бинарной форме на определенном интервале времени (выборке, например 20mS). Из структур бинарных элементов выделяют базовые блоки, т.е. стационарные блоки единиц У(11), стационарные блоки нулей й(00), нестационарные блоки Х!01), а также признак BY При этом для маркировки границ элементарного сегмента используют признак Y{11). Затем измеряют временные значения признаков

Y(11), К(00), BY и в результате анализа этих значений в зависимости от требуемой надежности распознают речевой сигнал по одному или более элементарным сегментам.

Предлагаемый способ распознавания повышает надежность и быстродействие обработки речевого сигнала.

Формула изобретения

Способ распознавания речевого сигнала путем его преобразования в последовательность импульсов с учетом заданной элементарной площади под кривой сигнала, запоминания и сравнения с эталонными значениями, отличающийся тем,что, с целью повышения надежности и быстродействия распознавания, производят нормализацию входного сигнала по уров-. ню на квазистационарных участках, а также преобразуют последовательность импульсов в бинарную форму относительно тактовой последовательности и выделяют стационарные блоки единиц — непрерывные последовательности единиц-, если их число превышает некоторое заданное число, стационарные блоки нулей — непрерывные последовательности нулей, если их число превышает некоторое заданное число, и нестационарные блоки — про» извольные последовательности бинарных элементов, а также разрывы стационарных блоков единиц, по стационарным блокам единиц определяют границы элементарных сегментов и исполь-зуют содержащуюся в них информацию для принятия решения о фонетической принадлежности звука.

Источники информации, принятые во внимание при экспертизе

1. Авторское свидетельство СССР

9 б14461, кл. G 10 L 1/02, 1977.

2. Авторское свидетельство СССР

9 830521, кл. G 10 L 1/02, 1981.

991492

Составитель В. Суханов

Редактор В. Данко Техред A.A÷ Корректор E. Pmnco акаэ 45 7 Тираж О Подписное

ВНИИПИ Государственного комитета СССР по делам иэобретений и открытий

113035, Носква, Ж-35, Раушская наб., д. 4/5 филиал ППП Патент, r. Ужгород, ул. Проектная,

Способ распознавания речевого сигнала Способ распознавания речевого сигнала Способ распознавания речевого сигнала Способ распознавания речевого сигнала 

 

Похожие патенты:

Изобретение относится к системам обработки информации и управления, а именно к способам построения систем распознавания речи

Изобретение относится к системам обработки информации и управления, в частности к способам построения систем распознавания речи
Наверх