Способ выделения речевого сигнала на фоне помех и устройство для его осуществления

Авторы патента:

G10L15/20 - техника распознавания речи, специально предназначенная для крайне неблагоприятных условий окружения, например в шуме, при речи, вызванной стрессом (G10L 21/02 имеет преимущество)

1. Способ выделения речевого сигнала на фоне помех, включающий фильтрацию гармонических составляющих основного тона, регулирование их уровня и суммирование , отличающийся тем, что, с целью повыщения качества звучания, дополнительно измеряют амплитудные и угловые модуляционные спектры обрабатываемого сигнала , фильтруют, регулируют уровни и суммируют гармонические составляющие нескольких тонов, которые выбирают в пределах .диапазона непроизвольных вариаций основного тона, гармонические составляющие модулируют соответствующим тоном по амплитуде до и после фильтрации и по углу после фильтрации, устанавливая глубины и фазы модуляций пропорциональными значениям модуляционных спектров, а уровни регулируют пропорционально глубинам амплитудной и угловой модуляций соответствующим тоном и пропорционально модулю косинуса сдвига фаз этих модуляций .

СОЮЗ СОВЕТСКИХ

СОЦИАЛИСТИЧЕСКИХ

РЕСПУБЛИК

4(50 G 10 L 1 00

ОПИСАНИЕ ИЗОБРЕТЕНИЯ

К А ВТОРСКОМ,Ф СВИДЕТЕЛЬСТВУ

ГОСУДАРСТВЕННЫЙ КОМИТЕТ СССР

ПО ДЕЛАМ ИЗОБРЕТЕНИЙ И ОТКРЫТИЙ (21) 3677242/24-10 (22) 22. 12.83 (46) 15.05.85. Бюл. № 18 (72) Е. И. Кабанова и В. А. Махонин (71) Институт проблем передачи информации АН СССР (53) 534.4 (088.8) (56) 1. Европейский патент № ЕР0076687, кл. G 10 L 1/00, опублик. 13.04.83.

2. А геа1 time noise suppressor

«CANARY». Research on information processing. Department of information science.

Kyoto University, 1981, рр. 12 вЂ” 13.

3. Видениекс П. О., Щербаков А. И.

Фильтр с переменными параметрами для приема сигналов. Рига «Зинатне», 1981.

4. Nagabuchi Н. and Kobayasht Т. Îuàlity improvement of synthesized speech in

noisy speech, Analysis вЂ” Synthesis processing Electronics and Communications in

Japan, vol. 64;А № 9, р. 21 вЂ” 30 (прототип).

5. Европейский патент ¹ EP0072706, кл. G 10 L 1/00, опублик. 23.02.83 (прототип) .

„SU„„1156126 A (54) СПОСОБ ВЫДЕЛЕНИЯ РЕЧЕВОГО

СИГНАЛА НА ФОНЕ ПОМЕХ И УСТРОЙСТВО ДЛЯ ЕГО ОСУЩЕСТВЛЕНИЯ. (57) 1. Способ выделения речевого сигнала на фоне помех, включающий фильтрацию гармонических составляющих основного тона, регулирование их уровня и суммирование, отличающийся тем, что, с целью повышения качества звучания, допол !ительно измеряют амплитудные и угловые модуляционные спектры обрабатываемого сигнала, фильтруют, регулируют уровни и суммируют гармонические составляющие нескольких тонов, которые выбирают в пределах .диапазона непроизвольных вариаций основного тона, гармонические составляющие модулируют соответствующим тоном по амплитуде до и после фильтрации и по углу после фильтрации, устанавливая глубины и фазы модуляций пропорциональными значениям модуляционных спектров, а уровни регулируют пропорционально глубинам амплитудной и угловой модуляций соответствующим тоном и пропорционально модулю косинуса сдвига фаз этих модуляций.

1156126

2. Устройство для выделения речевого сигнала на фоне помех, содержащее генератор импульсов, первый и второй выходы которого соединены с управляющими входами блока памяти, и фильтр с изменяемой рабочей характеристикой, отличающееся тем, что, с целью повышения качества звучания, в него введены амплитудный и угловой модулометры, генератор гармонических колебаний и два управляемых преобразователя частоты, причем первый вход и первый выход блока памяти соединены соответственно с входом и выходом устройства, второй выход блока памяти соединен с входом первого управляемого преобразователя частоты, выход которого через фильтр с изменяемой рабочей характеристикой соединен с входом второго управляемого преобразователя частоты, выход которого соединен с вторым входом блока памяти, а управляющий вход соединен с управляющим входом первого управляемого преобразователя частоты и третьим выходом генератора импульсов, четвертый выход которого соединен с первыми входами модулометров, вторые входы которых соединены с выходом первого управляемого преобразователя часто1

Изобретение относится к технике обработки искаженных помехами речевых сообщений и может быть использовано в технике связи и в приборах для улучшения звучания дефектных фонограмм. 5

Известны способ и устройство для адаптивного выделения речевых сообщений на. фоне шумов. Выделение основано на преобразовании обрабатываемого сигнала избирательными цепями, настроенными на различные частотные полосы спектра сигнала. Эти цепи составляют первый набор фильтров. Разделенные составляющие усиливают и суммируют. Выделение осуществляется посредством управления этими усилениями. Для формирования сигналов управления используют второй блок фильтров, соединенный с управляющими входами усилителей через блок логических элементов, преобразующий выработанные во втором блоке фильтров опенки сигнала в команды управления деформациями динамических диапазонов частотных полос, которые обеспечивают улучшение звучания искаженной помехами речи (1).

Недостатком этих способа и устройства является то, что они обеспечивают только компенсацию искажений динамического ты, а выходы вЂ” с соответствующими четырьмя управляющими входами фильтра с изменяемой рабочей характеристикой, остальные два управляющих входа которого соединены с выходами генератора гармонических колебаний и третьими и четвертыми входами модулометров.

3, Устройство по п. 2, отличающееся тем, что фильтр с изменяемой рабочей характеристикой выполнен в виде последовательно соединенных первого амплитудного модулятора, полосового фильтра, второго амплитудного модулятора, углового модулятора и управляемого аттенюатора, причем первые два управляющих входа амплитудных модуляторов соединены с первыми двумя у.правляющими входами углового модулятора, вторые два управляющих входа амплитудных модуляторов соединены с первыми двумя управляющими входами управ. ляемого аттенюатора, вторые два управляющих входа которого соединены с двумя вторыми управляющими входами углового модулятора, а блок памяти выполнен состоящим из двух обособленных частей, каждая из которых содержит узел основной памяти, узел буферной памяти и сумматор.

2 диапазона полосных составляющих и не позволяют выделять быстроизменяющиеся сигналы на фоне нестационарных помех.

Одной из причин этого является неконтролируемое запаздывание при формировании управляющих сигналов в блоке логических элементов.

Известно устройство для выделения речевых сигналов в реальном масштабе времени, что достигается введением оперативного запоминающего устройства, построенного по принципу пожарных цепочек. Это оперативное запоминающее устройство обеспечивает временное согласование между изменениями коэффициентов усиления и пропусканием сигналов через регулируемые усилители (2).

Недостатком этого устройства является невозможность внутриполосной селекции полезных колебательных составляющих, что ограничивает сокращение уровня остаточных помех.

Известен фильтр с переменными параметрами, упрощенный по отношению к следящим модулированным фильтрам и обеспечивающий преобразования частот принимаемых сигналов. Этот фильтр позволяет выделить амплитудно-модулированные коле1156126

3 бательные составляющие сигнала, но он не позволяет выделять составляющие с углово и модуляцией (3) .

Наиболее близким к предлагаемому является способ выделения речевого сигнала на фоне помех путем выделения колебательных составляюших обрабатываемого сигнала, фильтрации гармонических составляющих основного тона, оценки шумовых спектров, регулирования уровня шумовых колебательных составляющих и профильтрованных гармонических составляюших и суммирования колебательных и гармонических составляющих (4) .

Недостатком этого способа является снижение качества звучания речи, вызванное ослаблением модуляций речевого сигнала, характеризующих его микровариационные свойства, нужные для передачи индивидуальных и эмоциональных особенностей высказывания, а также высокий уровень остаточных помех и искажений.

Наиболее близким к предлагаемому является устройство для преобразования речевых сигналов, содержащее блок памяти, генератор импульсов, фильтр с изменяемой рабочей характеристикой, аналого-цифровой и .цифроаналоговый преобразователь, а также фильтр нижних частот (5).

Это устройство позволяет преобразовывать колебательные составляющие речевого сигнала, трансформируя его частотный спектр. Однако оно не позволяет выделять речевой сигнал из смеси с шумами.

Целью изобретения является повышение качества звучания речевых сигналов.

Поставленная цель достигается тем, что согласно способу выделения речевого сигнала на фоне помех, включаюшему фильтрацию гармонических составляющих основного тона, регулирование их уровня и суммирование, дополнительно измеряют амплитудные и угловые модуляционные спектры обрабатываемого сигнала, фильтруют, регулируют уровни и суммируют гармонические составляющие нескольких тонов, .которые выбирают в пределах диапазона непроизвольных вариваций основного тона, гармонические составляющие модулируют соответствующим тоном по амплитуде до и после фильтрации и по углу после фильтрации, устанавливая глубины и фазы модуляций пропорциональными значениям модуляционных спектров, а уровни регул..руют пропорционально глубинам амплитудной и угловой модуляций соответствуюшим тоном и пропорционально модулю косинуса сдвига фаз этих модуляций.

В устройство для выделения речевого сигнала на фоне помех, содержащее блок памяти, генератор импульсов и фильтр с изменяемой рабочей характеристикой, причем два выхода генератора импульсов соединены с двумя управляющими входами блока

4 памяти, введены амплитудный и угловой модулометры, генератор гармонических колебаний и два управляемых преобразователя частоты, причем первый вход и первый выход блока памяти соединены соответственно со входом и выходом устройства, второй выход блока памяти соодинен со входом первого управляемого преобразователя частоты, выход которого через фильтр с изменяемой рабочей характеристикой соединен со входом второго управляемого преобразователя частоты, выход которого соединен со вторым входом блока памяти, а управляющий вход соединен с управляющим входом первого управляемого преобразователя час. тоты и третьим выходом генератора импульсов, четвертый выход которого соединен с первыми входами модулометров, вторые входы которых соединены с выходом первого управляемого преобразователя частоты, а выходы вЂ” с соответствующими четырьмя управляющими входами фильтра с изменяемой рабочей характеристикой, остальные два управляющих входа которого соединены с выходами генератора гармонических колебаний и третьими и четвертыми входами модулометров.

Кроме того, фильтр с изменяемой рабочей характеристикой выполнен в виде последовательно соединенных первого амплитудного модулятора, полосового фильтра, второго амплитудного модулятора, углового модулятора и управляемого аттенюатора, причем первые два управляющих входа амплитудных модуляторов соединены с первыми двумя управляюшими входами углового модулятора, вторые два управляющих входа амплитудных модуляторов соединены с первыми двумя управляющими входами управ35 ляемого аттенюатора, вторые два управляющих входа которого соединены с двумя вторыми управляющими входами углового модулятора, а блок памяти состоит из двух обособленных частей, каждая из которых

411 содержит узел основной памяти, узел буферной памяти и сумматор.

На фиг. 1 представлены (снизу вверх) искаженный помехами речевой сигнал, выделенный сигнал и сигнал-оригинал, из . которого получен искаженный сигнал; на фиг. 2 вЂ” блок-схема устройства для осуществления предлагаемого способа.

Устройство содержит блок 1 памяти, первый управляемый преобразователь 2 частоты, фильтр 3 с изменяемой рабочей характеристикой, первый амплитудный модулятор 4, полосовой фильтр 5, второй амплитудный модулятор 6, угловой модулятор 7, управляемый аттенюатор 8, второй управляемый преобразователь 9 частоты, генератор 10 импульсов, амплитудный модулометр 11, угловой модулометр 12, генератор

13 гармонических колебаний.

1156126

Для каждого выбранного тона в диапазоне непроизвольных вариаций основного тона накоплением отсчетов входного сигнаIB на отрезках времени, в несколько раз превышающих период тона, со сдвигами, равными этому периоду, и последующим суммированием накопленных отсчетов (благодаря чему происходит их усреднение с периодом основного тона) получают импульсное периодическое колебание, которое потом расфильтровывают Ilo гармоникам полосовыми фильтрами, настроенными на эти гармоники. После фильтрации колебательные составляющие остаются модулированными по ))гл и амплитуде.

Из-зя нестяционярных свойств речи энер-15 гия колебательных составляю(цих пульсирует, Вмc(. 1(с ней пульсирует и отношение сигнал!!Иу м, поэтому амплитудные модуляции импульсных периодических колебаний повышя)о) среднее значение отношения сигнал,шум Выделенн(н о сигнала. Повторные ямплитудныс и угловые модуляции, осуществляемыее после ф ил ьтрации, компенсируloI потери глубины модуляции в поло ()Bhlx фильграх, благодаря чему устанавлива)о fc51 глубины модуляции, соответствуюН!ИЕ МО;(У Л Я ЦИОН НЫМ СII(KTPi! M, ПОМЕХОУCтойчиво характеризующим индивидуальные оттенки звуков речи говорящего.

Первые гармоники пульсаций угла и амплитуды колебаний, Выделенные фильтрами, настроенными ня гармоники основного )О тона, б,!Изкие к формянтам сигнала, характсризук)тся новь!щенной энергией и повышенным значением модуля косинуса сдвига фаз междх ах!11.1итудными и у глОВыми моду i5I«HII IH. Эти колебания особенно важны для слуха при восприятии речи, поэтому их !

)о;1 IepIHBiiio! устанавливая повышенное

lIo о(ношению к другим колебаниям усиление

Испьггания способа показали, что пренебрежение модуляцией колебаний высшими 40 гiiðì()íHêiiìH тона llе сказывается заметно

Hа рязб()ðHèâoñòè и идентифицируемости Bîсстанов.!енной речи, тяк как слоговые перех()ды при модуляциях первой гармоникой

ocll()B1l()I о ()Hd речи восстянявливя)отся с не()б)() IH), ой ди нах! Икой (фиг. 1 ) . 45

Профильтрованные, промодулированныс и Il pop(. N.IHpoBiiííhI(. колебательные

С О С Т и В, 1 H I O l l I H (. М У,. 1 1. 1 H 11. Ч И Ц И Р y К) Т (П О В Т Оряк)т),1151 восстановления .)лительности обрабатываемого сигнала.

Обработка сигнала при нескольких тонях и суммирование полу I(.HIIhlx результатов позволяет восстановить естественные изменения форм почти периодов речевой волны, xoiopiI51 никогда точно не повторя-ТСЯ. 55

Б у(гр()Й(I В ;l, lя Выделения речевого.HI l: l lil llil фо(!с 11(>)!сх блок 1 памяти выполнен состоящим из двух обособленных частей: первая служит для накопления усредненных с периодом тона отсчетов обрабатываемого сигнала, их хранения и воспроизведения, а вторая вЂ” для накопления и хранения обработанных колебательных составляющих выделенного речевого сигнала.

Под действием синхросигналов записи, поступающих из генератора 10 импульсов в блоке 1 памяти формируется совокупность адресов поля записи, в которое вплоть до окончания заданного отрезка времени с суммированием с отсчетами, накопленными за предыдущии период -,îíà, для каждого из выбранных тонов записываются отсчеты обрабатываемого сигнала.

Воспро;.зведение записанных в первой области памяти отсчетов производится периодически и с ускорением благодаря входящему в состав блока 1 памяти буферу, управляемому синхросигналами, поступающими из генератора 10 импульсов. Ускорение воспроизведения позволяет осуществить обработку. колебательных составляющих, соответствующих разным гармоникам разных основных тонов последовательно во времени.

Такая развертка при анализе и синтезе сигнала позволяет сократить число параллельных каналов фильтрации до одного, т. е. использовать только один полосовой фильтр.

Перестройка на разные гармоники основного тона производится с помощью первого управляемого преобразователя 2 частоты.

Ускорение анализа колебательных составляющих позволяет вместе с числом каналов одновременно., обрабатываемых колебательных составляющих сократить и число

Одновременно измеряемых глубин и фаз модуляции. Использование генератора 13 гармонических колебаний, генерирующего квадратур ные колебания позволяет измерять глубины квадратурных составляющих модуляции, которые в виде управляющих сигналов передаются в управляемый аттенюатор 8, а также в модуляторы 4, 6 и 7, куда поступают также и квадратурные составляю цие опорного гармонического сигнала.

После модуляций, фильтрации, регулирования в фильтре 3 с изменяемой рабочей характеристикой и обратного преобразования частоты вторым управляемым преобразователем 9 частоты колебательные составляющие поступают во вторую область памяти блока 1 памяти, где благодаря буферу, входящему в его состав, осуществляется обратное преобразовачие масштаба времени. Далее преобразованные составляющие для одного значения тона мультиплицируются для восстановления длительности сигнала, суммируются с соответствующими

11561

7 составляющими для других выбранных тонов и запоминаются, образуя выделенный сигнал.

Использование изобретения позволяет

26 повысить качество звучания речи, что повышает производительность труда операторов службы связи и контроля фонограмм диспетчерских служб.

Составитель С. Аврин

Редактор С. Тимохина Техред И. Верес Ко рректо р О. Била к

Заказ 3182 49 Тираж 372 Подписное

ВНИИПИ Государственного комитета СССР по делам изобретений и открытий

113035, Москва, Ж вЂ” 35, Раушская наб., д. 4/5

Филиал ППП «Патент», г. Ужгород, ул. Проектная, 4

Способ выделения речевого сигнала на фоне помех и устройство для его осуществления

Дешифратор речи // 726569

Способ и устройство вокодирования переменной скорости при пониженной скорости кодирования // 2146394

Изобретение относится к системе связи и предназначено для выполнения кодирования с линейным предсказанием, возбуждаемого кодом переменной скорости

Система адаптивной фильтрации аудиосигналов для улучшения разборчивости речи при наличии шума // 2163032

Изобретение относится к передаче речи

Устройство распознавания речевых команд в условиях шумов // 2267820

Изобретение относится к радиотехнике

Способ распознавания речевых команд управления // 2271578

Изобретение относится к анализу речи в неблагоприятных условиях окружения

Способ оценки шума с использованием пошагового байесовского изучения // 2370831

Изобретение относится к оценке шума, в частности к оценке шума в сигналах, используемых для распознавания образов

Повышение качества речи с использованием множества датчиков с помощью модели состояний речи // 2420813

Изобретение относится к распознаванию и передаче речи, в частности к способам и устройствам для определения правдоподобия состояния речи на основании сигнала альтернативного датчика и сигнала микрофона, основанного на принципе воздушной проводимости

Способ распознавания речи // 1483481

Спектрополосный анализатор для распознавания речевых команд // 1601634

Изобретение относится к речевой информатике и может быть использовано при распознавании речи

Оптимизация громкости и динамического диапазона через различные устройства воспроизведения // 2631139

Изобретение относится к области обработки аудиосигналов, в частности к обработке потоков битов аудиоданных с метаданными. Технический результат заключается в обеспечении приема потоков битов. Технический результат достигается за счет анализа метаданных, чтобы определять то, действительно ли упомянутые метаданные представляют собой или включают в себя метаданные профиля, указывающие целевой профиль, причем метаданные профиля пригодны для выполнения по меньшей мере одного из управления громкостью, нормализации громкости или управления динамическим диапазоном аудиоданных в соответствии с целевым профилем, и при этом целевой профиль определяет целевую громкость и/или по меньшей мере одну целевую характеристику динамического диапазона, подвергнутой рендерингу версии аудиоданных для воспроизведения устройством воспроизведения аудио из группы устройств воспроизведения аудио. 4 н. и 15 з.п. ф-лы, 17 ил.