Устройство анализа и синтеза речевого сигнала

Авторы патента:

ПРОХОРОВ ЮРИЙ НИКОЛАЕВИЧ

САННИКОВ ВЛАДИМИР ГРИГОРЬЕВИЧ

G10L19/04 - с использованием способов прогнозирования

ОП ИСАНИЕ

ИЗОБРЕТЕНИЯ

К АВТОРСКОМУ СВИДЕТЕЛЬСТВУ

Союз Советских

Социалистических

Республик

<п> 9S0133 (61) Дополнительное к авт. свид-ву (22) Заявлено 06. 02, 81 (21) 3246179/18-10 с присоединением заявки HP

{23) Приоритет

Опубликовано 07. 12.82. Бюллетень М 45

Дата опубликования описания 07. 12. 82

Р М g э

G 01 L 1/00

Государственный комитет

СССР но делам изобретений и открытий

f33) УДК 621. 391, .19(088.8) (72) Авторы изобретения

Ю.Н. Прохоров и В.Г, Санников

Московский ордена Трудового Красного Знамени... электротехнический институт связи (71) Заявитель (54) УСТРОЙСТВО АНАЛИЗА И СИНТЕЗА РЕЧЕВОГО

СИГНАЛА

Изобретение относится к анализу, синтезу и передаче (запоминанию) речевых сигналов и может быть использовано в технике связи, в частности в телефонии, а также в устройствах распознавания образов.

Известны устройства анализа .и синтеза речевых сигналов, в которых выделение параметров речевого сигнала осуществляется на основе корреляционной обработки в предположении, что модель образования сигнала линейка, Синтез речевого сигнала осуществляется посредством перестраиваемого линейного фильтра-предсказателя (1 ) и (2 3

Наиболее близким к предлагаемому по технической сущности является устройство анализа и синтеза речевого сигнала, содержащее в анализаторе фильтр нижних частот, дискретизатор, генератор импульсов, вычислитель параметров линейного фильтрапредсказателя, выделитель периода основного тона и вычислитель тон/шум, в котором вычисляется среднеквадратическое отклонение ошибки предсказания, уплотнитель, который через канал связи соединен с разделителем, В синтезаторе содержатся гене-., ратор импульсов основного тона, ге. нератор шума, фильтр с перестраивае мыми параметрами, который состоит иэ линейного фильтра-предсказателя и сумматора, усилители и фильтр нижних частот (3 3.

Однако в данном устройстве оценка коэффициентов линейного фильтра с перестраиваемыми параметрами и периода импульсов основного тона раздельна, что приводит к неоптимальной обработке речевого сигнала и, как следствие, к уменьшению точности анализа и синтеза. Кроме того, в анализаторе при оценке периода основного тона неизбежны ошибки типа пропусков и появления ложных импульсов, качество синтеза оказывается сравнительно невысоким. цель изобретения вЂ” поВышение точности анализа и синтеза речи эа счет исключения иэ передачи информации об основном .тоне на основе введения нелинейной обработки сигнала.

Поставленная цель достигается тем, что в устройство, содержащее в анализаторе последовательно соединенные фильтр нижних частот и дискретиэатор, генератор импульсов, подЗО ключенный к управляющему входу диск980133 ретизатора, нычислитель тон/шум, соединенный с первым входом уплотнителя, подключенного через канал связи к разделителю, в синтезаторе разделитель, первый выход которого соединен с входом линейного фильтра-предсказателя, подключенного к третьему входу сумматора, четвертый выход разделителя соединен с управляющим входом второго усилителя, вход которого, подключен к выходу генератора шума, а выход вЂ” к первому входу сумматора, нторой вход сумматора соединен с выходом первого усилителя, выход сумматора подключен к входам линейного фильтра-предсказателя и первого фильтра нижних частот, в анализатор введен вычислитель параметров нелинейного предсказания, вход которого соединен с выходом дискретизатора, а три выхода подключены соответственно: первый вЂ” к входу вычислителя тон/шум, второй и третий вЂ” к второму и третьему входам уплотнителя, н синтезатор введены последовательно соединенные второй дополнительный фильтр нижних частот, первый нелинейный преобразователь, линейный сглажинающий фильтр и второй нелинейный преобразователь, при этом вход второго дополнительного фильтра нижних частот соединен с выходом сумматора, выход второго нелинейного преобразователя соединен с входом первого усилителя,управляющий вход которого соединен с третьим выходом разделителя, второй выход разделителя соединен с управляющим входом линейного сглаживающего фильтра и с первым управляющим входом второго нелинейного преобразователя, второй управляющий вход которого подключен к четвертому выходу разделителя.

На фи г . 1 и зображен а блок-схема предлагаемого устройства; на фиг,2 осциллограммы, поясняющие его работу; на фиг.3 и 4 - характеристики второго и первого нелинейных преобразователей соответственно.

Анализатор предлагаемого устройм ства содержит фильтр 1 нижних частот, дискретиэатор 2, генератор 3 импульсов, нычислитель 4 параметров нелинейного предсказания, вычислитель 5 тон/шум, уплотнитель 6, Выходы уплотнителя 6 через канал 7 связи соединены с входом разделителя 8.

Устройство также содержит линейный фильтр-предсказатель 9, второй нелинейный преобразователь 10, сглаживающий фильтр 11, первый усилитель

12, второй усилитель 13, генератор

14 шума, сумматор 15, второй дополнительный фильтр 16 нижних частот, первый фильтр 17 нижних частот и перный нелинейный преобразователь 18

8,ч,<1), i=1,m оценки- функции взаимной корреляции между сигналом йз и его нелиненнзм преобразованием у (Z", З,.;; = „,q, З на сегменте анализа и

8xu Й= g . вЂ” xn Е(2 „5;;1=r+1,0), Ьж 1+.1

r "„= Е: Ь,. г (х„, i=1

На осциллограмме A (фиг.2) изображена изменяющаяся во времени шумовая составляющая на первом входе сумматора 15, вырабатываемая генератором 14 шума с учетом коэффициента усиления усилителя 13 ° На осциллограмме Б изображен сигнал на втором входе сумматора 15, вырабатываемый вторым нелинейным преобразователем 10 с учетом действия, оказынаемого усилителем 12. На осциллограмме В изображен сигнал на выходе сумматора 15. На осциллограмме

Г приведен сигнал, формируемый на выходе сглаживающего фильтра 11, Работа устройства основана на не. линейной модели речеобразования.

Предполагается, что сигнал образуется н соответствии с нелинейным уравнением следующего вида

Щ ХСдЫ„ХС 1+."+СЯ,„Хg + Î f 6;; 1и р+1, j4%g где

"я" (2С М (,,Ь,;1=1+Г,i. )= О

2с

2 = Ь, (х .), rcP;

i=1

Мс вЂ” дискретный белый шум;

1а;),1с1,m- коэффициенты линейного предgp сказания (аналогичные коэффициентам в модели речеобразования известного);

fS;),i=1,r вЂ” коэффициенты сглаживания фильтра1 у5 (Ь;),i=r+1,Ð вЂ” коэффициенты, характеризующие форму и наклон характеристики второго нелинейного преобразователя.

Все параметры сигнала хс, к которым относятся (а;, 1 = l,m, (b;),i=

=1,С, и среднеквадратическое отклонеиие ошибки нелинейного предсказания 4 рассчитываются на основе корреляционной обработки х+ в результате решения нелинейных корреляцион45 ных уравнений

Вхх (") и С1. 8хх <о ""- ам 8хх < -")+ 8p8xy<1)

ВХХ <2)са18ХХ <1)+--. + ат 8Хх <1п- )+ ЬОВху <Я

5р 8хх <1")жа1 8хх (- 1)+.-- m8xx

8хх<1)= g вЂ” хн хи+ п=1

980133

Таким образом, в вычислителе осуществляется расчет корреляционных функций сигнала на сегменте и решение приведенной системы корреляционных уравнений °

Исходный сигнал х ограничивает- 5 ся по спектру частот, дискретиэируется и подвергается анализу, на основе которого вычисляются параметры нелинейной модели в вычислителе параметров нелинейного предсказания и вычислителе тон/шум. Эти параметры уплотняются в уплотнителе б, передаются по каналу 7 связи, разделяются в разделителе 8 и поступают в синтезатор. Синтез К< осуществляется следующим образом, Коэффициенты (а",.1, i = 1,m подаются на линейный фильтрпредсказатель 9 и определяют его состояние. Коэффициент Ь управляет усилением усилителя 12 и полярностью сигнала на его выходе (полярность определяется знаком b ). Коэффициенты Ъ ), i = r+1,9 определяют состояние сглаживающего фильтра 11.

Коэффициенты fb;j, i = r+1,R устанавливают характеристику второго нелинейного преобразователя 10. Величина 6" определяет коэффициент усиления усилителя 13 и используется для подстройки порога а во втором нелинейном преобразователе 10. Выходной сигнал х », наблюдаемый на выходе сумматора 15 (осциллограмма B на фиг.2), сглаживается первым фильтром

17 нижних частот.

Формирование реализации .синтезированного речевого сигнала при Ь» > 0 происходит следующим образом (фиг.2) .

Если в анализируемом сигнале обрабатывается вокализованный сегмент, 4р соответствующий участку типа тон, то величина )b01достаточно велика и поэтому вблизи момента времени на выходе второго нелинейного преобразователя 10 возникает ненулевой 45 сигнал И (осциллограмма Б на фиг.2) при прохождении сигнала (осциллог° рамма Г на фиг.2) через пороговое значение д(фиг.3). Сигнал И воздействует на второй вход сумматора 15, на первый вход которого с выхода генератора шума подается белый шум

W (осциллограмма А на фиг.2), усиленный в соответствии с величиной

6". Так как среднеквадратическое отклонение ошибки предсказания на участке типа тон обычно мало (отношение шум/сигнал около 1%), то и уровень шума относительно мал и не играет существенной роли в формировании х<. На третий вход сумматора 15 воздействует сигнал с выхода линейного фильтра-предсказателя 9, равный нулю в начальный момент времени 2 р. Сигнал х вблизи tp(t=to+L) равен отклику цепй, состоящей иэ 65 сумматора 15 и фильтра-предсказателя

9, на сигнал И и возрастает по уровню (точка на фиг. 2, осциллограмма

В). Одновременно возрастает по уровню сигнал, который пропорционален огибающей сигнала х . Это приводит к убыванию сигнала И на выходе второго нелинейного преобразователя 10 (точка Y на фиг.2, осциллограммы Б и Г и фиг.3). Далее сигнал Z изменяется медленно, так что остается близким к нулю до момента временн

1 (осциллограммы Б и Г на фиг.2) . Таким образом, на участке (t«t„) сиг" нал х" совпадает с откликом цепи, состоящей иэ сумматора 15 и фильтра

9, на импульс с выхода второго нелинейного преобразователя 10 и незначительное шумовое воздействие N<, Так как коэффициенты (а,-), i=1,m определены на сегменте типа тон, то этот отклик носит характерный для вокалиэованных фрагментов речи ос-. циллирующий характер. По мере приближения сигнала Z» к значению

Ф (фиг. 3) и убывания амплитуды R на выходе второго нелинейного преобразователя 10 формируется новый импульс, который после усиления и установки нужной полярности в усилителе 12 вновь поступает на второй вход сумматора 15, и далее процесс повторяется до тех пор, пока х в

)анализаторе обрабатывается на сегменте тон (точки t,t э и t на фиг.2) .

На сегменте типа шум среднеквадратическое отклонение ошибки предсказания возрастает, а коэффициент I bо(уменьшается. Это приводит к тому, что цепь нелинейной обратной связи практически не участвует в формировании х и основную роль иг1 рает сигнал с выхода генератора 14 шума (точки t>, t и t в области времен t t< на фиг.2) .

Предлагаемое устройство по сравнению с известными позволяет повысить точность анализа и синтеза речевого сигнала, при этом качество синтезированного сигнала повышается за счет лучшего воспроизведения основного тона.

Формула изобретения

Устройство анализа и синтеза речевого сигнала, содержащее в анализаторе последовательно соединенные фильтр нижних частот и дискретизатор, генератор импульсов, подключенный к управляющему входу дискретизатора, вычислитель тон/шум, соединенный с первым входом уплотнителя, подключенного через канал связи к разделителю, в синтезаторе вЂ” разделитель, первый выход которого соединен с входом линейного фильтра980133 предсказателя, соединенного с третьнм входом сумматора, четвертый выход. разделителя соединен с управляющим входом второго усилителя, вход которого подключен к выходу генератора шума, а выход - к первому входу сум- 5 матора, второй вход сумматора соединен с выходом первого усилителя, выход сумматора подключен к входам линейного фильтра-предсказателя и первого фильтра нижних частот, о т- 10 л и ч а ю щ е е с я тем, что, с целью повышения точности анализа и синтеза речевого сигнала, в анализатор введен вычислитель параметров нелинейного предсказания, вход которого соединен с выходом дискретиэатора, а три выхода подключены соответственно1 первый - к входу вычислителя тон/шум, второй и третий вЂ” к второму и третьему входам уплотнителя, в синтезатор введены последовательно соединенные второй дополнительный фильтр нижних частот первый нелинейный преобразователь, линейный сглаживающий фильтр и второй нелинейный преобразователь, при этом вход второго дополнительного,фильтра нижних частот соединен с выходом сумматора, выход второго нелинейного преобразователя соединен с входом первого усилителя, управляющий вход которого соединен с третьим выходом разделителя, второй выход разделителя соединен с управляющим входом линейного сглаживающего фильтра и с первым управляющим входом второго нелинейного преобразователя, второй управляющий вход которого подключен к четвертому выходу разделителя, Источники информации, принятые во внимание при экспертизе

1. Atal В,S., Hanaueg S ° I,. Analysis and Synthesis by Linear. Prediction of Speech Wave. I.A,S.A., V. 50, 9 2 (part 2), 1971.

2 ° F. Itakura et al. An Audio

Response Unit Based on Partial

АШосоггеТа 1оп, IEEE Tr. V. C0M-20, Р 4, 1972.

3. Atal В,S. Speech Analysis

and Synthesis by the Use of the

Linear. Prediction of Speech Wave.

oct. 29, 1969, ta ser. 8720516, U.S. cI, 179-15А, 9 3624302.

980133

Фиг. 4

Составитель Б. Поспелов

Редактор Ю. Ковач Техред О. Неце Корректор О. Билак

Заказ 9366/41 Тираж 887 Подписное

ВНИИПИ Государственного комитета СССР по делам изобретений и открытий

113035, Москва, Ж-35, Раушская наб., д. 4/5

Филиал ППП Патент, r. ужгород, ул. Проектная, 4

Устройство анализа и синтеза речевого сигнала

Изобретение относится к речевым кодерам и может использоваться в сотовых системах радиосвязи

Способы и устройства для введения низкочастотных предыскажений в ходе сжатия звука на основе acelp/tcx // 2389085

Изобретение относится к способу введения низкочастотных предыскажений в спектр звукового сигнала, преобразуемого в частотной области и содержащего коэффициенты преобразования, сгруппированные в ряд блоков, в котором вычисляется максимальная интенсивность для одного блока и определяется индекс позиции блока с максимальной интенсивностью, рассчитывается коэффициент для каждого блока, имеющего индекс позиции меньше индекса позиции блока с максимальной интенсивностью, и для каждого блока определяется усиление из коэффициента и применяется к коэффициентам преобразования блока

Способ векторного квантования параметров линейного предсказания // 2408088

Изобретение относится к системе электросвязи, а именно к системам низкоскоростного кодирования речевого сигнала, при котором осуществляется векторное квантование с предсказанием параметров линейного предсказания

Поддиапазонный речевой кодекс с многокаскадными таблицами кодирования и избыточным кодированием // 2418324

Изобретение относится к аудиокодекам, в частности к поддиапазонному кодированию, таблицам кодирования и/или избыточному кодированию

Улучшенная компенсация температуры многопараметрического датчика давления // 2453931

Изобретение относится к области регулирования промышленных процессов и может быть использовано при контроле различного рода оборудования

Способ формирования сигналов управления синтезом речи и устройство для его осуществления // 1043737

Способ кодирования аудиосигнала, способ декодирования аудиосигнала, устройство кодирования, устройство декодирования, система обработки аудиосигнала, программа кодирования аудиосигнала и программа декодирования аудиосигнала // 2482554

Изобретение относится к способам кодирования и декодирования аудиосигнала, устройствам кодировании и декодирования и системе обработки аудиосигнала

Компенсатор и способ компенсации потери кадров звукового сигнала в области модифицированного дискретного косинусного преобразования // 2488899

Изобретение относится к способу и устройству кодирования аудиосигнала и к способу и устройству декодирования аудиосигнала. Сущность состоит в том, что когда кадр, непосредственно предшествующий целевому кадру кодирования, подлежащий кодированию с помощью первого модуля кодирования, работающему согласно схеме кодирования с линейным предсказанием, кодируется с помощью второго модуля кодирования, работающего согласно схеме кодирования, отличной от схемы кодирования с линейным предсказанием, целевой кадр кодирования может быть кодирован согласно схеме кодирования с линейным предсказанием с помощью инициализации внутреннего состояния первого модуля кодирования. Вследствие этого может быть реализована обработка кодирования, выполняемая согласно множеству схем кодирования, включающих в себя схему кодирования с линейным предсказанием и схему кодирования, отличную от схемы кодирования с линейным предсказанием. Технический результат - улучшение качества речи. 7 н.п. ф-лы, 5 ил.

Изобретение относится к способам кодирования и декодирования аудиосигнала, к устройствам кодирования и декодирования и системе обработки аудиосигнала. Сущность способа кодирования заключается в том, что когда кадр, непосредственно предшествующий целевому кадру кодирования, подлежащий кодированию с помощью первого модуля кодирования, работающему согласно схеме кодирования с линейным предсказанием, кодируется с помощью второго модуля кодирования, работающего согласно схеме кодирования, отличной от схемы кодирования с линейным предсказанием, целевой кадр кодирования может быть кодирован согласно схеме кодирования с линейным предсказанием с помощью инициализации внутреннего состояния первого модуля кодирования. Вследствие этого может быть реализована обработка кодирования, выполняемая согласно множеству схем кодирования, включающих в себя схему кодирования с линейным предсказанием и схему кодирования, отличную от схемы кодирования с линейным предсказанием. Технический результат - улучшение качества речи. 7 н.п. ф-лы, 5 ил.