Способ анализа и синтеза речи и устройство для его осуществления

 

Изобретение может быть использовано в системах вокодерной телефонии . Цель изобретения - повьш)сиие качества синтеза речи. Устройство, реализующее способ, состоит из источника 1 речевого сигнала, анализатора 2, канала 3 связи и синтезатора 4, фильтров 5 и 19 нижних частот, аналого-цифровых преобразователей 6 и 18 тактового генератора 7, бттоков 8 и 11 быстрого преобразования Фурье, детектора 9 высоты тона, генератора 10 сигналов возбуждения, блока 12 умножения, накапливающего сумматора 13, кодера 14, декодера 15, генератора 16 сигналов возбуждения и цифрового фильтра 17. Введение новых элементов и образование новых связей между элементами устройства позволяют достичь поставленную цель путем фильтрации сигнала возбуждения фильтром с передаточной характеристикой, зависящеГ от спектральной огибающей исходного речевого сигнала и обеспечинлю це11 минимальную ошибку его восстановления . Определение параметров спектральной огибающей исходного речевог о сигнала по взаимному спектру исходного речевого сигнала и сигнала возбуждения позволяет учесть конкретный вид сигнала возбуждения так, что минимизируется ошибка синтеза речевого сигнала. 2 с.п.ф-лы, 2 ил. о (Л 5 № со 05 О со I . л/г./

СОЮЗ СОВЕТСНИХ

СОЦИАЛИСТИЧЕСКИХ

РЕСПУБЛИН

„„SU,1316030

А1 (51) 4 С 10 1 7/06

Ф г, ю

OllHCAHHE ИЗОБРЕТЕНИЯ

К А ВТОРСКОМУ СВИДЕТЕЛЬСТВУ

CO

СА:1

С0

ГОСУДАРСТВЕННЫЙ НОМИТЕТ СССР

ПО ДЕЛАМ ИЗОБРЕТЕНИЙ И ОТКРЫТИЙ (21) 4002 91 8/24-1 О (22) 06, 01. 86 (46) 07.06,87. Бюл. ¹ 21 (71) Акустический институт им. акад.Н,Н.Àíäðååâà (72) 10,В.Захаров (53) 534.782 (088,8) (56) Авторское свидетельство СССР

¹ 570082, кл. С 10 L 7/06, 1977 °

Патент Великобритании № 1485803, кл. С 01 L 7/06, 1974, (54) СПОСОБ АНАЛИЗА И СИНТЕЗА РЕЧИ

И УСТРОЙСТВО ДЛЯ ЕГО ОСУЩЕСТВЛЕНИЯ (57) Изобретение может быть использовано в системах вокодерной телефонии, Цель изобретения — повышение качества синтеза речи, Устройство, реализующее способ, состоит из источ— ника 1 речевого сигнала, анализатора 2, канала 3 связи и синтезатора 4, фильтров 5 и 19 нижних частот, аналого-цифровых преобразователей 6 и 18 тактового генератора 7, блоков

8 и 11 быстрого преобразования Фурье, детектора 9 высоты тона, генератора

10 сигналов возбуждения, блока 12 умножения, накапливающего сумматора

13 кодера 14, декодера 15, генерато— ра 16 сигналов возбуждения и цифрового фильтра 17. Введение новых элементов и образование новых связей между элементами устройства позволяют достичь поставленную цель путем фильтрации сигнала возбуждения фильтром с передаточной характеристикой, зависящей от спектральной огибающей исходного речевого сигнала и обеспечивающей минимальную ошибку его восстановления ° Определение параметров спектральной огибающей исходного речевого сигнала по взаимному спектрч исходного речевого сигнала и сигнала возбуждения позволяет учесть конкретный вид сигнала возбуждения так, что минимизируется ошибка синтеза речевого сигнала. 2 с,п.ф-лы, 2 ил.

1316030

Изобретение относится к анализу и синтезу речи и может быть использовано в системах вокодерной телефонии.

Пель изобретения — повышение качества синтеза речи путем фильтрации сигнала возбуждения фильтром с передаточной характеристикой, зависящей от спектральной огибающей исходного речевого сигнала и обеспечивающей минимальную ошибку е о восстановле10 ния

Сущность способа заключается в

t5 следующем.

Исходный речевой сигнал разбивают лс ioII.lTE л -ность коротких импульсов, п»pI» 1д следования которых является п»риодом основного тона, а для невокализоваших сегментов — псевдослу35 чаиная и< следонательность импульсов, По сигналу возбуждения определяют комплексно-сопряж»нный спектр сигна-, ла возбуждения Р (ь „), k = О, М- l, 40 где « — знак сопряжения, Перемножая слектр исходного речевого сигнала и комплексно-сопряженный спектр сигнала возбуждения, получают взаимный спектр этих сигналов s(iu )

Х(w ) P (w ), Параметры г. спект Х М тm ральной огибающей исходного речевого сигнала определяют путем усреднения взаимного спектра s (ы,) в разных интервалах частот

М-1 — (ur>)s (ы,), m = 1,N, Хо где N — число параметров спектральной огибающей исходного речевого сигнала, а весовые функции V (ш„) принимают постоянные значения в неперекрываю55 щихся интервалах частот на отдельные сегменты.

Исходньп речевой сигнал разбивают на отдельные сегменты. В течение каждого сегмента определяют спектр исходного речевого сигнала х (

Bo á жления, Для вокализованных сегмснтон сигнал возбуждения — это пос1,

К (ы )

О, для других k, Числа определяют граничные частоты при выделении параметров Г

rm.

0<4 <4 с 4 <,, ° <) <

О.WxIII

2 N-a н

Параметры сигнала возбуждения (параметр тон/шум и период основного тона) и параметры ) m 1, полученные при анализе, передают в синтезатор, где на основании принятых данных формируют сигнал возбуждения, который в точности совпадает с сигналом возбуждения, формируемым при анализе, Затем сигнал возбуждения фильтруют в соответствии с параметрами спектральной огибающей исходного речевого сигнала ° Передаточная функция фильтра, -используемого для фильтрации сигнала возбуждения, определяется выражением

Н(a ) = < „,Ч,„(<>Х), Щ=1 где С„, =,„ /а„;

М-1

А„= /Р(ы„)/ а (ы ), 1=о

При такой передаточной функции

Н4. Х) параметры E обеспечивают миEm нимиэацию ошибки

Е = /х(и ) — х (и ) /2

Х=о л где x(w ) — спектр синтезированноk го речевого сигнала х(м ) = Р(и> )Н(оз„).

На фиг,l изображена структурная схема устройства для анализа и синтеза речи: на фиг.2 — структурная схема цифрового фильтра.

Устройство состоит из последовательно включенных источника 1 речевого сигнала, анализатора 2, канала

3 связи и синтезатора 4, Анализатор

2 содержит фильтр 5 нижних частот, аналого-цифровой преобразователь (AUD) 6, тактовый генератор 7, первый блок 8 быстрого преобразования

Фурье (БПФ), детектор 9 высоты тона, генератор 10 сигналов возбуждения, второй блок 11 БПФ, блок 12 умножения, накапливающий сумматор 13 и ко3 дер 14. Синтезатор 4 содержит последовательно соединенные декодер 15, генератор 16 сигналов возбуждения, цифровой AHJIbTp 17, цифроаналоговый преобразователь (ЦАП) 18 и фильтр 19 нижних частот.

Цифровой фильтр 17 содержит последовательно включенные блок БПФ 20, квадратор 21, накапливающий сумматор 22, блок 23 деления, блок 24 умножения и блок 25 обратного БПФ.

Устройство для анализа и синтеза речи работает следующим образом.

Исходный речевой сигнал с выхода источника 1 речевого сигнала фильтруется в фильтре 5 нижних частот и поступает на вход АЦП 6, управляемого тактовым генср»тором 7. Цифровые отсчеты x., i = О, Г1-1 с выхода

АЦП 6 поступают в первый блок 8 БПФ и на вход детектора 9 высотьl тона.

В первом блок 8 БПФ вычисляется спектр исходного речевого сигнала м-1wk т х(ц ) = с хе

I=0

k = О, Г1-1, = 1-1;

131 на частот»х „= 37il k/Г!Т, где Т период взятия отсчетов в ЛЦП 6, Де— тектор 9 высот«I тона измеряет параметры сигнала возбуждения: параметр тон/шум и период основн..го тона, В соответствии с цар»метром тон/ шум генератор 10 сигналов возбуждения формируеT либо цифровую последовательность импульсов с периодом повторения, равным измеренному периоду основногo тона, либо псевдослучайную цифровую послед в»тельность импульсов, С выхода генератора 10 сиги»лов возбу:децця цифровые отсчеты

Р, i = О, Г! — 1 поступают во второй блок )1 БПФ, в котором вычисляется спектр сигнала возбуждения м-jAI т

P(wÄ) = Р; е =o

С выходов первого 8 и второго 11 блоков БПФ на входы блока 12 умножения последоватепьно во времени поступают цифровые отсчеты х(и. ) и

P(wk) . В блоке 2 умножения зти отсчеты перемножаются, и на вход накапливающего сумматора 13 последовательно во времени поступают отсчеты взаимного спектр» исходного речевого сигнала и си «»ла возбуждения

4)

Блок 12 умножения можно выполнить в виде обыкновенного цифрового умножителя, В этом случае на его первый вход с выхода первого блока

8 БПФ цифровые отсчеты действительных ;; (, ) и мнимых Ь (и ) состав") k У k ляющих спектра х(1 ) исходного ре4 чевого сигнала должны поступать в следующем порядке:... à „(vk), 10 Ь„(ц>„), а„(в„„)... и т.д, С выхода второго блока 11 БПФ цифровые .отсчеты действительных ар(ю ) и мнимых

Ь (u k) составляющих спектра P(wk) сигнала возбуждения должны поступать

15 в следующем порядке:... а p(wk), Ь (ы), а (III ), b, (w), а,(ы„,, )..., т.е. составляющие для каждой частоты ц должны поступать в блок умноk жения дважды. При этом на, выходе бло20 ка умножения последовательно во времени образуются произведения ...а„(„) а р(> ), а„(ы„)" р(ы ), Для каждого k в накапчивающем сумматоре 13 вычисляются две суммы

Lа,.(Fly) а (4Fk) + Ь,(м„)Ьр (ы„)); (Ь„(,,)»,(w„) — а,(„)ьр(„), 30 являющиеся соответственно действительной и мнимой составляющими Flpou ll едения спектров х(ч ) P (w ) на

«»c ToTe ш1, и суммируются по всем

35 k при „,.„< k

40 м- (ink) s(gi ), m = I,N, k=n

П»раметры „, поступают с выхода н»кап ив»ющего сумматора 13 на один

45 из входов кодера 14. На другой его вход с выхода детектора 9 высоты тон» поступают параметры сигнала возбуждения, Кодер 14 совместно с декодером 15 обеспечивают передачу этих

50 п»раметров по каналу 3 связи, включенному между анализатором 2 и синтезатором 4, С первого выхода декодера 15 на вход генератора 16 сигналов возбуждения поступают параметры тон/шум и период основного тона, Генератор 16 сигналов возбуждения в синтезаторе 4 выполнен идентично генератору 10 сиг1316030

/P(w )/

1а-Vm ° 1

40

50 х(ш„) Р(ш„) Н(ы„) налов возбуждения в анализаторе 2, В соответствии с входными параметрами генератор 16 сигналов возбуждения в синтезаторе 4 формирует в точности такую же последовательность цифровых отсчетов P., i = О, М-1, как генератор 10 сигналов возбуждения в анализаторе 2. Эта последовательность поступает в цифровой фильтр 17 на вход блока 20 БПФ. В последнем вы- 10 с числяется спектр сигнала возбуждения

Р(ы ), k = О, M-1. С выхода блока

20 БПФ на вход квадратора 21 поочередно поступают цифровые отсчеты действительной а („) и мнимой Ь,)(ы„) 15 составляющих спектра Р(„) сигнала возбуждения ...а (м, „ ), bp(IÄ ), а,(с )) Ъ (ы,))... . В квадраторе 21 эти составляющие возводятся в квадрат и поступают затем в накапливаю- 20 щий сумматор 22, где вычисляются коэффициенты

<) а = с (а, (wIÄ) + Ьр („)j

1с = 25

М.1 (wk)/P((d )/ ) m = 1)N. k*O

Цифровые отсчеты а с выхода накапливающего сумматора 22 поступают на первый вход блока 23 деления, на второй вход которого с второго выхода декодера 15 поступают параметры () m = 1)N В блоке деления параметры F нормируются на отсчеты а, и с его выхода на первый вход

Ih блока 24 умножения поступают коэффициенты С = f „ /а, В блоке умножения спектр сигнала возбуждения

P((u„) умножается в каждом из диапазонов частот ы 11 (ш < 1 на свой коэффициент С, в результате чего на его выходе формируется произ— ведение спектра сигнала возбуждения

Р(м„) на передаточную функцию х

H(w ) = Q С„, (u)„) т,е. спектр синтезированного речевого сигнала дов всех частот ш, k = 0, о-I . Величины x(w ) с выхода блока 24 умножения поступают на вход блока обратного БПФ) вычисляющего цифровые отсчеты х, i = О, M-1 синтезированного речевого сигнала, которые далее преобразуются в ЦАП 18 в непрерывный сигнал и затем фильтруются в фильтре 19 нижних частот, в результате чего на выходе фильтра 19 нижних частот образуется синтезированный речевой сигнал.

Таким образом, определение параметрОв спектральной огибающей исходного речевого сигнала по взаимному спектру исходного речевого сигнала и сигнала возбуждения позволяет учесть конкретный вид сигнала возбуждения так, что минимизируется ошибка синтеза речевого сигнала, -..е, повышается качество синтеза речи.

Например, на вокализованном сегменте речи в m-й полосе аналиэируемых частот могут оказаться две гармоники сигнала возбуждения, однако ошибки в воспроизведении спектральной плотности речевого сигнала, выражающейся в том, что синтезированный речевой сигнал мог бы иметь в этой полосе частот спектральную плотность в 2 раза больше, чем у исходного речевого сигнала, не произойдет ввиду учета сигнала возбуждения, Формула изобретения

1. Способ анализа и синтеза речи, в котором при анализе исходный речевой сигнал разбивают на отдельные сегменты, на каждом сегменте определяют параметры сигнала возбуждения, формируют сигнал возбуждения, определяют параметры спектральной огибающей исходного речевого сигнала, передают параметры, определенные при анализе, принимают эти параметры, формируют сигнал возбуждения, в точности совпадающий с сигналом возбуждения, формируемым при анализе, и синтезируют искусственный речевой сигнал путем фильтрации сигнала возбуждения в соответствии с параметрами спектральной огибающей исходного речевого сигнала, о т л и ч а ю— шийся тем, что, с целью повышения качества синтеза речи, при ана1316030

30 лизе находят спектр исходного речевого сигнала и комплексно-сопряженный спектр сигнала возбуждения, перемножают спектр исходного речевого сигнала и комплексно-сопряженный спектр сигнала возбуждения, а параметры спектральной огибающей исходного речевого сигнала находят путем усреднения произведения спектра исходного речевого сигнала и комплексно-сопряженного спектра сигнала возбуждения в различных непересекающихся интервалах частот.

2. Устройство для анализа и синтеза речи, содержащее последовательно включенные источник речевого сигнала, анализатор, канал связи и синтезатор, состоящий иэ последовательно соединенных декодера, вход которого является входом синтезатора, генератора сигналов возбуждения,цифрового фильтра, управляющий вход которого соединен с вторым выходом декодера, цифроаналогового преобразователя и фильтра нижних частот, выход которого является выходом синтезатора, причем анализатор содержит последовательно включенные фильтр нижних частот, вход которого является входом анализатора, аналого-цифровой преобразователь, управляющий вход которого соединен с выходом так тового генератора, детектор высоты тона, выход которого соединен с входом генератора сигналов возбуждения и первым входом кодера, выход которого является выходом анализатора, о т л и ч а ю щ е е с я тем, что, с целью повышения качества синтеза речи, в анализатор введены первый блок быстрого преобразования Фурье, вход которого соединен с входом детектора высоты тона, и последователь. но соединенные второй блок быстрого преобразования Фурье, вход которого соединен с выходом генератора сигналов возбуждения, блок умножения, второй вход которого соединен с выходом первого блока быстрого преобразования Фурье, и накапливающий сумматор, выход которого соединен с вторым входом кодера ° а цифровой фильтр выполнен в виде последовательно соединенных блока быстрого преобразования Фурье, вход которого является информационным входом цифрового фильтра, квадратора, накапливающего сумматора, блока деления, второй вход которого является управляющим входом цифрового фильтра, блока умножения, второй вход которого соединен с выходом блока быстрого преобразования

Фурье, и блока обратного быстрого преобразования Фурье, выход которого является выходом цифрового фильтра.

1316030

Составитель С.Аврин

Техред J1.0ëèéíûê

Корректор Л. Пилипенко

Редактор 0 ° Головач

Заказ 2368/54

Тираж 345 Подписное

ВНИИПИ Государственного комитета СССР по делам изобретений и открытий

113035, Москва, Ж-35, Раушская наб., д.4/5

Производственно-полиграфическое предприятие, г.Ужгород, ул.Проектная, 4

Способ анализа и синтеза речи и устройство для его осуществления Способ анализа и синтеза речи и устройство для его осуществления Способ анализа и синтеза речи и устройство для его осуществления Способ анализа и синтеза речи и устройство для его осуществления Способ анализа и синтеза речи и устройство для его осуществления Способ анализа и синтеза речи и устройство для его осуществления 

 

Похожие патенты:

Изобретение относится к те.хнике анализа и синтеза звуковы.ч волн и позволяет новысить точность спектрального анализа

Изобретение относится к технике обработки сигналов для-речевой-информатики при регистрации и нормализации речевых сигналов

Изобретение относится к те.хнике анализа и синтеза звуковы.ч волн и позволяет новысить точность спектрального анализа

Изобретение относится к технике автоматизации систем голосового управления промышленными Входы объектами и позволяет повысить информативность обнаружения гра- i ниц слов

Изобретение относится к речевой информатике
Наверх