Анализатор речи

 

Изобретение относится к технике передачи информации и может быть использовано в системах телефонной связи для повышения точности анализа параметров речевого сигнала. Цель изобретения - повышение точности анализатора. Анализатор речи содержит спектральные каналы содержащие полосовые фильтры, амплитудные и фазовые детекторы и коммутаторы, а также вычислитель, анализатор фонем, генератор пилообразного напряжения, блок опорных напряжений и блок памяти и позволяет за счет учета фазовых соотношений сигналов на выходах полосовых фильтров более точно анализировать параметры речевого сигнала . 1 з.п. ф-лы, 2 ил. (Л С

СОЮЗ СОВЕТСКИХ

СОЦИАЛИСТИЧЕСКИХ

РЕСПУБЛИК (51)5 G 10 1 7/02

ГОСУДАРСТВЕННЫЙ КОМИТЕТ

ПО ИЗОБРЕТЕНИЯМ И ОТКРЫТИЯМ

ПРИ ГКНТ СССР

ОПИСАНИЕ ИЗОБРЕТЕНИЯ

К АВТОРСКОМУ СВИДЕТЕЛЬСТВУ (54) АНАЛИЗАТОР РЕЧИ

Л (,Ql ОО (л) (21) 4862376/24 (22) 27.08,90 (46) 30.09.92, Бюл. ¹ 36 (72) B.Â.Êoòåíêo, А.П.Глушко; А.И.Бернацкий, С.Н.Александров, С,С.Свистунов и

О.В.Даниленко (56) Назаров М.В., Прохоров Ю.Н. Методы цифровой обработки и передачи речевых сигналов. М.: Радио и связь, 1985.

Фланаген Дж. Анализ, синтез и восприятие речи. И„Связь, 1968.

Оппенхайм А„Лим Дж, Важность фазы при обработке сигналов, — ТИИЭР, 1981, №- 5, с. 39-54.

Рабинер Л.Р„Шафер P.В, Цифровая обработка речевых сигналов. — М.: Радио и связь, 1981.

Сапожков М. А., Михайлов В.Г. Вокодерная связь, — М.: Радио и связь, 1983.

Изобретение относится к технике передачи информации и может быть использовано в системах телефонной связи, Известен анализатор речи (см, Сапожков М. fl., Михайлов В.Г, Вокодерная связь — М,: Радио и связь, 1983), состоящий из полосовых фильтров (ПФ), разделяющих спектр речевого сигнала на частотные полосы, в каждой из которых путем декодирования и сглаживания фильтрами низких частот (ФНЧ) определяется средняя интенсивность речевого сигнала, выделителя основного тона (ВОТ), определяющего параметр основного тона речевого сигнала, выделителя "тон-шум" (BTLLj), определяющего вид спектра (ТОН-ШУМ) речевого сигнала; устройства расстановки кодовых комбинаций

„„. Ж„„1765843 А1 (57) Изобретение относится к технике передачи информации и может быть использовано в системах телефонной связи для повышения точности анализа параметров речевого сигнала. Цель изобретения — повышение точности анализатора. Анализатор речи содержит спектральные каналы содержащие полосовые фильтры, амплитудные и фазовые детекторы и коммутаторы, а также вычислитель, анализатор фонем, генератор пилообразного напряжения, блок опорных напряжений и блок памяти и позволяет за счет учета фазовых соотношений сигналов на выходах полосовых фильтров более точно анализировать параметры речевого сигнала. 1 з,п. ф-лы, 2 ил. (УРКК), преобразующего параллельный код комбинаций в последовательный для ввода их в канал связи, Однако известное устройство имеет низкую точность оценки речевого сигнала.

Причиной этого является то, что при реализации полосных вокодеров в настоящее время анализ речевого сигнала принято осуществлять на основе значений параметров мгновенного спектра амплитуд без учета информации о фазе речевого сигнала. Это объясняется тем, что в инженерной практике принято считать допустимыми потери кратковременных фазовых соотношений, так как органы слуха считаются нечувствительными к изменению фазы восстановлен- ного речевого сигнала, Однако результаты

1765843 проведенных в последнее время исследований показывают, что потери естественных фазовых соотношений оказывают существенное влияние на натуральность восприятия синтезированного в вокодерных 5 системах речевого сигнала (1,2,3).

При передаче речевого сигнала в полосных вокодерных системах его спектр разделяется полосовыми фильтрами на непересекающиеся частотные области 10 (спектральные каналы), Проведенные экспериментальные исследования характеристик -сигналов показали, что сигналы на выходах полосовых фильтров Х (т) представляют собой узкополосные процессы, кото- 15 рые могут быть описаны выражением вида

Х(t)=a< (t)cos(в, t + pj(t)) (1) где а;(т) и p(t) — соответственно огибающая и фаза сигнала i-го спектрального канала; во — частота, соответствующая макси- 20 муму энергии сигнала a i-том спектральном канале, Исследовались сигналы на выходе полосовых фильтров полосного вокодера. Характеристики полосовых фильтров 25 приведены в таблице.

На вход вокодера подавались речевые сигналы, соответствующие фонемам русской речи. Регистрация сигналов спектральных каналов производилась осциллографом 30

С 8-17, Схема экспериментальной установки приведена на фиг. 1.

На фиг. 2,3,4 показаны эпюры сигналов первого спектрального канала для фонемы

"а" (безударное) (рис. 2), седьмого спект- 35 рального канала для фонемы "к" (рис. 3) и одиннадцатого спектрального канала для фонемы "о" (рис. 4) и др.

Аналогичные результаты получены при

40 исследовании сигналов спектральных каналов для всей совокупности фонем русского языка, приведенной в (1). Анализ полученных результатов показывает справедливость представления сигналов на выходах полосовых фильтров в виде (1). Это показы- 45 вает, что в извЕстном устройстве анализ сигналов Xi(t) на выходах полосовых фильтров проводится недостаточно полно, так как анализируется только огибающая a;(t) без учета фазовых соотношений cos(и) ;т+ Pt)), что обуславливает недостаточную точность анализа параметров речевого сигнала, Цель изобретения — повышение точности анализа параметров речевого сигнала путем учета фазовых соотношений сигналов на выходах полосовых фильтров.

Поставленная цель достигается тем, что . в анализатор речи, содержащий N спектральных каналов, в каждом из которых соединены полосовой фильтр, амплитудный детектор, входы которых соединены со входами анализатора речи, а выходы со входами устройства расстановки кодовых комбинаций, выход которого подключен к каналу связи, дополнительно введены анализатор фонем, вход которого соединен со входом анализатора речи, генератор пилообразного напряжения, управляющий вход которого соединен с пятым выходом блока анализа фонем, блок опорных напряжений, блок памяти информационные входы которого соединены с первым, вторым и третьим выходами блока анализа фонем, вычислитель, а каждый спектральный канал дополнительно содержит фазовый детектор, вход которого соединен с выходом полосового фильтра, и коммутатор, управляющие входы которого соединены с выходами генератора пилообразного напряжения и блока опорных напряжений, а информационные входы подключены к выходам амплитудного детектора и фазового детектора, информационные входы вычислителя соединены с выходами коммутаторов и выходом блока анализа фонем, а выходы соединены с входами блока памяти, выходы которого соединены со входами преобразователя параллельного кода в последовательный.

Существенными отличительными признаками устройства являются дополнительно введенные анализатор фонем, блок памяти, генератор пилообразного напряжения, блок опорных напряжений, вычислитель, а в каждом спектральном канале— фазовый детектор и коммутатор.

Наличие в предлагаемом устройстве существенных признаков, являющихся отличительными в совокупности с признаками прототипа позволяет достичь положительный эффект, заключающийся в повышении точности анализа параметров речевого сигнала путем учета фазовых соотношений сигналов на выходах полосовых фильтров.

На фиг, 5 представлена функциональная схема предлагаемого устройства, на фиг. 6 — функциональная схема коммутатора,Устройство содержит N спектральных каналов 1, в каждом из которых соединены полосовой фильтр 2, вход которого соединен со входом анализатора речи, а выход— со входом фазового детектора 3 и входом амплитудного детектора 4, выход каждого из которых соединен с информационными входами коммутатора 5; анализатор фонем

7, вход которого соединен со входом анализатора речи; генератор 8 пилообразного напряжения, управляющий вход которого соединен с пятым выходом анализатора фо1765843

55 нем 7, а выход — с одним из управляющих входов коммутаторов 5; блок опорных напряжений 9, выходы которого соединены с управляющими входами коммутаторов 5; вычислитель 6, информационные входы которого соединены с четвертым выходом анализатора фонем 7 и с выходами коммутаторов 5; блок памяти 10, информационные и управляющие входы которого соединены с выходами вычислителя 6, а также информационные входы — с первым, вторым и третьим выходами анализатора фонем 7; преобразователь 11 параллельного кода в последовательный, входы которого соединены с выходами блока памяти 10, а выход — со входом цифрового канала связи.

Устройство работает следующим образом. Речевой сигнал поступает на входы полосовых фильтров 2 спектральных каналов и вход анализатора фонем 7. Паласовые фильтры разделяют спектр речевого сигнала на непересекающиеся частотные полосы спектральных каналов. С выходов полосовых фильтров сигнал поступает на входы амплитудного 4 и фазового 3 детекторов, которые соответственно выделяют значение огибающей и фазы речевых сигналов спектральных каналов. Анализатор фонем 7 по первому выходу выдает значение параметра основного тона на длительности фонемы (4), по второму выходу — значение параметра, определя ощего вид спектра (тон-шум) речевого сигнала (5), по третьему выходу — код фонемы (5) и по четвертому выходу — моменты начала и конца длительности фонемы (5). Сигнал с пятого выхода анализатора фонем 7 запускает генератор пилообразного напряжения 8, который вырабатывает пилообразное напряжение последовательно поступающее на входы компараторов 12 коммутатора 5 спектрального канала, на вторые входы которых поступает опорное напряжение с выхода блока опорных напряжений 9, При равенстве этих напряжений компараторы 12 последовательно вырабатывают управляющие импульсы, которые открывают ключи первой 13 и второй 14 группы коммутатора, что обеспечивает последовательное поступление на первый 15 и второй 16 аналого-цифровые преобразователи коммутатора значений ординат огибающих и фаз сигналов спектральных каналов, соответствующих заданным временным задержкам, Первый 15 и второй 16 аналого-цифровые преобразователи производят и реобразование поступивших на их входы сигналов в цифровую форму. Одновременно управляющие импульсы с выходов компараторов 12 последовательно поступают на входы триг5

45 геров 17 коммутатора, обеспечивая их срабатывание. Сигналы с выходов триггеров 17 открывают ключи третьей 18 и четвертой 19 группы коммутатора, что обеспечивает последовательное подключение выходов первого 15 и второго 16 аналого-цифровых преобразователей к соответствующим входам вычислителя 6. Вычислитель 6 производит оценку ординат спектра речевого сигнала по ранее рассмотренному алгоритму:

ni

Gxj(jw) = g Kj(kroj)h(leо!Ясоаср(Ьо|))

k =1

ni COS((Cup! jap)lao!) g Kj(kZоo!)h(i

k=1

M (sinp(kro,))sin((à; — )и,)!г,!) +

ni

+ g K,j(ktpj)h(kzpj)M (сового!))соя((во! +

k =1 и!

+ j®o)i pl) „Ка!(1 го!)"фго!)1 1

k=1 (sinp(kj"oj))sin((m„+ jcuо)la„i) где roj — период дискретизации z в 1-м спектральном канале, flj — число выборок в i-м спектральном канале, жо — шаг квантования по частоте, i — номер спектрального канала, определяемый из условия 1 = 1, если жн! jNo < вм, где и„! и вь! — соответственно нижняя и верхняя граничные частоты 1-го спектрального канала, Полученные в вычислителе 6 значения передаются в блок памяти 10, где осуществляется их запоминание на длительность фонемы, а по сигналу с анализатора фонем

7 через вычислитель 6 о конце фонемы — они поступают на входы преобразователя параллельного кода в последовательный 11, который преобразует параллельный код в последовательный и обеспечивает передачу этой информации в цифровой канал связи (в (5) преобразователь параллельного кода в последовательный назван устройством расстановки кодовых комбинаций).

Таким образом, предлагаемое устройство позволяет повысить точность анализа параметров речевого сигнала путем учета фазовых соотношений сигналов на выходах полосовых фильтров.

Формула изобретения

1. Анализатор речи, содержащий преобразователь параллельного кода в последовательный и спектральные каналы, каждый из которых содержит паласовой фильтр, выход которого соединен с входом амплитудного детектора, входы полосовых фильтров являются входом анализатора, а выход преобразователя параллельного кода в последовательный является выходом

1765843 анализатора, отличающийся тем, что, с целью повышения точности анализатора, в него введены анализатор фонем, блок памяти, генератор пилообразного напряжения, блок опорных напряжений и вычислитель, а каждый спектральный канал дополнительно содержит фазовый детектор и коммутатор, управляющие входы которого соединены с выходами блока опорных напряжений и генератора пилообразного напряжения, а информационные входы подключены к выходам амплитудного детектора .и фазового детектора, вход которого соединен с выходом полосового фильтра, информационные входы вычислителя соединены с выходами блоков коммутации и выходом анализатора фонем, а выходы соединены с управляющими входами преобразователя параллельного кода в последовательный и блока памяти, информационные входы которого соединены с выходами вычислителя и анализатора фонем, один из выходов которого соединен с управляющим входом генератора пилообразного

5 напряжения.

2. Анализатор по и. 1, о тл и ч а ю щ и йс я тем, что блок коммутации содержит ком. параторы, входы которого являются управляющими входами блока, а выходы

10 подключены к первым входам ключей первой, второй групп, вторые входы которых являются информационными входами блока, а выходы через соответственно первый и второй аналого-цифровой преобразовате15 ли соединены с первыми входами ключей соответственно третьей и четвертой групп, выходы которых являются выходами блока, а вторые входы соединены с выходами триггеров, входы которых соединены с выхода20 ми соответствующих компараторов, 1765843

1765843

Составитель В.Котенка

Редактор Т.Орловская Техред М.Моргентал Корректор Э.Лончакова

Заказ 3386 Тираж Подписное

ВНИИПИ Государственного комитета по изобретениям и открытиям при ГКНТ СССР

113035, Москва, Ж-35, Раушская наб., 4/5

Производственно-издательский комбинат "Патент", г, Ужгород, ул.Гагарина, 101

Анализатор речи Анализатор речи Анализатор речи Анализатор речи Анализатор речи Анализатор речи 

 

Похожие патенты:

Изобретение относится к области приборостроения и может быть использовано в медицине для оценки лечения больных с патологией речи

Изобретение относится к речевой акустике и может быть использовано при проектировании систем автоматического распознавания и синтеза звуковых волн, являющихся носителями речевой информации
Наверх