Способ разделения джиттера периода основного тона речевого сигнала

Изобретение относится к области анализа речевых сигналов, а именно к анализу и разложению на составляющие джиттера периода основного тона речевого сигнала. Техническим результатом является создание способа разделения джиттера основного тона речевого сигнала на случайную и периодическую составляющие с помощью спектрального метода. Указанный технический результат достигается тем, что определяют на каждом кадре речевого сигнала значение периода основного тона, вектор значений основного тона сохраняют в виде сигнальных векторов, затем по сигнальным векторам определяют функции ошибок временных интервалов, вычисляют усредненный спектр ошибок временных интервалов путем усреднения амплитуд спектральных составляющих спектров функции ошибок временных интервалов соседних сигнальных векторов, формируют массив частот FP, соответствующий частотам пиковых значений амплитуд в усредненном спектре ошибок временных интервалов, вычисляют модифицированный спектр периодического джиттера на частотах FP с амплитудами усредненного спектра ошибок временных интервалов и фазами спектра ошибок временных интервалов, вычисляют временную последовательность периодического джиттера путем обратного преобразования Фурье от модифицированного спектра периодического джиттера, вычисляют модифицированный спектр случайного джиттера путем подстановки на частотах FP амплитуды, равной корню квадратному из разности усредненной спектральной плотности мощности и квадрата модуля усредненного спектра ошибок временных интервалов, и случайной, равномерно распределенной фазы. 3 ил.

 

Предлагаемое техническое решение относится к области анализа речевых сигналов, а именно к анализу джиттера периода основного тона речевого сигнала и разложению джиттера на его составляющие, и может быть использовано в низкоскоростных кодеках речевого сигнала и в системах распознавания речи.

Известны способы разделения джиттера сигнала (данных) (см., например, патент US 7254168 B2 от 07.08.2007, патент US 6832172 B2 от 14.12.2004, патент US 6898535 B2 от 24.05.2005). Известные аналоги восстанавливают неизвестные значения в последовательности ошибок временных интервалов путем использования интерполяции по ближайшим известным значениям. Их общим недостатком является низкая точность оценки составляющих (периодического и случайного) общего джиттера, а также невозможность использования для анализа джиттера основного тона речевого сигнала.

Наиболее близким по технической сущности к заявляемому способу и выбранным в качестве прототипа является способ разделения джиттера сигнала данных (заявка на изобретение №2008126594 от 30.06.2008), заключающийся в том, что получают и сохраняют входной сигнал в виде сигнальных векторов, формируют функцию исходной структуры данных первого сигнального вектора, для каждого последующего сигнального вектора, следующего за первым сигнальным вектором, вычисляют функцию структуры данных, производят временной сдвиг функции структуры данных для выравнивания по оси времени с функцией исходной структуры данных первого сигнального вектора, вычисляют первую функцию ошибок временных интервалов, вычисляют функцию усредненной ошибки временных интервалов как скользящее среднее первых функций ошибок временных интервалов, определяют параметры джиттера, зависящего от данных, вычисляют вторую функцию ошибок временных интервалов путем вычитания функции усредненной ошибки временных интервалов из первой функции ошибок временных интервалов, вычисляют третью функцию ошибок временных интервалов путем подстановки нулевых значений во вторую функцию ошибок временных интервалов в интервалах, не имеющих переходов состояний входного сигнала, выполняют прямое дискретное преобразование Фурье от третьей функции ошибок временных интервалов, вычисляют усредненный спектр третьей функции ошибок временных интервалов путем усреднения амплитуд спектральных составляющих спектров третьих функций ошибок временных интервалов соседних сигнальных векторов, формируют массив частот FP2, соответствующий частотам амплитудных пиков в усредненном спектре третьей функции ошибок временных интервалов, формируют модифицированный спектр третьей функции ошибок временных интервалов путем обнуления амплитуд на частотах, не вошедших в массив FP2, выполняют обратное дискретное преобразование Фурье от модифицированного спектра третьей функции ошибок временных интервалов, подсчитывают количество изменений состояния входного сигнала в сигнальном векторе, вычисляют коэффициент усиления модифицированной третьей функции ошибок временных интервалов путем деления длины сигнального вектора на количество изменений состояния входного сигнала в сигнальном векторе, усиливают модифицированную третью функцию ошибок временных интервалов, формируют функцию ошибок временных интервалов путем подстановки в интервалы второй функции ошибок временных интервалов, не имеющих переходов состояний входного сигнала, значений из соответствующих интервалов модифицированной третьей функции ошибок временных интервалов, выполняют прямое дискретное преобразование Фурье для перевода функции ошибок временных интервалов в частотную область, вычисляют усредненный спектр ошибок временных интервалов путем усреднения амплитуд спектральных составляющих спектров функции ошибок временных интервалов соседних сигнальных векторов, формируют массив частот FP, соответствующий частотам пиковых значений амплитуд в усредненном спектре ошибок временных интервалов, вычисляют модифицированный спектр периодического джиттера на частотах FP с амплитудами усредненного спектра ошибок временных интервалов и фазами спектра ошибок временных интервалов, вычисляют временную последовательность периодического джиттера путем обратного преобразования Фурье от модифицированного спектра периодического джиттера, вычисляют гистограмму временной последовательности периодического джиттера, определяют размах значений периодического джиттера по гистограмме, вычисляют усредненную спектральную плотность мощности функции ошибок временных интервалов путем усреднения квадратов амплитуд спектральных составляющих спектров функции ошибок временных интервалов соседних сигнальных векторов, вычисляют модифицированный спектр случайного джиттера путем подстановки на частотах FP амплитуды, равной корню квадратному из разности усредненной спектральной плотности мощности и квадрата модуля усредненного спектра ошибок временных интервалов, и случайной, равномерно распределенной фазы, выполняют обратное преобразование Фурье от модифицированного спектра случайного джиттера, вычисляют среднеквадратическое отклонение значений случайного джиттера, принимают решение о дальнейшем усреднении результатов.

Недостатком способа-прототипа является невозможность его использования для анализа джиттера периода основного тона речевого сигнала, обусловленная следующими причинами.

1) В способе-прототипе под джиттером понимается отклонение показательных участков цифрового сигнала (например, фронтов) от своих идеальных положений во времени [Рекомендация МСЭ-Т 0.172]. Поэтому первую функцию у ошибок временных интервалов определяют как отклонение значащих участков сигнала от своих идеальных положений во времени. В области анализа речевого сигнала под джиггером периода основного тона следует понимать изменение данного периода на длительности кадра анализа и определять его соответствующим образом.

2) В способе-прототипе сигнальные вектора определяются двоичной последовательностью входного сигнала данных. При анализе джиттера периода основного тона сигнальные вектора должны определяться значениями данного периода, определенными на каждом кадре речевого сигнала.

В задачах анализа речевого сигнала (при его кодировании) достаточно часто возникает ошибка определения вокализации кадра речи, связанная с наличием коротких изолированных тонов (Дж.Д.Маркел, А.X.Грей. Линейное предсказание речи: Пер. с англ. / Под ред. Ю.Н.Прохорова и В.С.Звездина. - М.: Связь, 1980. - 308 с.: ил.). С целью уменьшения указанной ошибки в кодеках речи, основанных на линейном предсказании со смешанным возбуждением (L.М.Supplee, R.P.Cohn, J.S.Collura, A.V.McCree. MELP: The new Federal Standard at 2400 bps - IEEE ICASSP-97 Conference, Munich Germany. - P.1591-1594), кадр речевого сигнала классифицируется на три типа: невокализованный, вокализованный и слабовокализованный (вокализованный с джиттером, jittery voiced). Последний класс соответствует случаю, когда возбуждение апериодическое, но не случайное, и характерен для переходных кадров. Для отнесения кадра речи к слабовокализованному необходимо определение наличия джиттера периода основного тона.

В задачах синтеза речевого сигнала (при его декодировании) определенный интерес представляет знание характеристик джиттера периода основного тона. Наличие джиттера периода основного тона может быть объяснено следующими причинами: характером колебаний голосовых связок (включая нерегулярность) и состоянием артикуляционного аппарата при речеобразовании. Определенное воздействие может оказывать пульсация кровотока (Калинцев Ю.К. Разборчивость речи в цифровых вокодерах. - М.: Радио и связь, 1991. - 220 с.). Таким образом, наличие данных факторов создает теоретические предпосылки для разделения джиттера периода основного тона речевого сигнала на случайную и периодическую составляющие.

Задачей изобретения является разработка способа разделения джиттера основного тона речевого сигнала на случайную и периодическую составляющие с помощью спектрального метода.

В заявленном способе эта задача решается тем, что в известном способе разделения джиттера сигнала данных, заключающемся в том, что вычисляют первую функцию ошибок временных интервалов, вычисляют функцию усредненной ошибки временных интервалов как скользящее среднее первых функций ошибок временных интервалов, вычисляют вторую функцию ошибок временных интервалов путем вычитания функции усредненной ошибки временных интервалов из первой функции ошибок временных интервалов, вычисляют третью функцию ошибок временных интервалов путем подстановки нулевых значений во вторую функцию ошибок временных интервалов в интервалах, не имеющих переходов состояний входного сигнала, выполняют прямое дискретное преобразование Фурье от третьей функции ошибок временных интервалов, вычисляют усредненный спектр третьей функции ошибок временных интервалов путем усреднения амплитуд спектральных составляющих спектров третьих функций ошибок временных интервалов соседних сигнальных векторов, формируют массив частот FP2, соответствующий частотам амплитудных пиков в усредненном спектре третьей функции ошибок временных интервалов, формируют модифицированный спектр третьей функции ошибок временных интервалов путем обнуления амплитуд на частотах, не вошедших в массив FP2, выполняют обратное дискретное преобразование Фурье от модифицированного спектра третьей функции ошибок временных интервалов, подсчитывают количество изменений состояния входного сигнала в сигнальном векторе, вычисляют коэффициент усиления модифицированной третьей функции ошибок временных интервалов путем деления длины сигнального вектора на количество изменений состояния входного сигнала в сигнальном векторе, усиливают модифицированную третью функцию ошибок временных интервалов, формируют функцию ошибок временных интервалов путем подстановки в интервалы второй функции ошибок временных интервалов, не имеющих переходов состояний входного сигнала, значений из соответствующих интервалов модифицированной третьей функции ошибок временных интервалов, выполняют прямое дискретное преобразование Фурье для перевода функции ошибок временных интервалов в частотную область, вычисляют усредненный спектр ошибок временных интервалов путем усреднения амплитуд спектральных составляющих спектров функции ошибок временных интервалов соседних сигнальных векторов, формируют массив частот FP, соответствующий частотам пиковых значений амплитуд в усредненном спектре ошибок временных интервалов, вычисляют модифицированный спектр периодического джиттера на частотах FP с амплитудами усредненного спектра ошибок временных интервалов и фазами спектра ошибок временных интервалов, вычисляют временную последовательность периодического джиттера путем обратного преобразования Фурье от модифицированного спектра периодического джиттера, вычисляют гистограмму временной последовательности периодического джиттера, определяют размах значений периодического джиттера по гистограмме, вычисляют усредненную спектральную плотность мощности функции ошибок временных интервалов путем усреднения квадратов амплитуд спектральных составляющих спектров функции ошибок временных интервалов соседних сигнальных векторов, вычисляют модифицированный спектр случайного джиттера путем подстановки на частотах FP амплитуды, равной корню квадратному из разности усредненной спектральной плотности мощности и квадрата модуля усредненного спектра ошибок временных интервалов, и случайной, равномерно распределенной фазы, выполняют обратное преобразование Фурье от модифицированного спектра случайного джиттера, вычисляют среднеквадратическое отклонение значений случайного джиттера, принимают решение о дальнейшем усреднении результатов, дополнительно получают и сохраняют входной речевой сигнал. Затем разделяют входной речевой сигнал на кадры равной длительности. Определяют на каждом кадре речевого сигнала значение периода основного тона, а затем вычисляют первую функцию ошибок временных интервалов.

Проведенный анализ уровня техники позволил установить, что аналоги, характеризующиеся совокупностью признаков, тождественных всем признакам заявленного способа кодирования широкополосного речевого сигнала, отсутствуют. Следовательно, заявленное изобретение соответствует условию патентоспособности «новизна».

Результаты поиска известных решений в данной и смежных областях техники с целью выявления признаков, совпадающих с отличительными от прототипа признаками заявленного объекта, показали, что они не следуют явным образом из уровня техники. Из уровня техники также не выявлена известность влияния предусматриваемых существенными признаками заявленного изобретения преобразований на достижение указанного технического результата. Следовательно, заявленное изобретение соответствует условию патентоспособности «изобретательский уровень».

Заявленное изобретение поясняется следующими чертежами:

фиг.1 - блок-схема способа разделения джиттера периода основного тона согласно изобретению;

фиг.2 - блок-схема заполнения неизвестных значений функции ошибок временных интервалов;

фиг.3 - амплитудный спектр восстановленной последовательности ошибок временных интервалов согласно настоящему изобретению.

Для разделения джиттера основного тона речевого сигнала на случайную и периодическую составляющие согласно предлагаемому способу выполняют следующие операции. В блоке 102 входной речевой сигнал сохраняют (буферизируют) в промежуточной памяти в виде кадров определенной длины. Для каждого кадра речевого сигнала в блоке 103 вычисляют значение периода основного тона (Speech Recognition and Coding. New Advances and Trends. / NATO ASI Series. - Germany, 1995. - 464 p.). Полученный в результате вектор значений основного тона сохраняют в виде сигнальных векторов x определенной длины N.

Далее сигнальный вектор x поступает в блок 104 вычисления ошибок временных интервалов, в котором определяют изменение значения периода основного тона во времени на длительности одного кадра. «Идеальные» значения периода основного тона могут быть определены как из самого входного речевого сигнала, так и в результате ручной разметки траектории основного тона (Chu Wai С.Speech coding algorithms: Foundation and evolution of standardized coders. - John Wiley & Sons, Inc.; Hoboken, New Jersey: USA, 2003. - 558 p.). Получившуюся последовательность отклонений основного тона обозначают как первую функцию у ошибок временных интервалов для текущего вектора х. Так как во входном речевом сигнале период основного тона может отсутствовать (для невокализованных кадров), то первая функция у ошибок временных интервалов на этих кадрах будет иметь неопределенные значения.

В блоке 105 вычисляют функцию у' усредненной ошибки временных интервалов путем вычисления скользящего среднего между функциями у ошибок временных интервалов соседних векторов х. Для вычисления функции у' может быть использовано скользящее среднее с экспоненциальными, линейными или другими весами. В блоке 106 устраняют компоненты джиттера, зависящего от данных, из первой функции у ошибок временных интервалов. Данная операция происходит путем вычитания функции у' усредненной ошибки временных интервалов из первой функции у ошибок временных интервалов. В результате получают вторую функцию z ошибок временных интервалов. Функция у' усредненной ошибки временных интервалов дает оценку зависимой от данных функции ошибок временных интервалов, таким образом, после ее вычитания из функции у останется только не зависимая от данных составляющая функции ошибок временных интервалов.

В блоках 107 происходит заполнение неизвестных значений функции z. Последовательность операций, выполняемых в блоке 107, представлена в виде блок-схемы на фиг.2.

Вторая функция z ошибок временных интервалов из блока 106 поступает в блок 201, где неизвестные значения функции z заменяют нулями. В результате этой операции получают третью функцию g ошибок временных интервалов. Далее в блоке 202 выполняют прямое ДПФ функции g. Результатом данной операции является спектр G третьей функции ошибок временных интервалов. Вычисление спектра G в блоке 202 может быть реализовано посредством быстрого преобразования Фурье. Перед выполнением процедуры прямого преобразования Фурье для устранения эффекта «растекания спектра» третья функция g ошибок временных интервалов может быть умножена на оконную функцию, например на окно Блэкмана [Марпл-мл. С.Л. Цифровой спектральный анализ и его приложения. / Пер. с анг. М.: Мир, 1990. 584 с.]. На следующем шаге в блоке 203 формируют усредненный спектр G' третьей функции ошибок временных интервалов путем усреднения амплитуд |G| спектральных составляющих спектров G третьих функций ошибок временных интервалов соседних спектральных векторов. Усреднение амплитуд может быть вычислено как взвешенное среднее установленного числа измерений или как скользящее среднее с экспоненциальными, линейными или другими весами. В блоке 204 определяют пики усредненного спектра G' третьей функции ошибок временных интервалов, которые по амплитуде превышают уровень шумов. Частоты усредненного спектра G', соответствующие пиковым значениям, заносят в массив FP2. Один из способов нахождения пиковых значений может состоять в нахождении порога T2 путем нахождения среднего значения спектра G' по всем частотам и умножении полученного среднего значения на постоянный коэффициент. Значения усредненного спектра G' третьей функции ошибок временных интервалов, которые превышают порог T2, относят к спектральным пикам, и их частоты записывают в массив FP2. В блоке 205 обнуляют амплитуды |G| спектральных составляющих спектра G третьей функции ошибок временных интервалов на частотах, которые не вошли в массив FP2, то есть на частотах, которые не соответствуют пиковым значениям спектра. В результате данной операции формируют модифицированный спектр S третьей функции ошибок временных интервалов. В блоке 206 модифицированный спектр S третьей функции ошибок временных интервалов из частотной области переводят во временную в результате выполнения обратного ДПФ. На выходе блока 206 формируют модифицированную функцию s третьей функции ошибок временных интервалов. Если в блоке 202 перед выполнением прямого ДПФ третья функция g ошибок временных интервалов была умножена на оконную функцию, например на окно Блэкмана, то после обратного ДПФ необходимо устранить влияние окна на полученную модифицированную функцию s путем умножения ее на обратную оконную функцию.

Далее в блоке 207 вычисляют коэффициент k усиления модифицированной функции s третьей функции ошибок временных интервалов путем подсчета количества NΔ изменений состояния (знакоперемен) входного сигнала x и деления длины сигнального вектора N на количество знакоперемен NΔ. В блоке 208 выполняют усиление модифицированной функции s третьей функции ошибок временных интервалов в k раз. Далее в блоке 209 заполняют неизвестные значения второй функции z ошибок временных интервалов путем подстановки значений из усиленной в k раз модифицированной функции s третьей функции ошибок временных интервалов из соответствующих временных интервалов. В результате заполнения неизвестных значений на выходе блока 209 формируют функцию w ошибок временных интервалов, у которой все значения известны. Значения функции w ошибок временных интервалов, которые были подставлены из модифицированной функции s третьей функции ошибок временных интервалов, обозначают как «интерполированные» и после разделения случайного и периодического джиттера спектральным методом не учитывают при построении гистограмм периодического и случайного джиттера. Выход блока 209 является общим выходом блока 107.

Сформированная в блоке 107 функция w ошибок временных интервалов поступает на вход блока 108, где выполняют прямое ДПФ, в результате которого формируют спектр W функции ошибок временных интервалов. Перед выполнением процедуры прямого ДПФ для устранения эффекта «растекания спектра» функция w ошибок временных интервалов может быть умножена на оконную функцию, например на окно Блэкмана. На следующем шаге в блоке 109 формируют усредненный спектр W' функции ошибок временных интервалов путем усреднения амплитуд |W| спектральных составляющих спектров W функций ошибок временных интервалов соседних спектральных векторов. Усреднение амплитуд может быть вычислено как взвешенное среднее установленного числа измерений или как скользящее среднее с экспоненциальными, линейными или другими весами. В блоке 110 определяют пиковые значения усредненного спектра W' функции ошибок временных интервалов, которые по амплитуде превышают уровень шумов. Частоты усредненного спектра W', соответствующие пиковым значениям, заносят в массив FP. Один из способов нахождения спектральных пиков описан выше.

Массив частот спектральных пиков FP может отличаться от массива частот FP2. Это связано с тем, что при заполнении неизвестных значений в функции z нулевыми значениями спектральный уровень шумов в спектре G' будет больше спектрального уровня шумов в спектре W', особенно при наличии одной или нескольких относительно мощных гармонических составляющих периодического джиттера. В результате этого некоторые гармонические составляющие периодического джиттера могут быть неразличимы на уровне шумов спектра G' и не попасть в массив FP2, а при анализе спектра W', в котором спектральный уровень шумов соответствует истинному, гармонические составляющие с малой амплитудой могут быть различимы и внесены в массив FP.

Блоки 111, 112, 113 и 114 описывают операции по анализу периодического джиттера. Сначала в блоке 111 вычисляют модифицированный спектр P периодического джиттера. На частотах, вошедших в массив FP, модифицированный спектр P заполняют амплитудами из усредненного спектра W' и фазами из спектра W, а на частотах, не вошедших в FP, амплитуды обнуляют. Затем в блоке 112 вычисляют обратное ДПФ от модифицированного спектра Р периодического джиттера. В результате этой операции формируют функцию p ошибок временных интервалов периодического джиттера. Если в блоке 108 перед выполнением прямого ДПФ функция w ошибок временных интервалов была умножена на оконную функцию, то после обратного ДПФ необходимо устранить влияние окна на полученную функцию р ошибок временных интервалов периодического джиттера путем умножения ее на обратную оконную функцию. Далее в блоке 113 вычисляют скользящую гистограмму значений функции p. Значения функции p, соответствующие неизвестным значениям функции z и помеченные как «интерполированные», не участвуют в построении гистограммы периодического джиттера. Далее в блоке 114 по гистограмме определяют размах значений периодического джиттера PJpp.

Блоки 115, 116, 117 и 118 описывают операции по анализу случайного джиттера. В блоке 115 вычисляют усредненную спектральную плотность мощности R' функции ошибок временных интервалов путем усреднения квадратов амплитуд спектра W функций ошибок временных интервалов. Усреднение квадратов амплитуд |W|2 может быть вычислено как взвешенное среднее установленного числа измерений или как скользящее среднее с экспоненциальными, линейными или другими весами. Далее в блоке 116 формируют модифицированный спектр Q случайного джиттера, который состоит из амплитуд и фаз спектра W на частотах, не вошедших в массив FP, и амплитуд, равных корню квадратному из разности усредненной спектральной плотности мощности R' и квадрата модуля усредненного спектра W', и случайных, равномерно распределенных фаз на частотах FP. После этого в блоке 117 выполняют обратное ДПФ от модифицированного спектра Q случайного джиттера. В результате данной операции формируют функцию q ошибок временных интервалов случайного джиттера. Если в блоке 108 перед выполнением прямого ДПФ функция w ошибок временных интервалов была умножена на оконную функцию, то после обратного ДПФ необходимо устранить влияние окна на полученную функцию q ошибок временных интервалов случайного джиттера путем умножения ее на обратную оконную функцию. Далее в блоке 118 из функции q ошибок временных интервалов случайного джиттера устраняют значения, соответствующие неизвестным значениям функции z и помеченные как «интерполированные».

Следующим шагом является расчет скользящего среднеквадратического отклонения RJrms случайного джиттера по формуле

где L - количество знакоперемен в сигнальных векторах, используемых при вычислении скользящего среднеквадратического значения;

- среднее значение функций q сигнальных векторов, используемых при вычислении RJrms.

При вычислении среднеквадратического отклонения RJrms, и среднего значения q суммирование производят только по известным, не помеченным как «интерполированные», значениям функций q ошибок временных интервалов случайного джиттера сигнальных векторов.

При вычислении скользящего среднеквадратического отклонения RJrms случайного джиттера могут быть использованы линейные, экспоненциальные или другие веса для взвешивания значений функций q сигнальных векторов, используемых в расчетах.

В блоке 119 принимают решение о необходимости выполнения дальнейшего усреднения результатов. При решении выполнения дальнейшего измерения и усреднении полученных результатов производят переход к блоку 102 и обработку нового сигнального вектора значений основного тона. В противном случае процесс обработки значений периода основного тона прекращают. Процесс усреднения полученных результатов обеспечивает более высокую точность измерений по сравнению с методом, использующим один сигнальный вектор значений периода основного тона.

Операции буферизации (блок 102), заполнения неизвестных значений (блок 107), а также для хранения промежуточных значений вычислений могут быть реализованы на устройствах оперативной памяти. Схемы ОЗУ известны и описаны, например, в книге В.Н.Вениаминова, О.Н.Лебедева, А.И.Мирошниченко. Микросхемы и их применение. М.: Радио и связь, 1989. - С.146, рис.5.2. В частности, ОЗУ может быть реализовано на микросхемах К565 серии.

Вычислительные операции, выполняемые в блоках 103-118, а также принятие решения в блоке 119 могут быть реализованы в арифметическо-логическом устройстве (АЛУ). Схемы АЛУ известны и описаны, например, в книге Шило В.Л. Популярные цифровые микросхемы. - М.: Радио и связь, 1987. - С.273-275, рис.2.70. В частности, такая схема может быть реализована на микросхемах К564ИПЗ.

Для проверки работоспособности предлагаемого способа разделения джиттера сигнала данных было произведено математическое моделирование по оцениванию параметров периодического и случайного джиттера. В качестве входного речевого сигнала была взята запись речи одного диктора длительностью 28 минут. Буферизация данной записи осуществлена кадрами длительностью 22,5 мс. Для каждого кадра речевого сигнала вычислены значение периода основного тона и величина его изменения на длительности каждого кадра по алгоритму, изложенному в книге Chu Wai С. Speech coding algorithms: Foundation and evolution of standardized coders (John Wiley & Sons, Inc.; Hoboken, New Jersey: USA, 2003. - 558 p.) на стр.412-426. Полученный в результате вектор значений основного тона сохранен в виде сигнальных векторов x длины N=28, а последовательность отклонений периода основного тона - в виде функций у ошибок временных интервалов.

Далее был применен спектральный метод оценки параметров периодического PJpp и случайного RJrms джиттера. Амплитудные спектры восстановленных последовательностей ошибок временных интервалов представлены на фиг.3.

График, представленный на фиг.3, свидетельствует о наличии случайной и периодической составляющих джиттера периода основного тона, что подтверждает имеющиеся теоретические предпосылки. Анализ влияния каждой из них на флуктуацию периода основного тона указывает на доминирующую роль случайной компоненты джиттера. В связи с этим в задачах синтеза речевого сигнала при формировании сигнала возбуждения для слабовокализованных кадров речи достаточным является случайное изменение периода основного тона с дисперсией ±25%. Анализ периодической составляющей джиттера периода основного тона, связанной с пульсацией кровотока, представляет особый интерес в задачах распознавания речи.

Способ разделения джиттера периода основного тона речевого сигнала, заключающийся в том, что получают и сохраняют входной речевой сигнал, разделяют входной речевой сигнал на кадры равной длительности, определяют на каждом кадре речевого сигнала значение периода основного тона, полученный вектор значений основного тона сохраняют в виде сигнальных векторов определенной длины, затем по сигнальным векторам определяют изменение значения периода основного тона во времени на длительности одного кадра и получившуюся последовательность отклонений основного тона обозначают как первую функцию ошибок временных интервалов, затем вычисляют функцию усредненной ошибки временных интервалов как скользящее среднее первых функций ошибок временных интервалов, вычисляют вторую функцию ошибок временных интервалов путем вычитания функции усредненной ошибки временных интервалов из первой функции ошибок временных интервалов, вычисляют третью функцию ошибок временных интервалов путем подстановки нулевых значений во вторую функцию ошибок временных интервалов в интервалах, не имеющих переходов состояний входного сигнала, выполняют прямое дискретное преобразование Фурье от третьей функции ошибок временных интервалов, вычисляют усредненный спектр третьей функции ошибок временных интервалов путем усреднения амплитуд спектральных составляющих спектров третьих функций ошибок временных интервалов соседних сигнальных векторов, формируют массив частот FP2, соответствующий частотам амплитудных пиков в усредненном спектре третьей функции ошибок временных интервалов, формируют модифицированный спектр третьей функции ошибок временных интервалов путем обнуления амплитуд на частотах, не вошедших в массив FP2, выполняют обратное дискретное преобразование Фурье от модифицированного спектра третьей функции ошибок временных интервалов, подсчитывают количество изменений состояния входного сигнала в сигнальном векторе, вычисляют коэффициент усиления модифицированной третьей функции ошибок временных интервалов путем деления длины сигнального вектора на количество изменений состояния входного сигнала в сигнальном векторе, усиливают модифицированную третью функцию ошибок временных интервалов, формируют функцию ошибок временных интервалов путем подстановки в интервалы второй функции ошибок временных интервалов, не имеющих переходов состояний входного сигнала, значений из соответствующих интервалов модифицированной третьей функции ошибок временных интервалов, выполняют прямое дискретное преобразование Фурье для перевода функции ошибок временных интервалов в частотную область, вычисляют усредненный спектр ошибок временных интервалов путем усреднения амплитуд спектральных составляющих спектров функции ошибок временных интервалов соседних сигнальных векторов, формируют массив частот FP, соответствующий частотам пиковых значений амплитуд в усредненном спектре ошибок временных интервалов, вычисляют модифицированный спектр периодического джиттера на частотах FP с амплитудами усредненного спектра ошибок временных интервалов и фазами спектра ошибок временных интервалов, вычисляют временную последовательность периодического джиттера путем обратного преобразования Фурье от модифицированного спектра периодического джиттера, вычисляют гистограмму временной последовательности периодического джиттера, определяют размах значений периодического джиттера по гистограмме, вычисляют усредненную спектральную плотность мощности функции ошибок временных интервалов путем усреднения квадратов амплитуд спектральных составляющих спектров функции ошибок временных интервалов соседних сигнальных векторов, вычисляют модифицированный спектр случайного джиттера путем подстановки на частотах FP амплитуды, равной корню квадратному из разности усредненной спектральной плотности мощности и квадрата модуля усредненного спектра ошибок временных интервалов, и случайной, равномерно распределенной фазы, выполняют обратное преобразование Фурье от модифицированного спектра случайного джиттера, вычисляют среднеквадратическое отклонение значений случайного джиттера, принимают решение о дальнейшем усреднении результатов.



 

Похожие патенты:

Изобретение относится к обработке речевых сигналов. .

Изобретение относится к методу анализа речи, обнаруживающему частоту основного тона голоса, а также к методу обнаружения эмоций, оценивающему эмоцию на основании частоты основного тона голоса.

Изобретение относится к кодированию речи и более конкретно к проблеме разреженности в кодированных речевых сигналах. .

Изобретение относится к области передачи сигналов. .

Изобретение относится к области кодирования. .

Изобретение относится к области анализа и распознавания речевых сигналов. .

Изобретение относится к области анализа и распознавания речевых сигналов и касается способа распознавания фонем речи. .

Изобретение относится к радиоизмерительной технике и может быть использовано для исследования параметров нескольких электрических сигналов параллельно. .

Изобретение относится к радиоизмерительной технике и может быть использовано для исследования параметров электрических сигналов. .

Изобретение относится к радиоизмерительной технике и может быть использовано при проектировании различных широкополосных измерительных систем для обеспечения сверхширокополосной автоматической синхронизации при проведении измерений.

Изобретение относится к технике электрических измерений и может быть использовано в системах сбора данных для преобразования напряжения переменного тока в код. .

Изобретение относится к области измерения физических величин путем преобразования их в электрические величины, например в частоту переменного тока, преобразования ее в последовательность импульсов и их подсчета, в частности к модификации основных электрических элементов, приспособленных для использования в электрических измерительных приборах, к конструктивным сопряжениям таких элементов с этими приборами, а также к конструктивным соединениям электрических измерительных приборов с электронными устройствами общего назначения, например с устройствами для подсчета импульсов, и представления измеряемых электрических переменных величин в цифровом виде.

Изобретение относится к измерительной технике и может быть использовано для калибровки стробоскопических преобразователей (осциллографов), предназначенных для высокоточных измерений сверхширокополосных электрических сигналов.

Изобретение относится к измерительной технике и может быть использовано для передачи информации об объекте диагностирования. .

Изобретение относится к области измерительной техники, в частности к преобразованию сигналов случайных процессов, и может быть использовано в автоматине вычислительной, бытовой, медтехнике и телеметрических системах.

Изобретение относится к области измерительной техники, в частности к преобразованию сигналов случайных процессов, и может быть использовано в автоматине вычислительной, бытовой, медтехнике и телеметрических системах.
Наверх