Компенсатор и способ компенсации потери кадров звукового сигнала в области модифицированного дискретного косинусного преобразования

Авторы патента:

ЛУ Цзин (CN)

ЛИ Цзяли (CN)

ВУ Мин (CN)

ЦЮ Сяоцзюнь (CN)

ЛИНЬ Чжибинь (CN)

ПЕН Ке (CN)

G10L19/04 - с использованием способов прогнозирования

Владельцы патента RU 2488899:

ЗетТиИ Корпорейшн (CN)

Предлагается способ компенсации потери кадров звукового сигнала в области MDCT, включающий: шаг а, на котором, когда текущий потерянный кадр является Р-ым кадром, получают набор предсказываемых частот, для каждой частоты в этом наборе используют фазы и амплитуды множества кадров перед (Р-1)-ым кадром в области MDCT-MDST для предсказания фазы и амплитуды Р-го кадра и используют предсказанную фазу и амплитуду для получения коэффициентов MDCT Р-го кадра, соответствующих каждой частоте; шаг b, на котором для частот вне набора предсказываемых частот используют коэффициенты MDCT множества кадров перед Р-ым кадром для вычисления значений коэффициентов MDCT Р-го кадра на этих частотах; шаг с, на котором выполняют обратное модифицированное дискретное косинусное преобразование (IMDCT) для коэффициентов MDCT Р-го кадра на всех частотах для получения сигнала во временной области для Р-го кадра. Предлагается также компенсатор потери кадров. Изобретение имеет преимущества отсутствия задержки, малого объема вычислений, малого объема пространства памяти и простоты реализации. Технический результат - увеличение эффективности компенсации потери кадров звукового сигнала. 2 н. и 22 з.п. ф-лы, 8 ил.

Область техники

Изобретение относится к области декодирования звуковых сигналов и, в частности, к компенсатору и способу компенсации потери кадров звукового сигнала в области модифицированного дискретного косинусного преобразования (Modified Discrete Cosine Transform, MDCT), с низкой сложностью и без временных задержек.

Уровень техники

В сетевых коммуникациях широко применяется технология пакетной передачи. По сети передается различная информация, такая как речь, звуковые сигналы или другие данные, после кодирования с использованием технологии пакетной передачи, такой как голосовая связь по протоколу Интернета (Voice over Internet Protocol, VoIP) и т.п. Потеря информации кадра речи и звукового сигнала в результате ограничения пропускной способности передающего конца и в результате того, что кадр информации пакета не приходит в буферную зону приемного конца в пределах назначенного времени задержки, или в результате перегрузки сети и т.п., вызывает быстрое ухудшение качества синтезированной речи и звуковых сигналов на декодирующем конце, поэтому на декодирующем конце необходимо использовать технологии для компенсации потери данных кадра. Компенсатор потери кадров представляет технологию, которая уменьшает ухудшение качества речевых и звуковых сигналов вследствие потери кадров. В настоящее время имеется много технологий для компенсации потери кадров, но большинство из них предназначены для компенсации потери кадров речи, и только немногие соответствующие технологии пригодны для компенсации потери кадров звукового сигнала.

Самым простым из известных способов компенсации потери кадров звукового сигнала является способ повторения сигнала MDCT последнего кадра или замена заглушением. Хотя способ прост в реализации и не имеет задержек, результат компенсации средний. Другие способы компенсации, такие как технология оценки фазы и амплитуды данных с пропусками (Gapped Data Amplitude and Phase Estimation, GAPES), преобразовывают коэффициент MDCT в коэффициент оконного дискретного преобразования Фурье (Discrete Short-Time Fourier Transform, DSTFT). Но эти способы характеризуются высокой сложностью и требуют большие объемы памяти. Организация Проекта сотрудничества по созданию системы третьего поколения (Third Generation Partnership Project, 3GPP) предложила осуществлять компенсацию потери кадров звукового сигнала с помощью технологии внесения шума с формированем спектра, которая дает хороший результат компенсации для шумоподобного сигнала, но худший результат компенсации для звукового сигнала с множеством гармоник.

В общем, большинство известных технологий компенсации потери кадров звукового сигнала не дают явных результатов или имеют высокую сложность вычисления и чрезмерно большое время задержки.

Сущность изобретения

Техническая задача, решаемая в настоящем изобретении, заключается в предоставлении компенсатора и способа компенсации потери кадров звукового сигнала в области MDCT, при этом предлагаемое изобретение обеспечивает хорошие результаты компенсации, низкую вычислительную сложность и отсутствие задержки.

Для решения указанной выше задачи предлагается способ компенсации потери кадров звукового сигнала в области модифицированного дискретного косинусного преобразования, включающий:

шаг а, на котором, когда текущий потерянный кадр является Р-ым кадром, получают набор предсказываемых частот, для каждой частоты в наборе предсказываемых частот используют фазы и амплитуды множества кадров перед (Р-1)-ым кадром в области модифицированного дискретного косинусного преобразования - модифицированного дискретного синусного преобразования (MDCT-MDST) для предсказания фазы и амплитуды Р-го кадра в области MDCT-MDST и используют предсказанную фазу и амплитуду Р-го кадра в области MDCT-MDST для получения коэффициента MDCT Р-го кадра на каждой частоте, при этом (Р-1)-й кадр предшествует Р-му кадру;

шаг b, на котором для любой частоты в кадре вне набора предсказываемых частот используют коэффициенты MDCT множества кадров перед Р-ым кадром для вычисления коэффициента MDCT Р-го кадра на этой частоте;

шаг с, на котором выполняют обратное модифицированное дискретное косинусное преобразование (IMDCT) для коэффициентов MDCT Р-го кадра на всех частотах для получения сигнала во временной области для Р-го кадра.

Упомянутый способ может характеризоваться тем, что он также включает перед шагом а, при обнаружении того, что текущий кадр потерян, определение типа текущего потерянного кадра и выполнение шага а, если текущий потерянный кадр является кадром с множеством гармоник.

Упомянутый способ может характеризоваться тем, что шаг определения типа текущего потерянного кадра включает:

вычисление равномерности спектра каждого из K кадров перед текущим потерянным кадром; если число кадров, равномерность спектра которых меньше порогового значения, является меньшим или равным K₀ в K кадрах, то текущий потерянный кадр является кадром без множества гармоник; если число кадров, равномерность спектра которых меньше порогового значения, больше K₀, то текущий потерянный кадр является кадром с множеством гармоник, при этом K₀≤K, где K₀, K - натуральные числа.

Упомянутый способ может характеризоваться тем, что при получении набора предсказываемых частот на шаге а используют комплексные сигналы в области MDCT-MDST и/или коэффициенты MDCT множества кадров перед Р-ым кадром для получения набора Sc предсказываемых частот или непосредственно помещают все частоты в кадре в набор S_C предсказываемых частот.

Упомянутый способ может характеризоваться тем, что шаг использования комплексных сигналов в области MDCT-MDST и/или коэффициентов MDCT множества кадров перед Р-ым кадром для получения набора S_C предсказываемых частот включает:

назначение упомянутого множества кадров перед Р-ым кадром как L1 кадров, вычисление мощности каждой частоты в L1 кадрах, получение L1 наборов S₁,…,S_L1, включающих частоты с пиковыми значениями в каждом кадре из L1 кадров, при этом число частот в каждом наборе составляет N₁,…,N_L1, соответственно;

выбор набора S_i из L1 наборов S₁,…,S_L1, для каждой частоты m_j, j=1…N_i, с пиковым значением в наборе S_i, определение, имеется ли частота, принадлежащая одновременно всем другим наборам частот с пиковыми значениями среди частот m_j, m_j±1,…,m_j±k,

если да, помещение всех частот m_j, m_j±1,…,m_j±k в набор S_C частот;

если нет частоты, принадлежащей одновременно всем другим наборам частот с пиковыми значениями, то помещение всех частот в кадре в набор S_C частот,

где k - неотрицательное целое число.

Упомянутый способ может характеризоваться тем, что упомянутая частота с пиковым значением относится к частоте, мощность которой больше мощности двух соседних с ней частот.

Упомянутый способ может характеризоваться тем, что если L1 кадров включают (Р-1)-й кадр, то мощность каждой частоты в (Р-1)-ом кадре вычисляют следующим образом:

${| {\hat{ν}}^{р - 1} (m) |}^{2} = {[c^{р - 1} (m)]}^{2} + {[с^{р - 1} (m + 1) - с^{р - 1} (m - 1)]}^{2}$ , где ${| {\hat{ν}}^{р - 1} (m) |}^{2}$ - мощность частоты т в (Р-1)-ом кадре, с^р-1(m) - коэффициент MDCT частоты т в (Р-1)-ом кадре, с^р-1(m+1) - коэффициент MDCT частоты m+1 в (Р-1)-ом кадре, c^p-1(m-1) - коэффициент MDCT частоты m-1 в (Р-1)-ом кадре.

Упомянутый способ может характеризоваться тем, что шаг предсказания фазы и амплитуды Р-го кадра в области MDCT-MDST на шаге а включает: использование для каждой предсказываемой частоты фаз L2 кадров перед (Р-1)-ым кадром на упомянутой частоте в области MDCT-MDST для выполнения линейной экстраполяции или линейной аппроксимации для получения фазы Р-го кадра на упомянутой частоте в области MDCT-MDST и

получение амплитуды Р-го кадра на упомянутой частоте в области MDCT-MDST согласно амплитуде одного из L2 кадров на упомянутой частоте в области MDCT-MDST, при этом L2>1.

Упомянутый способ может характеризоваться тем, что, когда L2=2, используют t1-й кадр и t2-й кадр для представления двух кадров, соответственно, и предсказывают фазу Р-го кадра в области MDCT-MDST согласно следующей формуле:

${\hat{ϕ}}^{p} (m) = ϕ^{t 1} (m) + \frac{p - t 1}{t 1 - t 2} [ϕ^{t 1} (m) - ϕ^{t 2} (m)]$ ,

где ${\hat{ϕ}}^{р} (m)$ - предсказанное значение фазы Р-го кадра в области MDCT-MDST на частоте m, φ^t1(m) - фаза t1-го кадра на частоте т в области MDCT-MDST и φ^t2(m) - фаза f2-го кадра на частоте m в области MDCT-MDST.

Упомянутый способ может характеризоваться тем, что, когда L2>2, для каждой предсказываемой частоты выполняют линейную аппроксимацию фаз L2 кадров перед (Р-1)-ым кадром на упомянутой частоте в области MDCT-MDST для получения фазы Р-го кадра на упомянутой частоте в области MDCT-MDST.

Упомянутый способ может характеризоваться тем, что на шаге а получают набор предсказываемых частот путем использования комплексных сигналов в области MDCT-MDST для (Р-2)-го кадра и (Р-3)-го кадра и коэффициента MDCT (Р-1)-го кадра и для каждой частоты в наборе S_C частот предсказывают фазу и амплитуду Р-го кадра в области MDCT-MDST путем использования фаз и амплитуд (Р-2)-го кадра и (Р-3)-го кадра в области MDCT-MDST.

Упомянутый способ может характеризоваться тем, что на шаге b в качестве коэффициента MDCT Р-го кадра используют половину коэффициента MDCT (Р-1)-го кадра.

Предлагается также компенсатор потери кадров звукового сигнала в области модифицированного дискретного косинусного преобразования, содержащий модуль компенсации потери кадров с множеством гармоник, второй модуль компенсации и модуль IMDCT, в котором

модуль компенсации потери кадров с множеством гармоник сконфигурирован так, чтобы, когда текущий потерянный кадр является Р-ым кадром, получать набор предсказываемых частот и для каждой частоты в наборе предсказываемых частот использовать фазы и амплитуды множества кадров перед (Р-1)-ым кадром в области MDCT-MDST для предсказания фазы и амплитуды Р-го кадра в области MDCT-MDST, использовать предсказанную фазу и амплитуду Р-го кадра в области MDCT-MDST для получения коэффициента MDCT Р-го кадра на каждой упомянутой частоте и передавать коэффициент MDCT во второй модуль компенсации, при этом (Р-1)-й кадр предшествует Р-му кадру;

второй модуль компенсации сконфигурирован так, чтобы для любой частоты вне набора предсказываемых частот в кадре использовать коэффициенты MDCT множества кадров перед Р-ым кадром для вычисления коэффициента MDCT Р-го кадра на упомянутой частоте и передавать коэффициенты MDCT Р-го кадра на всех частотах в модуль IMDCT;

модуль IMDCT сконфигурирован так, чтобы выполнять преобразование IMDCT для коэффициентов MDCT Р-го кадра на всех частотах для получения сигнала во временной области для Р-го кадра.

Упомянутый компенсатор потери кадров может характеризоваться тем, что он также включает модуль определения типа кадра, который сконфигурирован так, чтобы при обнаружении потери кадра определять тип текущего потерянного кадра и подавать команду модулю компенсации потери кадров с множеством гармоник на выполнение компенсации, если текущий потерянный кадр является кадром с множеством гармоник.

Упомянутый компенсатор потери кадров может характеризоваться тем, что модуль определения типа кадра сконфигурирован для определения типа текущего потерянного кадра путем вычисления равномерности спектра каждого кадра из K кадров перед текущим потерянным кадром; при этом если число кадров, равномерность спектра которых меньше порогового значения, меньше K₀ в K кадрах, то текущий потерянный кадр является кадром без множества гармоник; а если число кадров, равномерность спектра которых меньше порогового значения, больше K₀, то текущий потерянный кадр является кадром с множеством гармоник, при этом K₀≤K, где K₀, K - натуральные числа.

Упомянутый компенсатор потери кадров может характеризоваться тем, что модуль компенсации потери кадров с множеством гармоник содержит блок генерации набора частот, при этом модуль компенсации потери кадров с множеством гармоник сконфигурирован так, чтобы посредством блока генерации набора частот использовать комплексные сигналы в области MDCT-MDST и/или коэффициенты MDCT множества кадров перед Р-ым кадром для получения набора S_C предсказываемых частот или непосредственно помещать все частоты в кадре в набор S_C предсказываемых частот.

Упомянутый компенсатор потери кадров может характеризоваться тем, что блок генерации набора частот сконфигурирован для использования комплексных сигналов в области MDCT-MDST и/или коэффициентов MDCT множества кадров перед Р-ым кадром для получения набора S_C предсказываемых частот путем

назначения множества кадров перед Р-ым кадром как L1 кадров, вычисления мощности каждой частоты в L1 кадрах, получения L1 наборов S₁,…,S_L1, включающих частоты с пиковыми значениями в каждом кадре из L1 кадров, при этом число соответствующих частот в каждом наборе составляет N₁,…,N_L1, соответственно;

выбора набора S_i из L1 наборов S₁,…S_L1, для каждой частоты m_j, j=1…N_i с пиковым значением в наборе S_i, определения, имеется ли частота, принадлежащая одновременно всем другим наборам частот с пиковыми значениями среди частот m_j, m_j±1,…,m_j±k, если да, помещения всех частот m_j, m_j±1,…,m_j±k в набор S_C частот;

если нет частоты, принадлежащей одновременно всем другим наборам частот с пиковыми значениями для каждой частоты m_j, j=1…N_i с пиковым значением в наборе S_i, помещения всех частот в кадре в набор S_C частот, где k - неотрицательное целое число.

Упомянутый компенсатор потери кадров может характеризоваться тем, что частота с пиковым значением относится к частоте, мощность которой больше мощности двух соседних с ней частот.

Упомянутый компенсатор потери кадров может характеризоваться тем, что блок генерации набора частот сконфигурирован так, чтобы, когда L1 кадров включают (Р-1)-й кадр, вычислять мощность каждой частоты в (Р-1)-ом кадре следующим образом:

${| {\hat{ν}}^{р - 1} (m) |}^{2} = {[с^{р - 1} (m)]}^{2} + {[с^{р - 1} (m + 1) - с^{р - 1} (m - 1)]}^{2}$ , где ${| {\hat{ν}}^{р - 1} (m) |}^{2}$ - мощность частоты m в (Р-1)-ом кадре, с^р-1(m) - коэффициент MDCT частоты m в (Р-1)-ом кадре, c^p-1(m+1) - коэффициент MDCT частоты m+1 в (Р-1)-ом кадре, c^p-1(m-1) - коэффициент MDCT частоты m-1 в (Р-1)-ом кадре.

Упомянутый компенсатор потери кадров может характеризоваться тем, что модуль компенсации потери кадров с множеством гармоник также содержит блок генерации коэффициентов, при этом модуль компенсации потери кадров с множеством гармоник сконфигурирован так, чтобы посредством блока генерации коэффициентов использовать фазы и амплитуды L2 кадров перед (Р-1)-ым кадром в области MDCT-MDST для предсказания фазы и амплитуды каждой частоты, принадлежащей набору предсказываемых частот в Р-ом кадре, использовать предсказанную фазу и амплитуду Р-го кадра для получения коэффициента MDCT Р-го кадра, соответствующего каждой частоте, и передавать коэффициент MDCT во второй модуль компенсации, при этом L2>1;

блок генерации коэффициентов содержит субблок предсказания фазы и субблок предсказания амплитуды, причем

субблок предсказания фазы сконфигурирован так, чтобы для предсказываемой частоты использовать фазы L2 кадров на упомянутой частоте в области MDCT-MDST для выполнения линейной экстраполяции или линейной аппроксимации для получения фазы Р-го кадра на упомянутой частоте в области MDCT-MDST,

субблок предсказания амплитуды сконфигурирован так, чтобы получать амплитуду Р-го кадра на упомянутой частоте в области MDCT-MDST из амплитуды одного из L2 кадров на упомянутой частоте в области MDCT-MDST.

Упомянутый компенсатор потери кадров может характеризоваться тем, что субблок предсказания фазы сконфигурирован так, чтобы, когда L2=2, предсказывать фазу Р-го кадра в области MDCT-MDST согласно следующей формуле:

${\hat{ϕ}}^{p} (m) = ϕ^{t 1} (m) + \frac{p - t 1}{t 1 - t 2} [ϕ^{t 1} (m) - ϕ^{t 2} (m)]$ ,

где t1-й кадр и t2-й кадр представляют два кадра перед (Р-1)-ым кадром, ${\hat{ϕ}}^{р} (m)$ - предсказываемое значение фазы Р-го кадра на частоте m в области MDCT-MDST, φ^t1(m) - фаза t1-го кадра на частоте т в области MDCT-MDST и φ^t2(m) - фаза f2-го кадра на частоте m в области MDCT-MDST.

Упомянутый компенсатор потери кадров может характеризоваться тем, что субблок предсказания фазы сконфигурирован так, чтобы, когда L2>2, предсказывать фазу Р-го кадра в области MDCT-MDST путем выполнения для предсказываемой частоты линейной аппроксимации фаз выбранных L2 кадров на упомянутой частоте в области MDCT-MDST для получения фазы Р-го кадра на упомянутой частоте в области MDCT-MDST.

Упомянутый компенсатор потери кадров может характеризоваться тем, что модуль компенсации потери кадров с множеством гармоник сконфигурирован так, чтобы использовать комплексные сигналы в области MDCT-MDST для (Р-2)-го кадра и (Р-3)-го кадра и коэффициенты MDCT (Р-1)-го кадра для получения набора предсказываемых частот и использовать фазы и амплитуды (Р-2)-го кадра и (Р-3)-го кадра в области MDCT-MDST для предсказания фазы и амплитуды Р-го кадра в области MDCT-MDST для каждой частоты в наборе частот.

Упомянутый компенсатор потери кадров может характеризоваться тем, что второй модуль компенсации сконфигурирован так, чтобы использовать половину значения коэффициента MDCT (Р-1)-го кадра в качестве значения коэффициента MDCT Р-го кадра на частоте вне набора предсказываемых частот.

Посредством предлагаемых в настоящем изобретении компенсатора и способа компенсации потери кадров звукового сигнала в области MDCT для случая без множества гармоник коэффициент MDCT текущего потерянного кадра получают путем использования значений коэффициента MDCT множества кадров перед текущим потерянным кадром, а для случая с множеством гармоник коэффициент MDCT текущего потерянного кадра получают с помощью характеристики текущего потерянного кадра в области MDCT-MDST. По сравнению с известным уровнем техники изобретение имеет преимущества отсутствия задержки, малого объема вычисления, малого объема пространства памяти, простой реализации и т.д.

Краткое описание чертежей

На фиг.1 показана схема последовательности кадров, используемая в настоящем изобретении.

На фиг.2 показана блок-схема способа компенсации потери кадров звукового сигнала в области MDCT согласно настоящему изобретению.

На фиг.3 показана блок-схема для определения кадра с множеством гармоник/кадра без множества гармоник согласно настоящему изобретению.

На фиг.4 показана блок-схема способа компенсации потери кадров с множеством гармоник согласно настоящему изобретению.

На фиг.5 показана блок-схема способа вычисления коэффициента MDCT для компенсации потери кадров с множеством гармоник согласно примеру 1 изобретения.

На фиг.6 показана структурная схема компенсатора потери кадров звукового сигнала в области MDCT согласно настоящему изобретению.

На фиг.7 показана структурная схема компенсатора потери кадров звукового сигнала в области MDCT в другом примере изобретения.

На фиг.8 показана структурная схема компенсатора потери кадров звукового сигнала в области MDCT в еще одном примере изобретения.

Предпочтительные формы осуществления изобретения

Основная идея изобретения состоит в следующем: предсказывают фазу и амплитуду в области MDCT-MDST для текущего потерянного кадра с помощью использования линейности фазы гармонического сигнала в области MDCT-MDST и информации множества кадров перед текущим потерянным кадром и таким образом получают коэффициент MDCT для текущего потерянного кадра, согласно которому затем получают сигнал во временной области для текущего потерянного кадра.

Предлагается способ компенсации потери кадров звукового сигнала в области MDCT, показанный на фиг.2 и включающий:

Шаг S1, на котором, при обнаружении того, что пакет данных текущего кадра потерян, на декодирующем конце обозначают текущий кадр как текущий потерянный кадр, определяют тип текущего потерянного кадра и осуществляют переход к шагу S2, если текущий потерянный кадр является кадром без множества гармоник, или, в противном случае, переход к шагу S3;

при этом операция определения типа текущего потерянного кадра, которую выполняют согласно коэффициентам MDCT К кадров перед текущим потерянным кадром, как показано на фиг.3, включает:

1а) вычисление равномерности спектра каждого кадра из К кадров перед текущим потерянным кадром и определение того, что кадр состоит главным образом из множества гармоник и является кадром стационарного сигнала с множеством гармоник, если равномерность спектра меньше заранее заданного порога;

1b) если число кадров стационарного сигнала с множеством гармоник в К кадрах меньше или равно K₀ кадрам, считают, что текущий потерянный кадр является кадром без множества гармоник, или, в противном случае, текущий потерянный кадр является кадром с множеством гармоник (таким как музыкальный кадр), при этом K₀≤K, где K₀ и K - заранее заданные значения.

Изобретение не ограничено использованием показанного на фиг.3 способа определения типа текущего потерянного кадра, и для определения также могут использоваться другие способы, например, без ограничения этим, коэффициент перехода через ноль (zero-pass ratio).

Шаг S2. Если определяют, что текущий потерянный кадр является кадром без множества гармоник, то используют значения коэффициентов MDCT множества кадров перед текущим потерянным кадром для вычисления значения коэффициентов MDCT текущего потерянного кадра для каждой частоты в кадре, затем осуществляют переход к шагу S4.

Например, в качестве значения коэффициента MDCT текущего потерянного кадра используют половину или другие отношения значения коэффициента MDCT кадра, непосредственно предшествующего текущему потерянному кадру.

Шаг S3. Если определяют, что текущий потерянный кадр является кадром с множеством гармоник, то посредством оценки получают значение коэффициента МОСТ текущего потерянного кадра с использованием алгоритма компенсации потери кадров с множеством гармоник без задержки, который показан на фиг.4 и, в частности, включает:

3а) когда потерян Р-й кадр, то есть текущий потерянный кадр является Р-ым кадром, взятие L1 кадров перед Р-ым кадром.

Если L1 кадров включают (Р-1)-й кадр, используют алгоритм быстрого модифицированного дискретного синусного преобразования (Fast Modified Discrete Sine Transform, FMDST) для получения коэффициентов MDST L1-1 кадров из L1 кадров за исключением (Р-1)-го кадра согласно коэффициентам MDCT, полученным посредством декодирования кадров перед текущим потерянным кадром. Для каждого кадра в L1-1 кадрах комплексный сигнал в области MDCT-MDST каждого кадра включает коэффициент MDST и коэффициент MDCT кадра, где коэффициент MDCT - параметр вещественной части, а коэффициент MDST - параметр мнимой части.

Если L1 кадров не содержат (Р-1)-й кадр, используют алгоритм FMDST для получения коэффициентов MDST L1 кадров согласно коэффициентам MDCT, полученным посредством декодирования кадров перед текущим потерянным кадром. Для каждого кадра в L1 кадрах комплексный сигнал в области MDCT-MDST каждого кадра включает коэффициент MDST и коэффициент MDCT кадра, где коэффициент MDCT - параметр вещественной части, а коэффициент MDST - параметр мнимой части.

При этом способ вычисления коэффициента MDST включает:

выполнение обратного преобразования MDCT для получения сигнала во временной области для (Р-2)-го кадра согласно коэффициентам MDCT (Р-1)-го кадра и (Р-2)-го кадра и выполнение обратного преобразования MDCT для получения сигнала во временной области для (Р-3)-го кадра согласно коэффициентам MDCT (Р-2)-го кадра и (Р-3)-го кадра и т.д.;

использование алгоритма FMDST для получения коэффициента MDST (Р-2)-го кадра согласно сигналам во временной области для (Р-2)-го кадра и (Р-3)-го кадра и использование алгоритма FMDST для получения коэффициента MDST (Р-3)-го кадра согласно сигналам во временной области для (Р-3)-го кадра и (Р-4)-го кадра и т.д.

Последовательность Р-го кадра, (Р-1)-го кадра и других кадров показана на фиг.1.

3b) Нахождение набора частот с пиковыми значениями для каждого кадра в упомянутых L1 кадрах.

Если L1 кадров содержат (Р-1)-й кадр, то

для (Р-1)-го кадра вычисляют мощность каждой частоты в (Р-1)-ом кадре согласно коэффициенту MDCT (Р-1)-го кадра и получают набор, включающий множество предыдущих частот, имеющих самую большую мощность;

для каждого другого кадра, кроме (Р-1)-го кадра, вычисляют мощность каждой частоты в кадре согласно комплексному сигналу кадра в области MDCT-MDST и получают набор, включающий множество предыдущих частот, имеющих самую большую мощность; при этом частота с пиковым значением относится к частоте, мощность сигнала на которой больше мощности сигнала на двух соседних с ней частотах.

Если L1 кадров не содержат (Р-1)-й кадр, то

для каждого кадра в L1 кадрах набор, включающий множество предыдущих частот, имеющих самые большие значения мощности, получают согласно комплексному сигналу кадра в области MDCT-MDST,

при этом число частот в L1 наборах может быть одинаковым или различным.

Наборы L1 также могут быть получены другими способами, например, для каждого кадра берут набор, включающий частоты с пиковыми значениями, мощности которых больше установленного порога, при этом порог для каждого кадра может быть одинаковым или различным.

3с) Если L1>1, и L1 наборов частот обозначены как S₁,…,S_L1, и число соответствующих частот в наборах составляет N₁,…,N_L1, выбирают набор S_i и для каждой частоты m_j (j=1…N_i) с пиковыми значениями в наборе S_i определяют, принадлежит ли какая-либо частота среди частот m_j, m_j±1,…,m_j±K (K - неотрицательное целое число, обычно K=0 или 1) одновременно всем другим наборам частот с пиковыми значениями, если да, помещают все частоты m_j, m_j±1,…,m_j±k в набор S_C частот.

Если среди частот m_j, m_j±1,…m_j±К для каждой частоты m_j (j=1…N_i) с пиковым значением в наборе S_i нет частоты, принадлежащей одновременно всем другим наборам частот с пиковыми значениями, все частоты в кадре непосредственно помещают в набор S_C частот.

Если L1=1, и набор частот обозначен как S₁, а соответствующее число частот равно N₁, для каждой частоты m_i (i=1…N₁) с пиковым значением в наборе S₁ частот с пиковыми значениями все частоты m_i, m_i±1,…m_i±K (K - неотрицательное целое число, которое обычно выбирается как K=0 или 1) помещают в набор S_C частот.

Вышеупомянутые разделы шагов 3а, 3b и 3с также можно не выполнять и непосредственно помещать все частоты в кадре в набор S_C частот.

3d) Берут L2 (L2>1) кадров перед (Р-1)-ым кадром, вычисляют и получают комплексные сигналы L2 кадров в области MDCT-MDST (кокретный способ вычисления такой же, как на шаге 3а). Для каждой частоты в наборе S_C частот получают фазу текущего потерянного кадра в области MDCT-MDST, используя фазы L2 кадров в области MDCT-MDST, и получают амплитуду текущего потерянного кадра в области MDCT-MDST, используя амплитуды L2 кадров в области MDCT-MDST, и затем получают коэффициент MDCT текущего потерянного кадра, соответствующий каждой частоте, согласно фазе и амплитуде текущего потерянного кадра.

Если L2=2, то для всех частот в наборе S_C частот используют фазы двух выбранных кадров на каждой предсказываемой частоте, чтобы выполнить линейную экстраполяцию для получения фазы комплексного сигнала в области MDCT-MDST для текущего потерянного кадра на этой частоте; получают амплитуду комплексного сигнала в области MDCT-MDST для текущего потерянного кадра на упомянутой частоте из амплитуды в области MDCT-MDST одного из двух кадров на этой частоте, то есть используют амплитуду в области MDCT-MDST одного из двух кадров на данной частоте в качестве амплитуды в области MDCT-MDST для текущего потерянного кадра на этой частоте.

Один из способов линейной экстраполяции заключается в следующем.

Если L2=2, f1-и кадр и t2-й кадр используют для представления двух кадров, соответственно, фазу Р-го кадра в области MDCT-MDST предсказывают для предсказываемой частоты т следующим образом: ${\hat{ϕ}}^{p} (m) = ϕ^{t 1} (m) + \frac{p - t 1}{t 1 - t 2} [ϕ^{t 1} (m) - ϕ^{t 2} (m)]$ , где ${\hat{ϕ}}^{р} (m)$ - предсказываемое значение фазы Р-го кадра в области MDCT-MDST на частоте m, φ^t1(m) - фаза t1-го кадра в области MDCT-MDST на частоте m и φ^t2(m) - фаза t2-го кадра в области MDCT-MDST на частоте m.

Если L2>2, то для всех частот в наборе S_C используют фазы в области MDCT-MDST для L2 кадров на каждой предсказываемой частоте, чтобы выполнить линейную аппроксимацию для получения фазы комплексного сигнала в области MDCT-MDST для текущего потерянного кадра на упомянутой частоте; получают амплитуду комплексного сигнала в области MDCT-MDST текущего потерянного кадра на упомянутой частоте из амплитуды в области MDCT-MDST одного из двух кадров на этой частоте, то есть используют амплитуду в области MDCT-MDST одного из двух кадров на упомянутой частоте в качестве амплитуды в области MDCT-MDST текущего потерянного кадра на этой частоте.

3е) Для частоты вне набора S_C частот вычисляют значения коэффициентов MDCT Р-го кадра, используя значения коэффициентов MDCT множества кадров перед Р-ым кадром. Например, в качестве значения коэффициента MDCT текущего потерянного кадра используют половину значения коэффициента MDCT кадра, непосредственно предшествующего текущему потерянному кадру.

В другом примере изобретения на шаге S3 или перед шагом 3а выполняют шаг использования значений коэффициентов MDCT множества кадров перед текущим потерянным кадром, чтобы вычислить значение коэффициента MDCT текущего потерянного кадра для каждой частоты в кадре, и затем выполняют шаги 3а, 3b, 3с и 3d, а шаг 3е пропускают для перехода к шагу S4.

Могут быть выполнены и другие изменения, например, шаг 3е может быть выполнен после шага 3с и перед шагом S4, то есть только после того, как получен набор S_C частот.

Шаг S4. Выполняют преобразование IMDCT (обратное преобразование MDCT) для коэффициентов MDCT текущего потерянного кадра на всех частотах, чтобы получить сигнал во временной области для текущего потерянного кадра.

Приведенный пример может быть изменен следующим образом: сначала выполняют начальную компенсацию, то есть вычисляют значение коэффициента MDCT Р-го кадра, используя значения коэффициентов MDCT множества кадров перед Р-ым кадром, затем определяют тип текущего потерянного кадра и выполняют различные шаги согласно типу текущего потерянного кадра; непосредственно выполняют шаг S4, если кадр является кадром без множества гармоник, а если кадр является кадром с множеством гармоник, выполняют на шаге S3 шаги 3а, 3b, 3с и 3d и тогда пропускают шаг 3е, чтобы непосредственно выполнить шаг S4.

Далее изобретение будет пояснено на двух конкретных примерах.

Пример 1

Шаг 110. При обнаружении потери пакета данных текущего кадра декодирующий конец определяет, является ли текущий кадр (то есть текущий потерянный кадр) кадром с множеством гармоник (например, музыкальный кадр, включающий различные гармоники), и выполняет шаг 120, если текущий кадр является кадром без множества гармоник, или, в противном случае, выполняет шаг 130.

Конкретный способ оценки включает

вычисление равномерности спектра 10 кадров перед текущим потерянным кадром, при этом, если равномерность спектра меньше 0,1, считают, что кадр является кадром стационарного сигнала с множеством гармоник; если более 8 кадров в 10 кадрах перед потерянным кадром являются кадрами стационарного сигнала с множеством гармоник, считают, что текущий потерянный кадр является кадром с множеством гармоник, в противном случае считают, что текущий потерянный кадр является кадром без множества гармоник. Способ вычисления равномерности спектра состоит в следующем:

равномерность спектра i-го кадра SFM_i определяют как отношение среднего геометрического к среднему арифметическому амплитуды сигнала в области преобразования сигнала i-го кадра:

$S F M_{i} = \frac{G_{i}}{A_{i}}, (1)$

где $G_{i} = (\prod_{m = 0}^{M - 1} | c^{i} (m) |)^{\frac{1}{M}}$ - среднее геометрическое амплитуды сигнала i-го кадра, $A_{i} = \frac{1}{M} \sum_{m = 0}^{M - 1} | c^{i} (m) |$ - среднее арифметическое амплитуды сигнала i-го кадра, cⁱ(m) - коэффициент MDCT i-го кадра на частоте m, и М - длина кадра сигнала в области MDCT.

Шаг 120. Если определяют, что текущий потерянный кадр является кадром без множества гармоник, в качестве значения коэффициента MDCT текущего потерянного кадра для каждой частоты в кадре используют половину значения коэффициента MDCT кадра, непосредственно предшествующего текущему потерянному кадру, то есть

$c^{р} (m) = 0,5 * c^{р - 1} (m), (2)$

где m=0, 1, 2, 3…М-1,

затем выполняют шаг 140.

Шаг 130. Если определяют, что текущий потерянный кадр является кадром с множеством гармоник, коэффициент MDCT текущего потерянного кадра получают с использованием алгоритма компенсации потери кадров с множеством гармоник без задержки и выполняют шаг 140.

Конкретный способ использования алгоритма компенсации потери кадров с множеством гармоник без задержки для получения коэффициента MDCT текущего потерянного кадра показан на фиг.5 и заключается в следующем:

если пакет данных Р-го кадра потерян, сначала в качестве значения коэффициента MDCT Р-го кадра на упомянутой частоте для всех частот в кадре используют половину значения коэффициента MDCT (Р-1)-го кадра на упомянутой частоте, как указано в формуле (2);

затем используют алгоритм FMDST, чтобы получить коэффициенты MDST s^P-2(m) и s^P-3(m) (Р-2)-го кадра и (Р-3)-го кадра согласно коэффициентам MDCT, которые получены посредством декодирования кадров перед текущим потерянным кадром. Полученные коэффициенты MDST (Р-2)-го кадра и (Р-3)-го кадра и коэффициенты MDCT (P-2)-го кадра и (Р-3)-го кадра с^Р-2(m) и с^Р-3(m) составляют комплексные сигналы в области MDCT-MDST:

$ν^{p - 2} (m) = c^{р - 2} (m) + j s^{р - 2} (m), (3)$

$ν^{р - 3} (m) = c^{р - 3} (m) + j s^{р - 3} (m), (4)$

где j - символ мнимого числа;

вычисляют мощность каждой частоты в (Р-2)-ом кадре и (Р-3)-ом кадре, составляют наборы m^p-2, m^p-3 частот, беря первые 10 частот с пиковыми значениями, имеющих самую большую мощность соответственно в (Р-2)-ом кадре и (Р-3)-ом кадре (если число частот с пиковыми значениями в каком-либо кадре меньше 10, берут все частоты с пиковыми значениями в этом кадре);

оценивают мощность каждой частоты в (Р-1)-ом кадре согласно коэффициенту MDCT (Р-1)-го кадра:

${| {\hat{ν}}^{р - 1} (m) |}^{2} = {[c^{р - 1} (m)]}^{2} + {[c^{р - 1} (m + 1) - c^{р - 1} (m - 1)]}^{2}, (5)$

где ${| {\hat{ν}}^{р - 1} (m) |}^{2}$ - мощность (Р-1)-го кадра на частоте m, c^p-1(m+1) - коэффициент MDCT (Р-1)-го кадра на частоте m+1, и далее аналогично;

получают посредством вычисления первые 10 частот $m_{i}^{р - 1}$ , i=1…10 с пиковыми значениями, имеющих самую большую мощность в (Р-1)-ом кадре, при этом, если число частот с пиковыми значениями в каком-либо кадре меньше 10, берут все частоты $m_{i}^{р - 1}$ , i=1…N^p-1 с пиковыми значениями в кадре;

для каждой частоты $m_{i}^{р - 1}$ определяют, принадлежат ли какая-либо из частот $m_{i}^{р - 1}$ , $m_{i}^{р - 1} \pm 1$ (частоты вблизи частоты с пиковым значением добавляют к набору частот с пиковыми значениями (Р-1)-го кадра, поскольку их мощность также может быть очень большой) наборам m^p-2, m^p-3 одновременно, если да, получают фазу и амплитуду комплексного сигнала в области MDCT-MDST для Р-го кадра на частотах $m_{i}^{р - 1}$ , $m_{i}^{р - 1} \pm 1$ , (следующее вычисление выполняют для всех трех частот $m_{i}^{р - 1}$ , $m_{i}^{р - 1} \pm 1$ при условии, что одна из частот $m_{i}^{р - 1}$ , $m_{i}^{р - 1} \pm 1$ принадлежит наборам m^p-2, m^p-3 одновременно) согласно следующим формулам (6)-(11):

$ϕ^{р - 2} (m) = ∠ ν^{р - 2} (m), (6)$

$ϕ^{р - 3} (m) = ∠ ν^{р - 3} (m), (7)$

$А^{р - 2} (m) = | ν^{р - 2} (m) |, (8)$

$А^{р - 3} (m) = | ν^{р - 3} (m) |, (9)$

${\hat{φ}}^{р} (m) = φ^{р - 2} (m) + 2 [φ^{р - 2} (m) - φ^{р - 3} (m)], (10)$

${\hat{А}}^{р} (m) = А^{р - 2} (m), (11)$

где φ, A - фаза и амплитуда, соответственно, ${\hat{ϕ}}^{р} (m)$ - фаза Р-го кадра на частоте m, ${\hat{ϕ}}^{р - 2} (m)$ - фаза (Р-2)-го кадра на частоте m, ${\hat{ϕ}}^{р - 3} (m)$ - фаза (Р-3)-го кадра на частоте m, ${\hat{А}}^{р} (m)$ - амплитуда Р-го кадра на частоте m и ${\hat{А}}^{р - 2} (m)$ - амплитуда (Р-2)-го кадра на частоте m, и далее аналогично;

соответственно, коэффициент MDCT Р-го кадра на частоте m, получаемый посредством компенсации, определяется выражением

${\hat{c}}^{р} (m) = {\hat{А}}^{р} (m) \cos [{\hat{ϕ}}^{р} (m)] . (12)$

Если нет частоты из всех частот $m_{i}^{р - 1}$ , $m_{i}^{р - 1} \pm 1$ , принадлежащей наборам m^p-2, m^p-3 одновременно, оценивают коэффициенты MDCT для всех частот текущего потерянного кадра по формулам (6)-(12).

Операцию вычисления предсказываемых частот также можно не выполнять и непосредственно оценивать коэффициенты MDCT по формулам (6)-(12) для всех частот в текущем потерянном кадре.

Шаг 140. Выполняют преобразование IMDCT для коэффициентов MDCT текущего потерянного кадра на всех частотах, чтобы получить сигнал во временной области для текущего потерянного кадра.

Пример 2

Шаг 210. При обнаружении потери пакета данных текущего кадра декодирующий конец определяет, является ли текущий кадр (то есть текущий потерянный кадр) кадром с множеством гармоник (например, музыкальным кадром, включающим различные гармоники), и выполняет шаг 220, если текущий кадр является кадром без множества гармоник, или, в противном случае, выполняет шаг 230.

Конкретный способ определения, является ли текущий потерянный кадр кадром с множеством гармоник, состоит в следующем:

вычисляют равномерность спектра 10 кадров перед текущим потерянным кадром и для каждого кадра полагают, что кадр является кадром стационарного сигнала с множеством гармоник, если равномерность спектра меньше 0,1; если более 8 кадров в 10 кадрах перед потерянным кадром являются кадрами стационарного сигнала с множеством гармоник, считают, что текущий потерянный кадр является кадром с множеством гармоник, в противном случае считают, что текущий потерянный кадр является кадром без множества гармоник. Способ вычисления равномерности спектра состоит в следующем:

$S F M_{i} = \frac{G_{i}}{A_{i}}, (13)$

Шаг 220. Если определяют, что текущий потерянный кадр является кадром без множества гармоник, то в качестве значения коэффициента MDCT текущего потерянного кадра для каждой частоты в кадре используют половину значения коэффициента MDCT кадра, непосредственно предшествующего текущему потерянному кадру, то есть

$c^{р} (m) = 0,5 * c^{р - 1} (m), (14)$

где m=0, 1, 2, 3…M-1,

затем выполняют шаг 240.

Шаг 230. Если определяют, что текущий потерянный кадр является кадром с множеством гармоник, то коэффициент MDCT текущего потерянного кадра получают с использованием алгоритма компенсации потери кадров с множеством гармоник без задержки и выполняют шаг 240.

Конкретный способ использования алгоритма компенсации потери кадров с множеством гармоник без задержки для получения коэффициента MDCT текущего потерянного кадра заключается в следующем: когда пакет данных Р-го кадра потерян, то используют алгоритм FMDST, чтобы получить коэффициенты MDST s^P-2(m), s^P-3(m) и s^P-4(m) (Р-2)-го кадра, (Р-3)-го кадра и (Р-4)-го кадра согласно коэффициентам MDCT, которые получены посредством декодирования кадров перед текущим потерянным кадром. Полученные коэффициенты MDST (Р-2)-го кадра, (Р-3)-го кадра и (Р-4)-го кадра и коэффициенты MDCT (Р-2)-го кадра, (Р-3)-го кадра и (Р-4)-го с^Р-2(m), c^P-3(m) и c^P-4(m) составляют комплексные сигналы в области MDCT-MDST:

$ν^{р - 2} (m) = c^{р - 2} (m) + j s^{р - 2} (m), (15)$

$ν^{р - 3} (m) = c^{р - 3} (m) + j s^{р - 3} (m), (16)$

$ν^{р - 4} (m) = c^{р - 4} (m) + j s^{р - 4} (m), (17)$

где j - символ мнимого числа.

Вычисляют мощность каждой частоты в (Р-2)-ом кадре, (Р-3)-ом кадре и (Р-4)-ом кадре ${| ν^{р - 2} (m) |}^{2}$ , ${| ν^{р - 3} (m) |}^{2}$ , ${| ν^{р - 4} (m) |}^{2}$ , составляют наборы m^p-2, m^p-3, m^p-4 частот, беря первые 10 частот с пиковыми значениями, имеющие самую большую мощность соответственно в (Р-2)-ом кадре, (Р-3)-ом кадре и (Р-4)-ом кадре (если число частот с пиковыми значениями в каком-либо кадре меньше 10, берут все частоты с пиковыми значениями в кадре).

Для каждой частоты $m_{i}^{р - 4}$ в наборе m^p-4 частот определяют, принадлежат ли какие-либо из частот $m_{i}^{р - 4}$ , $m_{i}^{р - 4} \pm 1$ (частоты вблизи частоты с пиковым значением добавляют к набору частот с пиковыми значениями Р-4-го кадра, поскольку их мощность также может быть очень большой) наборам m^p-2, m^p-3 одновременно, и, если да, получают фазу и амплитуду комплексного сигнала в области MDCT-MDST для Р-го кадра на частотах $m_{i}^{р - 1}$ , $m_{i}^{р - 1} \pm 1$ , (следующее вычисление выполняют для всех трех частот $m_{i}^{р - 1}$ , $m_{i}^{р - 1} \pm 1$ при условии, что одна из частот $m_{i}^{р - 1}$ , $m_{i}^{р - 1} \pm 1$ одновременно принадлежит наборам m^p-2, m^p-3) согласно следующим формулам (18)-(27):

$ϕ^{р - 2} (m) = ∠ ν^{р - 2} (m), (18)$

$ϕ^{р - 3} (m) = ∠ ν^{р - 3} (m), (19)$

$ϕ^{р - 4} (m) = ∠ ν^{р - 4} (m), (20)$

$А^{р - 2} (m) = | ν^{р - 2} (m) |, (21)$

$А^{р - 3} (m) = | ν^{р - 3} (m) |, (22)$

$А^{р - 4} (m) = | ν^{р - 4} (m) |, (23)$

${\hat{А}}^{р} (m) = А^{р - 2} (m), (24)$

где φ, А - фаза и амплитуда, соответственно, ${\hat{ϕ}}^{р} (m)$ - фаза Р-го кадра на частоте m, ${\hat{ϕ}}^{р - 2} (m)$ - фаза (Р-2)-го кадра на частоте m, ${\hat{ϕ}}^{р - 3} (m)$ - фаза (Р-3)-го кадра на частоте m, ${\hat{А}}^{р} (m)$ - амплитуда Р-го кадра на частоте m и ${\hat{А}}^{р - 2} (m)$ - амплитуда (Р-2)-го кадра на частоте m, и далее аналогично;

для вычисления функции линейной аппроксимации фаз различных кадров на одной и той же частоте используют метод наименьших квадратов

$ϕ (m) = а_{0} + а_{1} х, (25)$

где х - порядковый номер кадра, а₀, а₁ - коэффициенты функции линейной аппроксимации, которые необходимо вычислить.

Коэффициенты а₀, а₁ получают из следующей системы формул согласно способу измерения ошибки аппроксимации с использованием критерия наименьших квадратов

$[\begin{matrix} 3 & \sum_{k = 2}^{4} p - k \\ \sum_{k = 2}^{4} p - k & \sum_{k = 2}^{4} {(p - k)}^{2} \end{matrix}] [\begin{matrix} а_{0} \\ а_{1} \end{matrix}] = [\begin{matrix} \sum_{k = 2}^{4} ϕ^{p - k} (m) \\ \sum_{k = 2}^{4} (p - k) ϕ^{p - k} (m) \end{matrix}] . (26)$

В других примерах также может измеряться ошибка аппроксимации, и могут оцениваться коэффициенты аппроксимации с использованием других критериев помимо критерия наименьших квадратов. Фаза Р-го кадра на частоте m тогда может оцениваться согласно полученным коэффициентам а₀, а₁ как

${\hat{ϕ}}^{р} (m) = а_{0} + а_{1} р . (27)$

Соответственно, коэффициент MDCT Р-го кадра на частоте m, получаемый посредством компенсации, равен

${\hat{c}}^{р} (m) = {\hat{А}}^{р} (m) \cos [{\hat{ϕ}}^{р} (m)] . (28)$

Если какая-либо частота из всех частот $m_{i}^{р - 4}$ , $m_{i}^{р - 4} \pm 1$ не принадлежит наборам m^p-2, m^p-3 одновременно, то S_C используют для обозначения набора, включающего все частоты, которые скомпенсированы согласно формулам (18)-(28), и в качестве значения коэффициента MDCT текущего потерянного кадра для частоты, которая находится вне набора S_C частот в кадре используют половину значения коэффициента MDCT кадра, непосредственно предшествующего текущему потерянному кадру.

Если нет частоты среди всех частот $m_{i}^{р - 4}$ , $m_{i}^{р - 4} \pm 1$ , принадлежащей наборам m^p-2, m^p-3 одновременно, то коэффициенты MDCT оценивают для всех частот текущего потерянного кадра по формулам (18)-(28).

Операцию вычисления предсказываемых частот также можно не выполнять и непосредственно оценивать коэффициенты MDCT по формулам (18)-(28) для всех частот в текущем потерянном кадре.

Шаг 240. Выполняют преобразование IMDCT для коэффициентов MDCT текущего потерянного кадра на всех частотах, чтобы получить сигнал во временной области для текущего потерянного кадра.

Также предлагается компенсатор потери кадров звукового сигнала в области MDCT, содержащий модуль определения типа кадра, модуль компенсации потери кадров без множества гармоник, модуль компенсации потери кадров с множеством гармоник, второй модуль компенсации и модуль IMDCT, как показано на фиг.6, при этом

модуль определения типа кадра сконфигурирован так, чтобы при обнаружении того, что текущий кадр потерян, определять тип текущего потерянного кадра и подавать модулю компенсации потери кадров без множества гармоник команду на компенсацию, если текущий потерянный кадр является кадром без множества гармоник; подавать модулю компенсации потери кадров с множеством гармоник команду на компенсацию, если текущий потерянный кадр является кадром с множеством гармоник; конкретный способ определения типа текущего потерянного кадра описан ранее и поэтому здесь не приводится;

модуль компенсации потери кадров без множества гармоник сконфигурирован так, чтобы для всех частот в кадре использовать значения коэффициентов MDCT множества кадров перед текущим потерянным кадром для вычисления значения коэффициента MDCT текущего потерянного кадра и передавать коэффициент MDCT в модуль IMDCT;

модуль компенсации потери кадров с множеством гармоник сконфигурирован так, чтобы, когда текущий потерянный кадр является Р-ым кадром, получать набор предсказываемых частот и для каждой частоты в наборе предсказываемых частот использовать фазы и амплитуды множества кадров перед (Р-1)-ым кадром в области MDCT-MDST, чтобы предсказывать фазу и амплитуду Р-го кадра в области MDCT-MDST, использовать предсказанную фазу и амплитуду Р-го кадра в области MDCT-MDST для получения коэффициента MDCT Р-го кадра на каждой частоте и передавать коэффициент MDCT во второй модуль компенсации, причем (Р-1)-й кадр является кадром, непосредственно предшествующим Р-му кадру;

модуль компенсации потери кадров с множеством гармоник сконфигурирован так, чтобы использовать комплексные сигналы в области MDCT-MDST для (Р-2)-го кадра и (Р-3)-го кадра и коэффициент MDCT (Р-1)-го кадра для получения набора предсказываемых частот и использовать фазы и амплитуды (Р-2)-го кадра и (Р-3)-го кадра в области MDCT-MDST для предсказания фазы и амплитуды Р-го кадра в области MDCT-MDST для каждой частоты в наборе частот.

При получении набора предсказываемых частот модуль компенсации потери кадров с множеством гармоник использует комплексные сигналы в области MDCT-MDST и/или коэффициенты MDCT множества кадров перед Р-ым кадром для получения набора предсказываемых частот или непосредственного помещения всех частот в кадре в набор частот.

Второй модуль компенсации сконфигурирован так, чтобы для частоты вне набора предсказываемых частот в кадре использовать значения коэффициентов MDCT множества кадров перед Р-ым кадром для вычисления коэффициента MDCT Р-го кадра на упомянутой частоте, передавать коэффициенты MDCT Р-го кадра на всех частотах в модуль IMDCT; кроме того, второй модуль компенсации использует в качестве значения коэффициента MDCT Р-го кадра на частоте вне набора предсказываемых частот половину значения коэффициента MDCT (Р-1)-го кадра.

Модуль компенсации потери кадров с множеством гармоник также содержит блок генерации набора частот и блок генерации коэффициентов, причем

блок генерации набора частот сконфигурирован для генерации набора S_C предсказываемых частот;

блок генерации коэффициентов сконфигурирован так, чтобы использовать фазы и амплитуды L2 кадров перед (Р-1)-ым кадром в области MDCT-MDST для предсказания фазы и амплитуды каждой частоты, принадлежащей набору Sc частот в Р-ом кадре, использовать предсказанную фазу и амплитуду Р-го кадра в области MDCT-MDST для получения коэффициента MDCT Р-го кадра на каждой соответствующей частоте и передавать коэффициент MDCT во второй модуль компенсации, причем L2>1.

Блок генерации набора частот сконфигурирован так, чтобы генерировать набор S_C предсказываемых частот путем назначения множества кадров перед Р-ым кадром как L1 кадров, вычисления мощности каждой частоты в L1 кадрах и получения наборов S₁,…,S_L1, включающих частоты с пиковыми значениями в каждом кадре из L1 кадров, при этом число частот, соответствующих каждому набору, составляет N₁,…,N_L1, соответственно;

выбора набора S_i из L1 наборов S₁,…,S_L1, определения, имеется ли частота среди частот m_j, m_j±1,…,m_j±k, принадлежащая всем другим наборам частот с пиковыми значениями одновременно, для каждой частоты m_j, j=1…N_i с пиковым значением в наборе S_i, если да, то помещение всех частот m_j, m_j±1,…,m_j±k в набор S_C частот;

если нет частоты среди частот m_j, m_j±1,…,m_j±k, принадлежащей всем другим наборам частот с пиковыми значениями одновременно для каждой частоты m_j, j=1…N_i с пиковым значением в наборе S_i, помещение всех частот в кадре в набор S_C частот;

где k - неотрицательное целое число. Частота с пиковым значением относится к частоте, мощность которой больше мощности двух соседних с ней частот.

Когда (Р-1)-й кадр входит в состав L1 кадров, блок генерации набора частот вычисляет мощность каждой частоты в (Р-1)-ом кадре следующим образом:

${| {\hat{ν}}^{р - 1} (m) |}^{2} = {[c^{р - 1} (m)]}^{2} + {[c^{р - 1} (m + 1) - c^{р - 1} (m - 1)]}^{2}$ , где ${| {\hat{ν}}^{р - 1} (m) |}^{2}$ - мощность частоты m в (Р-1)-ом кадре, с^р-1(m) - коэффициент MDCT частоты m в (Р-1)-ом кадре, c^p-1(m+1) - коэффициент MDCT частоты m+1 в (Р-1)-ом кадре, с^р-1(m-1) - коэффициент MDCT частоты m-1 в (Р-1)-ом кадре.

Блок генерации коэффициентов также содержит субблок предсказания фазы и субблок предсказания амплитуды, при этом

субблок предсказания фазы сконфигурирован так, чтобы для предсказываемой частоты использовать фазы Z-2 кадров в области MDCT-MDST на упомянутой частоте для выполнения линейной экстраполяции или линейной аппроксимации, чтобы получить фазу Р-го кадра в области MDCT-MDST на упомянутой частоте;

субблок предсказания амплитуды сконфигурирован так, чтобы получать амплитуду Р-го кадра в области MDCT-MDST на упомянутой частоте из амплитуды одного из L2 кадров в области MDCT-MDST на упомянутой частоте.

Если L2=2, то t1-й кадр и t2-й кадр используют для представления двух кадров соответственно, и субблок предсказания фазы предсказывает фазу Р-го кадра в области MDCT-MDST для предсказываемой частоты m следующим образом: ${\hat{ϕ}}^{р} (m) = ϕ^{t 1} (m) + \frac{p - t 1}{t 1 - t 2} [ϕ^{t 1} (m) - ϕ^{t 2} (m)]$ , где ${\hat{ϕ}}^{р} (m)$ - предсказываемое значение фазы Р-го кадра в области MDCT-MDST на упомянутой частоте m, φ^t1(m) - фаза t1-го кадра в области MDCT-MDST на частоте m, и φ^t2(m) - фаза t2-го кадра в области MDCT-MDST на частоте m.

Если L2>2, субблок предсказания фазы предсказывает фазу Р-го кадра в области MDCT-MDST путем выполнения для предсказываемой частоты линейной аппроксимации фаз выбранных L2 кадров в области MDCT-MDST на упомянутой частоте для получения фазы Р-го кадра в области MDCT-MDST на этой частоте.

Модуль IMDCT сконфигурирован так, чтобы выполнять преобразование IMDCT для коэффициентов MDCT Р-го кадра на всех частотах для получения сигнала во временной области для Р-го кадра.

Компенсатор потери кадров звукового сигнала в области MDCT, показанный на фиг.6, может быть изменен так, как показано на фиг.7, и может содержать модуль определения типа кадра, модуль компенсации потери кадров без множества гармоник, модуль компенсации потери кадров с множеством гармоник, второй модуль компенсации и модуль IMDCT, при этом второй модуль компенсации соединен с модулем определения типа кадра и модулем компенсации потери кадров с множеством гармоник, а модуль компенсации потери кадров с множеством гармоник соединен с модулем IMDCT, причем

второй модуль компенсации сконфигурирован так, чтобы для всех частот в кадре использовать значения коэффициентов MDCT множества кадров перед текущим потерянным кадром для вычисления значения коэффициента MDCT текущего потерянного кадра и передавать коэффициент MDCT в модуль компенсации потери кадров с множеством гармоник;

модуль компенсации потери кадров с множеством гармоник сконфигурирован так, чтобы получать набор предсказываемых частот и получать коэффициент MDCT Р-го кадра на каждой частоте в наборе предсказываемых частот, при этом конкретный способ является таким же, что и у модуля компенсации потери кадров с множеством гармоник, показанного на фиг.6; для каждой частоты вне набора предсказываемых частот используют коэффициент MDCT, полученный от второго модуля компенсации в качестве коэффициента MDCT Р-го кадра на упомянутой частоте и передают коэффициенты MDCT Р-го кадра на всех частотах в модуль IMDCT.

Функции других модулей аналогичны функциям модулей, показанных на фиг.6, и поэтому здесь не приводятся.

На фиг.8 показана другая структурная схема компенсатора потери кадров звукового сигнала в области MDCT согласно настоящему изобретению, в которой компенсатор потери кадров звукового сигнала в области MDCT включает модуль компенсации потери кадров без множества гармоник, модуль определения типа кадра, модуль компенсации потери кадров с множеством гармоник и модуль IMDCT, при этом

модуль компенсации потери кадров без множества гармоник сконфигурирован так, чтобы при обнаружении потерянного кадра использовать значения коэффициентов MDCT множества кадров перед текущим потерянным кадром для вычисления значения коэффициента MDCT текущего потерянного кадра для всех частот в кадре и передавать коэффициент MDCT в модуль определения типа кадра;

модуль определения типа кадра сконфигурирован так, чтобы определять тип текущего потерянного кадра, и если текущий потерянный кадр является кадром без множества гармоник, то передавать в модуль IMDCT коэффициент MDCT, принятый от модуля компенсации потери кадров без множества гармоник; если текущий потерянный кадр является кадром с множеством гармоник, то передавать коэффициент MDCT в модуль компенсации потери кадров с множеством гармоник; при этом конкретный способ определения типа текущего потерянного кадра описан выше и поэтому здесь не приводится.

Модуль компенсации потери кадров с множеством гармоник сконфигурирован так, чтобы получать набор предсказываемых частот и коэффициент MDCT Р-го кадра на каждой частоте в наборе предсказываемых частот; при этом конкретный способ является таким же, что и у модуля компенсации потери кадров с множеством гармоник, показанного на фиг.6; для каждой частоты вне набора предсказываемых частот используют коэффициент MDCT, полученный от модуля определения типа кадра, в качестве коэффициента MDCT Р-го кадра на упомянутой частоте и передают коэффициенты MDCT Р-го кадра на всех частотах в модуль IMDCT;

модуль IMDCT сконфигурирован так, чтобы выполнять преобразование IMDCT для коэффициентов MDCT текущего потерянного кадра на всех частотах для получения сигнала во временной области для Р-го кадра.

Способ компенсации и компенсатор потери кадров звукового сигнала, раскрытые в изобретении, могут быть применены для решения задачи компенсации потери кадров звукового сигнала при двусторонней связи в реальном времени, такой как радиосвязь, видеоконференции по протоколу Интернета, а также в области предоставления широковещательных услуг в реальном времени, например, в телевидении по протоколу Интернета (Internet Protocol Television, IPTV), при передаче потоковой мультимедийной информации в системах мобильной связи, в мобильном телевидении и других областях для улучшения защиты от ошибок передаваемого битового потока. Изобретение позволяет хорошо устранять ухудшения качества речи, вызываемые потерей пакета во время передачи по сети звуковых и речевых сигналов, посредством операции компенсации, улучшает комфорт и качество звуковых и речевых сигналов после потери пакета и сильно влияет на восприятие звучания.

Промышленная применимость

По сравнению с известным уровнем техники компенсатор и способ компенсации потери кадров звукового сигнала в области MDCT согласно настоящему изобретению имеют преимущества отсутствия задержки, малого объема вычислений, малого объема пространства памяти, простоты реализации и т.д.

1. Способ компенсации потери кадров звукового сигнала в области модифицированного дискретного косинусного преобразования, включающий:
шаг а, на котором, когда текущий потерянный кадр является Р-м кадром, получают набор предсказываемых частот, для каждой частоты в наборе предсказываемых частот используют фазы и амплитуды множества кадров перед (Р-1)-м кадром в области модифицированного дискретного косинусного преобразования - модифицированного дискретного синусного преобразования (MDCT-MDST) для предсказания фазы и амплитуды Р-го кадра в области MDCT-MDST и используют предсказанную фазу и амплитуду Р-го кадра в области MDCT-MDST для получения коэффициента MDCT Р-го кадра на каждой частоте, при этом (Р-1)-й кадр предшествует Р-му кадру;
шаг b, на котором для любой частоты в кадре вне набора предсказываемых частот используют коэффициенты MDCT множества кадров перед Р-м кадром для вычисления коэффициента MDCT Р-го кадра на этой частоте;
шаг с, на котором выполняют обратное модифицированное дискретное косинусное преобразование (IMDCT) для коэффициентов MDCT Р-го кадра на всех частотах для получения сигнала во временной области для Р-го кадра.

2. Способ по п.1, отличающийся тем, что перед шагом а способ также включает, при обнаружении того, что текущий кадр потерян, определение типа текущего потерянного кадра и выполнение шага а, если текущий потерянный кадр является кадром с множеством гармоник.

3. Способ по п.2, отличающийся тем, что шаг определения типа текущего потерянного кадра включает:
вычисление равномерности спектра каждого из К кадров перед текущим потерянным кадром; при этом если число кадров, равномерность спектра которых меньше порогового значения, является меньшим или равным К₀ в К кадрах, то текущий потерянный кадр является кадром без множества гармоник, и если число кадров, равномерность спектра которых меньше порогового значения, больше К₀, то текущий потерянный кадр является кадром с множеством гармоник, при этом К₀<К, где К₀, К - натуральные числа.

4. Способ по п.1, отличающийся тем, что шаг получения набора предсказываемых частот на шаге а включает:
использование комплексных сигналов в области MDCT-MDST и/или коэффициентов MDCT множества кадров перед Р-м кадром для получения набора S_C предсказываемых частот или непосредственное помещение всех частот в кадре в набор S_C предсказываемых частот.

5. Способ по п.4, отличающийся тем, что шаг использования комплексных сигналов в области MDCT-MDST и/или коэффициентов MDCT множества кадров перед Р-м кадром для получения набора S_C предсказываемых частот включает:
назначение упомянутого множества кадров перед Р-м кадром как L1 кадров, вычисление мощности каждой частоты в L1 кадрах, получение L1 наборов S₁,…, S_L1, включающих частоты с пиковыми значениями в каждом кадре из L1 кадров, при этом число частот в каждом наборе составляет N₁,…, N_L1 соответственно;
выбор набора S_i из L1 наборов S₁,…, S_L1 для каждой частоты m_j, j=1,…,N_i с пиковым значением в наборе S_i, определение, имеется ли частота, принадлежащая одновременно всем другим наборам частот с пиковыми значениями среди частот m_j, m_j±1,…, m_j±k,
если да, помещение всех частот m_j, m_j±1,…, m_j±k в набор S_C частот;
если нет частоты, принадлежащей одновременно всем другим наборам частот с пиковыми значениями, то помещение всех частот в кадре в набор S_C частот,
где k - неотрицательное целое число.

6. Способ по п.5, отличающийся тем, что упомянутая частота с пиковым значением относится к частоте, мощность которой больше мощности двух соседних с ней частот.

7. Способ по п.5, отличающийся тем, что если L1 кадров включают (Р-1)-й кадр, то мощность каждой частоты в (Р-1)-м кадре вычисляют следующим образом
${| {\hat{ν}}^{р - 1} (m) |}^{2} = {[c^{р - 1} (m)]}^{2} + {[с^{р - 1} (m + 1) - с^{р - 1} (m - 1)]}^{2}$ , где ${| {\hat{ν}}^{р - 1} (m) |}^{2}$ - мощность частоты m в (Р-1)-м кадре, c^p-1(m) - коэффициент MDCT частоты m в (Р-1)-м кадре, c^p-1(m+1) - коэффициент MDCT частоты m+1 в (Р-1)-м кадре, c^p-1(m-1) - коэффициент MDCT частоты m-1 в (Р-1)-м кадре.

8. Способ по любому из пп.1-7, отличающийся тем, что шаг предсказания фазы и амплитуды Р-го кадра в области MDCT-MDST на шаге а включает: использование для каждой предсказываемой частоты фаз L2 кадров перед (Р-1)-м кадром на упомянутой частоте в области MDCT-MDST для выполнения линейной экстраполяции или линейной аппроксимации для получения фазы Р-го кадра на упомянутой частоте в области MDCT-MDST и
получение амплитуды Р-го кадра на упомянутой частоте в области MDCT-MDST согласно амплитуде одного из L2 кадров на упомянутой частоте в области MDCT-MDST, при этом L2>1.

9. Способ по п.8, отличающийся тем, что если L2=2, то шаг использования фаз L2 кадров перед (Р-1)-м кадром на упомянутой частоте в области MDCT-MDST для выполнения линейной экстраполяции или линейной аппроксимации для получения фазы Р-го кадра на упомянутой частоте в области MDCT-MDST включает:
получение фазы φ^p(m) Р-го кадра в области MDCT-MDST согласно следующей формуле
${\hat{ϕ}}^{p} (m) = ϕ^{t 1} (m) + \frac{p - t 1}{t 1 - t 2} [ϕ^{t 1} (m) - ϕ^{t 2} (m)]$ ,
где t1-й кадр и t2-й кадр представляют два кадра перед (Р-1)-м кадром, m - предсказываемая частота, φ^t1(m) - фаза t1-го кадра на частоте m в области MDCT-MDST и φ^t2(m) - фаза t2-го кадра на частоте m в области MDCT-MDST.

10. Способ по п.8, отличающийся тем, что если L2>2, то шаг использования фаз L2 кадров перед (Р-1)-м кадром на упомянутой частоте в области MDCT-MDST для выполнения линейной экстраполяции или линейной аппроксимации для получения фазы Р-го кадра на упомянутой частоте в области MDCT-MDST включает:
для каждой предсказываемой частоты выполнение линейной аппроксимации фаз L2 кадров перед (Р-1)-м кадром на упомянутой частоте в области MDCT-MDST для получения фазы Р-го кадра на упомянутой частоте в области MDCT-MDST.

11. Способ по п.4, отличающийся тем, что шаг использования комплексных сигналов в области MDCT-MDST и/или коэффициентов MDCT множества кадров перед Р-м кадром для получения набора S_C предсказываемых частот включает: использование комплексных сигналов в области MDCT-MDST для (Р-2)-го кадра и (Р-3)-го кадра и коэффициентов MDCT (P-1)-го кадра для получения набора S_C предсказываемых частот;
при этом шаг использования фаз и амплитуд множества кадров перед (Р-1)-м кадром в области MDCT-MDST для предсказания фазы и амплитуды Р-го кадра в области MDCT-MDST включает:
для каждой частоты в наборе S_C частот использование фаз и амплитуд (Р-2)-го кадра и (Р-3)-го кадра в области MDCT-MDST для предсказания фазы и амплитуды Р-го кадра в области MDCT-MDST.

12. Способ по любому из пп.1-7, отличающийся тем, что шаг использования коэффициентов MDCT множества кадров перед Р-м кадром для вычисления коэффициента MDCT Р-го кадра на упомянутой частоте включает:
использование половины коэффициента MDCT (P-1)-го кадра в качестве коэффициента MDCT Р-го кадра.

13. Компенсатор потери кадров звукового сигнала в области модифицированного дискретного косинусного преобразования, содержащий модуль компенсации потери кадров с множеством гармоник, второй модуль компенсации и модуль IMDCT, при этом
модуль компенсации потери кадров с множеством гармоник сконфигурирован так, чтобы, когда текущий потерянный кадр является Р-м кадром, получать набор предсказываемых частот, для каждой частоты в наборе предсказываемых частот использовать фазы и амплитуды множества кадров перед (Р-1)-м кадром в области MDCT-MDST для предсказания фазы и амплитуды Р-го кадра в области MDCT-MDST, использовать предсказанную фазу и амплитуду Р-го кадра в области MDCT-MDST для получения коэффициента MDCT Р-го кадра на каждой упомянутой частоте и передавать коэффициент MDCT во второй модуль компенсации, при этом (Р-1)-й кадр предшествует Р-му кадру;
второй модуль компенсации сконфигурирован так, чтобы для любой частоты вне набора предсказываемых частот в кадре использовать коэффициенты MDCT множества кадров перед Р-м кадром для вычисления коэффициента MDCT Р-го кадра на упомянутой частоте и передавать коэффициенты MDCT Р-го кадра на всех частотах в модуль IMDCT;
модуль IMDCT сконфигурирован так, чтобы выполнять преобразование IMDCT для коэффициентов MDCT Р-го кадра на всех частотах для получения сигнала во временной области для Р-го кадра.

14. Компенсатор потери кадров по п.13, также включающий модуль определения типа кадра, который сконфигурирован так, чтобы при обнаружении потери кадра определять тип текущего потерянного кадра и подавать команду модулю компенсации потери кадров с множеством гармоник на выполнение компенсации, если текущий потерянный кадр является кадром с множеством гармоник.

15. Компенсатор потери кадров по п.14, отличающийся тем, что модуль определения типа кадра сконфигурирован для определения типа текущего потерянного кадра путем вычисления равномерности спектра каждого кадра из К кадров перед текущим потерянным кадром; при этом если число кадров, равномерность спектра которых меньше порогового значения, меньше К₀ в К кадрах, то текущий потерянный кадр является кадром без множества гармоник; а если число кадров, равномерность спектра которых меньше порогового значения, больше К₀, то текущий потерянный кадр является кадром с множеством гармоник, при этом К₀≤К, где К₀, К - натуральные числа.

16. Компенсатор потери кадров по п.13, отличающийся тем, что модуль компенсации потери кадров с множеством гармоник содержит блок генерации набора частот, при этом модуль компенсации потери кадров с множеством гармоник сконфигурирован так, чтобы посредством блока генерации набора частот использовать комплексные сигналы в области MDCT-MDST и/или коэффициенты MDCT множества кадров перед Р-м кадром для получения набора S_C предсказываемых частот или непосредственно помещать все частоты в кадре в набор S_C предсказываемых частот.

17. Компенсатор потери кадров по п.16, отличающийся тем, что блок генерации набора частот сконфигурирован для использования комплексных сигналов в области MDCT-MDST и/или коэффициентов MDCT множества кадров перед Р-м кадром для получения набора S_C предсказываемых частот путем
назначения множества кадров перед Р-м кадром как L1 кадров, вычисления мощности каждой частоты в L1 кадрах, получения L1 наборов S₁,…, S_L1, включающих частоты с пиковыми значениями в каждом кадре из L1 кадров, при этом число соответствующих частот в каждом наборе составляет N₁,…, N_L1 соответственно;
выбора набора S_i из L1 наборов S₁,…, S_L1 для каждой частоты m_j, j=1,…,N_i с пиковым значением в наборе S_i, определения, имеется ли частота, принадлежащая одновременно всем другим наборам частот с пиковыми значениями среди частот m_j, m_j±1,…, m_j±k, если да, помещения всех частот m_j, m_j±1,…, m_j±k в набор S_C частот;
если нет частоты, принадлежащей одновременно всем другим наборам частот с пиковыми значениями для каждой частоты m_j, j=1,…,N; с пиковым значением в наборе S_i, помещения всех частот в кадре в набор S_C частот, где k - неотрицательное целое число.

18. Компенсатор потери кадров по п.17, отличающийся тем, что частота с пиковым значением относится к частоте, мощность которой больше мощности двух соседних с ней частот.

19. Компенсатор потери кадров по п.17, отличающийся тем, что блок генерации набора частот сконфигурирован так, чтобы, когда L1 кадров включают (Р-1)-й кадр, вычислять мощность каждой частоты в (Р-1)-м кадре следующим образом
${| {\hat{ν}}^{р - 1} (m) |}^{2} = {[c^{р - 1} (m)]}^{2} + {[с^{р - 1} (m + 1) - с^{р - 1} (m - 1)]}^{2}$ , где ${| {\hat{ν}}^{р - 1} (m) |}^{2}$ - мощность частоты m в (Р-1)-м кадре, c^p-1(m) - коэффициент MDCT частоты m в (Р-1)-м кадре, c^p-1(m+1) - коэффициент MDCT частоты m+1 в (Р-1)-м кадре, c^p-1(m-1) - коэффициент MDCT частоты m-1 в (Р-1)-м кадре.

20. Компенсатор потери кадров по любому из пп.13-19, отличающийся тем, что
модуль компенсации потери кадров с множеством гармоник также содержит блок генерации коэффициентов, при этом модуль компенсации потери кадров с множеством гармоник сконфигурирован так, чтобы посредством блока генерации коэффициентов использовать фазы и амплитуды L2 кадров перед (Р-1)-м кадром в области MDCT-MDST для предсказания фазы и амплитуды каждой частоты, принадлежащей набору предсказываемых частот в Р-м кадре, использовать предсказанную фазу и амплитуду Р-го кадра для получения коэффициента MDCT P-го кадра, соответствующего каждой частоте, и передавать коэффициент MDCT во второй модуль компенсации, при этом L2>1;
блок генерации коэффициентов содержит субблок предсказания фазы и субблок предсказания амплитуды, причем
субблок предсказания фазы сконфигурирован так, чтобы для предсказываемой частоты использовать фазы L2 кадров на упомянутой частоте в области MDCT-MDST для выполнения линейной экстраполяции или линейной аппроксимации для получения фазы Р-го кадра на упомянутой частоте в области MDCT-MDST,
субблок предсказания амплитуды сконфигурирован так, чтобы получать амплитуду Р-го кадра на упомянутой частоте в области MDCT-MDST из амплитуды одного из L2 кадров на упомянутой частоте в области MDCT-MDST.

21. Компенсатор потери кадров по п.20, отличающийся тем, что субблок предсказания фазы сконфигурирован так, чтобы, когда L2=2, предсказывать фазу Р-го кадра в области MDCT-MDST согласно следующей формуле
${\hat{ϕ}}^{p} (m) = ϕ^{t 1} (m) + \frac{p - t 1}{t 1 - t 2} [ϕ^{t 1} (m) - ϕ^{t 2} (m)]$ ,
где t1-й кадр и t2-й кадр представляют два кадра перед (Р-1)-м кадром, m - предсказываемая частота, ${\hat{ϕ}}^{р} (m)$ - предсказываемое значение фазы Р-го кадра на частоте m в области MDCT-MDST, φ^t1(m) - фаза t1-го кадра на частоте m в области MDCT-MDST и φ^t2(m) - фаза t2-го кадра на частоте m в области MDCT-MDST.

22. Компенсатор потери кадров по п.20, отличающийся тем, что субблок предсказания фазы сконфигурирован так, чтобы, когда L2>2, предсказывать фазу Р-го кадра в области MDCT-MDST путем выполнения для предсказываемой частоты линейной аппроксимации фаз выбранных L2 кадров на упомянутой частоте в области MDCT-MDST для получения фазы Р-го кадра на упомянутой частоте в области MDCT-MDST.

23. Компенсатор потери кадров по п.16, отличающийся тем, что модуль компенсации потери кадров с множеством гармоник сконфигурирован так, чтобы использовать комплексные сигналы в области MDCT-MDST для (Р-2)-го кадра и (Р-3)-го кадра и коэффициенты MDCT (P-1)-го кадра для получения набора предсказываемых частот и использовать фазы и амплитуды (Р-2)-го кадра и (Р-3)-го кадра в области MDCT-MDST для предсказания фазы и амплитуды Р-го кадра в области MDCT-MDST для каждой частоты в наборе частот.

24. Компенсатор потери кадров по любому из пп.13-19, отличающийся тем, что второй модуль компенсации сконфигурирован так, чтобы использовать половину значения коэффициента MDCT (P-1)-го кадра в качестве значения коэффициента MDCT Р-го кадра на частоте вне набора предсказываемых частот.

Изобретение относится к способам кодирования и декодирования аудиосигнала, устройствам кодировании и декодирования и системе обработки аудиосигнала. .

Улучшенная компенсация температуры многопараметрического датчика давления // 2453931

Изобретение относится к области регулирования промышленных процессов и может быть использовано при контроле различного рода оборудования. .

Поддиапазонный речевой кодекс с многокаскадными таблицами кодирования и избыточным кодированием // 2418324

Изобретение относится к аудиокодекам, в частности к поддиапазонному кодированию, таблицам кодирования и/или избыточному кодированию. .

Способ векторного квантования параметров линейного предсказания // 2408088

Изобретение относится к системе электросвязи, а именно к системам низкоскоростного кодирования речевого сигнала, при котором осуществляется векторное квантование с предсказанием параметров линейного предсказания.

Способы и устройства для введения низкочастотных предыскажений в ходе сжатия звука на основе acelp/tcx // 2389085

Изобретение относится к способу введения низкочастотных предыскажений в спектр звукового сигнала, преобразуемого в частотной области и содержащего коэффициенты преобразования, сгруппированные в ряд блоков, в котором вычисляется максимальная интенсивность для одного блока и определяется индекс позиции блока с максимальной интенсивностью, рассчитывается коэффициент для каждого блока, имеющего индекс позиции меньше индекса позиции блока с максимальной интенсивностью, и для каждого блока определяется усиление из коэффициента и применяется к коэффициентам преобразования блока.

Речевой кодер с линейным предсказанием и использованием анализа через синтез // 2163399

Изобретение относится к речевым кодерам и может использоваться в сотовых системах радиосвязи. .

Способ формирования сигналов управления синтезом речи и устройство для его осуществления // 1043737

Устройство анализа и синтеза речевого сигнала // 980133

Изобретение относится к способу и устройству кодирования аудиосигнала и к способу и устройству декодирования аудиосигнала. Сущность состоит в том, что когда кадр, непосредственно предшествующий целевому кадру кодирования, подлежащий кодированию с помощью первого модуля кодирования, работающему согласно схеме кодирования с линейным предсказанием, кодируется с помощью второго модуля кодирования, работающего согласно схеме кодирования, отличной от схемы кодирования с линейным предсказанием, целевой кадр кодирования может быть кодирован согласно схеме кодирования с линейным предсказанием с помощью инициализации внутреннего состояния первого модуля кодирования. Вследствие этого может быть реализована обработка кодирования, выполняемая согласно множеству схем кодирования, включающих в себя схему кодирования с линейным предсказанием и схему кодирования, отличную от схемы кодирования с линейным предсказанием. Технический результат - улучшение качества речи. 7 н.п. ф-лы, 5 ил.

Изобретение относится к способам кодирования и декодирования аудиосигнала, к устройствам кодирования и декодирования и системе обработки аудиосигнала. Сущность способа кодирования заключается в том, что когда кадр, непосредственно предшествующий целевому кадру кодирования, подлежащий кодированию с помощью первого модуля кодирования, работающему согласно схеме кодирования с линейным предсказанием, кодируется с помощью второго модуля кодирования, работающего согласно схеме кодирования, отличной от схемы кодирования с линейным предсказанием, целевой кадр кодирования может быть кодирован согласно схеме кодирования с линейным предсказанием с помощью инициализации внутреннего состояния первого модуля кодирования. Вследствие этого может быть реализована обработка кодирования, выполняемая согласно множеству схем кодирования, включающих в себя схему кодирования с линейным предсказанием и схему кодирования, отличную от схемы кодирования с линейным предсказанием. Технический результат - улучшение качества речи. 7 н.п. ф-лы, 5 ил.

Устройство аудио кодирования и декодирования для кодирования фреймов, представленных в виде выборок звуковых сигналов // 2498419

Устройство аудио кодирования (100), предназначенное для кодирования фреймов представленного в виде выборок звукового сигнала для получения закодированных фреймов, причем фрейм состоит из нескольких аудио выборок во временной области, включая стадии анализа для кодирования с предсказанием (110) и определения информации о коэффициентах фильтра синтеза и информации о фрейме области предсказания на основе фрейма из аудио выборок. Устройство аудио кодирования (100) дополнительно содержит преобразователь области (120) для преобразования фрейма аудио выборок частотной области и получения спектра фрейма и вычислителя области кодирования (130) для принятия решения о закодированных данных для фрейма на основе информации о коэффициентах и информации о фрейме области предсказания, или на основе спектра фрейма. Устройство аудио кодирования (100) включает в себя контроллер (140) для определения информации о коэффициенте переключения для случаев, когда вычислитель области кодирования решает, что закодированные данные текущего фрейма основаны на информации о коэффициентах и информации о фрейме области прогнозирования, и [для случаев] когда данные предыдущего фрейма кодировались на основе спектра предыдущего фрейма и кодировщика избыточности сокращения (150) для кодирования информации о фрейме области предсказания, информации о коэффициентах, информации о коэффициенте переключении и/или спектре фрейма. Технический результат - улучшение концепции кодирования звука с использованием переключения области кодирования. 5 н. и 9 з.п. ф-лы, 29 ил.

Кодирующее устройство, декодирующее устройство и способ // 2502138

Раскрыто кодирующее устройство, которое может точно указать полосу, имеющую большую ошибку среди всех полос, с использованием небольшого объема вычислений. Устройство включает в себя: модуль (201) идентификации первого положения, который использует ошибочный коэффициент преобразования первого уровня, указывающий ошибку в декодировании сигнала для входного сигнала, чтобы найти полосу, имеющую большую ошибку в относительно широкой полосе пропускания во всех полосах входного сигнала, и формирует информацию о первом положении, указывающую идентифицированную полосу; модуль (202) идентификации второго положения, который ищет целевую полосу частот, имеющую большую ошибку в относительно узкой полосе пропускания в полосе, идентифицированной модулем (201) идентификации первого положения, и формирует информацию о втором положении, указывающую идентифицированную целевую полосу частот; и модуль (203) кодирования, который кодирует ошибочный коэффициент преобразования в декодировании первого уровня, содержащийся в целевой полосе частот. Информация о первом положении, информация о втором положении и модуль кодирования передаются партнеру по связи. 4 н. и 4 з.п. ф-лы, 37 ил.

Способ и устройство для селективного кодирования сигнала на основе характеристик базового кодера // 2504026

В селективном кодере сигнала входной сигнал сначала кодируется (1004) с использованием кодера базового уровня для формирования кодированного сигнала базового уровня. Кодированный сигнал базового уровня декодируется (1006) для получения восстановленного сигнала, и сигнал ошибки генерируется (1008) как разность между восстановленным сигналом и входным сигналом. Восстановленный сигнал сравнивается (1010) с входным сигналом. Один из двух или более кодеров уровня расширения выбираются (1014, 1016) в зависимости от сравнения и используются для кодирования сигнала ошибки. Кодированный сигнал базового уровня, кодированный сигнал уровня расширения и указатель выбора выводятся (1018) в канал (например, для передачи или хранения). Технический результат - высококачественное воспроизведение речи и аудио при приемлемо низких скоростях данных. 3 н. и 15 з.п. ф-лы, 10 ил.

Стереофоническое кодирование на основе mdct с комплексным предсказанием // 2525431

Изобретение относится к средствам для стереофонического кодирования и декодирования с использованием комплексного предсказания в частотной области. Технический результат заключается в повышении скорости кодирования в диапазоне высоких скоростей передачи битов. Способ декодирования, предназначенный для получения выходного стереофонического сигнала из входного стереофонического сигнала, закодированного посредством стереофонического кодирования с комплексным предсказанием и включающего первые представления двух входных каналов в частотной области, содержит следующие этапы повышающего микширования: (i) вычисление второго представления первого входного канала в частотной области, и (ii) вычисление выходного канала на основе первого и второго представлений первого входного канала в частотной области, первого представления второго входного канала в частотной области и коэффициента комплексного предсказания. 2 н.з. и 12 з.п. ф-лы, 19 ил., 1 табл.

Аудио или видео кодер, аудио или видео и относящиеся к ним способы для обработки многоканальных аудио или видеосигналов с использованием переменного направления предсказания // 2541864

Изобретение относится к средствам обработки многоканальных аудио или видеосигналов с использованием переменного направления предсказания. Технический результат заключается в повышении качества аудио или видео. Объединяют два аудио или видео канала для получения первого сигнала объединения в качестве среднего сигнала и остаточного сигнала, который может быть получен используя предсказанный боковой сигнал, полученный из среднего сигнала. Первый сигнал объединения и остаточный сигнал предсказания кодируются и записываются в поток данных совместно с информацией предсказания, полученной оптимизатором на основе цели оптимизации, и индикатором направления предсказания, указывающим направление предсказания, ассоциированное с остаточным сигналом. Декодер использует остаточный сигнал предсказания, первый сигнал объединения, индикатор направления предсказания и информацию предсказания для получения декодированного сигнала первого канала и декодированного сигнала второго канала. В примере кодера или в примере декодера для оценки мнимой части спектра первого сигнала объединения может применяться преобразование действительного-в-мнимое. 5 н. и 14 з.п. ф-лы, 31 ил., 2 табл.

Устройство, способ и машиночитаемый носитель для получения параметра, описывающего изменение характеристики сигнала // 2543308

Группа изобретений относится к средствам для анализа временных вариаций аудио сигналов. Технический результат заключается в создании средств, обладающих повышенной надежностью, для получения параметра, описывающего временные изменения сигнальной характеристики. Для этого предложено устройство для получения параметра, который описывает изменения сигнальной характеристики сигнала на основе фактических параметров области преобразования, описывающих аудиосигнал в области преобразования, которое включает определитель параметра. Определитель параметра предназначен для определения одного или нескольких модельных параметров модели изменения в области преобразования, описывающих эволюцию параметров области преобразования в зависимости от одного или нескольких модельных параметров, представляющих сигнальную характеристику, так, что модельная ошибка, представляющая собой отклонения между моделируемой временной эволюцией параметров в области преобразования и эволюцией фактических параметров области преобразования снижается ниже заданного порогового значения или сводится к минимуму. 13 н. и 14 з.п. ф-лы, 9 ил.

Аудиокодек, поддерживающий режимы кодирования во временной области и в частотной области // 2547241

Изобретение относится к средствам, поддерживающим режимы кодирования во временной области и в частотной области. Технический результат заключается в уменьшении задержки и повышении эффективности кодирования с точки зрения отношения скорость/искажения. Конфигурируют аудиокодер таким образом, что он работает в различных рабочих режимах, так что, если активный рабочий режим является первым рабочим режимом, зависящий от режима набор из доступных режимов кодирования кадров не пересекается с первым поднабором режимов кодирования во временной области и перекрывается со вторым поднабором режимов кодирования в частотной области, тогда как, если активный рабочий режим является вторым рабочим режимом, зависящий от режима набор из доступных режимов кодирования кадров перекрывается с обоими поднаборами, т.е. с поднабором режимов кодирования во временной области, а также с поднабором режимов кодирования в частотной области. 6 н. и 13 з.п. ф-лы, 6 ил.

Устройство для расширения полосы частот // 2552184

Изобретение относится к средствам для расширения полосы частот. Технический результат заключается в улучшении восприятия расширенного звукового сигнала. Генерируют сигнал возбуждения на основе звукового сигнала, при этом звуковой сигнал содержит множество частотных компонентов. Выделяют вектор признаков из звукового сигнала, при этом вектор признаков содержит по меньшей мере один признак компонента в частотной области и по меньшей мере один признак компонента во временной области. Определяют по меньшей мере один параметр формы спектра на основе вектора признаков, при этом по меньшей мере один параметр формы спектра соответствует сигналу поддиапазона, содержащему частотные компоненты, которые принадлежат дополнительному множеству частотных компонентов. Генерируют сигнал поддиапазона путем фильтрации сигнала возбуждения с помощью банка фильтров и взвешивания отфильтрованного сигнала возбуждения с использованием по меньшей мере одного параметра формы спектра. 3 н. и 18 з.п. ф-лы, 10 ил.