Способ векторного квантования параметров линейного предсказания

Авторы патента:

Суботенко Александр Владимирович (RU)

Басов Владимир Олегович (RU)

Иванов Владимир Алексеевич (RU)

Саитов Игорь Акрамович (RU)

Басов Олег Олегович (RU)

G10L19/04 - с использованием способов прогнозирования

Владельцы патента RU 2408088:

Государственное образовательное учреждение высшего профессионального образования Академия Федеральной службы охраны Российской Федерации (Академия ФСО России) (RU)

Изобретение относится к системе электросвязи, а именно к системам низкоскоростного кодирования речевого сигнала, при котором осуществляется векторное квантование с предсказанием параметров линейного предсказания. Техническим результатом является снижение количества бит, выделяемых для кодирования параметров линейного предсказания стационарных вокализованных кадров речевого сигнала, при минимальной ошибке квантования. Указанный технический результат достигается введением в разностный векторный квантователь параметров линейного предсказания предсказателя с адаптацией к основному тону речи: при классификации кадра речевого сигнала как стационарного вокализованного выбирают схему предсказания с адаптацией к основному тону речи, вычисление вектора предсказания включает в себя вычисление вектора ошибки предсказания посредством предсказания с адаптацией к основному тону речи, выбор одной из множества схем масштабирования включает в себя выбор масштабного коэффициента, равного одному. 4 ил.

Системы низкоскоростного кодирования предназначены для компактного представления речевого сигнала, необходимого для передачи по каналам связи с ограниченной пропускной способностью, без значительной потери его качества. В используемом низкоскоростными системами диапазоне скоростей (<16 кбит/с) доминирующее положение среди различных методов кодирования занимает кодирование на основе метода ЛП.

Отличительным признаком метода ЛП является одношаговое приближенное представление (предсказание) текущего отсчета s(k) речевого сигнала линейной комбинацией s_пр(k) конечного числа предыдущих отсчетов:

где k - номер текущего отсчета; c(k) - порождающий сигнал с единичной дисперсией; G - масштабирующий коэффициент; М - порядок предсказания; b_i - коэффициенты предсказания, i=1,2,…,M.

В системах низкоскоростного кодирования, основанных на методе ЛП, порядок предсказания М, как правило, является постоянным, а значения коэффициентов b_i фиксируются на коротких, примыкающих друг к другу и равных по длительности временных интервалах, называемых кадрами речевого сигнала [Быков С.Ф., Журавлев В.И., Шалимов И.А. Цифровая телефония: учеб. пособие для вузов. - М.: Радио и связь, 2003. - 144 с.: ил.]. Анализ предлагаемых алгоритмических решений низкоскоростных систем кодирования позволяет выделить доминирующие на сегодняшний день тенденции в совершенствовании липредерного метода кодирования речи:

1) преимущественное использование для описания текущего состояния голосового тракта М-мерного вектора линейных спектральных частот (ЛСЧ) Ω=(ω₁,…,ω_M), являющегося математическим эквивалентом множества {b_i}, но обладающего лучшей устойчивостью к канальным ошибкам;

2) широкое применение разновидностей векторного квантования (ВК) для отображения кодируемых параметров речи при активном использовании внутрикадровых и межкадровых зависимостей последних с целью максимально возможного исключения избыточности.

Алгоритм определения ЛСЧ известен и представлен в [Рекомендации ITU-T G.729 «Coding of speech at 8 kbit/s using conjugate-structure algebraic-code-excited linear prediction (CS-ACELP)», Женева, 1996]. Без потери общности в дальнейшем описании под параметрами ЛП будем понимать ЛСЧ.

Известен способ векторного квантования параметров ЛП [Рекомендации ITU-T G.729 «Coding of speech at 8 kbit/s using conjugate-structure algebraic-code-excited linear prediction (CS-ACELP)», Женева, 1996], согласно которому квантование вектора параметров ЛП осуществляется в два этапа, причем вектор второго этапа разделяется на два субвектора. Недостатком данного способа является большое значение ошибки квантования, представляющей собой разницу между квантованным и исходным вектором параметров ЛП. Недостаток обусловлен малым числом бит, отводимым на квантование ЛСЧ в низкоскоростных системах кодирования речевого сигнала.

Известен способ преобразования речевого сигнала методом линейного предсказания с адаптивным распределением информационных ресурсов по патенту №2248619 от 27.08.2004, заключающийся в том, что при кодировании используют акустико-фонетическую классификацию обрабатываемых кадров речевого сигнала на четыре непересекающихся класса, классификационное решение включают в структуру кодовой комбинации, передаваемой по каналу связи, и используют для детерминирования режима функционирования классифицированного ВК, отличающихся различными объемами КК по каждому кодируемому параметру, чем обеспечивают адаптивное распределение информационных ресурсов. Недостатками данного способа являются значительная ошибка квантования параметров ЛП, увеличение числа передаваемых бит, а также артефакты звучания синтезированной речи, вызванные переключением ВК для каждого класса кадров речевого сигнала.

Наиболее близким, принятым за прототип, является способ для векторного квантования с надежным предсказанием параметров линейного предсказания в кодировании речи с переменной битовой скоростью по патенту №2326450 от 10.06.2008, заключающийся в том, что принимают входной вектор параметров линейного предсказания, классифицируют кадр речевого сигнала, соответствующий входному вектору параметров линейного предсказания, вычисляют вектор предсказания, удаляют вычисленный вектор предсказания из входного вектора параметров линейного предсказания для создания вектора ошибки предсказания, масштабируют вектор ошибки предсказания, квантуют масштабированный вектор ошибки предсказания, при этом вычисление вектора предсказания включает в себя выбор одной из множества схем предсказания в отношении классификации кадра речевого сигнала и вычисление вектора предсказания в соответствии с выбранной схемой предсказания, и масштабирование вектора ошибки предсказания включает в себя выбор по меньшей мере одной из множества схем масштабирования в отношении выбранной схемы предсказания и масштабирование вектора ошибки предсказания в соответствии с выбранной схемой масштабирования, множество схем предсказания включает в себя предсказание скользящим средним значением и предсказание авторегрессией, при этом классификация кадра речевого сигнала включает в себя определение, что кадр речевого сигнала является стационарным вокализованным кадром, выбор одной из множества схем предсказания включает в себя выбор предсказания авторегрессией, вычисление вектора предсказания включает в себя вычисление вектора ошибки предсказания посредством предсказания авторегрессией, выбор одной из множества схем масштабирования включает в себя выбор масштабного коэффициента, и масштабирование вектора ошибки предсказания включает в себя масштабирование вектора ошибки предсказания с использованием упомянутого масштабного коэффициента. Недостатками данного способа являются следующие:

1) предсказание авторегрессией, применяемое для стационарных вокализованных кадров, не является надежным в условиях потери кадров - в случае потери речевых кадров ошибка распространяется на последующие кадры;

2) для получения минимальной ошибки квантования параметров ЛП стационарных вокализованных кадров требуется затрачивать значительное число бит.

Техническим результатом, на достижение которого направлено изобретение, является снижение количества бит, выделяемых для кодирования параметров ЛП стационарных вокализованных кадров речевого сигнала, при минимальной ошибке квантования.

Для достижения такого технического результата в способе векторного квантования, заключающемся в том, что принимают входной вектор параметров линейного предсказания, классифицируют кадр речевого сигнала, соответствующий входному вектору параметров линейного предсказания, вычисляют вектор предсказания, удаляют вычисленный вектор предсказания из входного вектора параметров линейного предсказания для создания вектора ошибки предсказания, масштабируют вектор ошибки предсказания, квантуют масштабированный вектор ошибки предсказания, при этом вычисление вектора предсказания включает в себя выбор одной из множества схем предсказания в отношении классификации кадра речевого сигнала и вычисление вектора предсказания в соответствии с выбранной схемой предсказания, и масштабирование вектора ошибки предсказания включает в себя выбор по меньшей мере одной из множества схем масштабирования в отношении выбранной схемы предсказания и масштабирование вектора ошибки предсказания в соответствии с выбранной схемой масштабирования, множество схем предсказания включает в себя предсказание скользящим средним значением и предсказание авторегрессией, при этом если классификация кадра речевого сигнала включает в себя определение, что кадр речевого сигнала является стационарным вокализованным кадром, то выбор одной из множества схем предсказания включает в себя выбор предсказания авторегрессией, вычисление вектора предсказания включает в себя вычисление вектора ошибки предсказания посредством предсказания авторегрессией, выбор одной из множества схем масштабирования включает в себя выбор масштабного коэффициента и масштабирование вектора ошибки предсказания включает в себя масштабирование вектора ошибки предсказания с использованием упомянутого масштабного коэффициента, изменено множество схем предсказания. Множество схем предсказания включает в себя предсказание скользящим средним значением и предсказание с адаптацией к основному тону речи, при этом если классификация кадра звукового сигнала включает в себя определение, что кадр звукового сигнала является стационарным вокализованным кадром, то выбор одной из множества схем предсказания включает в себя выбор предсказания с адаптацией к основному тону речи, вычисление вектора предсказания включает в себя вычисление вектора ошибки предсказания посредством предсказания с адаптацией к основному тону речи, выбор одной из множества схем масштабирования включает в себя выбор масштабного коэффициента, равного одному. Далее осуществляют масштабирование вектора ошибки предсказания.

Для описания стационарных вокализованных кадров речевого сигнала модель (1) может быть преобразована к следующему виду:

где Ψ(s(k-1)) - типовое нелинейное преобразование, определяющее импульсное возбуждение линейной части уравнения [Прохоров Ю.Н. Статистические модели и рекуррентное предсказание речевых сигналов. - М.: Радио и связь, 1984. - 240 с.: ил.].

В принятой модели (2) при G=0 период основного тона речи Т₀ является неслучайной величиной и может быть рассчитан по формуле Т₀=(lnΔ₂- lnΔ₁)/lnb₁, где Δ₁ и Δ₂ - параметры функции Ψ(s(k-1)). Откуда зависимость параметра ЛП b₁ от периода основного тона речи Т₀ может быть вычислена следующим образом:

Аналогичные зависимости для линейных регрессий большего порядка (b_m, m>1) в аналитическом виде получить достаточно сложно, поэтому, учитывая связь коэффициентов ЛП b_i с ЛСЧ, указанные зависимости определены экспериментальным путем и представлены на фиг.1. Данные зависимости могут быть аппроксимированы полиномиальными моделями [Кобзарь А.И. Прикладная математическая статистика. Для инженеров и научных работников. - М.: ФИЗМАТЛИТ, 2006. - 816 с.] вида:

где ; - t-й коэффициент полинома, аппроксимирующего i-ю ЛСЧ. Значения коэффициентов аппроксимирующих полиномов представлены на фиг.2.

В низкоскоростных системах кодирования речевого сигнала значение периода (частоты, нормированного периода) основного тона подлежит передаче из кодера в декодер, поэтому реализация предсказания с адаптацией к основному тону речи в виде выражения (4) позволяет существенно уменьшить динамический диапазон ЛСЧ и, как следствие, ошибку квантования. При этом в случае потери речевых кадров ошибка не будет распространяться на последующие кадры.

Заявленное изобретение поясняется следующими чертежами:

фиг.1 - зависимости ЛСЧ ω_i, i=1,2,…,М, от периода основного тона речи Т₀ при М=10;

фиг.2 - коэффициенты полиномов, используемых для аппроксимации ЛСЧ;

фиг.3 - блок-схема, иллюстрирующая возможный вариант реализации векторного квантователя параметров линейного предсказания согласно изобретению;

фиг.4 - сравнительная оценка качества квантования параметров линейного предсказания стационарных вокализованных кадров речевого сигнала для разного числа бит согласно прототипу и настоящему изобретению.

Для снижения количества бит, выделяемых для кодирования параметров ЛП стационарных вокализованных кадров речевого сигнала, при минимальной ошибке квантования согласно предлагаемому способу выполняют следующие операции:

1) принимают входной вектор параметров ЛП Ω=(ω₁,…,ω_M);

2) классифицируют кадр речевого сигнала, соответствующий входному вектору параметров ЛП;

3) вычисляют вектор предсказания Ω_ПР;

4) удаляют вычисленный вектор предсказания из входного вектора параметров ЛП для создания вектора ошибки предсказания Е;

5) масштабируют вектор ошибки предсказания;

6) квантуют масштабированный вектор ошибки предсказания Е'.

При этом вычисление вектора предсказания включает в себя выбор одной из схем предсказания (предсказание скользящим средним или предсказание с адаптацией к основному тону речи) в отношении классификации кадра звукового сигнала и вычисление вектора предсказания в соответствии с выбранной схемой предсказания; масштабирование вектора ошибки предсказания включает в себя выбор по меньшей мере одной из множества схем масштабирования в отношении выбранной схемы предсказания и масштабирование вектора ошибки предсказания в соответствии с выбранной схемой масштабирования.

Если кадр речевого сигнала классифицируют как стационарный вокализованный, то в качестве схемы предсказания выбирают предсказание с адаптацией к основному тону речи и с помощью нее вычисляют вектор ошибки предсказания Ω_ПР= Ω_ОТ, где Ω_ОТ= (ω_ОТ1,…,ω_ОТМ); в качестве схемы масштабирования выбирают масштабный коэффициент, равный одному, что эквивалентно отсутствию операции масштабирования.

Фиг.3 иллюстрирует возможный вариант реализации ВК параметров ЛП, использующий предсказатель с адаптацией к основному тону речи.

Как изображено на фиг.3, сначала получают вектор ошибки предсказания Е посредством вычитания в блоке 301 вектора предсказания Ω_ПР, полученного с выхода блока 307, из входного вектора параметров ЛП Ω:

Для стационарных вокализованных кадров речевого сигнала вектор предсказания Ω_ПР= Ω_ОТ определяют в блоке 305 по полиномиальной модели (4) с коэффициентами, приведенными на фиг.2.

Для нестационарных речевых кадров вектор предсказания Ω_ПР= Ω_СС определяют посредством предсказания скользящим средним значением [Koestoer N.Р. Robust linear prediction analysis for low bit-rate speech coding: DPh dissertation. - Brisbane: Griffith University, 2002. - 132 p.] в блоке 306.

Вектор ошибки предсказания Е масштабируют в блоке 302 соответствующим масштабным коэффициентом. При этом для схемы предсказания с адаптацией к основному тону используют масштабный коэффициент, равный 1, а для схемы предсказания скользящим средним значением - масштабный коэффициент больше 1.

Квантованное значение масштабированного вектора ошибки предсказания Е' полученное в блоке 303, после обратного масштабирования в блоке 304 используют в блоке 306 предсказания скользящим средним значением, а его индекс в КК передают в декодер.

Для проверки работоспособности рассмотренного ВК и оценки качества квантования параметров ЛП согласно предлагаемому способу было произведено имитационное моделирование.

Качество квантования параметров ЛП оценивалось с использованием спектрального искажения [Павловец А.Н., Петровский А.А. Квантование огибающей спектра в вокодере, основанное на декомпозиции речевого сигнала на периодическую и апериодическую составляющие // Цифровая обработка сигналов. - 2005. - №3. - С.13-21], определяемого следующим образом:

где P_j и - спектры мощности речевого кадра, рассчитанные по входным и квантованным ЛСЧ соответственно. Среднее спектральное искажение оценивалось как

где J - число измерений (количество анализируемых кадров речевого сигнала). В [Palival K.K., Atal В.S. Efficient vector quantization of LPC parameters at 24 bits/frame // IEEE Trans. on Acoustics, Speech and Signal Processing. - 1993. - Vol.1. - №1. - P.3-14] экспериментально установлены следующие условия, приводящие к отсутствию слышимых искажений из-за спектральных несоответствий:

- среднее значение спектрального искажения SD не превышает 1 дБ;

- количество кадров, на которых sd принимает значения от 2 до 4 дБ, не превышает 2%;

- отсутствие сегментов со значением sd более 4 дБ.

Обучение КК масштабированного вектора ошибки предсказания Е' осуществлялось с помощью обобщенного алгоритма Ллойда [Макхоул Д., Рукос С., Гиш Г. Векторное квантование при кодировании речи // ТИИЭР. - 1985. - Т.73. - №11. - С.19-61]. Для обучения и тестирования КК использовалась речь различных дикторов длительностью около 125 и 15 минут соответственно. При этом речь в обучающей и тестовой выборках принадлежала различным дикторам, а общее число векторов ЛСЧ в них составило 375873 и 45318 соответственно (соотношение длительностей выборок приблизительно равно 8:1). Значение периода основного тона речи предполагалось известным. Сравнительная оценка качества квантования параметров линейного предсказания стационарных вокализованных кадров речевого сигнала для разного числа бит согласно прототипу и настоящему изобретению представлена на фиг.4.

Из фиг.4 следует, что ВК с адаптацией к основному тону речи согласно настоящему изобретению позволяет снизить количество бит, необходимых для кодирования параметров ЛП стационарных вокализованных кадров речевого сигнала, при минимальной ошибке квантования по сравнению с прототипом, использующим предсказание авторегрессией.

Способ векторного квантования параметров линейного предсказания, заключающийся в том, что принимают входной вектор параметров линейного предсказания, классифицируют кадр речевого сигнала, соответствующий входному вектору параметров линейного предсказания, вычисляют вектор предсказания, удаляют вычисленный вектор предсказания из входного вектора параметров линейного предсказания для создания вектора ошибки предсказания, масштабируют вектор ошибки предсказания, квантуют масштабированный вектор ошибки предсказания, при этом вычисление вектора предсказания включает в себя выбор одной из множества схем предсказания в отношении классификации кадра речевого сигнала и вычисление вектора предсказания в соответствии с выбранной схемой предсказания, и масштабирование вектора ошибки предсказания включает в себя выбор по меньшей мере одной из множества схем масштабирования в отношении выбранной схемы предсказания и масштабирование вектора ошибки предсказания в соответствии с выбранной схемой масштабирования, множество схем предсказания включает в себя предсказание скользящим средним значением и предсказание авторегрессией, при этом если классификация кадра речевого сигнала включает в себя определение, что кадр речевого сигнала является стационарным вокализованным кадром, то выбор одной из множества схем предсказания включает в себя выбор предсказания авторегрессией, вычисление вектора предсказания включает в себя вычисление вектора ошибки предсказания посредством предсказания авторегрессией, выбор одной из множества схем масштабирования включает в себя выбор масштабного коэффициента, и масштабирование вектора ошибки предсказания включает в себя масштабирование вектора ошибки предсказания с использованием упомянутого масштабного коэффициента, отличающийся тем, что множество схем предсказания включает в себя предсказание скользящим средним значением и предсказание с адаптацией к основному тону речи, при этом если классификация кадра речевого сигнала включает в себя определение, что кадр речевого сигнала является стационарным вокализованным кадром, то выбор одной из множества схем предсказания включает в себя выбор предсказания с адаптацией к основному тону речи, вычисление вектора предсказания включает в себя вычисление вектора ошибки предсказания посредством предсказания с адаптацией к основному тону речи, выбор одной из множества схем масштабирования включает в себя выбор масштабного коэффициента, равного одному.

Изобретение относится к способу введения низкочастотных предыскажений в спектр звукового сигнала, преобразуемого в частотной области и содержащего коэффициенты преобразования, сгруппированные в ряд блоков, в котором вычисляется максимальная интенсивность для одного блока и определяется индекс позиции блока с максимальной интенсивностью, рассчитывается коэффициент для каждого блока, имеющего индекс позиции меньше индекса позиции блока с максимальной интенсивностью, и для каждого блока определяется усиление из коэффициента и применяется к коэффициентам преобразования блока.

Речевой кодер с линейным предсказанием и использованием анализа через синтез // 2163399

Изобретение относится к речевым кодерам и может использоваться в сотовых системах радиосвязи. .

Способ формирования сигналов управления синтезом речи и устройство для его осуществления // 1043737

Устройство анализа и синтеза речевого сигнала // 980133

Поддиапазонный речевой кодекс с многокаскадными таблицами кодирования и избыточным кодированием // 2418324

Изобретение относится к аудиокодекам, в частности к поддиапазонному кодированию, таблицам кодирования и/или избыточному кодированию

Улучшенная компенсация температуры многопараметрического датчика давления // 2453931

Изобретение относится к области регулирования промышленных процессов и может быть использовано при контроле различного рода оборудования

Способ кодирования аудиосигнала, способ декодирования аудиосигнала, устройство кодирования, устройство декодирования, система обработки аудиосигнала, программа кодирования аудиосигнала и программа декодирования аудиосигнала // 2482554

Изобретение относится к способам кодирования и декодирования аудиосигнала, устройствам кодировании и декодирования и системе обработки аудиосигнала

Компенсатор и способ компенсации потери кадров звукового сигнала в области модифицированного дискретного косинусного преобразования // 2488899

Изобретение относится к способу и устройству кодирования аудиосигнала и к способу и устройству декодирования аудиосигнала. Сущность состоит в том, что когда кадр, непосредственно предшествующий целевому кадру кодирования, подлежащий кодированию с помощью первого модуля кодирования, работающему согласно схеме кодирования с линейным предсказанием, кодируется с помощью второго модуля кодирования, работающего согласно схеме кодирования, отличной от схемы кодирования с линейным предсказанием, целевой кадр кодирования может быть кодирован согласно схеме кодирования с линейным предсказанием с помощью инициализации внутреннего состояния первого модуля кодирования. Вследствие этого может быть реализована обработка кодирования, выполняемая согласно множеству схем кодирования, включающих в себя схему кодирования с линейным предсказанием и схему кодирования, отличную от схемы кодирования с линейным предсказанием. Технический результат - улучшение качества речи. 7 н.п. ф-лы, 5 ил.

Изобретение относится к способам кодирования и декодирования аудиосигнала, к устройствам кодирования и декодирования и системе обработки аудиосигнала. Сущность способа кодирования заключается в том, что когда кадр, непосредственно предшествующий целевому кадру кодирования, подлежащий кодированию с помощью первого модуля кодирования, работающему согласно схеме кодирования с линейным предсказанием, кодируется с помощью второго модуля кодирования, работающего согласно схеме кодирования, отличной от схемы кодирования с линейным предсказанием, целевой кадр кодирования может быть кодирован согласно схеме кодирования с линейным предсказанием с помощью инициализации внутреннего состояния первого модуля кодирования. Вследствие этого может быть реализована обработка кодирования, выполняемая согласно множеству схем кодирования, включающих в себя схему кодирования с линейным предсказанием и схему кодирования, отличную от схемы кодирования с линейным предсказанием. Технический результат - улучшение качества речи. 7 н.п. ф-лы, 5 ил.

Устройство аудио кодирования и декодирования для кодирования фреймов, представленных в виде выборок звуковых сигналов // 2498419

Устройство аудио кодирования (100), предназначенное для кодирования фреймов представленного в виде выборок звукового сигнала для получения закодированных фреймов, причем фрейм состоит из нескольких аудио выборок во временной области, включая стадии анализа для кодирования с предсказанием (110) и определения информации о коэффициентах фильтра синтеза и информации о фрейме области предсказания на основе фрейма из аудио выборок. Устройство аудио кодирования (100) дополнительно содержит преобразователь области (120) для преобразования фрейма аудио выборок частотной области и получения спектра фрейма и вычислителя области кодирования (130) для принятия решения о закодированных данных для фрейма на основе информации о коэффициентах и информации о фрейме области предсказания, или на основе спектра фрейма. Устройство аудио кодирования (100) включает в себя контроллер (140) для определения информации о коэффициенте переключения для случаев, когда вычислитель области кодирования решает, что закодированные данные текущего фрейма основаны на информации о коэффициентах и информации о фрейме области прогнозирования, и [для случаев] когда данные предыдущего фрейма кодировались на основе спектра предыдущего фрейма и кодировщика избыточности сокращения (150) для кодирования информации о фрейме области предсказания, информации о коэффициентах, информации о коэффициенте переключении и/или спектре фрейма. Технический результат - улучшение концепции кодирования звука с использованием переключения области кодирования. 5 н. и 9 з.п. ф-лы, 29 ил.

Кодирующее устройство, декодирующее устройство и способ // 2502138

Раскрыто кодирующее устройство, которое может точно указать полосу, имеющую большую ошибку среди всех полос, с использованием небольшого объема вычислений. Устройство включает в себя: модуль (201) идентификации первого положения, который использует ошибочный коэффициент преобразования первого уровня, указывающий ошибку в декодировании сигнала для входного сигнала, чтобы найти полосу, имеющую большую ошибку в относительно широкой полосе пропускания во всех полосах входного сигнала, и формирует информацию о первом положении, указывающую идентифицированную полосу; модуль (202) идентификации второго положения, который ищет целевую полосу частот, имеющую большую ошибку в относительно узкой полосе пропускания в полосе, идентифицированной модулем (201) идентификации первого положения, и формирует информацию о втором положении, указывающую идентифицированную целевую полосу частот; и модуль (203) кодирования, который кодирует ошибочный коэффициент преобразования в декодировании первого уровня, содержащийся в целевой полосе частот. Информация о первом положении, информация о втором положении и модуль кодирования передаются партнеру по связи. 4 н. и 4 з.п. ф-лы, 37 ил.

Способ и устройство для селективного кодирования сигнала на основе характеристик базового кодера // 2504026

В селективном кодере сигнала входной сигнал сначала кодируется (1004) с использованием кодера базового уровня для формирования кодированного сигнала базового уровня. Кодированный сигнал базового уровня декодируется (1006) для получения восстановленного сигнала, и сигнал ошибки генерируется (1008) как разность между восстановленным сигналом и входным сигналом. Восстановленный сигнал сравнивается (1010) с входным сигналом. Один из двух или более кодеров уровня расширения выбираются (1014, 1016) в зависимости от сравнения и используются для кодирования сигнала ошибки. Кодированный сигнал базового уровня, кодированный сигнал уровня расширения и указатель выбора выводятся (1018) в канал (например, для передачи или хранения). Технический результат - высококачественное воспроизведение речи и аудио при приемлемо низких скоростях данных. 3 н. и 15 з.п. ф-лы, 10 ил.

Стереофоническое кодирование на основе mdct с комплексным предсказанием // 2525431

Изобретение относится к средствам для стереофонического кодирования и декодирования с использованием комплексного предсказания в частотной области. Технический результат заключается в повышении скорости кодирования в диапазоне высоких скоростей передачи битов. Способ декодирования, предназначенный для получения выходного стереофонического сигнала из входного стереофонического сигнала, закодированного посредством стереофонического кодирования с комплексным предсказанием и включающего первые представления двух входных каналов в частотной области, содержит следующие этапы повышающего микширования: (i) вычисление второго представления первого входного канала в частотной области, и (ii) вычисление выходного канала на основе первого и второго представлений первого входного канала в частотной области, первого представления второго входного канала в частотной области и коэффициента комплексного предсказания. 2 н.з. и 12 з.п. ф-лы, 19 ил., 1 табл.