Низкочастотное акцентирование для основанного на lpc кодирования в частотной области



Низкочастотное акцентирование для основанного на lpc кодирования в частотной области
Низкочастотное акцентирование для основанного на lpc кодирования в частотной области
Низкочастотное акцентирование для основанного на lpc кодирования в частотной области
Низкочастотное акцентирование для основанного на lpc кодирования в частотной области
Низкочастотное акцентирование для основанного на lpc кодирования в частотной области
Низкочастотное акцентирование для основанного на lpc кодирования в частотной области
Низкочастотное акцентирование для основанного на lpc кодирования в частотной области
Низкочастотное акцентирование для основанного на lpc кодирования в частотной области
Низкочастотное акцентирование для основанного на lpc кодирования в частотной области
Низкочастотное акцентирование для основанного на lpc кодирования в частотной области
Низкочастотное акцентирование для основанного на lpc кодирования в частотной области

 


Владельцы патента RU 2612589:

ФРАУНХОФЕР-ГЕЗЕЛЛЬШАФТ ЦУР ФЕРДЕРУНГ ДЕР АНГЕВАНДТЕН ФОРШУНГ Е.Ф. (DE)

Изобретение относится к области кодирования и декодирования аудиосигналов. Технический результат – обеспечение минимума слышимых артефактов кодирования в выходном аудиосигнале на низких частотах путем низкочастотного акцентирования на стороне кодера и деакцентирования на стороне декодера. Аудиокодер содержит комбинацию фильтра кодирования с линейным предсказанием, имеющего множество коэффициентов (LC) кодирования с линейным предсказанием, и преобразователя из временной области в частотную область, причем упомянутая комбинация выполнена с возможностью фильтрации и преобразования фрейма (FI) аудиосигнала (AS) в частотную область для того, чтобы вывести спектр (SP) на основе этого фрейма (FI) и коэффициентов (LC) кодирования с линейным предсказанием; блок низкочастотного акцентирования, выполненный с возможностью вычисления обработанного спектра (PS) на основе спектра (SP), причем спектральные линии (SL) обработанного спектра (PS), представляющие более низкую частоту, чем референсная спектральная линия (RSL), акцентированы; и управляющее устройство, выполненное с возможностью управления вычислением обработанного спектра (PS) с помощью блока низкочастотного акцентирования в зависимости от коэффициентов (LC) кодирования с линейным предсказанием фильтра кодирования с линейным предсказанием. 7 н. и 21 з.п. ф-лы, 10 ил.

 

Известно, что неречевые сигналы, например музыкальный звук, могут быть более сложными в обработке, чем звук человеческого голоса, занимая более широкую полосу частот. Системы кодирования аудиосигналов современного уровня техники, такие как AMR-WB+ [3] и xHE-AAC [4], предлагают инструмент кодирования преобразования для музыки и других общих, неречевых сигналов. Этот инструмент широко известен как кодируемое преобразованием возбуждение (TCX) и основан на принципе передачи разности кодирования с линейным предсказанием (LPC), которую называют возбуждением, проквантованной и энтропийно закодированной в частотной области. Однако из-за ограниченного порядка предсказателя, используемого на этапе LPC, в декодируемом сигнале могут образовываться артефакты, особенно на низких частотах, где человеческий слух является очень чувствительным. С этой целью в публикациях [1-3] была введена схема низкочастотного акцентирования и деакцентирования.

Упомянутая схема адаптивного низкочастотного акцентирования (ALFE) предшествующего уровня техники усиливает низкочастотные спектральные линии перед квантованием в кодере. В частности, низкочастотные линии группируются в полосы, вычисляется энергия каждой полосы, и находится полоса с локальным энергетическим максимумом. На основе величины и положения энергетического максимума полосы, находящиеся ниже полосы с максимальной энергией, усиливаются так, чтобы они были более точно проквантованы при последующем квантовании.

Низкочастотное деакцентирование, выполняемое для инвертирования ALFE в соответствующем декодере, является концептуально аналогичным. Как и в кодере, устанавливаются низкочастотные полосы и определяется полоса с максимальной энергией. В отличие от кодера, полосы, находящиеся ниже энергетического пика, не усиливаются, а ослабляются. Эта процедура примерно восстанавливает энергии линий первоначального спектра.

Стоит заметить, что в предшествующем уровне техники вычисление энергии полос в кодере выполняется перед квантованием, то есть на входном спектре, тогда как в декодере оно выполняется на обратно проквантованных линиях, то есть на декодированном спектре. Хотя операция квантования может быть спроектирована так, чтобы спектральная энергия сохранялась в среднем, невозможно гарантировать точное сохранение энергии для индивидуальных спектральных линий. Следовательно, схема ALFE не может быть точно инвертирована. Кроме того, в предпочтительной реализации схемы ALFE предшествующего уровня техники и в кодере, и в декодере требуется операция вычисления квадратного корня. Желательно избежать таких относительно сложных операций.

Задачей настоящего изобретения является предложить улучшенные концепции для обработки аудиосигнала. Более конкретно, задачей настоящего изобретения является предложить улучшенные концепции для адаптивного низкочастотного акцентирования и деакцентирования. Задача настоящего изобретения решается аудиокодером в соответствии с п. 1 формулы изобретения, аудиодекодером в соответствии с п. 12 формулы изобретения, системой в соответствии с п. 22 формулы изобретения, способами в соответствии с пп. 25 и 26 формулы изобретения и компьютерной программой в соответствии с п. 27 формулы изобретения.

В одном аспекте настоящее изобретение предлагает аудиокодер для кодирования неречевого аудиосигнала, производящий из него поток битов и включающий в себя:

комбинацию фильтра кодирования с линейным предсказанием, имеющего множество коэффициентов кодирования с линейным предсказанием, и преобразователя из временной области в частотную область, причем эта комбинация выполнена с возможностью фильтрации и преобразования фрейма аудиосигнала в частотную область для того, чтобы вывести спектр на основе этого фрейма и коэффициентов кодирования с линейным предсказанием;

блок низкочастотного акцентирования, выполненный с возможностью вычисления обработанного спектра на основе спектра, в котором спектральные линии обработанного спектра, представляющие более низкие частоты, чем референсная спектральная линия, акцентированы; и

управляющее устройство, выполненное с возможностью управления вычислением обработанного спектра с помощью блока низкочастотного акцентирования в зависимости от коэффициентов кодирования с линейным предсказанием фильтра кодирования с линейным предсказанием.

Фильтр кодирования с линейным предсказанием (фильтр LPC) является инструментом, используемым в обработке аудиосигнала и обработке речи для представления спектральной огибающей кадрированного цифрового сигнала звука в сжатой форме, используя информацию линейной прогнозирующей модели.

Преобразователь из временной области в частотную область является инструментом для преобразования в частности кадрированного цифрового сигнала из временной области в частотную область так, чтобы оценить спектр сигнала. Преобразователь из временной области в частотную область может использовать модифицированное дискретное косинусное преобразование (MDCT), которое является преобразованием свертки, основанным на дискретном косинусном преобразовании типа IV (DCT-IV), с дополнительным свойством свертки: оно разработано для выполнения на последовательных фреймах большего набора данных, где последовательные фреймы перекрываются так, что вторая половина одного фрейма совпадает с первой половиной следующего фрейма. Это перекрытие, в дополнение к свойствам энергетического уплотнения DCT, делает преобразование MDCT особенно притягательным для приложений сжатия сигналов, так как это помогает избежать артефактов, обуславливаемых границами фреймов.

Блок низкочастотного акцентирования выполнен с возможностью вычисления обработанного спектра на основе спектра, причем спектральные линии обработанного спектра, представляющие более низкую частоту, чем референсная спектральная линия, акцентируются, так что акцентируются только низкие частоты, содержащиеся в обработанном спектре. Референсная спектральная линия может быть предопределена на основе эмпирического опыта.

Управляющее устройство выполнено с возможностью управления вычислением обработанного спектра с помощью блока низкочастотного акцентирования в зависимости от коэффициентов кодирования с линейным предсказанием фильтра кодирования с линейным предсказанием. Следовательно, кодер в соответствии с настоящим изобретением не должен анализировать спектр аудиосигнала с целью акцентирования низких частот. Кроме того, поскольку в кодере и в последующем декодере могут использоваться идентичные коэффициенты кодирования с линейным предсказанием, адаптивное низкочастотное акцентирование полностью обратимо независимо от квантования спектра, если коэффициенты кодирования с линейным предсказанием передаются декодеру в потоке битов, который производится кодером или любыми другими средствами. В большинстве случаев коэффициенты кодирования с линейным предсказанием должны быть так или иначе переданы в потоке битов с целью восстановления выходного аудиосигнала из потока битов соответствующим декодером. Следовательно, скорость передачи потока битов не будет увеличиваться низкочастотным акцентированием, описанным в настоящем документе.

Описанная в настоящем документе система с адаптивным низкочастотным акцентированием может быть осуществлена в основном кодере TCX стандарта LD-USAC (EVS), разновидности стандарта xHE-AAC с малой задержкой [4], который может пофреймово переключаться между временной областью и областью кодирования MDCT.

В соответствии с предпочтительным вариантом осуществления настоящего изобретения фрейм аудиосигнала подается на вход фильтра кодирования с линейным предсказанием, в котором фильтрованный фрейм выводится фильтром кодирования с линейным предсказанием, и в котором преобразователь из временной области в частотную область выполнен с возможностью оценки спектра на основе фильтрованного фрейма. Соответственно, фильтр кодирования с линейным предсказанием может работать во временной области, получая на входе аудиосигнал.

В соответствии с предпочтительным вариантом осуществления настоящего изобретения фрейм аудиосигнала подается на преобразователь из временной области в частотную область, в котором преобразованный фрейм выводится преобразователем из временной области в частотную область, и в котором фильтр кодирования с линейным предсказанием выполнен с возможностью оценки спектра на основе преобразованного фрейма. Альтернативно, но эквивалентно первому варианту осуществления кодера в соответствии с настоящим изобретением, имеющему блок низкочастотного акцентирования, кодер может вычислять обработанный спектр на основе спектра фрейма, произведенного посредством шумового формирования в частотной области (FDNS), как раскрыто, например, в публикации [5]. Более конкретно, порядок чередования инструментов здесь изменен: преобразователь из временной области в частотную область, такой как вышеупомянутый, может быть выполнен с возможностью оценки преобразованного фрейма на основе фрейма аудиосигнала, а фильтр кодирования с линейным предсказанием выполнен с возможностью оценки аудиоспектра на основе преобразованного фрейма, который выводится преобразователем из временной области в частотную область. Соответственно, фильтр кодирования с линейным предсказанием может работать в частотной области (вместо временной области), имея на входе преобразованный фрейм, с фильтром кодирования с линейным предсказанием, применяемым посредством умножения на спектральное представление коэффициентов кодирования с линейным предсказанием.

Специалистам в данной области техники должно быть очевидно, что эти два подхода - линейная фильтрация во временной области с последующим преобразованием из временной области в частотную область по сравнению с преобразованием из временной области в частотную область с последующей линейной фильтрацией посредством спектрального взвешивания в частотной области - могут быть осуществлены так, что они будут эквивалентными.

В соответствии с предпочтительным вариантом осуществления настоящего изобретения аудиокодер включает в себя устройство квантования, выполненное с возможностью производства проквантованного спектра на основе обработанного спектра, а также генератор потока битов, выполненный с возможностью встраивания проквантованного спектра и коэффициентов кодирования с линейным предсказанием в поток битов. Квантование в цифровой обработке сигналов представляет собой процесс отображения большого набора входных значений на (исчисляемый) меньший набор, такой как округление значений с некоторой точностью. Устройство или алгоритмическая функция, которая выполняет квантование, называется устройством квантования. Генератор потока битов может быть любым устройством, которое способно встраивать цифровые данные из различных источников в единый поток битов. С помощью этих особенностей поток битов, произведенный с адаптивным низкочастотным акцентированием, может быть произведен легко, причем адаптивное низкочастотное акцентирование является полностью обратимым для последующего декодера путем использования исключительно информации, уже содержащейся в потоке битов.

В предпочтительном варианте осуществления настоящего изобретения управляющее устройство включает в себя спектральный анализатор, выполненный с возможностью оценки спектрального представления коэффициентов кодирования с линейным предсказанием, анализатор максимума-минимума, выполненный с возможностью оценки минимума спектрального представления и максимума спектрального представления ниже дополнительной референсной спектральной линии, и устройство вычисления коэффициента акцентирования, выполненное с возможностью вычисления коэффициентов акцентирования спектральной линии для вычисления спектральных линий обработанного спектра, представляющего более низкую частоту, чем ссылочная спектральная линия, на основе минимума и максимума, причем спектральные линии обработанного спектра акцентируются путем применения коэффициентов акцентирования спектральной линии к спектральным линиям спектра фильтрованного фрейма. Анализатор спектра может быть преобразователем из временной области в частотную область, как описано выше. Спектральное представление является передаточной функцией фильтра кодирования с линейным предсказанием и может быть, но не обязательно, тем же самым спектральным представлением, которое используется для FDNS, как описано выше. Спектральное представление может быть вычислено из нечетного дискретного преобразования Фурье (ODFT) коэффициентов кодирования с линейным предсказанием. В стандартах xHE-AAC и LD-USAC передаточная функция может быть аппроксимирована 32 или 64 усилениями в области модифицированного дискретного косинусного преобразования, которые покрывают все спектральное представление.

В предпочтительном варианте осуществления настоящего изобретения устройство вычисления коэффициента акцентирования конфигурируется таким образом, что коэффициент акцентирования спектральной линии увеличивается в направлении от референсной спектральной линии к спектральной линии, представляющей самую низкую частоту спектра. Это означает, что спектральная линия, представляющая самую низкую частоту, усиливается больше всего, тогда как спектральная линия, смежная с референсной спектральной линией, усиливается меньше всего. Референсная спектральная линия и спектральные линии, представляющие более высокие частоты, чем референсная спектральная линия, не акцентируются вообще. Это снижает вычислительную сложность без каких-либо слышимых недостатков.

В предпочтительном варианте осуществления настоящего изобретения блок вычисления коэффициента акцентирования включает в себя первый каскад, выполненный с возможностью вычисления базисного коэффициента акцентирования в соответствии с первой формулой γ=(α⋅min/max)β, где α является первой заданной величиной, α>1, β является второй заданной величиной, 0<β≤1, min является минимумом спектрального представления, max является максимумом спектрального представления, и γ является базисным коэффициентом акцентирования, а также блок вычисления коэффициента акцентирования включает в себя второй каскад, выполненный с возможностью вычисления коэффициентов акцентирования спектральной линии в соответствии со второй формулой εii'-i, в которой i' является количеством спектральных линий, которые будут акцентированы, i является индексом соответствующей спектральной линии, причем значение индекса увеличивается с увеличением частоты спектральных линий, i=0…i'-1, γ является базисным коэффициентом акцентирования, и εi является коэффициентом акцентирования спектральной линии с индексом i. Базисный коэффициент акцентирования легко вычисляется из отношения минимума и максимума с помощью первой формулы. Базисный коэффициент акцентирования служит базисом для вычисления всех коэффициентов акцентирования спектральных линий, причем вторая формула гарантирует, что коэффициенты акцентирования спектральных линий увеличиваются в направлении от референсной спектральной линии к спектральной линии, представляющей самую низкую частоту спектра. В отличие от решений предшествующего уровня техники предложенное решение не требует сложных вычислений типа вычисления квадратного корня для каждой спектральной полосы. Необходимы только 2 операции деления и 2 операции возведения в степень, по одной на стороне декодера и кодера.

В предпочтительном варианте осуществления настоящего изобретения первая заданная величина меньше чем 42 и больше чем 22, в частности меньше чем 38 и больше чем 26, более конкретно меньше чем 34 и больше чем 30. Вышеупомянутые интервалы основаны на эмпирических экспериментах. Наилучшие результаты могут быть достигнуты, когда первая заданная величина устанавливается равной 32.

В предпочтительном варианте осуществления настоящего изобретения вторая заданная величина определяется в соответствии с формулой β=1/(θ⋅i'), в которой i' является количеством акцентируемых спектральных линий, θ является коэффициентом между 3 и 5, в частности между 3,4 и 4,6, более конкретно между 3,8 и 4,2. Эти интервалы также основаны на эмпирических экспериментах. Было найдено, что наилучшие результаты могут быть достигнуты, когда вторая заданная величина устанавливается равной 4.

В предпочтительном варианте осуществления настоящего изобретения референсная спектральная линия представляет частоту между 600 Гц и 1000 Гц, в частности между 700 Гц и 900 Гц, более конкретно между 750 Гц и 850 Гц. Эти найденные опытным путем интервалы гарантируют достаточное низкочастотное акцентирование, а также низкую вычислительную сложность системы. Эти интервалы гарантируют в частности, что в плотно заполненных спектрах линии низких частот закодированы с достаточной точностью. В предпочтительном варианте осуществления референсная спектральная линия представляет 800 Гц, причем акцентируются 32 спектральных линии.

В предпочтительном варианте осуществления настоящего изобретения дополнительная референсная спектральная линия представляет ту же самую или более высокую частоту, чем референсная спектральная линия. Эти особенности гарантируют, что оценка минимума и максимума делается в соответствующем частотном диапазоне.

В предпочтительном варианте осуществления настоящего изобретения управляющее устройство конфигурируется таким образом, что спектральные линии обработанного спектра, представляющие более низкую частоту, чем референсная спектральная линия, акцентируются только в том случае, если максимум меньше минимума, умноженного на первую заданную величину α. Эти особенности гарантируют, что низкочастотное акцентирование выполняется только при необходимости, так что рабочая нагрузка кодера может быть минимизирована, и биты не тратятся впустую на перцепционно незначительные области во время спектрального квантования.

В одном аспекте настоящее изобретение предлагает аудиодекодер для декодирования потока битов, на основе неречевого аудиосигнала, так, чтобы произвести из этого потока битов декодированный неречевой выходной аудиосигнал, в частности для декодирования производимого аудиокодером в соответствии с настоящим изобретением потока битов, содержащего проквантованные спектры и множество коэффициентов кодирования с линейным предсказанием, причем этот аудиодекодер включает в себя:

приемник потока битов, выполненный с возможностью извлечения проквантованного спектра и коэффициентов кодирования с линейным предсказанием из потока битов;

устройство деквантования, выполненное с возможностью производства деквантованного спектра на основе квантованного спектра;

блок низкочастотного деакцентирования, выполненный с возможностью вычисления обратно обработанного спектра на основе деквантованного спектра, в котором спектральные линии обратно обработанного спектра, представляющие более низкие частоты, чем референсная спектральная линия, деакцентированы; и

управляющее устройство, выполненное с возможностью управления вычислением обратно обработанного спектра с помощью низкочастотного корректора в зависимости от коэффициентов кодирования с линейным предсказанием, содержащихся в потоке битов.

Приемник потока битов может быть любым устройством, которое способно классифицировать цифровые данные из единого потока битов так, чтобы отправлять классифицированные данные подходящему последующему этапу обработки. В частности, приемник потока битов выполнен с возможностью извлечения из потока битов проквантованного спектра, который затем передается устройству деквантования, и коэффициентов кодирования с линейным предсказанием, которые затем передаются управляющему устройству.

Устройство деквантования выполнено с возможностью производства деквантованного спектра на основе квантованного спектра, в котором деквантование является процессом, обратным квантованию, как объяснено выше.

Блок низкочастотного деакцентирования выполнен с возможностью вычисления обратно обработанного спектра на основе деквантованного спектра, причем спектральные линии обратно обработанного спектра, представляющие более низкую частоту, чем референсная спектральная линия, деакцентируются, так что деакцентируются только низкие частоты, содержащиеся в обратно обработанном спектре. Референсная спектральная линия может быть предопределена на основе эмпирического опыта. Следует отметить, что референсная спектральная линия декодера должна представлять ту же самую частоту, что и референсная спектральная линия кодера, как объяснено выше. Однако частота, к которой относится референсная спектральная линия, может храниться на стороне декодера так, чтобы не было необходимости передавать эту частоту в потоке битов.

Управляющее устройство выполнено с возможностью управления вычислением обратно обработанного спектра с помощью блока низкочастотного деакцентирования в зависимости от коэффициентов кодирования с линейным предсказанием фильтра кодирования с линейным предсказанием. Поскольку в кодере, производящем поток битов, и в декодере могут использоваться идентичные коэффициенты кодирования с линейным предсказанием, адаптивное низкочастотное акцентирование является полностью обратимым независимо от квантования спектра, если коэффициенты кодирования с линейным предсказанием передаются к декодеру в потоке битов. В большинстве случаев коэффициенты кодирования с линейным предсказанием должны быть так или иначе переданы в потоке битов с целью восстановления выходного аудиосигнала из потока битов декодером. Следовательно, скорость передачи потока битов не будет увеличиваться описанными в настоящем документе низкочастотным акцентированием и низкочастотным деакцентированием.

Описанная в настоящем документе система с адаптивным низкочастотным деакцентированием может быть осуществлена в основном кодере TCX стандарта LD-USAC, разновидности стандарта xHE-AAC с малой задержкой [4], который может переключаться между временной областью и областью кодирования MDCT.

С помощью этих функций поток битов, произведенный с адаптивным низкочастотным акцентированием, может быть декодирован легко, причем адаптивное низкочастотное деакцентирование может быть выполнено декодером путем использования исключительно информации, уже содержащейся в потоке битов.

В соответствии с одним предпочтительным вариантом осуществления настоящего изобретения аудиодекодер включает в себя комбинацию преобразователя из частотной области во временную область и фильтра обратного кодирования с линейным предсказанием, получающего множество коэффициентов кодирования с линейным предсказанием, содержащихся в потоке битов, причем эта комбинация выполнена с возможностью обратной фильтрации и преобразования обратно обработанного спектра во временную область для того, чтобы вывести выходной сигнал, основанный на обратно обработанном спектре и на коэффициентах кодирования с линейным предсказанием.

Преобразователь из частотной области во временную область является инструментом для выполнения операции, обратной операции преобразования из временной области в частотную область, как объяснено выше. Он является инструментом для преобразования в частности спектра сигнала в частотной области в кадрированный цифровой сигнал во временной области с тем, чтобы оценить первоначальный сигнал. Преобразователь из частотной области во временную область может использовать обратное модифицированное дискретное косинусное преобразование (обратное MDCT), которое является преобразованием свертки, основанным на дискретном косинусном преобразовании типа IV (DCT-IV), с дополнительным свойством свертки: оно разработано для выполнения на последовательных фреймах большего набора данных, где последовательные фреймы перекрываются так, что вторая половина одного фрейма совпадает с первой половиной следующего фрейма. Это перекрытие, в дополнение к свойствам энергетического уплотнения DCT, делает преобразование MDCT особенно притягательным для приложений сжатия сигналов, так как это помогает избежать артефактов, обуславливаемых границами фреймов. Специалист в данной области техники поймет, что возможны и другие преобразования. Однако преобразование в декодере должно быть обратным преобразованием для преобразования в кодере.

Обратный фильтр кодирования с линейным предсказанием является инструментом для выполнения операции, обратной операции, выполняемой фильтром кодирования с линейным предсказанием (фильтром LPC), как объяснено выше. Он является инструментом, используемым в обработке аудиосигнала и в обработке речи для декодирования спектральной огибающей кадрированного цифрового сигнала для того, чтобы реконструировать цифровой сигнал, используя информацию линейной прогнозирующей модели. Кодирование и декодирование с линейным предсказанием является полностью обратимым, если используются одни и те же коэффициенты кодирования с линейным предсказанием, что может быть обеспечено путем передачи из кодера декодеру коэффициентов кодирования с линейным предсказанием, встроенных в поток битов, как описано в настоящем документе.

С помощью этих особенностей выходной сигнал может быть легко обработан.

В соответствии с предпочтительным вариантом осуществления настоящего изобретения преобразователь из частотной области во временную область выполнен с возможностью оценки временного сигнала на основе обратно обработанного спектра, причем обратный фильтр кодирования с линейным предсказанием выполнен с возможностью вывода выходного сигнала на основе временного сигнала. Соответственно, обратный фильтр кодирования с линейным предсказанием может работать во временной области, получая на входе временной сигнал.

В соответствии с одним предпочтительным вариантом осуществления настоящего изобретения обратный фильтр кодирования с линейным предсказанием выполнен с возможностью оценки обратно фильтрованного сигнала на основе обратно обработанного спектра, причем преобразователь из частотной области во временную область выполнен с возможностью вывода выходного сигнала на основе обратно фильтрованного сигнала.

Альтернативно и эквивалентно, и аналогично вышеописанной процедуре FDNS, выполняемой на стороне кодера, порядок чередования преобразования из частотной области во временную область и обратного фильтра кодирования с линейным предсказанием может быть изменен, так что последний будет выполняться первым и в частотной области (вместо временной области). Более конкретно, обратный фильтр кодирования с линейным предсказанием может выводить обратно фильтрованный сигнал на основе обратно обработанного спектра, с применением обратного фильтра кодирования с линейным предсказанием посредством умножения (или деления) на спектральное представление коэффициентов кодирования с линейным предсказанием, как описано в публикации [5]. Соответственно, преобразователь из частотной области во временную область, такой как вышеупомянутый, может быть выполнен с возможностью оценки фрейма выходного сигнала на основе обратно фильтрованного сигнала, который является входом для преобразователя из временной области в частотную область.

Специалистам в данной области техники должно быть очевидно, что эти два подхода - линейная обратная фильтрация посредством спектрального взвешивания в частотной области с последующим преобразованием из частотной области во временную область по сравнению с преобразованием из частотной области во временную область с последующей обратной линейной фильтрацией во временной области - могут быть осуществлены так, что они будут эквивалентными.

В предпочтительном варианте осуществления настоящего изобретения управляющее устройство включает в себя спектральный анализатор, выполненный с возможностью оценки спектрального представления коэффициентов кодирования с линейным предсказанием, анализатор максимума-минимума, выполненный с возможностью оценки минимума спектрального представления и максимума спектрального представления ниже дополнительной референсной спектральной линии, и устройство вычисления коэффициента деакцентирования, выполненное с возможностью вычисления коэффициентов деакцентирования спектральной линии для вычисления спектральных линий обработанного спектра, представляющего более низкую частоту, чем ссылочная спектральная линия, на основе минимума и максимума, причем спектральные линии обратно обработанного спектра деакцентируются путем применения коэффициентов деакцентирования спектральной линии к спектральным линиям деквантованного спектра. Анализатор спектра может быть преобразователем из временной области в частотную область, как описано выше. Спектральное представление является передаточной функцией фильтра кодирования с линейным предсказанием и может быть, но не обязательно, тем же самым спектральным представлением, которое используется для FDNS, как описано выше. Спектральное представление может быть вычислено из нечетного дискретного преобразования Фурье (ODFT) коэффициентов кодирования с линейным предсказанием. В стандартах xHE-AAC и LD-USAC передаточная функция может быть аппроксимирована 32 или 64 усилениями в области модифицированного дискретного косинусного преобразования, которые покрывают все спектральное представление.

В предпочтительном варианте осуществления настоящего изобретения блок вычисления коэффициента деакцентирования конфигурируется таким образом, что коэффициенты деакцентирования спектральной линии уменьшаются в направлении от референсной спектральной линии к спектральной линии, представляющей самую низкую частоту обратно обработанного спектра. Это означает, что спектральная линия, представляющая самую низкую частоту, ослабляется больше всего, тогда как спектральная линия, смежная с референсной спектральной линией, ослабляется меньше всего. Референсная спектральная линия и спектральные линии, представляющие более высокие частоты, чем референсная спектральная линия, не деакцентируются вообще. Это снижает вычислительную сложность без каких-либо слышимых недостатков.

В предпочтительном варианте осуществления настоящего изобретения блок вычисления коэффициента деакцентирования включает в себя первый каскад, выполненный с возможностью вычисления базисного коэффициента деакцентирования в соответствии с первой формулой δ=(α⋅min/max), где α является первой заданной величиной, α>1, β является второй заданной величиной, 0<β≤1, min является минимумом спектрального представления, max является максимумом спектрального представления, и δ является базисным коэффициентом деакцентирования, а также блок вычисления коэффициента деакцентирования включает в себя второй каскад, выполненный с возможностью вычисления коэффициентов деакцентирования спектральной линии в соответствии со второй формулой ii'-i, в которой i' является количеством деакцентируемых спектральных линий, i является индексом соответствующей спектральной линии, причем значение индекса увеличивается с увеличением частоты спектральных линий, i=0…i'-1, δ является базисным коэффициентом деакцентирования и i является коэффициентом деакцентирования спектральной линии с индексом i. Операция вычисления коэффициента деакцентирования является обратной по отношению к операции вычисления коэффициента акцентирования, как описано выше. Базисный коэффициент деакцентирования легко вычисляется из отношения минимума и максимума с помощью первой формулы. Базисный коэффициент деакцентирования служит базисом для вычисления всех коэффициентов деакцентирования спектральных линий, причем вторая формула гарантирует, что коэффициенты деакцентирования спектральных линий уменьшаются в направлении от референсной спектральной линии к спектральной линии, представляющей самую низкую частоту обработанного спектра. В отличие от решений предшествующего уровня техники предложенное решение не требует сложных вычислений типа вычисления квадратного корня для каждой спектральной полосы. Необходимы только 2 операции деления и 2 операции возведения в степень, по одной на стороне декодера и кодера.

В предпочтительном варианте осуществления настоящего изобретения первая заданная величина меньше чем 42 и больше чем 22, в частности меньше чем 38 и больше чем 26, более конкретно меньше чем 34 и больше чем 30. Вышеупомянутые интервалы основаны на эмпирических экспериментах. Наилучшие результаты могут быть достигнуты, когда первая заданная величина устанавливается равной 32. Следует отметить, что первая заданная величина декодера должна быть той же самой, что и первая заданная величина кодера.

В предпочтительном варианте осуществления настоящего изобретения вторая заданная величина определяется в соответствии с формулой β=1/(θ⋅i'), в которой i' является количеством деакцентируемых спектральных линий, θ является коэффициентом между 3 и 5, в частности между 3,4 и 4,6, более конкретно между 3,8 и 4,2. Наилучшие результаты могут быть достигнуты, когда вторая заданная величина устанавливается равной 4. Следует отметить, что вторая заданная величина декодера должна быть той же самой, что и вторая заданная величина кодера.

В предпочтительном варианте осуществления настоящего изобретения референсная спектральная линия представляет частоту между 600 Гц и 1000 Гц, в частности между 700 Гц и 900 Гц, более конкретно между 750 Гц и 850 Гц. Эти найденные опытным путем интервалы гарантируют достаточное низкочастотное акцентирование, а также низкую вычислительную сложность системы. Эти интервалы гарантируют в частности, что в плотно заполненных спектрах линии низких частот закодированы с достаточной точностью. В предпочтительном варианте осуществления референсная спектральная линия представляет 800 Гц, причем деакцентируются 32 спектральных линии. Очевидно, что референсная спектральная линия декодера должна представлять ту же самую частоту, что и референсная спектральная линия кодера.

В предпочтительном варианте осуществления настоящего изобретения дополнительная референсная спектральная линия представляет ту же самую или более высокую частоту, чем референсная спектральная линия. Эти особенности гарантируют, что оценка минимума и максимума выполняется в соответствующем частотном диапазоне, как и в случае кодера.

В предпочтительном варианте осуществления настоящего изобретения управляющее устройство конфигурируется таким образом, чтобы спектральные линии обратно обработанного спектра, представляющие более низкую частоту, чем референсная спектральная линия, деакцентировались только в том случае, если максимум меньше чем минимум, умноженный на первую заданную величину α. Эти особенности гарантируют, что низкочастотное деакцентирование выполняется только при необходимости, так что рабочая нагрузка декодера может быть минимизирована, и биты не тратятся впустую на перцепционно несоответствующие области во время квантования.

В одном аспекте настоящее изобретение предлагает систему, включающую в себя декодер и кодер, в которой кодер спроектирован в соответствии с настоящим изобретением и/или декодер спроектирован в соответствии с настоящим изобретением.

В одном аспекте настоящее изобретение предлагает способ для кодирования неречевого аудиосигнала так, чтобы произвести из него поток битов, причем этот способ включает в себя этапы:

фильтрования с фильтром кодирования с линейным предсказанием, имеющим множество коэффициентов кодирования с линейным предсказанием, и преобразования фрейма аудиосигнала в частотную область для того, чтобы вывести спектр на основе этого фрейма и коэффициентов кодирования с линейным предсказанием;

вычисления обработанного спектра на основе спектра фильтрованного фрейма, в котором спектральные линии обработанного спектра, представляющие более низкую частоту, чем референсная спектральная линия, являются акцентированными; и

управления вычислением обработанного спектра в зависимости от коэффициентов кодирования с линейным предсказанием фильтра кодирования с линейным предсказанием.

В одном аспекте настоящее изобретение предлагает способ для декодирования потока битов, на основе неречевого аудиосигнала, так, чтобы произвести из потока битов неречевой выходной аудиосигнал, в частности для декодирования произведенного способом в соответствии вышеизложенным потока битов, содержащего проквантованные спектры и множество коэффициентов кодирования с линейным предсказанием, причем этот способ включает в себя этапы:

извлечения из потока битов проквантованного спектра и коэффициентов кодирования с линейным предсказанием;

производства деквантованного спектра, на основе проквантованного спектра;

вычисления обратно обработанного спектра на основе деквантованного спектра, в котором спектральные линии обратно обработанного спектра, представляющие более низкие частоты, чем референсная спектральная линия, деакцентированы; и

управления вычислением обратно обработанного спектра в зависимости от коэффициентов кодирования с линейным предсказанием, содержащихся в потоке битов.

В одном аспекте настоящее изобретение предлагает компьютерную программу, которая при ее выполнении на компьютере или процессоре выполняет способ в соответствии с настоящим изобретением.

Предпочтительные варианты осуществления настоящего изобретения обсуждаются далее со ссылками на сопроводительные чертежи, в которых:

Фиг. 1a иллюстрирует первый вариант осуществления аудиокодера в соответствии с настоящим изобретением;

Фиг. 1b иллюстрирует второй вариант осуществления аудиокодера в соответствии с настоящим изобретением;

Фиг. 2 иллюстрирует первый пример для низкочастотного акцентирования, выполняемого аудиокодером в соответствии с настоящим изобретением;

Фиг. 3 иллюстрирует второй пример для низкочастотного акцентирования, выполняемого аудиокодером в соответствии с настоящим изобретением;

Фиг. 4 иллюстрирует третий пример для низкочастотного акцентирования, выполняемого аудиокодером в соответствии с настоящим изобретением;

Фиг. 5a иллюстрирует первый вариант осуществления аудиодекодера в соответствии с настоящим изобретением;

Фиг. 5b иллюстрирует второй вариант осуществления аудиодекодера в соответствии с настоящим изобретением;

Фиг. 6 иллюстрирует первый пример для низкочастотного деакцентирования, выполняемого аудиодекодером в соответствии с настоящим изобретением;

Фиг. 7 иллюстрирует второй пример для низкочастотного деакцентирования, выполняемого аудиодекодером в соответствии с настоящим изобретением;

Фиг. 8 иллюстрирует третий пример для низкочастотного деакцентирования, выполняемого аудиодекодером в соответствии с настоящим изобретением.

Фиг. 1a иллюстрирует первый вариант осуществления аудиокодера 1 в соответствии с настоящим изобретением. Аудиокодер 1 для кодирования неречевого аудиосигнала AS для производства из него потока битов BS включает в себя:

комбинацию 2, 3 фильтра 2 кодирования с линейным предсказанием, имеющего множество коэффициентов LC кодирования с линейным предсказанием, и преобразователя 3 из временной области в частотную область, причем эта комбинация 2, 3 выполнена с возможностью фильтрации и преобразования фрейма FI аудиосигнала AS в частотную область для того, чтобы вывести спектр SP на основе этого фрейма FI и коэффициентов LC кодирования с линейным предсказанием;

блок 4 низкочастотного акцентирования, выполненный с возможностью вычисления обработанного спектра PS на основе спектра SP, в котором спектральные линии SL (см. Фиг. 2) обработанного спектра PS, представляющие более низкую частоту, чем референсная спектральная линия RSL (см. Фиг. 2), акцентированы; и

управляющее устройство, выполненное с возможностью управления вычислением обработанного спектра PS с помощью блока 4 низкочастотного акцентирования в зависимости от коэффициентов LC кодирования с линейным предсказанием фильтра 2 кодирования с линейным предсказанием.

Фильтр 2 кодирования с линейным предсказанием (фильтр LPC) является инструментом, используемым в обработке аудиосигнала и обработке речи для представления спектральной огибающей кадрированного цифрового сигнала звука в сжатой форме, используя информацию линейной прогнозирующей модели.

Преобразователь 3 из временной области в частотную область является инструментом для преобразования в частности кадрированного цифрового сигнала из временной области в частотную область так, чтобы оценить спектр сигнала. Преобразователь 3 из временной области в частотную область может использовать модифицированное дискретное косинусное преобразование (MDCT), которое является преобразованием свертки, основанным на дискретном косинусном преобразовании типа IV (DCT-IV), с дополнительным свойством свертки: оно разработано для выполнения на последовательных фреймах большего набора данных, где последовательные фреймы перекрываются так, что вторая половина одного фрейма совпадает с первой половиной следующего фрейма. Это перекрытие, в дополнение к свойствам энергетического уплотнения DCT, делает преобразование MDCT особенно притягательным для приложений сжатия сигналов, так как это помогает избежать артефактов, обуславливаемых границами фреймов.

Блок 4 низкочастотного акцентирования выполнен с возможностью вычисления обработанного спектра PS на основе спектра SP фильтрованного фрейма FF, причем спектральные линии SL обработанного спектра PS, представляющие более низкую частоту, чем референсная спектральная линия RSL, акцентируются, так что акцентируются только низкие частоты, содержащиеся в обработанном спектре PS. Референсная спектральная линия RSL может быть предопределена на основе эмпирического опыта.

Управляющее устройство 5 выполнено с возможностью управления вычислением обработанного спектра SP с помощью блока 4 низкочастотного акцентирования в зависимости от коэффициентов LC кодирования с линейным предсказанием фильтра 2 кодирования с линейным предсказанием. Следовательно, кодер 1 в соответствии с настоящим изобретением не должен анализировать спектр SP аудиосигнала AS с целью акцентирования низких частот. Кроме того, поскольку в кодере 1 и в последующем декодере 12 (см. Фиг. 5) могут использоваться идентичные коэффициенты LC кодирования с линейным предсказанием, адаптивное низкочастотное акцентирование полностью обратимо независимо от квантования спектра, если коэффициенты LC кодирования с линейным предсказанием передаются декодеру 12 в потоке BS битов, который производится кодером 1 или любыми другими средствами. В большинстве случаев коэффициенты LC кодирования с линейным предсказанием так или иначе должны быть переданы в потоке битов BS с целью реконструирования выходного аудиосигнала OS (см. Фиг. 5) из потока BS битов с помощью соответствующего декодера 12. Следовательно, скорость передачи потока BS битов не будет увеличиваться низкочастотным акцентированием, описанным в настоящем документе.

Описанная в настоящем документе система с адаптивным низкочастотным акцентированием может быть осуществлена в основном кодере TCX стандарта LD-USAC, разновидности стандарта xHE-AAC с малой задержкой [4], который может пофреймово переключаться между временной областью и областью кодирования MDCT.

В соответствии с одним предпочтительным вариантом осуществления настоящего изобретения фрейм FI аудиосигнала AS подается на вход фильтра 2 кодирования с линейным предсказанием, в котором фильтрованный фрейм FF выводится фильтром 2 кодирования с линейным предсказанием, и в котором преобразователь 3 из временной области в частотную область выполнен с возможностью оценки спектра SP на основе фильтрованного фрейма FF. Соответственно, фильтр 2 кодирования с линейным предсказанием может работать во временной области, получая на входе аудиосигнал AS.

В соответствии с одним предпочтительным вариантом осуществления настоящего изобретения аудиокодер 1 включает в себя устройство 6 квантования, выполненное с возможностью производства проквантованного спектра QS на основе обработанного спектра BS, а также генератор 7 потока битов, выполненный с возможностью встраивания проквантованного спектра QS и коэффициентов LC кодирования с линейным предсказанием в поток битов BS. Квантование в цифровой обработке сигналов представляет собой процесс отображения большого набора входных значений на (исчисляемый) меньший набор, такой как округление значений с некоторой точностью. Устройство или алгоритмическая функция, которая выполняет квантование, называется устройством 6 квантования. Генератор 7 потока битов может быть любым устройством, которое способно встраивать цифровые данные из различных источников 2, 6 в единый поток битов BS. С помощью этих особенностей поток битов BS, произведенный с адаптивным низкочастотным акцентированием, может быть произведен легко, причем адаптивное низкочастотное акцентирование является полностью обратимым с помощью последующего декодера 12 путем использования исключительно информации, уже содержащейся в потоке битов BS.

В одном предпочтительном варианте осуществления настоящего изобретения управляющее устройство 5 включает в себя спектральный анализатор 8, выполненный с возможностью оценки спектрального представления SR коэффициентов LC кодирования с линейным предсказанием, анализатор 9 максимума-минимума, выполненный с возможностью оценки минимума MI спектрального представления SR и максимума MA спектрального представления SR ниже дополнительной референсной спектральной линии, а также блок 10, 11 вычисления коэффициента акцентирования, выполненный с возможностью вычисления коэффициентов SEF акцентирования спектральной линии для вычисления спектральных линий SL обработанного спектра PS, представляющих более низкую частоту, чем референсная спектральная линия RSL, на основе минимума MI и максимума MA, причем спектральные линии SL обработанного спектра PS акцентируются путем применения коэффициентов SEF акцентирования спектральной линии к спектральным линиям спектра SP фильтрованного фрейма FF. Анализатор спектра может быть преобразователем из временной области в частотную область, как описано выше. Спектральное представление SR является передаточной функцией фильтра 2 кодирования с линейным предсказанием. Спектральное представление SR может быть вычислено из нечетного дискретного преобразования Фурье (ODFT) коэффициентов кодирования с линейным предсказанием. В стандартах xHE-AAC и LD-USAC передаточная функция может быть аппроксимирована 32 или 64 усилениями в области модифицированного дискретного косинусного преобразования, которые покрывают все спектральное представление SR.

В одном предпочтительном варианте осуществления настоящего изобретения блок 10, 11 вычисления коэффициента акцентирования конфигурируется таким образом, что коэффициенты SEF акцентирования спектральной линии увеличиваются в направлении от референсной спектральной линии RSL к спектральной линии SL0, представляющей самую низкую частоту спектра PS. Это означает, что спектральная линия SL0, представляющая самую низкую частоту, усиливается больше всего, тогда как спектральная линия SLi'-1, смежная с референсной спектральной линией, усиливается меньше всего. Референсная спектральная линия RSL и спектральные линии SLi'+1, представляющие более высокие частоты, чем референсная спектральная линия RSL, не акцентируются вообще. Это снижает вычислительную сложность без каких-либо слышимых недостатков.

В одном предпочтительном варианте осуществления настоящего изобретения блок 10, 11 вычисления коэффициента акцентирования включает в себя первый каскад 10, выполненный с возможностью вычисления базисного коэффициента BEF акцентирования в соответствии с первой формулой γ=(α⋅min/max)β, где α является первой заданной величиной, α>1, β является второй заданной величиной, 0<β≤1, min является минимумом MI спектрального представления SR, max является максимумом MA спектрального представления SR, и γ является базисным коэффициентом BEF акцентирования, а также блок 10, 11 вычисления коэффициента акцентирования включает в себя второй каскад 11, выполненный с возможностью вычисления коэффициентов SEF акцентирования спектральной линии в соответствии со второй формулой εii'-i, в которой i' является количеством спектральных линий SL, которые будут акцентированы, i является индексом соответствующей спектральной линии SL, причем значение индекса увеличивается с увеличением частоты спектральных линий SL, i=0…i'-1, γ является базисным коэффициентом BEF акцентирования, и εi является коэффициентом SEF акцентирования спектральной линии с индексом i. Базисный коэффициент акцентирования легко вычисляется из отношения минимума и максимума с помощью первой формулы. Базисный коэффициент акцентирования BEF служит базисом для вычисления всех коэффициентов SEF акцентирования спектральных линий, причем вторая формула гарантирует, что коэффициенты SEF акцентирования спектральных линий увеличиваются в направлении от референсной спектральной линии RSL к спектральной линии SL0, представляющей самую низкую частоту спектра PS. В отличие от решений предшествующего уровня техники предложенное решение не требует сложных вычислений типа вычисления квадратного корня для каждой спектральной полосы. Необходимы только 2 операции деления и 2 операции возведения в степень, по одной на стороне декодера и кодера.

В предпочтительном варианте осуществления настоящего изобретения первая заданная величина меньше чем 42 и больше чем 22, в частности меньше чем 38 и больше чем 26, более конкретно меньше чем 34 и больше чем 30. Вышеупомянутые интервалы основаны на эмпирических экспериментах. Наилучшие результаты могут быть достигнуты, когда первая заданная величина устанавливается равной 32.

В одном предпочтительном варианте осуществления настоящего изобретения вторая заданная величина определяется в соответствии с формулой β=1/(θ⋅i'), в которой i' является количеством акцентируемых спектральных линий SL, θ является коэффициентом между 3 и 5, в частности между 3,4 и 4,6, более конкретно между 3,8 и 4,2. Эти интервалы также основаны на эмпирических экспериментах. Было найдено, что наилучшие результаты могут быть достигнуты, когда вторая заданная величина устанавливается равной 4.

В одном предпочтительном варианте осуществления настоящего изобретения референсная спектральная линия RSL представляет частоту между 600 Гц и 1000 Гц, в частности между 700 Гц и 900 Гц, более конкретно между 750 Гц и 850 Гц. Эти найденные опытным путем интервалы гарантируют достаточное низкочастотное акцентирование, а также низкую вычислительную сложность системы. Эти интервалы гарантируют в частности, что в плотно заполненных спектрах линии низких частот закодированы с достаточной точностью. В предпочтительном варианте осуществления референсная спектральная линия представляет 800 Гц, причем акцентируются 32 спектральных линии.

Вычисление коэффициентов SEF акцентирования спектральной линии может быть выполнено с помощью следующего кода программы:

В предпочтительном варианте осуществления настоящего изобретения дополнительная референсная спектральная линия представляет ту же самую или более высокую частоту, чем референсная спектральная линия RSL. Эти особенности гарантируют, что оценка минимума MI и максимума MA делается в соответствующем частотном диапазоне.

Фиг. 1b иллюстрирует второй вариант осуществления аудиокодера 1 в соответствии с настоящим изобретением. Второй вариант осуществления основан на первом варианте осуществления. Далее будут объяснены только различия между этими двумя вариантами осуществления.

В соответствии с одним предпочтительным вариантом осуществления настоящего изобретения фрейм FI аудиосигнала AS подается на преобразователь 3 из временной области в частотную область, в котором преобразованный фрейм FC выводится преобразователем 3 из временной области в частотную область, и в котором фильтр 2 кодирования с линейным предсказанием выполнен с возможностью оценки спектра SP на основе преобразованного фрейма FC. Альтернативно, но эквивалентно первому варианту осуществления кодера 1 в соответствии с настоящим изобретением, имеющему блок низкочастотного акцентирования, кодер 1 может вычислять обработанный спектр PS на основе спектра SP фрейма FI, произведенного посредством шумового формирования в частотной области (FDNS), как раскрыто, например, в публикации [5]. Более конкретно, порядок чередования инструментов здесь изменен: преобразователь 3 из временной области в частотную область, такой как вышеупомянутый, может быть выполнен с возможностью оценки преобразованного фрейма FC на основе фрейма FI аудиосигнала AS, а фильтр 2 кодирования с линейным предсказанием выполнен с возможностью оценки аудиоспектра SP на основе преобразованного фрейма FC, который выводится преобразователем 3 из временной области в частотную область. Соответственно, фильтр 2 кодирования с линейным предсказанием может работать в частотной области (вместо временной области), имея на входе преобразованный фрейм FC, с фильтром 2 кодирования с линейным предсказанием, применяемым посредством умножения на спектральное представление коэффициентов LC кодирования с линейным предсказанием.

Специалистам в данной области техники должно быть очевидно, что первый и второй варианты осуществления - линейная фильтрация во временной области с последующим преобразованием из временной области в частотную область по сравнению с преобразованием из временной области в частотную область с последующей линейной фильтрацией посредством спектрального взвешивания в частотной области - могут быть осуществлены так, что они будут эквивалентными.

Фиг. 2 иллюстрирует первый пример для низкочастотного акцентирования, выполняемого кодером в соответствии с настоящим изобретением. Фиг. 2 показывает примерный спектр SP, примерные коэффициенты SEF акцентирования спектральной линии и примерный обработанный спектр SP в общей системе координат, в которой частота откладывается по оси X, а амплитуда в зависимости от частоты откладывается по оси Y. Спектральные линии SL0-SLi'-1, которые представляют частоты более низкие, чем референсная линия спектра RSL, усиливаются, тогда как референсная спектральная линия RSL и спектральная линия SLi'+1, которая представляет частоту более высокую, чем референсная спектральная линия RSL, не усиливаются. Фиг. 2 изображает ситуацию, в которой отношение минимума MI и максимума MA спектрального представления SR коэффициентов LC кодирования с линейным предсказанием близко к 1. Следовательно, максимальный коэффициент SEF акцентирования спектральной линии для спектральной линии SL0 составляет приблизительно 2,5.

Фиг. 3 иллюстрирует второй пример для низкочастотного акцентирования, выполняемого кодером в соответствии с настоящим изобретением. Разница с низкочастотным акцентированием, показанным на Фиг. 2, заключается в том, что отношение минимума MI и максимума MA спектрального представления SR коэффициентов LC кодирования с линейным предсказанием является более малым. Следовательно, максимальный коэффициент SEF акцентирования спектральной линии для спектральной линии SL0 будет меньше, например ниже 2,0.

Фиг. 4 иллюстрирует третий пример для низкочастотного акцентирования, выполняемого кодером в соответствии с настоящим изобретением. В предпочтительном варианте осуществления настоящего изобретения управляющее устройство 5 конфигурируется таким образом, что спектральные линии SL обработанного спектра SP, представляющие более низкую частоту, чем референсная спектральная линия RSL, акцентируются только в том случае, если максимум меньше минимума, умноженного на первую заданную величину. Эти особенности гарантируют, что низкочастотное акцентирование выполняется только при необходимости, так что рабочая нагрузка кодера может быть минимизирована. На Фиг. 4 эти условия соблюдаются, так что низкочастотное акцентирование не выполняется.

Фиг. 5 иллюстрирует один вариант осуществления декодера в соответствии с настоящим изобретением. Аудиодекодер 12 выполнен с возможностью декодирования потока BS битов, на основе неречевого аудиосигнала, так, чтобы произвести из потока BS битов неречевой выходной аудиосигнал OS, в частности для декодирования потока BS битов, произведенного аудиокодером 1 в соответствии с настоящим изобретением, в котором поток BS битов содержит проквантованные спектры QS и множество коэффициентов LC кодирования с линейным предсказанием. Аудиодекодер 12 включает в себя:

приемник 13 потока битов, выполненный с возможностью извлечения проквантованного спектра QS и коэффициентов LC кодирования с линейным предсказанием из потока BS битов;

устройство 14 деквантования, выполненное с возможностью производства деквантованного спектра DQ на основе квантованного спектра QS;

блок 15 низкочастотного деакцентирования, выполненный с возможностью вычисления обратно обработанного спектра RS на основе деквантованного спектра DQ, в котором спектральные линии SLD обратно обработанного спектра RS, представляющие более низкие частоты, чем референсная спектральная линия RSLD, деакцентированы; и

управляющее устройство 16, выполненное с возможностью управления вычислением обратно обработанного спектра RS с помощью блока 15 низкочастотного деакцентирования в зависимости от коэффициентов LC кодирования с линейным предсказанием, содержащихся в потоке BS битов.

Приемник 13 потока битов может быть любым устройством, которое способно классифицировать цифровые данные из единого потока BS битов так, чтобы отправлять классифицированные данные подходящему последующему этапу обработки. В частности, приемник 13 потока битов выполнен с возможностью извлечения из потока BS битов проквантованного спектра QS, который затем передается устройству 14 деквантования, и коэффициентов LC кодирования с линейным предсказанием, которые затем передаются управляющему устройству 16.

Устройство 16 деквантования выполнено с возможностью производства деквантованного спектра DQ на основе квантованного спектра QS, в котором деквантование является процессом, обратным квантованию, как объяснено выше.

Блок 15 низкочастотного деакцентирования выполнен с возможностью вычисления обратно обработанного спектра RS на основе деквантованного спектра QS, причем спектральные линии SLD обратно обработанного спектра RS, представляющие более низкую частоту, чем референсная спектральная линия RSLD, деакцентируются, так что деакцентируются только низкие частоты, содержащиеся в обратно обработанном спектре RS. Референсная спектральная линия RSLD может быть предопределена на основе эмпирического опыта. Следует отметить, что референсная спектральная линия RSLD декодера 12 должна представлять ту же самую частоту, что и референсная спектральная линия RSL кодера 1, как объяснено выше. Однако частота, к которой относится референсная спектральная линия RSLD, может храниться на стороне декодера так, чтобы не было необходимости передавать эту частоту в потоке BS битов.

Управляющее устройство 16 выполнено с возможностью управления вычислением обратно обработанного спектра RS с помощью блока 15 низкочастотного деакцентирования в зависимости от коэффициентов LS кодирования с линейным предсказанием фильтра 2 кодирования с линейным предсказанием. Поскольку в кодере 1, производящем поток BS битов, и в декодере 12 могут использоваться идентичные коэффициенты LC кодирования с линейным предсказанием, адаптивное низкочастотное акцентирование является полностью обратимым независимо от квантования спектра, если коэффициенты кодирования с линейным предсказанием передаются к декодеру 12 в потоке BS битов. В большинстве случаев коэффициенты LC кодирования с линейным предсказанием так или иначе должны быть переданы в потоке битов BS с целью реконструирования выходного аудиосигнала OS из потока BS битов с помощью декодера 12. Следовательно, скорость передачи потока BS битов не будет увеличиваться описанными в настоящем документе низкочастотным акцентированием и низкочастотным деакцентированием.

Описанная в настоящем документе система с адаптивным низкочастотным деакцентированием может быть осуществлена в основном кодере TCX стандарта LD-USAC, разновидности стандарта xHE-AAC с малой задержкой [4], который может пофреймово переключаться между временной областью и областью кодирования MDCT.

С помощью этих особенностей поток BS битов, произведенный с адаптивным низкочастотным акцентированием, может быть легко декодирован, причем адаптивное низкочастотное деакцентирование может быть выполнено декодером 12 путем использования исключительно информации, уже содержащейся в потоке BS битов.

В соответствии с одним предпочтительным вариантом осуществления настоящего изобретения аудиодекодер 12 включает в себя комбинацию 17, 18 преобразователя 17 из частотной области во временную область и фильтра 18 обратного кодирования с линейным предсказанием, получающего множество коэффициентов LC кодирования с линейным предсказанием, содержащихся в потоке BS битов, причем эта комбинация 17, 18 выполнена с возможностью обратной фильтрации и преобразования обратно обработанного спектра RS во временную область для того, чтобы вывести выходной сигнал OS, основанный на обратно обработанном спектре RS и на коэффициентах LC кодирования с линейным предсказанием.

Преобразователь 17 из частотной области во временную область является инструментом для выполнения операции, обратной операции 3 преобразования из временной области в частотную область, как объяснено выше. Он является инструментом для преобразования в частности спектра сигнала в частотной области в кадрированный цифровой сигнал во временной области с тем, чтобы оценить первоначальный сигнал. Преобразователь из частотной области во временную область может использовать обратное модифицированное дискретное косинусное преобразование (обратное MDCT), которое является преобразованием свертки, основанным на дискретном косинусном преобразовании типа IV (DCT-IV), с дополнительным свойством свертки: оно разработано для выполнения на последовательных фреймах большего набора данных, где последовательные фреймы перекрываются так, что вторая половина одного фрейма совпадает с первой половиной следующего фрейма. Это перекрытие, в дополнение к свойствам энергетического уплотнения DCT, делает преобразование MDCT особенно притягательным для приложений сжатия сигналов, так как это помогает избежать артефактов, обуславливаемых границами фреймов. Специалист в данной области техники поймет, что возможны и другие преобразования. Однако преобразование в декодере 12 должно быть обратным преобразованием относительно преобразования, выполняемого в кодере 1.

Обратный фильтр 18 кодирования с линейным предсказанием является инструментом для выполнения операции, обратной операции, выполняемой фильтром 2 кодирования с линейным предсказанием (фильтром LPC), как объяснено выше. Он является инструментом, используемым в обработке аудиосигнала и в обработке речевого сигнала для декодирования спектральной огибающей кадрированного цифрового сигнала для того, чтобы реконструировать цифровой сигнал, используя информацию линейной прогнозирующей модели. Кодирование и декодирование с линейным предсказанием является полностью обратимым, если используются одни и те же коэффициенты кодирования с линейным предсказанием, что может быть обеспечено путем передачи из кодера 1 декодеру 12 коэффициентов LC кодирования с линейным предсказанием, встроенных в поток BS битов, как описано в настоящем документе.

С помощью этих особенностей выходной сигнал OS может быть легко обработан.

В соответствии с одним предпочтительным вариантом осуществления настоящего изобретения преобразователь 17 из частотной области во временную область выполнен с возможностью оценки временного сигнала TS, на основе обратно обработанного спектра RS, причем обратный фильтр 18 кодирования с линейным предсказанием выполнен с возможностью вывода выходного сигнала OS на основе временного сигнала TS. Соответственно, обратный фильтр 18 кодирования с линейным предсказанием может работать во временной области, получая на входе временной сигнал TS.

В одном предпочтительном варианте осуществления настоящего изобретения управляющее устройство 16 включает в себя спектральный анализатор 19, выполненный с возможностью оценки спектрального представления SR коэффициентов LC кодирования с линейным предсказанием, анализатор 20 максимума-минимума, выполненный с возможностью оценки минимума MI спектрального представления SR и максимума MA спектрального представления SR ниже дополнительной референсной спектральной линии, а также блок 21, 22 вычисления коэффициента деакцентирования, выполненный с возможностью вычисления коэффициентов SDF деакцентирования спектральной линии для вычисления спектральных линий SLD обратно обработанного спектра RS, представляющих более низкую частоту, чем референсная спектральная линия RSLD, на основе минимума MI и максимума MA, причем спектральные линии SLD обратно обработанного спектра RS деакцентируются путем применения коэффициентов SDF деакцентирования спектральной линии к спектральным линиям деквантованного спектра DQ. Анализатор спектра может быть преобразователем из временной области в частотную область, как описано выше. Спектральное представление является передаточной функцией фильтра кодирования с линейным предсказанием. Спектральное представление может быть вычислено из нечетного дискретного преобразования Фурье (ODFT) коэффициентов кодирования с линейным предсказанием. В стандартах xHE-AAC и LD-USAC передаточная функция может быть аппроксимирована 32 или 64 усилениями в области модифицированного дискретного косинусного преобразования, которые покрывают все спектральное представление.

В одном предпочтительном варианте осуществления настоящего изобретения блок вычисления коэффициента деакцентирования конфигурируется таким образом, что коэффициенты деакцентирования спектральной линии уменьшаются в направлении от референсной спектральной линии к спектральной линии, представляющей самую низкую частоту обратно обработанного спектра. Это означает, что спектральная линия, представляющая самую низкую частоту, ослабляется больше всего, тогда как спектральная линия, смежная с референсной спектральной линией, ослабляется меньше всего. Референсная спектральная линия и спектральные линии, представляющие более высокие частоты, чем референсная спектральная линия, не деакцентируются вообще. Это снижает вычислительную сложность без каких-либо слышимых недостатков.

В одном предпочтительном варианте осуществления настоящего изобретения блок 21, 22 вычисления коэффициента деакцентирования включает в себя первый каскад 21, выполненный с возможностью вычисления базисного коэффициента BDF деакцентирования в соответствии с первой формулой δ=(α⋅min/max), где α является первой заданной величиной, α>1, β является второй заданной величиной, 0<β≤1, min является минимумом MI спектрального представления SR, max является максимумом MA спектрального представления SR, и δ является базисным коэффициентом BDF деакцентирования, а также блок 21, 22 вычисления коэффициента деакцентирования включает в себя второй каскад 22, выполненный с возможностью вычисления коэффициентов SDF деакцентирования спектральной линии в соответствии со второй формулой ii'-i, в которой i' является количеством деакцентируемых спектральных линий SLD, i является индексом соответствующей спектральной линии SLD, причем значение индекса увеличивается с увеличением частоты спектральных линий SLD, i=0…i'-1, δ является базисным коэффициентом деакцентирования и i является коэффициентом SDF деакцентирования спектральной линии с индексом i. Работа блока 21, 22 вычисления коэффициента деакцентирования является обратной по отношению к работе блока 10, 11 вычисления коэффициента акцентирования, как описано выше. Базисный коэффициент BDF деакцентирования легко вычисляется из отношения минимума MI и максимума MA с помощью первой формулы. Базисный коэффициент BDF деакцентирования служит базисом для вычисления всех коэффициентов SDF деакцентирования спектральных линий, причем вторая формула гарантирует, что коэффициенты SDF деакцентирования спектральных линий уменьшаются в направлении от референсной спектральной линии RSLD к спектральной линии SL0, представляющей самую низкую частоту обработанного спектра RS. В отличие от решений предшествующего уровня техники предложенное решение не требует сложных вычислений типа вычисления квадратного корня для каждой спектральной полосы. Необходимы только 2 операции деления и 2 операции возведения в степень, по одной на стороне декодера и кодера.

В предпочтительном варианте осуществления настоящего изобретения первая заданная величина меньше чем 42 и больше чем 22, в частности меньше чем 38 и больше чем 26, более конкретно меньше чем 34 и больше чем 30. Вышеупомянутые интервалы основаны на эмпирических экспериментах. Наилучшие результаты могут быть достигнуты, когда первая заданная величина устанавливается равной 32. Следует отметить, что первая заданная величина декодера 12 должна быть той же самой, что и первая заданная величина кодера 1.

В предпочтительном варианте осуществления настоящего изобретения вторая заданная величина определяется в соответствии с формулой β=1/(θ⋅i'), в которой i' является количеством деакцентируемых спектральных линий, θ является коэффициентом между 3 и 5, в частности между 3,4 и 4,6, более конкретно между 3,8 и 4,2. Наилучшие результаты могут быть достигнуты, когда вторая заданная величина устанавливается равной 4. Следует отметить, что вторая заданная величина декодера 12 должна быть той же самой, что и вторая заданная величина кодера 1.

В предпочтительном варианте осуществления настоящего изобретения референсная спектральная линия RSLD представляет частоту между 600 Гц и 1000 Гц, в частности между 700 Гц и 900 Гц, более конкретно между 750 Гц и 850 Гц. Эти найденные опытным путем интервалы гарантируют достаточное низкочастотное акцентирование, а также низкую вычислительную сложность системы. Эти интервалы гарантируют в частности, что в плотно заполненных спектрах линии низких частот закодированы с достаточной точностью. В предпочтительном варианте осуществления референсная спектральная линия RSLD представляет 800 Гц, причем деакцентируются 32 спектральных линии SL. Очевидно, что референсная спектральная линия RSLD декодера 12 должна представлять ту же самую частоту, что и референсная спектральная линия RSL кодера.

Вычисление коэффициентов SEF акцентирования спектральной линии может быть выполнено с помощью следующего кода программы:

В одном предпочтительном варианте осуществления настоящего изобретения дополнительная референсная спектральная линия представляет ту же самую или более высокую частоту, чем референсная спектральная линия RSLD. Эти особенности гарантируют, что оценка минимума MI и максимума MA делается в соответствующем частотном диапазоне.

Фиг. 5b иллюстрирует второй вариант осуществления аудиодекодера 12 в соответствии с настоящим изобретением. Второй вариант осуществления основан на первом варианте осуществления. Далее будут объяснены только различия между этими двумя вариантами осуществления.

В соответствии с одним предпочтительным вариантом осуществления настоящего изобретения обратный фильтр 18 кодирования с линейным предсказанием выполнен с возможностью оценки обратно фильтрованного сигнала IFS на основе обратно обработанного спектра RS, причем преобразователь 17 из частотной области во временную область выполнен с возможностью вывода выходного сигнала OS на основе обратно фильтрованного сигнала IFS.

Альтернативно и эквивалентно, и аналогично вышеописанной процедуре FDNS, выполняемой на стороне кодера, порядок чередования преобразования 17 из частотной области во временную область и обратного фильтра 18 кодирования с линейным предсказанием может быть изменен, так что последний будет выполняться первым и в частотной области (вместо временной области). Более конкретно, обратный фильтр 18 кодирования с линейным предсказанием может выводить обратно фильтрованный сигнал IFS на основе обратно обработанного спектра RS, с применением обратного фильтра 2 кодирования с линейным предсказанием посредством умножения (или деления) на спектральное представление коэффициентов LC кодирования с линейным предсказанием, как описано в публикации [5]. Соответственно, преобразователь 17 из частотной области во временную область, такой как вышеупомянутый, может быть выполнен с возможностью оценки фрейма выходного сигнала OS на основе обратно фильтрованного сигнала IFS, который является входом для преобразователя 17 из временной области в частотную область.

Специалистам в данной области техники должно быть очевидно, что эти два подхода - линейная обратная фильтрация в частотной области с последующим преобразованием из частотной области во временную область по сравнению с преобразованием из частотной области во временную область с последующей линейной фильтрацией посредством спектрального взвешивания во временной области - могут быть осуществлены так, что они будут эквивалентными.

Фиг. 6 иллюстрирует первый пример для низкочастотного деакцентирования, выполняемого декодером в соответствии с настоящим изобретением. Фиг. 2 показывает деквантованный спектр DQ, примерные коэффициенты SDF деакцентирования спектральной линии и примерный обратно обработанный спектр RS в общей системе координат, в которой частота откладывается по оси X, а амплитуда в зависимости от частоты откладывается по оси Y. Спектральные линии SLD0-SLDi'-1, которые представляют частоты более низкие, чем референсная линия спектра RSLD, деакцентируются, тогда как референсная спектральная линия RSLD и спектральная линия SLDi'+1, которая представляет частоту более высокую, чем референсная спектральная линия RSLD, не деакцентируются. Фиг. 6 изображает ситуацию, в которой отношение минимума MI и максимума MA спектрального представления SR коэффициентов LC кодирования с линейным предсказанием близко к 1. Следовательно, максимальный коэффициент SEF акцентирования спектральной линии для спектральной линии SL0 составляет приблизительно 0,4. Дополнительно Фиг. 6 показывает погрешность квантования QE в зависимости от частоты. Благодаря сильному низкочастотному деакцентированию погрешность квантования QE является очень низкой на низких частотах.

Фиг. 7 иллюстрирует второй пример для низкочастотного деакцентирования, выполняемого декодером в соответствии с настоящим изобретением. Разница с низкочастотным акцентированием, показанным на Фиг. 6, заключается в том, что отношение минимума MI и максимума MA спектрального представления SR коэффициентов LC кодирования с линейным предсказанием является более малым. Следовательно, максимальный коэффициент SDF деакцентирования спектральной линии для спектральной линии SL0 будет больше, например выше 0,5. Погрешность квантования QE более высока в этом случае, но это не является критическим, как она значительно ниже амплитуды обратно обработанного спектра RS.

Фиг. 8 иллюстрирует третий пример для низкочастотного деакцентирования, выполняемого декодером в соответствии с настоящим изобретением. В предпочтительном варианте осуществления настоящего изобретения управляющее устройство 16 конфигурируется таким образом, что спектральные линии SLD обратно обработанного спектра RS, представляющие более низкую частоту, чем референсная спектральная линия RSLD, деакцентируются только в том случае, если максимум MA меньше минимума MI, умноженного на первую заданную величину. Эти особенности гарантируют, что низкочастотное деакцентирование выполняется только при необходимости, так что рабочая нагрузка декодера 12 может быть минимизирована. Эти особенности гарантируют, что низкочастотное деакцентирование выполняется только при необходимости, так что рабочая нагрузка кодера может быть минимизирована. На Фиг. 8 эти условия соблюдаются, так что низкочастотное акцентирование не выполняется.

В качестве решения вышеупомянутой проблемы относительно высокой сложности (возможно порождающей проблемы при реализации на мобильных устройствах с малой мощностью) и отсутствия полной обратимости (создающей риск недостаточной точности воспроизведения) в подходе ALFE предшествующего уровня техники предлагается модифицированный подход адаптивного низкочастотного акцентирования (ALFE), который

- не требует вычисления квадратного корня для каждой спектральной полосы или подобных сложных операций. Необходимы только 2 операции деления и 2 операции возведения в степень, по одной на стороне декодера и кодера.

- использует спектральное представление коэффициентов фильтра LPC в качестве управляющей информации для (де)акцентирования, а не сам спектр. Так как идентичные коэффициенты LPC используются в кодере и декодере, подход ALFE становится полностью обратим независимо от квантования спектра.

Описанная в настоящем документе система ALFE была осуществлена в основном кодере TCX стандарта LD-USAC, разновидности стандарта xHE-AAC с малой задержкой [4], который может пофреймово переключаться между временной областью и областью кодирования MDCT. Процесс в кодере и декодере выглядит в итоге следующим образом:

1. В кодере находятся минимум и максимум спектрального представления коэффициентов LPC ниже определенной частоты. Спектральное представление фильтра, обычно принятого в обработке сигналов, является передаточной функцией фильтра. В стандартах xHE-AAC и LD-USAC передаточная функция аппроксимируется 32 или 64 усилениями в области модифицированного дискретного косинусного преобразования, которые покрывают весь спектр, вычисляемыми из нечетного дискретного преобразования Фурье (ODFT) коэффициентов фильтра.

2. Если максимум больше чем некоторый глобальный минимум (например 0) и меньше чем в α раз больше, чем этот минимум, где α>1 (например 32), выполняются следующие два этапа ALFE.

3. Коэффициент γ низкочастотного акцентирования вычисляется из отношения между минимумом и максимумом как γ=(α⋅минимум/максимум) β, где 0<β≤1 и β зависит от α.

4. Линии MDCT с индексами i ниже, чем индекс i', представляющий некоторую частоту (то есть все линии ниже этой частоты, предпочтительно той же самой частоты, что используется на этапе 1) теперь умножаются на γi'-i. Это подразумевает, что линия, самая близкая к i', усиливается меньше всего, в то время как первая линия, самая близкая к постоянному току, усиливается сильнее всего. Предпочтительно i'=32.

5. В декодере этапы 1 и 2 выполняются так же, как и в кодере (с тем же самым частотным пределом).

6. Аналогично этапу 3, коэффициент низкочастотного деакцентирования, обратный коэффициенту γ акцентирования, вычисляется как δ=(α⋅минимум/максимум)-β=(максимум/(α⋅минимум))β.

7. Линии MDCT с индексами i ниже, чем индекс i', где i' выбирается как в кодере, умножаются наконец на δi'-i. Результатом этого является то, что линия, самая близкая к i', ослабляется меньше всего, первая линия ослабляется сильнее всего, и в целом ALFE на стороне кодера полностью инвертируется.

По существу, предложенная система ALFE гарантирует, что в плотно заполненных спектрах линии низких частот будут закодированы с достаточной точностью. Три случая могут служить иллюстрацией этого, как изображено на Фиг. 8. Когда максимум более чем в α раз больше, чем минимум, алгоритм ALFE не выполняется. Это происходит, когда низкочастотная форма LPC содержит сильный пик, вероятно происходящий из сильного изолированного низкого тона во входном сигнале. Кодирующие устройства LPC обычно способны относительно хорошо воспроизводить такой сигнал, таким образом алгоритм ALFE в этом случае не нужен.

В случае, если форма LPC является плоской, то есть максимум приближается к минимуму, ALFE является самым сильным, как изображено на Фиг. 6, и может предотвратить кодирование артефактов, таких как музыкальный шум.

Когда форма LPC не является ни полностью плоской, ни пиковой, например на гармонических сигналах с близко расположенными тонами, выполняется только мягкий алгоритм ALFE, как изображено на Фиг. 7. Следует отметить, что применение экспоненциальных коэффициентов γ на этапе 4 и δ на этапе 7 не требует операций возведения в степень, но может быть выполнено инкрементально, используя только операции умножения. Следовательно, сложность на одну спектральную линию, присущая схеме ALFE в соответствии с настоящим изобретением, является очень низкой.

Хотя некоторые аспекты были описаны в контексте устройства, понятно, что эти аспекты также представляют описание соответствующего способа, где блок или устройство соответствуют этапу способа или особенности этапа способа. Аналогично, аспекты, описанные в контексте этапов способа также, представляют описание соответствующего блока или узла или особенности соответствующего устройства. Некоторые или все этапы способа могут быть выполнены с помощью (или с использованием) аппаратного устройства, такого как, например, микропроцессор, программируемый компьютер или электронная схема. В некоторых вариантах осуществления какой-то один или больше из наиболее важных этапов способа могут быть выполнены таким устройством.

В зависимости от определенных требований реализации, варианты осуществления настоящего изобретения могут быть осуществлены в технических средствах или в программном обеспечении. Реализация может быть выполнена с использованием энергонезависимого носителя, такого как носитель цифрового накопителя, например гибкий диск, DVD, Blu-Ray, CD, ROM, PROM, EPROM, EEPROM или флэш-память, имеющего записанные на нем электронно читаемые управляющие сигналы, которые взаимодействуют (или способны взаимодействовать) с программируемой вычислительной системой таким образом, чтобы выполнялся соответствующий способ. Следовательно, носитель цифрового накопителя может быть компьютерно-читаемым.

Некоторые варианты осуществления в соответствии с настоящим изобретением включают в себя носитель информации, имеющий записанные на нем электронно читаемые управляющие сигналы, которые способны взаимодействовать с программируемой вычислительной системой таким образом, чтобы выполнялся один из описанных в настоящем документе способов.

В целом варианты осуществления настоящего изобретения могут быть осуществлены как компьютерный программный продукт с программным кодом программы, использующимся для выполнения одного из способов, когда этот компьютерный программный продукт выполняется на компьютере. Программный код может быть, например, сохранен на компьютерно-читаемом носителе.

Другие варианты осуществления включают в себя компьютерную программу для выполнения одного из способов, описанных в настоящем документе, сохраненную на компьютерно-читаемом носителе.

Другими словами, один вариант осуществления способа в соответствии с настоящим изобретением является, следовательно, компьютерной программой, имеющей программный код для выполнения одного из описанных в настоящем документе способов, когда эта компьютерная программа выполняется на компьютере.

Дополнительный вариант осуществления способа в соответствии с настоящим изобретением является, следовательно, носителем информации (или носителем цифрового накопителя, или компьютерно-читаемым носителем), содержащим записанную на нем компьютерную программу для выполнения одного из описанных в настоящем документе способов. Носитель информации, носитель цифрового накопителя или компьютерно-читаемый носитель являются обычно материальными и/или энергонезависимыми.

Дополнительный вариант осуществления способа по настоящему изобретению является, следовательно, потоком данных или последовательностью сигналов, представляющих компьютерную программу для выполнения одного из описанных в настоящем документе способов. Поток данных или последовательность сигналов могут, например, быть выполнены с возможностью передачи через соединение передачи данных, например, через Интернет.

Дополнительный вариант осуществления включает в себя средство обработки, например, компьютер или программируемое логическое устройство, выполненное с возможностью или приспособленное для выполнения одного из описанных в настоящем документе способов.

Дополнительный вариант осуществления включает в себя компьютер с установленной на нем компьютерной программой для выполнения одного из описанных в настоящем документе способов.

Дополнительный вариант осуществления в соответствии с настоящим изобретением включает в себя устройство или систему, выполненную с возможностью передачи получателю (например, электронно или оптически) компьютерной программы для выполнения одного из описанных в настоящем документе способов. Получатель может быть, например, компьютером, мобильным устройством, запоминающим устройством и т.п. Устройство или система могут, например, включать в себя файловый сервер для передачи компьютерной программы получателю.

В некоторых вариантах осуществления программируемое логическое устройство (например, логическая микросхема, программируемая в условиях эксплуатации) может использоваться для выполнения некоторой или всей функциональности описанных в настоящем документе способов. В некоторых вариантах осуществления логическая микросхема, программируемая в условиях эксплуатации, может взаимодействовать с микропроцессором для того, чтобы выполнить один из описанных в настоящем документе способов. Обычно способы предпочтительно выполняются с использованием технических средств.

Вышеописанные варианты осуществления предназначены лишь для иллюстрации принципов настоящего изобретения. Подразумевается, что модификации и вариации описанных в настоящем документе компоновок деталей будут очевидны для специалистов в данной области техники. Следовательно, предполагается, что настоящее изобретение ограничено только объемом прилагаемой формулы изобретения, а не конкретными деталями, представленными путем описания и объяснения вариантов осуществления в настоящем документе.

ССЫЛОЧНЫЕ ОБОЗНАЧЕНИЯ

1 - аудиокодер;

2 - фильтр кодирования с линейным предсказанием;

3 - преобразователь из временной области в частотную область;

4 - блок низкочастотного акцентирования;

5 - управляющее устройство;

6 - устройство квантования;

7 - генератор потока битов;

8 - спектральный анализатор;

9 - анализатор минимума-максимума;

10 - первый каскад блока вычисления коэффициента акцентирования;

11 - второй каскад блока вычисления коэффициента акцентирования;

12 - аудиодекодер;

13 - приемник потока битов;

14 - устройство деквантования;

15 - блок низкочастотного деакцентирования;

16 - управляющее устройство;

17 - преобразователь из частотной области во временную область;

18 - фильтр кодирования с обратным линейным предсказанием;

19 - спектральный анализатор;

20 - анализатор минимума-максимума;

21 - первый каскад блока вычисления коэффициента деакцентирования;

22 - второй каскад блока вычисления коэффициента деакцентирования;

AS - аудиосигнал;

LC - коэффициенты кодирования с линейным предсказанием;

FF - фильтрованный фрейм;

FI - фрейм;

SP - спектр;

PS - обработанный спектр;

QS - проквантованный спектр;

SR - спектральное представление;

MI - минимум спектрального представления;

MA - максимум спектрального представления;

SEF - коэффициенты акцентирования спектральной линии;

BEF - базисный коэффициент акцентирования;

FC - фрейм, преобразованный во временную область;

RSL - референсная спектральная линия;

SL - спектральная линия;

DQ - деквантованный спектр;

RS - обратно обработанный спектр;

TS - временной сигнал;

SDF - коэффициенты деакцентирования спектральной линии;

BDF - базисный коэффициент деакцентирования;

IFS - обратно фильтрованный сигнал;

SLD - спектральная линия;

RSLD - референсная спектральная линия;

QE - погрешность квантования.

ССЫЛКИ

[1] 3GPP TS 26.290, «Extended AMR Wideband Codec - Transcoding Functions,» Dec. 2004.

[2] B. Bessette, U.S. Patent 7,933,769 B2, «Methods and devices for low-frequency emphasis during audio compression based on ACELP/TCX», Apr. 2011.

[3] J. Mäkinen et al., «AMR-WB+: A New Audio Coding Standard for 3rd Generation Mobile Audio Services,» in Proc. ICASSP 2005, Philadelphia, USA, Mar. 2005.

[4] M. Neuendorf et al., «MPEG Unified Speech and Audio Coding - The ISO/MPEG Standard for High-Efficiency Audio Coding of All Content Types,» in Proc. 132nd Convention of the AES, Budapest, Hungary, Apr. 2012. Также ожидается публикация в Journal of the AES, 2013.

[5] T. Baeckstroem et al., European Patent EP 2 471 061 B1, «Multi-mode audio signal decoder, multi-mode audio signal encoder, methods and computer program using linear prediction coding based noise shaping».

1. Аудиокодер для кодирования неречевого аудиосигнала (AS) так, чтобы произвести из него поток (BS) битов, причем аудиокодер (1) включает в себя:

комбинацию (2, 3) фильтра (2) кодирования с линейным предсказанием, имеющего множество коэффициентов (LC) кодирования с линейным предсказанием, и преобразователя (3) из временной области в частотную область, причем эта комбинация (2, 3) выполнена с возможностью фильтрации и преобразования фрейма (FI) аудиосигнала (AS) в частотную область для того, чтобы вывести спектр (SP) на основе этого фрейма (FI) и коэффициентов (LC) кодирования с линейным предсказанием;

блок (4) низкочастотного акцентирования, выполненный с возможностью вычисления обработанного спектра (PS) на основе спектра (SP), в котором спектральные линии (SL) обработанного спектра (PS), представляющие более низкую частоту, чем референсная спектральная линия (RSL), акцентированы;

управляющее устройство (5), выполненное с возможностью управления вычислением обработанного спектра (PS) с помощью блока (4) низкочастотного акцентирования в зависимости от коэффициентов (LC) кодирования с линейным предсказанием фильтра (2) кодирования с линейным предсказанием;

устройство (6) квантования, выполненное с возможностью производства квантованного спектра (QS), на основе обработанного спектра (PS);

а также генератор (7) потока битов, выполненный с возможностью встраивания квантованного спектра (QS) и коэффициентов (LC) кодирования с линейным предсказанием в поток (BS) битов.

2. Аудиокодер по п. 1, в котором фрейм (FI) аудиосигнала (AS) подается на фильтр (2) кодирования с линейным предсказанием, причем фильтрованный фрейм (FF) выводится фильтром (2) кодирования с линейным предсказанием, и при этом преобразователь (3) из временной области в частотную область выполнен с возможностью оценки спектра (SP) на основе фильтрованного фрейма (FF).

3. Аудиокодер по п. 1, в котором фрейм (FI) аудиосигнала (AS) подается на преобразователь (3) из временной области в частотную область, причем преобразованный фрейм (FC) выводится преобразователем (3) из временной области в частотную область, и при этом фильтр (2) кодирования с линейным предсказанием выполнен с возможностью оценки спектра (SP) на основе преобразованного фрейма (FC).

4. Аудиокодер по п. 1, в котором управляющее устройство (5) включает в себя спектральный анализатор (8), выполненный с возможностью оценки спектрального представления (SR) коэффициентов (LC) кодирования с линейным предсказанием, анализатор (9) максимума-минимума, выполненный с возможностью оценки минимума (MI) спектрального представления (SR) и максимума (МА) спектрального представления (SR) ниже дополнительной референсной спектральной линии, а также блок (10, 11) вычисления коэффициента акцентирования, выполненный с возможностью вычисления коэффициентов (SEF) акцентирования спектральной линии для вычисления спектральных линий (SL) обработанного спектра (PS), представляющих более низкую частоту, чем референсная спектральная линия (RSL), на основе минимума (MI) и максимума (МА), причем спектральные линии (SL) обработанного спектра (PS) акцентируются путем применения коэффициентов (SEF) акцентирования спектральной линии к спектральным линиям спектра фильтрованного фрейма.

5. Аудиокодер по п. 4, в котором блок (10, 11) вычисления коэффициента акцентирования конфигурируется таким образом, что коэффициенты (SEF) акцентирования спектральной линии увеличиваются в направлении от референсной спектральной линии (RSL) к спектральной линии (SL), представляющей самую низкую частоту спектра (SP).

6. Аудиокодер по п. 4, в котором блок (10, 11) вычисления коэффициента акцентирования включает в себя первый каскад (10), выполненный с возможностью вычисления базисного коэффициента (BEF) акцентирования в соответствии с первой формулой γ=(α⋅min/max)β, где α является первой заданной величиной, α>1, β является второй заданной величиной, 0<β≤1, min является минимумом (MI) спектрального представления (SR), max является максимумом (МА) спектрального представления (SR), и γ является базисным коэффициентом (BEF) акцентирования, и причем блок (10, 11) вычисления коэффициента акцентирования включает в себя второй каскад (11), выполненный с возможностью вычисления коэффициентов (SEF) акцентирования спектральной линии в соответствии со второй формулой εii'-i, в которой i' является количеством спектральных линий (SL), которые будут акцентированы, i является индексом соответствующей спектральной линии (SL), причем значение индекса увеличивается с увеличением частоты спектральных линий, i=0 … i'-1, γ является базисным коэффициентом (BEF) акцентирования, и εi является коэффициентом (SEF) акцентирования спектральной линии с индексом i.

7. Аудиокодер по п. 6, в котором первая заданная величина меньше чем 42 и больше чем 22, в частности меньше чем 38 и больше чем 26, более конкретно меньше чем 34 и больше чем 30.

8. Аудиокодер по п. 6, в котором вторая заданная величина определяется в соответствии с формулой β=1/(θ⋅i'), в которой i' является количеством акцентируемых спектральных линий, θ является коэффициентом между 3 и 5, в частности между 3,4 и 4,6, более конкретно между 3,8 и 4,2.

9. Аудиокодер по п. 1, в котором референсная спектральная линия (RSL) представляет частоту между 600 Гц и 1000 Гц, в частности между 700 Гц и 900 Гц, более конкретно между 750 Гц и 850 Гц.

10. Аудиокодер по п. 4, в котором дополнительная референсная спектральная линия представляет ту же самую или более высокую частоту, чем референсная спектральная линия (RSL).

11. Аудиокодер по п. 1, в котором управляющее устройство (5) конфигурируется таким образом, что спектральные линии (SL) обработанного спектра (PS), представляющие более низкую частоту, чем референсная спектральная линия (RSL), акцентируются только в том случае, если максимум (МА) меньше минимума (MI), умноженного на первую заданную величину.

12. Аудиодекодер (12) для декодирования потока (BS) битов, на основе неречевого аудиосигнала (AS), так, чтобы произвести из потока (BS) битов неречевой выходной аудиосигнал (OS), в частности для декодирования потока (BS) битов, произведенного аудиокодером (1) по пп. 1-12, причем поток (BS) битов содержит квантованные спектры (QS) и множество коэффициентов (LC) кодирования с линейным предсказанием, причем аудиодекодер (12) включает в себя:

приемник (13) потока битов, выполненный с возможностью извлечения квантованного спектра (QS) и коэффициентов (LC) кодирования с линейным предсказанием из потока (BS) битов;

устройство (14) деквантования, выполненное с возможностью производства деквантованного спектра (DQ) на основе квантованного спектра (QS);

блок (15) низкочастотного деакцентирования, выполненный с возможностью вычисления обратно обработанного спектра (RS) на основе деквантованного спектра (DQ), причем спектральные линии (SLD) обратно обработанного спектра (RS), представляющие более низкие частоты, чем референсная спектральная линия (RSLD), деакцентированы; и

управляющее устройство (16), выполненное с возможностью управления вычислением обратно обработанного спектра (RS) с помощью блока (15) низкочастотного деакцентирования в зависимости от коэффициентов (LC) кодирования с линейным предсказанием, содержащихся в потоке (BS) битов.

13. Аудиодекодер (12) по п. 12, который включает в себя комбинацию (17, 18) преобразователя (17) из частотной области во временную область и фильтра (18) обратного кодирования с линейным предсказанием, получающего множество коэффициентов (LC) кодирования с линейным предсказанием, содержащихся в потоке (BS) битов, причем эта комбинация (17, 18) выполнена с возможностью обратной фильтрации и преобразования обратно обработанного спектра (RS) во временную область для того, чтобы вывести выходной сигнал (OS), основанный на обратно обработанном спектре (RS) и на коэффициентах (LC) кодирования с линейным предсказанием.

14. Аудиодекодер по п. 13, в котором преобразователь (17) из частотной области во временную область выполнен с возможностью оценки временного сигнала (TS), на основе обратно обработанного спектра (RS), и причем обратный фильтр (18) кодирования с линейным предсказанием выполнен с возможностью вывода выходного сигнала (OS), на основе временного сигнала (TS).

15. Аудиодекодер по п. 13, в котором обратный фильтр (18) кодирования с линейным предсказанием выполнен с возможностью оценки обратно фильтрованного сигнала (IFS), на основе обратно обработанного спектра (RS), и причем преобразователь (17) из частотной области во временную область выполнен с возможностью вывода выходного сигнала (OS), на основе обратно фильтрованного сигнала (IFS).

16. Аудиодекодер по п. 12, в котором управляющее устройство (16) включает в себя спектральный анализатор (19), выполненный с возможностью оценки спектрального представления (SR) коэффициентов (LC) кодирования с линейным предсказанием, анализатор (20) максимума-минимума, выполненный с возможностью оценки минимума (MI) спектрального представления (SR) и максимума (МА) спектрального представления (SR) ниже дополнительной референсной спектральной линии, а также блок (21, 22) вычисления коэффициента деакцентирования, выполненный с возможностью вычисления коэффициентов (SDF) деакцентирования спектральной линии для вычисления спектральных линий (SLD) обратно обработанного спектра (RS), представляющих более низкую частоту, чем референсная спектральная линия (RSLD), на основе минимума (MI) и максимума (МА), причем спектральные линии (SLD) обратно обработанного спектра (RS) деакцентируются путем применения коэффициентов (SDF) деакцентирования спектральной линии к спектральным линиям деквантованного спектра (DQ).

17. Аудиодекодер по п. 16, в котором блок (21, 22) вычисления коэффициента деакцентирования конфигурируется таким образом, что коэффициенты (SDF) деакцентирования спектральной линии уменьшаются в направлении от референсной спектральной линии (RSLD) к спектральной линии (SL), представляющей самую низкую частоту обратно обработанного спектра (RS).

18. Аудиодекодер по п. 16, в котором блок (21, 22) вычисления коэффициента деакцентирования включает в себя первый каскад (21), выполненный с возможностью вычисления базисного коэффициента (BDF) деакцентирования в соответствии с первой формулой δ=(α⋅min/max), где α является первой заданной величиной, α>1, β является второй заданной величиной, 0<β≤1, min является минимумом (MI) спектрального представления (SR), max является максимумом (МА) спектрального представления (SR), и δ является базисным коэффициентом (BDF) деакцентирования, и причем блок (21, 22) вычисления коэффициента деакцентирования включает в себя второй каскад (22), выполненный с возможностью вычисления коэффициентов (SDF) деакцентирования спектральной линии в соответствии со второй формулой ii'-i, в которой i' является количеством спектральных линий (SLD), которые будут деакцентированы, i является индексом соответствующей спектральной линии (SLD), причем значение индекса увеличивается с увеличением частоты спектральных линий, i=0 … i'-1, δ является базисным коэффициентом (BDF) деакцентирования, и i является коэффициентом (SDF) деакцентирования спектральной линии с индексом i.

19. Аудиодекодер по п. 18, в котором первая заданная величина меньше чем 42 и больше чем 22, в частности меньше чем 38 и больше чем 26, более конкретно меньше чем 34 и больше чем 30.

20. Аудиодекодер по п. 18, в котором вторая заданная величина определяется в соответствии с формулой β=1/(θ⋅i'), в которой i' является количеством акцентируемых спектральных линий (SLD), θ является коэффициентом между 3 и 5, в частности между 3,4 и 4,6, более конкретно между 3,8 и 4,2.

21. Аудиодекодер по п. 12, в котором референсная спектральная линия (RSLD) представляет частоту между 600 Гц и 1000 Гц, в частности между 700 Гц и 900 Гц, более конкретно между 750 Гц и 850 Гц.

22. Аудиодекодер по п. 16, в котором дополнительная референсная спектральная линия представляет ту же самую или более высокую частоту, чем референсная спектральная линия (RSLD).

23. Аудиодекодер по п. 12, в котором управляющее устройство (16) конфигурируется таким образом, что спектральные линии (SLD) обратно обработанного спектра (RS), представляющие более низкую частоту, чем референсная спектральная линия (RSLD), деакцентируются только в том случае, если максимум (МА) меньше минимума (MI), умноженного на первую заданную величину.

24. Система для кодирования неречевого аудиосигнала (AS), так чтобы произвести из него поток (BS) битов и для декодирования потока (BS) битов, на основе неречевого аудиосигнала (AS), так чтобы произвести из потока (BS) битов неречевой выходной аудиосигнал (OS), причем система включает в себя декодер (12) и кодер (1), в которой кодер (1) спроектирован в соответствии с одним из пп. 1-11 и/или декодер спроектирован в соответствии с одним из пп. 12-23.

25. Способ кодирования неречевого аудиосигнала (AS) так, чтобы произвести из него поток (BS) битов, причем способ включает в себя этапы:

фильтрования с фильтром (2) кодирования с линейным предсказанием, имеющим множество коэффициентов (LC) кодирования с линейным предсказанием, и преобразования фрейма (FI) аудиосигнала (AS) в частотную область для того, чтобы вывести спектр (SP) на основе этого фрейма (FI) и коэффициентов (LC) кодирования с линейным предсказанием;

вычисления обработанного спектра (PS) на основе спектра (SP), причем спектральные линии (SL) обработанного спектра (PS), представляющие более низкую частоту, чем референсная спектральная линия (RSL), акцентированы; и

управления вычислением обработанного спектра (PS) в зависимости от коэффициентов (LC) кодирования с линейным предсказанием фильтра (2) кодирования с линейным предсказанием;

производства квантованного спектра (QS), на основе обработанного спектра (PS); и

встраивания квантованного спектра (QS) и коэффициентов (LC) кодирования с линейным предсказанием в поток (BS) битов.

26. Способ для декодирования потока (BS) битов на основе неречевого аудиосигнала (AS) так, чтобы произвести из потока (BS) битов неречевой выходной аудиосигнал (OS), в частности для декодирования потока (BS) битов, произведенного с помощью способа по предшествующему пункту, причем поток (BS) битов содержит квантованные спектры (QS) и множество коэффициентов (LC) кодирования с линейным предсказанием, причем способ включает в себя этапы:

извлечения квантованного спектра (QS) и коэффициентов (LC) кодирования с линейным предсказанием из потока (BS) битов;

производства деквантованного спектра (DQ), на основе квантованного спектра (QS);

вычисления обратно обработанного спектра (RS) на основе деквантованного спектра (DQ), причем спектральные линии (SLD) обратно обработанного спектра (RS), представляющие более низкие частоты, чем референсная спектральная линия (RSLD), деакцентированы; и

управления вычислением обратно обработанного спектра (RS) в зависимости от коэффициентов (LC) кодирования с линейным предсказанием, содержащихся в потоке (BS) битов.

27. Энергонезависимый носитель, содержащий компьютерную программу, которая при ее выполнении на компьютере или процессоре выполняет способ по п. 25.

28. Энергонезависимый носитель, содержащий компьютерную программу, которая при ее выполнении на компьютере или процессоре выполняет способ по п. 26.



 

Похожие патенты:

Изобретение относится к средствам для управления фазовой когерентностью для гармонических сигналов в перцепционных аудиокодеках. Технический результат заключается в повышении качества аудиосигнала.

Изобретение относится к области кодирования сигнала и предназначено для обработки сигнала весовыми коэффициентами окна. Технический результат – повышение эффективности кодирования путем адаптации характеристик окна к характеристикам входного спектра.

Изобретение относится к средствам для кодирования и декодирования гармонических звуковых сигналов. Технический результат заключается в повышении качества кодированного гармонического звукового сигнала.

Настоящее изобретение относится к средствам кодирования и декодирования звука. Технический результат заключается в уменьшении вычислительной сложности процесса распределения битов, используемого в процессе кодирования/декодирования звука.

Изобретение относится к средствам для управления усилениями в полосах в расширенной области полосы частот на основе информации о положениях пиков. Технический результат заключается в повышении качества расширения полосы частот гармонических аудиосигналов.

Изобретение относится к средствам для управления усилениями в полосах в расширенной области полосы частот на основе информации о положениях пиков. Технический результат заключается в повышении качества расширения полосы частот гармонических аудиосигналов.

Изобретение относится к средствам кодирования и декодирования звукового сигнала. Технический результат заключается в повышении эффективности кодирования при наличии колебаний основной частоты.

Изобретение относится к средствам кодирования и декодирования звукового сигнала. Технический результат заключается в повышении эффективности кодирования при наличии колебаний основной частоты.

Изобретение относится к обработке звукового сигнала и\или видеосигнала в виде последовательности выборок и предназначено для кодирования и декодирования цифрового звукового сигнала.

Изобретение относится к кодированию/декодированию цифрового сигнала, состоящему из последовательных блоков выборок. Технический результат заключается в повышении качества кодированного звука.

Изобретение относится к средствам кодирования и декодирования. Технический результат заключается в повышении эффективности кодирования/декодирования данных. Устанавливают соответствие одной или более части исходных данных с одним или более элементом в одной или более базе данных, при этом указанный один или более элемент представляет соответствующий один или более блок данных, и записывают опорные значения, которые связывают указанную одну или более часть исходных данных с указанным одним или более соответственным элементом. Включают опорные значения в кодированные данные совместно с указанной одной или более базой данных и/или информацией, идентифицирующей указанную одну или более базу данных. Принимают кодированные данные, включающие опорные значения и информацию об идентификаторах областей, а также информацию об одной или более базе данных. Декодируют опорные значения из кодированных данных. Извлекают один или более элемент из указанной одной или более базы данных согласно указанным опорным значениям, при этом указанный один или более элемент представляет один или более соответствующий блок данных. Формируют указанный один или более блок данных для сборки соответствующих декодированных данных для вывода. 7 н. и 23 з.п. ф-лы, 5 табл., 3 ил.

Изобретение относится к области обработки сигнала. Техническим результатом является уменьшение сложности алгоритмов кодирования и декодирования за счет декорреляции только вещественнозначных коэффициентов. Способ обработки аудиоданных включает прием из битового потока аудиоданных, соответствующих ряду звуковых каналов, применение процесса декорреляции к некоторым из аудиоданных, причем процесс декорреляции включает применение алгоритма декорреляции, действующего полностью на вещественнозначных коэффициентах. 3 н. и 13 з.п. ф-лы, 37 ил.
Наверх