Устройство и способ обработки многоканального сигнала

Изобретение относится к звуковым кодерам и в особенности к звуковым кодерам на основе преобразования временного представления в спектральное представление. Устройство для обработки многоканального сигнала включает в себя средство для определения сходства между первым из двух каналов и вторым из двух каналов. Кроме того, обеспечивается средство для выполнения фильтрации предсказания спектральных коэффициентов, которое выполнено с возможностью выполнения фильтрации предсказания только с одним фильтром предсказания для обоих каналов в случае высокого сходства между первым и вторым каналом и выполнения фильтрации предсказания с двумя отдельными фильтрами предсказания в случае различия между первым и вторым каналом. Технический результат - повышение эффективности кодирования в технологии кодирования стереосигнала. 3 н. и 9 з.п ф-лы, 3 ил.

 

Изобретение имеет отношение к звуковым кодерам и в особенности к звуковым кодерам на основе преобразования, то есть в которых в начале конвейера кодера имеет место преобразование временного представления в спектральное представление.

Известный звуковой кодер на основе преобразования показан на фиг.3. Кодер, показанный на фиг.3, проиллюстрирован в международном стандарте ISO/IEC 14496-3: 2001 (E), подраздел 4, стр.4, и также известен в технической терминологии как кодер AAC (Advanced Audio Coding, усовершенствованное кодирование звука).

Ниже будет представлен кодер предшествующего уровня техники. Звуковой сигнал, который должен быть закодирован, подается на вход 1000. Этот звуковой сигнал первоначально подается на этап 1002 масштабирования, на котором проводится так называемая регулировка усиления AAC для установления уровня звукового сигнала. Дополнительная информация от масштабирования подается на устройство 1004 форматирования потока битов, как представлено стрелкой, расположенной между блоком 1002 и блоком 1004. Масштабированный звуковой сигнал затем подается на блок 1006 фильтров модифицированного дискретного косинусного преобразования (MDCT). Для кодера AAC блок фильтров осуществляет модифицированное дискретное косинусное преобразование с 50% накладывающихся окон, длина окна определяется блоком 1008.

Вообще говоря, блок 1008 присутствует с целью формирования окон кратковременных сигналов с относительно короткими окнами и формирования окон сигналов, которые имеют тенденцию быть постоянными, с относительно длинными окнами. Это служит для достижения более высокого уровня разрешающей способности по времени (за счет разрешающей способности по частоте) для кратковременных сигналов благодаря относительно коротким окнам, тогда как для сигналов, которые имеют тенденцию быть постоянными, более высокая разрешающая способность по частоте (за счет разрешающей способности по времени) достигается благодаря более длинным окнам, имеется тенденция предпочтения более длинных окон, так как они приводят к более высокой эффективности кодирования. На выходе блока 1006 фильтров находятся блоки спектральных значений, - блоки являются последовательными по времени, - которые могут быть коэффициентами модифицированного дискретного косинусного преобразования (MDCT), коэффициентами Фурье или сигналами поддиапазона в зависимости от реализации блока фильтров, каждый сигнал поддиапазона имеет определенную ограниченную полосу пропускания, заданную соответствующим каналом поддиапазона в блоке 1006 фильтров, и каждый сигнал поддиапазона имеет определенное количество выборок (сэмплов) поддиапазона.

Затем следует представление посредством примера случая, в котором блок фильтров дает на выходе последовательные во времени блоки спектральных коэффициентов модифицированного дискретного косинусного преобразования (MDCT), которые, вообще говоря, представляют собой последовательные краткосрочные спектры звукового сигнала, который должен быть закодирован, на входе 1000. Блок спектральных значений модифицированного дискретного косинусного преобразования (MDCT) затем подается в блок 1010 обработки TNS (TNS = temporary noise shaping, временное ограничение шума), в котором выполняется временное ограничение шума. Методика временного ограничения шума (TNS) используется для ограничения временной формы шума квантования в каждом окне преобразования. Это достигается применением процесса фильтрации к частям спектральных данных каждого канала. Кодирование выполняется на основе окна. В частности, выполняются следующие этапы для применения инструмента временного ограничения шума (TNS) к окну спектральных данных, то есть к блоку спектральных значений.

Первоначально выбирается частотный диапазон для инструмента временного ограничения шума (TNS). Подходящий выбор содержит покрытие фильтром частотного диапазона 1,5 кГц до максимально возможной полосы масштабного коэффициента. Следует указать, что этот частотный диапазон зависит от частоты дискретизации, как определено в стандарте AAC (ISO/IEC 14496-3: 2001 (E)).

Затем выполняется вычисление LPC (LPC = linear predictive coding, кодирование с линейным предсказанием), чтобы быть точным, c использованием спектральных коэффициентов модифицированного дискретного косинусного преобразования (MDCT), присутствующих в выбранном целевом частотном диапазоне. Для увеличенной стабильности коэффициенты, которые соответствуют частотам ниже 2,5 кГц, исключаются из этой обработки. Для вычисления кодирования с линейным предсказанием (LPC) могут быть использованы обычные процедуры кодирования с линейным предсказанием (LPC), известные из обработки речевой информации, например, известный алгоритм Левинсона-Дарбина (Levinson-Durbin). Вычисление выполняется для максимально допустимого порядка ограничивающего шум фильтра.

В результате вычисления кодирования с линейным предсказанием (LPC) получается ожидаемая эффективность предсказания (PG). Кроме того, получаются коэффициенты отражения, или коэффициенты частной корреляции (Parcor).

Если эффективность предсказания не превышает заданный порог, инструмент временного ограничения шума (TNS) не применяется. В этом случае часть информации управления записывается в поток битов таким образом, чтобы декодер знал, что обработка временного ограничения шума (TNS) не выполнялась.

Однако, если эффективность предсказания превышает порог, применяется обработка временного ограничения шума (TNS).

На следующем этапе коэффициенты отражения квантуются. Порядок использованного ограничивающего шум фильтра определяется путем удаления всех коэффициентов отражения, имеющих меньшее, чем порог, абсолютное значение, из "хвоста" массива коэффициентов отражения. Количество оставшихся коэффициентов отражения находится в порядке величины ограничивающего шум фильтра. Подходящим порогом является значение 0,1.

Оставшиеся коэффициенты отражения обычно преобразуются в линейные коэффициенты предсказания, эта методика также известна как процедура "пошагового увеличения".

Вычисленные коэффициенты кодирования с линейным предсказанием (LPC) затем используются как коэффициенты ограничивающего шум фильтра кодера, то есть как коэффициенты фильтра предсказания. Этот фильтр с конечной импульсной характеристикой (FIR) используется для фильтрации в заданном целевом частотном диапазоне. Авторегрессионный фильтр используется при декодировании, тогда как так называемый фильтр со скользящим средним значением используется при кодировании. В итоге дополнительная информация для инструмента временного ограничения шума (TNS) подается на устройство форматирования потока битов, как представлено стрелкой, показанной между блоком 1010 обработки временного ограничения шума (TNS) и устройством 1004 форматирования потока битов на фиг.3.

Затем проходят через несколько дополнительных инструментов, не показанных на фиг.3, таких как инструмент долгосрочного предсказания, инструмент интенсивности/связывания, инструмент предсказания, инструмент замены шума, пока в итоге не будет достигнут кодер 1012 центрального/разностного каналов (mid/side channel). Кодер 1012 центрального/разностного каналов активен, когда звуковой сигнал, который должен быть закодирован, является многоканальным сигналом, то есть стереосигналом, имеющим левый канал и правый канал. До сих пор, то есть вверх по потоку от блока 1012 на фиг.3, левый и правый стереоканалы обрабатывались, то есть масштабировались, преобразовывались блоком фильтров, подвергались или не подвергались обработке временного ограничения шума (TNS) и т.д. отдельно от друг друга.

В кодере центрального/разностного каналов первоначально выполняется проверка относительно того, имеет ли смысл кодирование центрального/разностного каналов, то есть приведет ли оно к эффективности кодирования вообще. Кодирование центрального/разностного каналов приведет к эффективности кодирования, если левый и правый каналы имеют тенденцию быть сходными, так как в этом случае центральный канал, то есть сумма левого и правого каналов, является почти равным левому каналу или правому каналу, кроме масштабирования с коэффициентом 1/2, тогда как разностный канал имеет только очень малые значения, так как он равен разности между левым и правым каналами. Как следствие, можно видеть, что когда левый и правый каналы являются приблизительно одинаковыми, разность является приблизительно нулевой, или включает в себя только очень малые значения, которые - на это есть надежда - будут квантованы в нулевое значение в последующем квантователе 1014, и, таким образом, могут быть переданы очень эффективным способом, так как энтропийный кодер 1016 связан вниз по потоку от квантователя 1014.

Психо-акустическая модель 1020 подает квантователю 1014 допустимую помеху на полосу масштабного коэффициента. Квантователь работает итерационным образом, то есть первоначально вызывается внешний итеративный цикл, который затем вызовет внутренний итеративный цикл. Вообще говоря, начиная с начальных значений шага квантования квантователя квантование блока значений первоначально выполняется на входе квантователя 1014. В частности, внутренний цикл квантует коэффициенты модифицированного дискретного косинусного преобразования (MDCT), при этом в процессе расходуется определенное количество битов. Внешний цикл вычисляет искажение и измененную энергию коэффициентов, используя масштабирующий коэффициент, таким образом, чтобы снова вызвать внутренний цикл. Этот процесс итерационно выполняется в течение такого времени, пока не будет удовлетворено заданное условное предложение. Для каждой итерации во внешнем итеративном цикле сигнал восстанавливается для того, чтобы вычислить помеху, внесенную квантованием, и сравнить ее с допустимой помехой, подаваемой психо-акустической моделью 1020. Кроме того, масштабирующие коэффициенты тех полос частоты, которые после этого сравнения еще считаются имеющими помеху, увеличиваются на одну или несколько ступеней от итерации к итерации, точнее говоря, для каждой итерации внешнего итеративного цикла.

Как только достигнута ситуация, в которой помеха квантования, внесенная квантованием, является ниже допустимой помехи, определяемой психо-акустической моделью, и если в то же время удовлетворены требования по битам, которые констатируют, чтобы быть точным, что не должна быть превышена максимальная битовая скорость передачи данных, итерация, то есть способ анализа через синтез, завершается, и полученные масштабные коэффициенты кодируются, как проиллюстрировано в блоке 1014, и подаются в закодированном виде на устройство 1004 форматирования потока битов, как отмечено стрелкой, которая нарисована между блоком 1014 и блоком 1004. Квантованные значения затем подаются на энтропийный кодер 1016, который обычно выполняет энтропийное кодирование для различных полос масштабных коэффициентов с использованием нескольких таблиц кода Хаффмана для того, чтобы перевести квантованные значения в двоичный формат. Как известно, энтропийное кодирование в виде кодирования Хаффмана приводит к снижению скорости на кодовых таблицах, которые создаются на основе ожидаемой статистики сигнала, и в которых часто появляющимся значениям даются более короткие кодовые слова, чем менее часто появляющимся значениям. Энтропийно закодированные значения затем подаются как фактическая главная информация на устройство 1004 форматирования потока битов, которое затем выдает закодированный звуковой сигнал на стороне выхода в соответствии с заданным синтаксисом потока битов.

Как уже было изложено, фильтрация предсказания используется для временного ограничения шума квантования в пределах фрейма кодирования в блоке 1010 обработки временного ограничения шума (TNS).

В частности, временное ограничение шума квантования выполняется путем фильтрации спектральных коэффициентов по частоте в кодере перед квантованием и последующей обратной фильтрацией в декодере. Обработка временного ограничения шума (TNS) приводит к тому, что огибающая шума квантования сдвигается во времени далее огибающей сигнала, чтобы избежать дефекта опережающего эха. Применение временного ограничения шума (TNS) является следствием оценки эффективности предсказания фильтрации, как это было изложено ранее. Коэффициенты фильтра для каждого фрейма кодирования определяются через меру корреляции. Вычисление коэффициентов фильтра делается отдельно для каждого канала. Они также передаются отдельно в закодированный поток битов.

Неблагоприятным в активации/деактивации понятия временного ограничения шума (TNS) является то, что для каждого стереоканала фильтрация временного ограничения шума (TNS) имеет место отдельно для каждого канала, если обработка временного ограничения шума (TNS) была активизирована благодаря хорошей ожидаемой эффективности кодирования. С относительно различными каналами это все еще непроблематично. Но если правый и левый каналы относительно сходны, то есть если левый и правый каналы имеют в точности одну и ту же полезную информацию в критическом примере, таком как динамик, и отличаются только по шуму, неизбежно содержащемуся в каналах, на предшествующем уровне техники для каждого канала по-прежнему вычисляется и используется собственный фильтр временного ограничения шума (TNS). Так как фильтр временного ограничения шума (TNS) непосредственно зависит от левого и/или правого канала и, в частности, реагирует относительно ощутимо на спектральные данные левого и правого каналов, обработка временного ограничения шума (TNS) с собственным фильтром предсказания выполняется для каждого канала также в случае сигнала, в котором левый и правый канал являются очень сходными, то есть в случае так называемого "квазимонофонического сигнала". Это приводит к тому, что имеет место различное временное ограничение шума в двух стереоканалах из-за различных коэффициентов фильтра.

Неблагоприятным в этом явлении является то, что это может привести к слышимым дефектам, так как, например, впечатление исходного звука, подобного монофоническому, получает нежелательный стереофонический характер через эти временные различия.

Известная процедура, однако, имеет дополнительный, возможно, еще более серьезный недостаток. Обработкой временного ограничения шума (TNS), выходные значения временного ограничения шума (TNS), то есть спектральные остаточные значения, подвергаются кодированию центрального/разностного каналов в кодере 1002 центрального/разностного каналов фиг.3. В то время, как эти два канала были еще относительно равны до обработки временного ограничения шума (TNS), так больше нельзя сказать после обработки временного ограничения шума (TNS). C помощью описанного стереоэффекта, который был внесен раздельной обработкой временного ограничения шума (TNS), спектральные остаточные значения этих двух каналов сделаны более непохожими, чем они были бы фактически. Это приводит к непосредственному снижению эффективности кодирования из-за кодирования центрального/разностного каналов, которое является особенно неблагоприятным для приложений, в которых, в частности, требуется низкая битовая скорость передачи данных.

Подводя итог вышесказанному, известная активация временного ограничения шума (TNS), таким образом, проблематична для стереосигналов, использующих сходную, но не точно идентичную информацию сигнала в обоих каналах, такую как голосовые сигналы, подобные монофоническим. До тех пор, пока различные коэффициенты фильтра определяются для обоих каналов для выявления временного ограничения шума (TNS), это приводит к различному временному ограничению шума квантования в каналах. Это может привести к слышимым дефектам, так как впечатление исходного звука, подобного монофоническому, получает нежелательный стереофонический характер через эти временные различия, например. Кроме того, как было изложено, спектр, измененный с помощью временного ограничения шума (TNS), подвергается кодированию центрального/разностного каналов на последующем этапе. Другие фильтры в обоих каналах дополнительно уменьшают сходство спектральных коэффициентов, и, таким образом, эффективность кодирования центрального/разностного каналов.

Патент DE 19829284C2 раскрывает способ и устройство для обработки временного стереосигнала и способ и устройство для декодирования звукового потока битов, закодированного с использованием предсказания по частоте. В зависимости от реализации левый, правый и моноканал могут быть подвергнуты собственному предсказанию по частоте, то есть обработке временного ограничения шума (TNS). Таким образом, полное собственное предсказание может быть выполнено для каждого канала. В качестве альтернативы при неполном предсказании может иметь место вычисление коэффициентов предсказания для левого канала, которые затем используются для фильтрации правого канала и моноканала.

Задачей настоящего изобретение является обеспечение концепции обработки многоканального сигнала, допускающего меньшее количество дефектов, но по-прежнему хорошее сжатие информации.

Эта задача достигается устройством для обработки многоканального сигнала по п.1, способом обработки многоканального сигнала по п.11 или компьютерной программой по п.12 формулы изобретения.

Настоящее изобретение основано на выводе, что, если левый и правый каналы сходны, то есть превышают меру сходства, одна и та же фильтрация временного ограничения шума (TNS) должна применяться для обоих каналов. Этим гарантируется, что никакие псевдостереодефекты не вносятся в многоканальный сигнал обработкой временного ограничения шума (TNS), поскольку при помощи одного и того же фильтра предсказания для обоих каналов достигается, что временное ограничение шума квантования также имеет место одинаково для обоих каналов, то есть не слышны никакие псевдостереодефекты.

Кроме того, гарантируется, что сигналы не становятся более непохожими, чем они фактически должны бы быть. Сходство сигналов после фильтрации временного ограничения шума (TNS), то есть сходство спектральных остаточных значений, здесь соответствует сходству входных сигналов в фильтры, а не, как на предшествующем уровне техники, сходству входных сигналов, которое еще будет уменьшаться другими фильтрами.

Таким образом, последующее кодирование центрального/разностного каналов не будет иметь потерь битовой скорости передачи данных, так как сигналы не были сделаны более непохожими, чем они фактически являются.

Конечно, при использовании того же самого фильтра предсказания для обоих сигналов произойдет маленькая потеря в эффективности предсказания. Эта потеря, однако, не будет настолько большой, так как синхронизация фильтрации временного ограничения шума (TNS) для обоих каналов используется только тогда, когда эти два канала сходны друг с другом так или иначе. Однако, эта маленькая потеря в эффективности предсказания, если она произошла, легко балансируется эффективностью центрального/разностного каналов, так как никакое дополнительное различие между левым и правым каналами, которое привело бы к сокращению эффективности кодирования центрального/разностного каналов, не вносится обработкой временного ограничения шума (TNS).

Предпочтительные варианты осуществления настоящего изобретения будут разъяснены подробно далее со ссылкой на сопроводительные чертежи, на которых:

Фиг.1 является структурной схемой соединений устройства для обработки многоканального сигнала в соответствии с изобретением,

Фиг.2 показывает предпочтительный вариант осуществления средства определения сходства и средства формирования фильтрации предсказания; и

Фиг.3 является структурной схемой соединений известного звукового кодера в соответствии со стандартом AAC.

Фиг.1 показывает устройство для обработки многоканального сигнала, в котором многоканальный сигнал представлен одним блоком спектральных значений каждого канала для, по меньшей мере, двух каналов, как показано буквами L и R. Блоки спектральных значений определены из выборок (сэмплов) временной области l(t) и/или r(t) для каждого канала с помощью фильтрации модифицированного дискретного косинусного преобразования (MDCT), например, посредством блока 10 фильтров модифицированного дискретного косинусного преобразования (MDCT).

В предпочтительном варианте осуществления настоящего изобретения блоки спектральных значений для каждого канала затем подаются на средство 12 для определения сходства между этими двумя каналами. В качестве альтернативы средство для определения сходства между этими двумя каналами может так же, как показано на фиг.1, быть выполнено с использованием выборок (сэмплов) временной области l(t) или r(t) для каждого канала. Предпочтительно однако использовать блоки спектральных значений, полученные от блока 10 фильтров, для определения сходства, так как они находятся под одинаковым влиянием возможных эффектов фильтрации в блоке 10 фильтров.

Средство 12 для определения сходства между первым и вторым каналами выполнено с возможностью формирования на линии 14 управления на основе меры сходства или альтернативно меры различия сигнала управления, который имеет, по меньшей мере, два состояния, одно из которых выражает, что блоки спектральных значений этих двух каналов являются сходными, или который указывает в своем другом состоянии, что блоки спектральных значений для каждого канала являются различными. Решение относительно того, преобладает ли сходство или различие, может быть принято с использованием предпочтительно числовой меры сходства.

Имеются различные возможности для определения сходства между двумя блоками спектральных значений для каждого канала, одна возможность из которых заключается в вычислении взаимной корреляции, приводящем к значению, которое может затем быть сравнено с заданным порогом сходства. Известны альтернативные способы измерения подобия, предпочтительный вид описывается позже.

Как блок спектральных значений для левого канала, так и блок спектральных значений для правого канала подаются на средство 16 для выполнения фильтрации предсказания. В частности, фильтрация предсказания выполняется по частоте, причем средство для выполнения выполнено с возможностью использования общего фильтра 16a предсказания для блока спектральных значений первого канала и для блока спектральных значений второго канала для выполнения предсказания по частоте, когда сходство больше, чем пороговое сходство. Однако, если средство 16 для выполнения фильтрации предсказания будет уведомлено средством 12 для определения сходства, что два блока спектральных значений для каждого канала различны, то есть имеют сходство, меньшее чем пороговое сходство, то средство 16 для выполнения фильтрации предсказания применит различные фильтры 16b к левому и правому каналу.

Выходные сигналы средства 16, таким образом, являются спектральными остаточными значениями левого канала на выходе 18a, а также спектральными остаточными значениями правого канала на выходе 18b, причем спектральные остаточные значения этих двух каналов были сформированы с использованием одного и того же фильтра предсказания (случай 16a) или с использованием разных фильтров предсказания (случай 16b) в зависимости от сходства правого и левого канала.

В зависимости от фактической реализации кодера спектральные остаточные значения левого и правого канала могут быть поданы либо непосредственно, либо после нескольких обработок, обеспечиваемых в стандарте AAC, на кодер центрального/разностного каналов, который выдает на выходе центральный сигнал как половину суммы левого и правого канала на выходе 21a, в то время как разностный сигнал выдается на выходе как половина разности левого и правого канала.

Как было изложено, в случае, если высокое сходство между каналами существовало прежде, разностный сигнал теперь меньше, чем в случае, в котором разные фильтры временного ограничения шума (TNS) используются для сходных каналов, благодаря синхронизации обработки временного ограничения шума (TNS) этих двух каналов, которая, таким образом, выдерживает перспективу более высокой эффективности кодирования благодаря тому факту, что разностный сигнал является меньшим.

Далее со ссылкой на фиг.2 будет проиллюстрирован предпочтительный вариант осуществления настоящего изобретение, в котором в средстве 12 для определения сходства первая стадия вычисления временного ограничения шума (TNS) уже выполнена, а именно вычисление коэффициентов частной корреляции и/или коэффициентов отражения и эффективности предсказания как для левого канала, так и для правого канала, как проиллюстрировано блоками 12a, 12b.

Эта обработка временного ограничения шума (TNS), таким образом, обеспечивает как коэффициенты фильтра для фильтра предсказания, который должен быть использован в конце, так и эффективность предсказания, причем эта эффективность предсказания также необходима, чтобы решить, должна ли вообще быть выполнена обработка временного ограничения шума (TNS) или нет.

Эффективность предсказания для первого, левого канала, которая обозначена как PG1 на фиг.2, подается средству определения меры сходства, которое обозначено как 12c на фиг.2, точно так же, как эффективность предсказания для правого канала, которая обозначена как PG2 на фиг.2. Это средство определения сходства выполнено с возможностью вычисления абсолютной величины разности или относительной разности двух эффективностей предсказания и определения, является ли она ниже заданного порога S отклонения. Если абсолютная величина разности эффективностей предсказания лежит ниже порога S, предполагается, что два сигнала сходны, и на вопрос в блоке 12c отвечают "Да". Однако, если установлено, что разность больше, чем порог S сходства, на вопрос отвечают "Нет". В случае утвердительного ответа на этот вопрос общий фильтр для обоих каналов L и R используется в средстве 16, тогда как в случае отрицательного ответа на вопрос в блоке 12c используются отдельные фильтры, то есть может быть выполнена обработка временного ограничения шума (TNS), как на предшествующем уровне техники.

С этой целью набор коэффициентов фильтра FKL для левого канала и набор коэффициентов фильтра FKR для правого канала подаются на средство 16 от средств 12a и/или 12b.

В предпочтительном варианте осуществления настоящего изобретения в блоке 16c делается специальный выбор для фильтрации посредством общего фильтра. В блоке 16c принимается решение, какой канал имеет большую энергию. Если установлено, что левый канал имеет большую энергию, коэффициенты фильтра FKL, вычисленные для левого канала средствами 12a, используются для общей фильтрации. Однако, если в блоке 16c установлено, что правый канал имеет большую энергию, набор коэффициентов фильтра FKR, вычисленный для правого канала в средствах 12b, используется для общей фильтрации.

Как может быть замечено по фиг.2, как временной сигнал, так и спектральный сигнал могут использоваться для определения энергии. Вследствие того, что дефекты преобразования, которые возможно имели место, уже содержатся в спектральных сигналах, предпочтительно использовать спектральные сигналы левого и правого каналов для принятия "решения об энергии" в блоке 16c.

В предпочтительном варианте осуществления настоящего изобретения используется синхронизация временного ограничения шума (TNS), то есть использование одних и тех же коэффициентов фильтра для обоих каналов, если эффективности предсказания для левого и правого каналов отличаются меньше, чем на три процента. Если оба канала отличаются больше, чем на три процента, на вопрос в блоке 12c фиг.2 отвечают "Нет".

Как уже было изложено, эффективности предсказаний этих двух каналов сравниваются при фильтрации - в смысле простого или требующего небольшого объема вычислений обнаружения сходства. Если различие эффективностей предсказания попадает ниже определенного порога, оба канала передаются с одной и той же фильтрацией временного ограничения шума (TNS), чтобы избежать описанных проблем.

В качестве альтернативы может также иметь место сравнение коэффициентов отражения двух отдельно вычисленных фильтров временного ограничения шума (TNS).

Вновь в качестве альтернативы определение сходства может также быть достигнуто с использованием других элементов сигнала таким образом, что когда сходство определено, должен быть вычислен только набор коэффициентов фильтра временного ограничения шума (TNS) для канала, который будет применяться для фильтрации предсказания обоих стереоканалов. Это имеет преимущество, в котором, глядя на фиг.2 и если сигналы сходны, будет активен только либо блок 12a, либо блок 12b.

Кроме того, идея изобретения может также быть использована для дополнительного уменьшения битовой скорости передачи данных закодированного сигнала. В то время как другая дополнительная информация временного ограничения шума (TNS) передается с использованием двух различных коэффициентов отражения, информация временного ограничения шума (TNS) для обоих каналов должна быть передана только один раз в фильтрации этих двух каналов с одним и тем же фильтром предсказания. Следовательно, в соответствии с идеей изобретения уменьшение битовой скорости передачи данных может также быть достигнуто тем, что набор дополнительной информации временного ограничения шума (TNS) "сохраняется", если левый и правый каналы сходны.

Идея изобретения в основном не ограничена стереосигналами, но может быть применена в многоканальном оборудовании среди различных пар каналов или также групп из более чем 2 каналов.

Как было заявлено, определение меры взаимной корреляции между левым и правым каналами или определение эффективности предсказания TNS и коэффициентов фильтра временного ограничения шума (TNS) могут иметь место отдельно для каждого канала для определения сходства.

Принятие решения о синхронизации имеет место, если k превышает порог (например, 0,6), и активизируется стереокодирование центрального/разностного каналов. Критерий центрального/разностного каналов также может быть опущен.

Определение опорного канала, фильтр временного ограничения шума (TNS) которого должен быть принят для другого канала, имеет место при синхронизации. Например, канал с большей энергией используется как опорный канал. В частности, тогда имеет место копирование коэффициентов фильтра временного ограничения шума (TNS) из опорного канала на другой.

Наконец, имеет место применение синхронизированных или несинхронизированных фильтров временного ограничения шума (TNS) к спектру.

В качестве альтернативы определение эффективности предсказания временного ограничения шума (TNS) и коэффициентов фильтра временного ограничения шума (TNS) имеют место отдельно для каждого канала. Затем принимается решение. Если эффективность предсказания обоих каналов отличается не более, чем на некоторую меру, например 3%, синхронизация имеет место. Здесь опорный канал также может быть выбран произвольно, если может быть предположено сходство каналов. Здесь также копируются коэффициенты фильтра временного ограничения шума TNS из опорного канала в другой канал, после чего имеет место применение синхронизированных или несинхронизированных фильтров (TNS) к спектру.

Далее следуют альтернативные возможности: активизируется ли принципиально временное ограничение шума (TNS) в канале, зависит от эффективности предсказания в этом канале. Если она превышает некоторый порог, временное ограничение шума (TNS) активизируется для этого канала. В качестве альтернативы производится также синхронизация временного ограничения шума (TNS) для двух каналов, если временное ограничение шума (TNS) было активизировано только в одном из обоих каналов. Тогда это соглашение, что, например, эффективность предсказания сходна, то есть один канал лежит непосредственно выше предела активации, и один канал - непосредственно ниже предела активации. Из этого сравнения тогда выводится активация временного ограничения шума (TNS) для обоих каналов с одними и теми же коэффициентами или возможна также дезактивация для обоих каналов.

В зависимости от обстоятельств способ обработки многоканального сигнала согласно изобретению может быть реализован в аппаратных средствах или в программном обеспечении. Реализация может быть на цифровом носителе данных, в частности, на гибком диске или компакт-диске с помощью читаемых электронными средствами сигналов управления, способных к содействию с программируемой компьютерной системой для выполнения способа. Вообще изобретение, таким образом, также заключается в продукте компьютерной программы с кодом программы, сохраненным на машиночитаемом носителе для выполнения способа согласно изобретению, когда продукт компьютерной программы выполняется на компьютере. Другими словами, изобретение может, таким образом, также быть осуществлено как компьютерная программа с программным кодом для выполнения способа, когда компьютерная программа выполняется на компьютере.

1. Устройство для обработки многоканального сигнала, в котором многоканальный сигнал представлен блоком спектральных значений каждого канала для, по меньшей мере, двух каналов, содержащее

средство (12) для определения сходства между первым из этих двух каналов и вторым из этих двух каналов, причем средство (12) для определения выполнено с возможностью вычисления первой эффективности предсказания из предсказания блока первого канала и второй эффективности предсказания из предсказания блока второго канала или первых коэффициентов отражения для первого фильтра предсказания для первого канала и вторых коэффициентов отражения для второго фильтра предсказания второго канала и получения (12с) сходства с использованием первой эффективности предсказания и второй эффективности предсказания или с использованием первых коэффициентов отражения и вторых коэффициентов отражения;

средство (16) для выполнения фильтрации предсказания, причем средство для выполнения выполнено с возможностью

использования общего фильтра предсказания для блока спектральных значений первого канала и блока спектральных значений второго канала для выполнения фильтрации предсказания, если сходство, которое определено средством (12) для определения сходства, больше, чем пороговое сходство, или

использования двух разных фильтров предсказания для выполнения фильтрации предсказания, если сходство, которое определено средством (12) для определения сходства, является меньшим, чем пороговое сходство.

2. Устройство по п.1, в котором средство (16) для выполнения выполнено с возможностью вывода спектральных остаточных значений в результате предсказания, и при этом устройство дополнительно содержит средство (20) для объединенного кодирования спектральных остаточных значений или значений первого канала, выведенных из спектральных остаточных значений, и спектральных остаточных значений или значений второго канала, выведенных из спектральных остаточных значений, если сходство больше, чем пороговое сходство.

3. Устройство по п.2, в котором объединенное кодирование является кодированием центрального/разностного каналов.

4. Устройство по п.3, в котором средство (20) для объединенного кодирования выполнено с возможностью вычисления центрального сигнала на основе суммы первого и второго канала и вычисления разностного сигнала на основе разности первого и второго канала.

5. Устройство по любому из пп.1-4, в котором блок спектральных значений для канала представляет собой кратковременный спектр этого канала, или в котором блок спектральных значений включает в себя множество полосовых сигналов для множества поддиапазонов.

6. Устройство по любому из пп.1-4, в котором средство (16) для выполнения выполнено с возможностью выполнения обработки временного ограничения шума (TNS).

7. Устройство по любому из пп.1-4, в котором средство (12) для определения выполнено с возможностью вычисления взаимной корреляции первого и второго канала.

8. Устройство по п.1, в котором средство (16) для выполнения выполнено с возможностью использования одного фильтра предсказания, если первая эффективность предсказания и вторая эффективность предсказания отличаются меньше чем на три процента или на три процента.

9. Устройство по любому из пп.1-4, в котором средство (16) для выполнения выполнено с возможностью использования в качестве общего фильтра предсказания фильтра предсказания, коэффициенты которого выведены из блока спектральных значений, содержащего больше энергии, чем другой блок спектральных значений.

10. Устройство по любому из пп.1-4, в котором средство (16) для выполнения выполнено с возможностью выполнения вычисления автокорреляции и вычисления кодирования с линейным предсказанием (LPC) с использованием алгоритма Левинсона-Дарбина на блоке спектральных значений для предсказания по частоте для получения коэффициентов частной корреляции или коэффициентов отражения, а также эффективности предсказания, и фильтрации блока спектральных значений с коэффициентами частной корреляции для получения спектральных остаточных значений.

11. Способ обработки многоканального сигнала, в котором многоканальный сигнал представлен блоком спектральных значений каждого канала для, по меньшей мере, двух каналов, заключающийся в том, что

определяют (12) сходство между первым из этих двух каналов и вторым из этих двух каналов

путем вычисления первой эффективности предсказания из предсказания блока первого канала и второй эффективности предсказания из предсказания блока второго канала для получения (12с) сходства из первой эффективности предсказания и второй эффективности предсказания, или

путем вычисления первых коэффициентов отражения для первого фильтра предсказания для первого канала и вторых коэффициентов отражения для второго фильтра предсказания второго канала для получения сходства с использованием первых коэффициентов отражения и вторых коэффициентов отражения;

выполняют фильтрацию предсказания с общим фильтром предсказания для блока спектральных значений первого канала и блока спектральных значений второго канала, если сходство, которое определено на этапе (12) определения сходства, больше, чем пороговое сходство, или

выполняют фильтрацию предсказания с двумя разными фильтрами предсказания для блока спектральных значений первого канала и блока спектральных значений второго канала, если сходство, которое определено на этапе (12) определения сходства, является меньшим, чем пороговое сходство.

12. Машиночитаемый носитель, предназначенный для взаимодействия с программируемой компьютерной системой под действием считываемых управляющих сигналов в виде программных кодов, сохраненных на машиночитаемом носителе, для обработки многоканального сигнала способом по п.11.



 

Похожие патенты:

Изобретение относится к аудиокодерам, в частности к аудиокодерам, в которых осуществляется преобразование временного представления в спектральное представление. .

Изобретение относится к способу передачи аудиосигналов между передатчиком и, по меньшей мере, одним приемником методом приоритетной передачи пикселей. .

Изобретение относится к анализу качества звуковых сигналов и может быть использовано для оценки качества речи, передаваемой по каналам радиосвязи. .

Изобретение относится к способу и устройству в области высокочастотного восстановления, применяемого в системах кодирования аудиосигналов. .

Изобретение относится к распознаванию речи. .

Изобретение относится к машинной оценке качества передачи аудиосигналов. .

Изобретение относится к области радиотехники, в частности к кодированию информации для расширения формата кодируемых сигналов. .

Изобретение относится к кодированию и декодированию речи. .

Изобретение относится к речевым декодерам, применяемым в радиоприемниках систем радиосвязи с подвижными объектами. .

Изобретение относится к цифровой обработке речи. .

Изобретение относится к аудиокодированию и, в частности, к аудиокодированию, которое позволяет кодировать аудиосигналы с коротким временем задержки

Изобретение относится к кодеру и к кодированию сигнала, содержащего аудио- и/или видеоинформацию, в частности к оценке потребности в информационных блоках для кодирования этого сигнала

Изобретение относится к способу поддержки кодирования звукового сигнала, в котором по меньшей мере один отрезок звукового сигнала необходимо кодировать с помощью модели кодирования, позволяющей использовать различные длительности кадра кодирования, согласно которому предлагается определять на основе характеристик звукового сигнала по меньшей мере один параметр управления

Изобретение относится к вычислительной технике и может быть использовано в устройствах кодирования звука

Изобретение относится к многоканальным кодерам, например к многоканальным звуковым кодерам, использующим параметрическое описание пространственного звука

Изобретение относится к устройству кодирования, устройству декодирования, способу кодирования и способу декодирования

Изобретение относится к способам кодирования данных, например к способу кодирования аудиоданных и/или видеоданных, используя переменные углы поворота для компонентов данных

Изобретение относится к обработке стереосигнала, полученного от кодировщика

Изобретение относится к области цифровой обработки речевых данных и может быть использовано в различных приложениях, например в IР-телефонии
Наверх