Прямая компенсация наложения спектров во временной области с применением в области взвешенного или исходного сигнала

Авторы патента:


Прямая компенсация наложения спектров во временной области с применением в области взвешенного или исходного сигнала
Прямая компенсация наложения спектров во временной области с применением в области взвешенного или исходного сигнала
Прямая компенсация наложения спектров во временной области с применением в области взвешенного или исходного сигнала
Прямая компенсация наложения спектров во временной области с применением в области взвешенного или исходного сигнала
Прямая компенсация наложения спектров во временной области с применением в области взвешенного или исходного сигнала
Прямая компенсация наложения спектров во временной области с применением в области взвешенного или исходного сигнала
Прямая компенсация наложения спектров во временной области с применением в области взвешенного или исходного сигнала
Прямая компенсация наложения спектров во временной области с применением в области взвешенного или исходного сигнала
Прямая компенсация наложения спектров во временной области с применением в области взвешенного или исходного сигнала
Прямая компенсация наложения спектров во временной области с применением в области взвешенного или исходного сигнала
Прямая компенсация наложения спектров во временной области с применением в области взвешенного или исходного сигнала
Прямая компенсация наложения спектров во временной области с применением в области взвешенного или исходного сигнала
Прямая компенсация наложения спектров во временной области с применением в области взвешенного или исходного сигнала
Прямая компенсация наложения спектров во временной области с применением в области взвешенного или исходного сигнала
Прямая компенсация наложения спектров во временной области с применением в области взвешенного или исходного сигнала
Прямая компенсация наложения спектров во временной области с применением в области взвешенного или исходного сигнала
Прямая компенсация наложения спектров во временной области с применением в области взвешенного или исходного сигнала

 


Владельцы патента RU 2557455:

ВОЙСЭЙДЖ КОРПОРЕЙШН (CA)

Изобретение относится к способам и устройствам для прямой компенсации наложения спектров во временной области в кодированном сигнале, передаваемом с кодера на декодер. Технический результат заключается в обеспечении компенсации эффектов наложения спектров в точке переключения между режимами кодирования. Технический результат достигается за счет того, что информация, относящаяся к коррекции наложения спектров во временной области в кодированном сигнале, вычисляется в кодере и добавляется в битовый поток, отправляемый с кодера на декодер. Декодер принимает битовый поток и компенсирует наложение спектров во временной области в кодированном сигнале в ответ на информацию, содержащуюся в битовом потоке. Информация может представлять собой разность между кадром звукового сигнала, подлежащего кодированию в первом режиме кодирования, и декодированным сигналом из кадра, включающим в себя эффекты наложения спектров во временной области. 4 н. и 30 з.п. ф-лы, 17 ил.

 

ОБЛАСТЬ ТЕХНИКИ

Настоящее изобретение относится к области кодирования и декодирования звуковых сигналов. В частности, настоящее изобретение относится к устройству и способу компенсации наложения спектров во временной области с использованием передачи дополнительной информации.

УРОВЕНЬ ТЕХНИКИ

В уровне техники при кодировании звука используется частотно-временное разложение для представления сигнала в виде его значимой части для сокращения количества данных. В частности, в кодерах звуковых сигналов используются преобразования для выполнения отображения выборок во временной области в коэффициенты в частотной области. Дискретные временные преобразования, используемые для такого отображения времени в частоту, обычно основываются на ядрах синусоидальных функций, таких как дискретное преобразование Фурье (DFT) и дискретное косинусное преобразование (DCT). Можно показать, что при таких преобразованиях достигается «уплотнение энергии» звуковых сигналов. Это означает, что в области преобразования (или частотной области) распределение энергии локализовано на менее значимых коэффициентах, чем в выборках во временной области. Выигрыш от кодирования может далее достигаться применением адаптивного распределения битов и подходящего квантования для коэффициентов в частотной области. В приемнике биты, представляющие квантованные и кодированные параметры (например, коэффициенты в частотной области), используются для восстановления квантованных коэффициентов в частотной области (или иных квантованных данных, таких как коэффициенты усиления), при этом обратное преобразование генерирует звуковой сигнал во временной области. Такие схемы кодирования обычно называют кодированием с преобразованием.

По определению кодирование с преобразованием работает по последовательным блокам выборок входного звукового сигнала. Поскольку квантование вносит некоторое искажение в каждый синтезированный блок звукового сигнала, использование неперекрывающихся блоков может вносить неоднородности на границах блока, что может ухудшать качество звукового сигнала. Поэтому при кодировании с преобразованием для того, чтобы избежать неоднородностей, кодированные блоки звукового сигнала перекрываются до применения дискретного преобразования и соответствующим образом оконно взвешиваются в перекрывающемся сегменте для обеспечения плавного перехода от одного декодированного блока к следующему. Использование «стандартного» преобразования, такого как DFT (либо его эквивалента - быстрого преобразования Фурье (FFT)) или DCT, и применение его к перекрывающимся блокам, к сожалению, приводит к так называемой «некритической выборке». Например, если взять типичное условие перекрытия 50%, кодирование блока из N последовательных выборок во временной области фактически требует выполнения преобразования по 2N последовательным выборкам - N выборкам от текущего блока и N выборкам от перекрывающейся части следующего блока. Поэтому для каждого блока из N выборок во временной области кодируются 2N коэффициентов в частотной области. Критическая выборка в частотной области подразумевает, что N входных выборок во временной области формируют только N коэффициентов в частотной области, подлежащих квантованию и кодированию.

Были разработаны специализированные преобразования для обеспечения возможности использования перекрывающихся окон и, тем не менее, поддержки критических выборок в области преобразования - чтобы 2N выборок во временной области на входе преобразования приводили к N коэффициентам в частотной области на выходе преобразования. Для достижения этого блок из 2N выборок во временной области сначала сокращается до блока из N выборок во временной области с помощью специальной временной инверсии и суммирования отдельных частей оконно взвешенного сигнала длиной 2N выборок. Такая специальная временная инверсия с суммированием вносит так называемое «наложение спектров во временной области», или TDA. При внесении такого наложения спектров в блок сигнала его нельзя удалить с использованием только этого блока. Это именно тот сигнал с наложением спектров во временной области, который является входным для преобразования размером N (а не 2N), формирующего N коэффициентов в частотной области преобразования. Для восстановления N выборок во временной области при обратном преобразовании фактически должны использоваться коэффициенты преобразования от двух последующих и перекрывающихся окон для компенсации TDA в ходе процесса, называемого компенсацией наложения спектров во временной области, или TDAC.

Примером такого преобразования с применением TDAC, которое широко применяется при звуковом кодировании, является модифицированное дискретное косинусное преобразование (или MDCT). Фактически MDCT реализует вышеупомянутое TDA без явного свертывания во временной области. Скорее, наложение спектров во временной области вносится при анализе как прямого, так и обратного MDCT (IMDCT) одного блока. Это возникает в результате математического построения MDCT и хорошо известно специалистам в данной области техники. Но известно также, что это наложение спектров во временной области может рассматриваться как эквивалентное сначала инвертированию частей выборок во временной области, а затем суммированию этих инвертированных частей с остальными частями сигнала (или вычитанию из них). Это известно как «свертывание».

Проблема возникает, когда кодер звуковых сигналов переключается между двумя моделями кодирования: одной с использованием TDAC и другой без использования. Предположим, например, что кодек переключается между моделью кодирования TDAC и моделью кодирования не-TDAC. Та сторона блока выборок, кодированного с использованием модели кодирования TDAC, которая является общей с блоком, кодированным без использования TDAC, содержит наложение спектров, которое нельзя компенсировать с использованием блока выборок, кодированного с использованием модели кодирования не-TDAC.

Первое решение состоит в исключении выборок, содержащих наложение спектров, которое не может быть скомпенсировано.

Такое решение приводит к неэффективному использованию полосы пропускания, поскольку блок выборок, для которого TDA не может быть компенсировано, кодируется дважды: один раз кодеком на основе TDAC и второй раз кодеком не на основе TDAC.

Второе решение состоит в использовании специально разрабатываемых окон, которые не вносят TDA, по меньшей мере, в одной части окна, когда применяется процесс временной инверсии и суммирования. Фиг. 1 представляет собой схему примера окна, вносящего TDA со своей левой стороны, но не вносящего TDA со своей правой стороны. В частности, на фиг. 1 окно из 2N выборок 100 вносит TDA 110 со своей левой стороны. Окно 100 на фиг. 1 пригодно для переходов от кодека на основе TDAC к кодеку не на основе TDAC. Первая половина этого окна формируется таким образом, что она вносит TDA 110, которое может быть скомпенсировано, если в предыдущем окне также используется TDA без перекрытия. Однако с правой стороны окна на фиг. 1 имеется выборка с нулевым значением 120 после точки свертывания в положении 3N/2. Поэтому эта часть окна 100 не вносит никакого TDA, когда процесс временной инверсии и суммирования (или свертывания) выполняется вокруг точки свертывания в положении 3N/2.

Кроме того, левая сторона окна 100 содержит плоскую область 130, которой предшествует клиновидная область 140. Назначение клиновидной области 140 состоит в обеспечении хорошего спектрального разрешения при вычислении преобразования и в сглаживании перехода во время операций перекрытия и суммирования между смежными блоками. Увеличение длительности плоской области 130 окна сокращает полосу частот информации и уменьшает спектральную эффективность окна, поскольку часть окна отправляется без какой-либо информации.

В многорежимном Аудиокодеке унифицированного речевого и аудиокодека (USAC) Группы экспертов по движущимся изображениям (MPEG) используются несколько специальных окон, таких как окно, описанное на фиг. 1, для управления различными переходами от кадров с использованием прямоугольных неперекрывающихся окон к кадрам с использованием непрямоугольных перекрывающихся окон. Такие специальные окна были разработаны для достижения различных компромиссов между спектральным разрешением, сокращением издержек данных и плавностью перехода между указанными различными типами кадров.

СУЩНОСТЬ ИЗОБРЕТЕНИЯ

Следовательно, существует потребность в методе компенсации наложения спектров для обеспечения переключения между режимами кодирования, причем данный метод компенсирует эффекты наложения спектров в точке переключения между указанными режимами.

В связи с этим в соответствии с настоящим изобретением предлагается способ прямой компенсации наложения спектров во временной области в кодированном сигнале, принимаемом в битовом потоке в декодере. Данный способ содержит прием в битовом потоке в декодере от кодера дополнительной информации, относящейся к коррекции наложения спектров во временной области в кодируемом сигнале. В декодере наложение спектров во временной области компенсируется в кодированном сигнале в ответ на дополнительную информацию.

В соответствии с настоящим изобретением предлагается также способ прямой компенсации наложения спектров во временной области в кодированном сигнале для передачи от кодера к декодеру. Данный способ содержит вычисление в кодере дополнительной информации, относящейся к коррекции наложения спектров во временной области в кодированном сигнале. Дополнительная информация, относящаяся к коррекции наложения спектров во временной области в кодированном сигнале, отправляется в битовом потоке от кодера к декодеру.

В соответствии с настоящим изобретениемпредлагается также устройство для прямой компенсации наложения спектров во временной области в кодированном сигнале, принимаемом в битовом потоке. Устройство содержит приемник для приема в битовом потоке от кодера дополнительной информации, относящейся к коррекции наложения спектров во временной области в кодированном сигнале. Устройство также содержит компенсатор наложения спектров во временной области в кодированном сигнале в ответ на дополнительную информацию.

Кроме того, настоящее изобретение относится к устройству для прямой компенсации наложения спектров во временной области в кодированном сигнале для передачи в декодер. Устройство содержит вычислитель дополнительной информации, относящейся к коррекции наложения спектров во временной области в кодированном сигнале. Устройство также содержит передатчик для отправки в битовом потоке на декодер дополнительной информации, относящейся к коррекции наложения спектров во временной области в кодированном сигнале.

Вышеупомянутые и другие признаки станут очевидны при прочтении нижеследующего неограничительного описания иллюстративных вариантов осуществления изобретения, приведенных лишь в качестве примера со ссылками на прилагаемые чертежи.

КРАТКОЕ ОПИСАНИЕ ЧЕРТЕЖЕЙ

Варианты осуществления данного изобретения описываются лишь в качестве примера со ссылкой на прилагаемые чертежи, на которых:

Фиг. 1 представляет собой схему примера окна, вносящего TDA со своей левой стороны, но не вносящего TDA со своей правой стороны;

фиг. 2 представляет собой схему примера перехода от блока с использованием неперекрывающегося прямоугольного окна к блоку с использованием перекрывающегося окна;

фиг. 3 представляет собой схему, на которой показаны свертывание и TDA применительно к схеме, показанной на фиг. 2;

фиг. 4 представляет собой схему, на которой показана прямая коррекция наложения спектров применительно к схеме, показанной на фиг. 2;

фиг. 5 представляет собой схему, на которой показана несвернутая прямая коррекция компенсации наложения спектров (FAC) (слева) и свернутая коррекция FAC (справа);

фиг. 6 представляет собой иллюстрацию первого применения способа коррекции FAC с использованием MDCT;

фиг. 7 представляет собой схему коррекции FAC с использованием информации из режима ACELP;

фиг. 8 представляет собой схему коррекции FAC, применяемой при переходе от блока с использованием перекрывающегося окна к блоку с использованием неперекрывающегося прямоугольного окна;

фиг. 9 представляет собой схему несвернутой коррекции FAC (слева) и свернутой коррекции FAC (справа);

фиг. 10 представляет собой иллюстрацию второго применения способа коррекции FAC с использованием MDCT;

фиг. 11 представляет собой блок-схему квантования FAC, включающего в себя коррекцию ошибок ТСХ;

фиг. 12 представляет собой схему различных случаев использования коррекции FAC в многорежимной системе кодирования;

фиг. 13 представляет собой схему другого случая использования коррекции FAC в многорежимной системе кодирования;

фиг. 14 представляет собой схему первого случая использования коррекции FAC при переключении между короткими кадрами с преобразованием и кадрами ACELP;

фиг. 15 представляет собой схему второго случая использования коррекции FAC при переключении между короткими кадрами с преобразованием и кадрами ACELP;

фиг. 16 представляет собой блок-схему примера устройства для прямой компенсации наложения спектров во временной области в кодированном сигнале, принимаемом в битовом потоке; и

фиг. 17 представляет собой блок-схему примера устройства для прямой компенсации наложения спектров во временной области в кодированном сигнале для передачи на декодер.

ПОДРОБНОЕ ОПИСАНИЕ

В нижеследующем описании рассматривается проблема компенсации эффектов наложения спектров во временной области и взвешивания с помощью непрямоугольного окна при кодировании звукового сигнала с использованием как перекрывающихся, так и неперекрывающихся окон в смежных кадрах. При использовании описанной здесь технологии можно избежать использования специальных неоптимальных окон, в то же время обеспечивая надлежащее управление переходами кадров в модели с использованием как прямоугольных неперекрывающихся окон, так и непрямоугольных перекрывающихся окон.

Примером кадра с использованием взвешивания с помощью прямоугольного неперекрывающегося окна является кодирование с линейным предсказанием (LP) и, в частности, линейное предсказание с алгебраическим кодовым возбуждением (ACELP). В альтернативном примере осуществления примером взвешивания с помощью непрямоугольного перекрывающегося окна является кодирование с преобразованием кодированного возбуждения (ТСХ), применяемое в Унифицированном речевом кодеке и аудиокодеке (USAC), в котором в кадрах ТСХ используются как перекрывающиеся кадры, так и модифицированное дискретное косинусное преобразование (MDCT), которое вносит наложение спектров во временной области (TDA). USAC также является типичным примером, в котором смежные кадры могут кодироваться с использованием либо прямоугольных неперекрывающихся окон, как, например, в кадрах ACELP, либо непрямоугольных перекрывающихся окон, как, например, в кадрах ТСХ и в кадрах улучшенного звукового кодирования (ААС). Без ущерба для общности в настоящем описании при этом рассматривается конкретный пример USAC для иллюстрации преимуществ предлагаемых системы и способа.

Рассматриваются два отдельных случая. Первый случай имеет место, когда переход осуществляется от кадра с использованием прямоугольного неперекрывающегося окна к кадру с использованием непрямоугольного перекрывающегося окна. Второй случай имеет место, когда переход осуществляется от кадра с использованием непрямоугольного перекрывающегося окна к кадру с использованием прямоугольного неперекрывающегося окна. В целях иллюстрации и без предположения ограничения кадры с использованием прямоугольного неперекрывающегося окна могут кодироваться с использованием модели ACELP, а кадры с использованием непрямоугольного перекрывающегося окна могут кодироваться с использованием модели ТСХ. Кроме того, для некоторых кадров используются конкретные величины длительности, например, 20 миллисекунд для кадра ТСХ, обозначаемые ТСХ20. Однако следует помнить, что эти конкретные примеры используются только в целях иллюстрации, но что могут предполагаться и другие значения длительности и типы кодирования, отличные от ACELP и ТСХ.

Ниже рассматривается случай перехода от кадра с использованием прямоугольного неперекрывающегося окна к кадру с использованием непрямоугольного перекрывающегося окна в отношении нижеследующего описания, приведенного применительно к фиг. 2, которая представляет собой схему примера перехода от блока с использованием неперекрывающегося прямоугольного окна к блоку с использованием перекрывающегося окна.

В соответствии с фиг. 2, типичное прямоугольное неперекрывающееся окно содержит кадр 202 ACELP, а типичное непрямоугольное перекрывающееся окно содержит кадр 206 ТСХ20. ТСХ20 относится к коротким кадрам ТСХ в USAC, которые номинально имеют длительность 20 мс, равно как и кадры ACELP во многих областях применения. На фиг. 2 показано, какие выборки используются в каждом кадре и как они оконно взвешиваются в кодере. То же окно 204 применяется в декодере, так что суммарный эффект, наблюдаемый в декодере, представляет собой квадрат формы окна, показанного на фиг. 2. Разумеется, такое двойное оконное взвешивание - один раз в кодере и второй раз в декодере - является типичным при кодировании с преобразованием. В тех случаях, когда окно не изображено, как в кадре 202 ACELP, это фактически означает, что для данного кадра используется прямоугольное окно. Непрямоугольное окно 204 для кадра 206 ТСХ20, показанное на фиг. 2, выбирается таким образом, что если в предыдущих и последующих кадрах также используются перекрывающиеся и неперекрывающиеся окна, то перекрывающиеся участки 204а и 204b окон после второго оконного взвешивания в декодере являются дополняющими и позволяют восстанавливать «невзвешенный с помощью окна» сигнал в перекрывающейся области окон.

Для эффективного кодирования кадра 206 ТСХ20, показанного на фиг. 2, наложение спектров во временной области (TDA) обычно применяется к оконно взвешенным выборкам для данного кадра 206 ТСХ20. В частности, левый 204а и правый 204b участки свертываются и объединяются. Фиг. 3 представляет собой схему, на которой показаны свертывание и TDA применительно к схеме, показанной на фиг. 2. Непрямоугольное окно 204, введенное в описание фиг. 2, показано в виде четырех четвертей. 1-я и 4-я четверти - 204а и 204d окна 204 - показаны пунктирной линией, поскольку они объединяются со 2-й и 3-й четвертями 204b, 204c, показанными сплошной линией. Объединение 1-й и 4-й четвертей 204а, 204d со 2-й и 3-й четвертями 204b, 204c осуществляется в ходе процесса, аналогичного процессу, используемому при кодировании MDCT, следующим образом. 1-я четверть 204а реверсируется во времени, затем она последовательно повыборочно выравнивается со 2-й четвертью 204b окна и, наконец, реверсированная во времени и сдвинутая 1-я четверть 204е вычитается из 2-й четверти 204b окна. Аналогичным образом 4-я четверть 204d окна реверсируется во времени и сдвигается (204f) для выравнивания с 3-й четвертью 204с окна и, наконец, она суммируется с 3-й четвертью 204с окна. Если в окне 204 ТСХ20, показанном на фиг. 2, имеется 2N выборок, то в конце этого процесса мы получаем N выборок, проходящих в точности от начала до конца изображенного на фиг. 3 кадра 206 ТСХ20. Затем указанные N выборок образуют входные данные соответствующего преобразования для эффективного кодирования в области преобразования. При использовании специального наложения спектров во временной области, описанного на фиг. 3, MDCT может являться преобразованием, используемым для этой цели.

После объединения реверсированных во времени и сдвинутых участков окна, описанного на фиг. 3, уже невозможно восстановить исходные выборки во временной области в кадре ТСХ20, поскольку они смешиваются с реверсированными во времени версиями выборок за пределами кадра ТСХ20. В кодере звуковых сигналов на основе MDCT, таком как MPEG AAC, в котором все кадры кодируются с использованием одного и того же преобразования и перекрывающихся окон, такое наложение спектров во временной области может быть скомпенсировано, при этом выборки звуковых сигналов могут быть восстановлены путем использования двух последовательных перекрывающихся кадров. Однако когда в смежных кадрах не используется один и тот же процесс оконного взвешивания и перекрытия, как на фиг. 2, на которой кадру ТСХ20 предшествует кадр ACELP, эффект непрямоугольного окна и наложения спектров во временной области не может быть исключен с использованием только информации из предыдущего кадра ACELP и последующего кадра ТСХ20.

Выше были представлены методы управления переходом такого типа. В настоящем описании предлагается альтернативный подход к управлению такими переходами. В данном подходе не используются неоптимальные и асимметричные окна в кадре, в котором используется кодирование в области преобразований на основе MDCT. Вместо этого введенные здесь способы и устройства позволяют использовать симметричные окна с центром в середине кодированного кадра, такого как, например, изображенный на фиг. 3 кадр ТСХ20, и с 50%-ным перекрытием с кадрами, кодированными с использованием MDCT, в которых также используются непрямоугольные окна. Таким образом, в введенных здесь способах и устройствах предлагается отправлять от кодера к декодеру в качестве дополнительной информации в битовом потоке коррекцию для компенсации эффекта оконного взвешивания и наложения спектров во временной области при переключении от кадров, кодированных с прямоугольным неперекрывающимся окном, к кадрам, кодированным с непрямоугольным перекрывающимся окном, и наоборот. При таких переходах возможны несколько случаев.

На фиг. 2 взвешивание с помощью прямоугольного неперекрывающегося окна показано для кадра ACELP, а взвешивание с помощью непрямоугольного перекрывающегося окна показано для кадра ТСХ20. При использовании TDA, введенного на фиг. 3, декодер, принимающий сначала биты от кадра ACELP, имеет достаточно информации для полного декодирования данного кадра ACELP вплоть до своей последней выборки. Но затем, после приема битов от кадра ТСХ20, надлежащее декодирование всех выборок в кадре ТСХ20 нарушается из-за эффекта наложения спектров, вызванного наличием предыдущего кадра ACELP. Если в следующем кадре также используется перекрывающееся окно, то взвешивание с помощью непрямоугольного окна и TDA, введенное в кодере, может компенсироваться во второй половине показанного кадра ТСХ20, и эти выборки могут быть надлежащим образом декодированы. Следовательно, в первой половине кадра ТСХ20, в котором реверсированная во времени и сдвинутая 1-я четверть 204е вычитается из 204b на фиг. 3, эффект непрямоугольного окна и TDA, введенное в кодере, не могут компенсироваться, поскольку в предыдущем кадре ACELP используется неперекрывающееся окно. Поэтому в введенных здесь способах и устройствах предлагается передавать информацию - Прямую компенсацию наложения спектров во временной области (FAC) - для компенсации указанных эффектов, и надлежащим образом восстанавливать первую половину кадра ТСХ20.

Фиг. 4 представляет собой схему, на которой показана прямая коррекция наложения спектров (FAC) применительно к схеме, показанной на фиг. 2. На фиг. 4 иллюстрируется ситуация в декодере, при которой взвешивание с помощью окна, например, косинусоидального окна, применяемого при MDCT, уже применялось во второй раз после обратного преобразования. Рассматривается только переход от ACELP к ТСХ20 независимо от кадра, следующего за кадром ТСХ20. Поэтому на фиг. 4 выборки, в которых применяется коррекция FAC, соответствуют первой половине кадра ТСХ20. Это то, что называется зоной 402 FAC. Имеются два эффекта, которые компенсируются с помощью FAC в данном примере. Первым эффектом является эффект оконного взвешивания, называемый x_w 404 на фиг. 4. Это соответствует умножению выборок в первой половине кадра 206 ТСХ20 на 2-ю четверть 204b непрямоугольного окна на фиг. 3. Поэтому первая часть коррекции FAC содержит прибавление дополнения этих оконно взвешенных выборок, что соответствует коррекции для сегмента x_w 406 на фиг. 4. Например, если данная входная выборка x[n] умножалась на оконную выборку w[n] в кодере, то дополнение этой оконно взвешенной выборки попросту равно величине (1-w[n]), умноженной на x[n]. Сумма x_w 404 и коррекция для x_w 406 равна 1 для всех выборок в данном сегменте. Вторая часть коррекции FAC соответствует компоненте наложения спектров во временной области, которая добавлялась в кодере в кадре ТСХ20. Для исключения этой компоненты наложения спектров, именуемой частью наложения спектров х_а 408 на фиг. 4, коррекция для х_а 406 на фиг. 4 инвертируется во времени, выравнивается с первой половиной кадра ТСХ20 и суммируется с указанной первой половиной сегмента, показанной как часть наложения спектров х_а 408. Она суммируется, а не вычитается потому, что на фиг. 3 левая часть свертывания, ведущая к наложению спектров во временной области, включала в себя вычитание данной компоненты, поэтому для исключения их она теперь вновь добавляется. Сумма указанных двух частей - компенсации окна x_w 404 и компенсации наложения спектров х_а 408 образует полную коррекцию FAC в зоне 402 FAC.

Существует несколько вариантов кодирования коррекции FAC. Фиг. 5 представляет собой схему, на которой показана несвернутая коррекция FAC (слева) и свернутая коррекция FAC (справа). Одним из вариантов может быть прямое кодирование оконно взвешенного FAC сигнала, как показано с левой стороны на фиг. 5. Данный сигнал, именуемый окном 502 FAC на фиг. 5, дважды перекрывает длину зоны FAC. В декодере декодированный оконно взвешенный FAC сигнал может далее быть свернут (инвертирование во времени левой половины и суммирование ее с правой половиной), а затем данный свернутый сигнал может быть добавлен в качестве коррекции 504 в зоне 402 FAC, как показано с правой стороны на фиг. 5. В данном подходе выборки во временной области кодируются дважды по сравнению с длиной коррекции.

Другой подход к кодированию сигнала коррекции FAC, показанного слева на фиг. 5, состоит в выполнении свертывания в кодере до кодирования сигнала. Это приводит к свернутому сигналу справа на фиг. 5, причем левая половина оконно взвешенного FAC сигнала реверсируется во времени и суммируется с правой половиной оконно взвешенного FAC сигнала. Затем к этому свернутому сигналу может быть применено кодирование с преобразованием с использованием, например, DCT. В декодере декодированный свернутый сигнал может быть попросту добавлен к зоне FAC, поскольку свертывание уже было применено в кодере. Такой подход позволяет выполнять кодирование того же числа выборок во временной области, что и длина зоны FAC, что приводит к кодированию с преобразованием с формированием критических выборок.

Еще один подход к кодированию сигнала коррекции FAC, показанного слева на фиг. 5, состоит в использовании неявного свертывания MDCT. Фиг. 6 представляет собой иллюстрацию первого применения способа коррекции FAC с использованием MDCT. В верхнем левом квадранте показано содержимое окна 502 FAC с незначительным изменением. В частности, последняя четверть окна 502а FAC сдвинута влево от окна 502 FAC и инвертирована по знаку (502b). Иными словами, окно FAC на фиг. 5 циклически поворачивается вправо на ¼ от его полной длины, а затем знак первой ¼ выборок инвертируется. Затем к оконно взвешенному сигналу применяется MDCT. MDCT по своей математической конструкции неявно применяет операцию свертывания, что приводит к свернутому сигналу 602, показанному в верхнем правом квадранте фиг. 6. Такое свертывание в MDCT применяет инверсию знака в левой части 502b, но не в правой части 502с, в которой добавляется свернутый сегмент. Сравнивая результирующий свернутый сигнал 602 с полной коррекцией 504 FAC на фиг. 5, можно увидеть, что он эквивалентен коррекции 504 FAC, за исключением инверсии во времени. Таким образом, в декодере после обратного MDCT (IMDCT) этот сигнал 602, который является инвертированным сигналом коррекции FAC, инвертируется во времени (или зеркально отражается) и становится сигналом 604 коррекции FAC, как показано в нижнем правом квадранте фиг. 6. Как указано выше, эта коррекция 604 FAC может добавляться к сигналу в зоне FAC фиг. 4.

В конкретном случае перехода от кадра ACELP к кадру ТСХ дополнительная эффективность может быть достигнута за счет использования информации, уже имеющейся в декодере. Фиг. 7 представляет собой схему коррекции FAC с использованием информации режима ACELP. Синтезированный сигнал 702 ACELP вплоть до конца кадра 202 ACELP известен в декодере. Кроме того, отклик при отсутствии входного сигнала (ZIR) 704 синтезирующего фильтра имеет хорошую корреляцию с сигналом в начале кадра 206 ТСХ20. Эта особенность уже использовалась в стандарте 3GPP AMR-WB+ для управления переходами от кадров ACELP к кадрам ТСХ. Здесь эта информация используется в двух целях: 1) для снижения амплитуды сигнала, подлежащего кодированию в качестве коррекции FAC, и 2) для обеспечения непрерывности сигнала ошибки с целью повышения эффективности кодирования MDCT этого сигнала ошибки. В соответствии с фиг. 7, сигнал 706 коррекции, подлежащий кодированию для передачи коррекции FAC, вычисляется следующим образом. Первая половина этого сигнала 706 коррекции, которая проходит до конца кадра 202 ACELP, берется как разность 708 между взвешенным сигналом 710 в исходной некодированной области и взвешенным синтезированным сигналом 702 в кадре 202 ACELP. Принимая во внимание, что модуль кодирования ACELP имеет достаточные характеристики, эта первая половина сигнала 706 коррекции имеет уменьшенную энергию и амплитуду по сравнению с исходным сигналом. Далее, что касается второй половины упомянутого сигнала 706 коррекции, берется разность 708 между взвешенным сигналом 712 в исходной некодированной области в начале кадра 206 ТСХ20 и откликом при отсутствии входного сигнала 704 взвешивающего синтезирующего фильтра ACELP. Поскольку отклик при отсутствии входного сигнала 704 коррелирован с взвешенным сигналом 712, по меньшей мере, в некоторой степени, особенно в начале кадра ТСХ20, указанная разность имеет меньшую амплитуду и энергию по сравнению с взвешенным сигналом 712 в начале кадра ТСХ20. Такая эффективность отклика при отсутствии входного сигнала 704 при моделировании исходного сигнала обычно выше в начале кадра. При добавлении эффекта окна 502 FAC, которое имеет уменьшающуюся амплитуду для данной второй половины окна FAC, форма второй половины сигнала 706 коррекции на фиг. 7 должна стремиться к нулю в начале и в конце, при этом, возможно, больше энергии концентрируется в середине второй половины окна 502 FAC в зависимости от точности соответствия ZIR взвешенному сигналу. После выполнения этих операций оконного взвешивания и различения, как описано применительно к фиг. 7, результирующий сигнал 706 коррекции может кодироваться, как описано на фиг. 5 или 6, либо любым заданным способом кодирования FAC-сигнала. В декодере фактический сигнал коррекции FAC вновь вычисляется сначала декодированием передаваемого сигнала 706 коррекции, описанного выше, а затем вновь суммированием синтезированного сигнала 702 ACELP с сигналом 706 в первой половине окна 502 FAC и суммированием ZIR 704 с тем же сигналом 706 во второй половине окна 502 FAC.

До сих пор в настоящем изобретении описывались переходы от кадра с использованием прямоугольного неперекрывающегося окна к кадру с использованием непрямоугольного перекрывающегося окна на примере случая перехода от кадра ACELP к кадру ТСХ. Следует понимать, что может возникнуть противоположная ситуация, а именно переход от кадра ТСХ к кадру ACELP. Фиг. 8 представляет собой схему коррекции FAC, применяемой при переходе от кадра с использованием перекрывающегося непрямоугольного окна к кадру с использованием неперекрывающегося прямоугольного окна. На фиг. 8 показан кадр 802 ТСХ20, за которым следует кадр 804 ACELP, со свернутым окном 806 ТСХ20, как видно в декодере, в кадре ТСХ. На фиг. 8 также показана зона 810 FAC, в которой коррекция FAC применяется для компенсации эффекта оконного взвешивания и наложения спектров во временной области в конце кадра 802 ТСХ20. Следует отметить, что кадр 804 ACELP не несет информации для компенсации указанных эффектов. Окно 812 FAC является симметричным относительно окна 502 FAC на фиг. 5.

Свертывание двух частей - 812-й левой и 812-й правой - окна 812 FAC при этом показано в случае перехода от кадра ТСХ к кадру ACELP. По сравнению с фиг. 5 имеются следующие различия: окно 812 FAC в данном случае реверсировано во времени, а свертывание части наложения спектров применяется к операции вычитания вместо суммирования, как проиллюстрировано на фиг. 5, чтобы согласовываться со знаком свертывания MDCT в этой части окна.

Фиг. 9 представляет собой схему несвернутой коррекции FAC (слева) и свернутой коррекции FAC (справа). Окно 812 FAC воспроизведено на левой стороне фиг. 9. Сигнал 902 свернутой коррекции FAC может кодироваться с использованием DCT или какого-либо иного подходящего способа. Если исходить из окна Хеннинга в преобразовании, которое использовалось, например, в MDCT, уравнения 904 и 906 на фиг. 9 описывают окно 812 FAC в случае фиг. 9. Разумеется, при использовании окон другой формы другие уравнения используются для описания окна FAC. Кроме того, использование окна типа Хеннинга в MDCT означает, что перед MDCT в кодере используется косинусоидальное окно, а в декодере после IMDCT вновь используется косинусоидальное окно. Именно повыборочная комбинация этих двух косинусоидальных окон приводит к требуемой форме окна Хеннинга, которая имеет соответствующую дополняющую форму для перекрытия и суммирования в части окна с 50%-ным перекрытием.

И снова, подход с MDCT также может использоваться для кодирования окна FAC, как описывалось на фиг. 6. Фиг. 10 представляет собой иллюстрацию второго применения способа коррекции FAC с использованием MDCT. В верхнем левом квадранте на фиг. 10 показано окно 812 FAC, изображенное на фиг. 8. Первая четверть 812а окна 812 FAC сдвинута вправо от окна FAC и инвертирована по знаку (812b). Иными словами, окно 812 FAC циклически поворачивается влево на ¼ от его полной длины, а затем знак последней ¼ выборок инвертируется. Затем к этому оконно взвешенному сигналу в верхнем правом квадранте фиг. 10 применяется MDCT. MDCT применяет внутри операцию свертывания, что приводит к свернутому сигналу 1002, показанному в верхнем правом квадранте фиг. 10. Такое свертывание в MDCT применяет инверсию знака в левой части 812с, но не в правой части 812b, в которой добавляется свернутый сегмент. Сравнивая результирующий свернутый сигнал 1002 с сигналом 902 коррекции FAC с правой стороны на фиг. 9, можно увидеть, что он эквивалентен, за исключением инвертирования во времени (зеркального отражения) и инверсии знака. Таким образом, в декодере после IMDCT этот сигнал 1002, который является инвертированной коррекцией FAC, инвертируется во времени (или зеркально отражается), инвертируется по знаку и становится коррекцией 1004 FAC, как показано в нижнем правом квадранте фиг. 10. Как указано выше, эта коррекция 1004 FAC может добавляться к сигналу в зоне FAC фиг. 8.

Квантование сигнала, соответствующего коррекции FAC, предполагает надлежащее выполнение. Действительно, коррекция FAC является частью кодированного в области преобразований сигнала, включая, например, кадры ТСХ20, используемые в примерах на фиг. 2-10, поскольку она добавляется к кадру для компенсации эффектов оконного взвешивания и наложения спектров. Поскольку квантование такой коррекции FAC вносит искажение, данное искажение управляется таким образом, что оно надлежащим образом смешивается с кодированным в области преобразований сигналом или согласуется с его искажением и не вносит звуковые артефакты в данный переход, соответствующий зоне FAC. Если вызываемый квантованием уровень шума, а также форма шума квантования во временной и частотной областях сохраняются приблизительно такими же в сигнале коррекции FAC, как и в кодированном с преобразованием кадре, в котором применяется коррекция FAC, то коррекция FAC не вносит дополнительного искажения.

Имеются несколько подходов к квантованию сигнала коррекции FAC, включая в качестве неограничивающих примеров скалярное квантование, векторное квантование, стохастические кодовые книги, алгебраические кодовые книги и т.п. В каждом случае следует понимать, что имеется сильная корреляция в атрибутах коэффициентов коррекции FAC и коэффициентах соответствующего кодированного в области преобразований кадра, как в примере кадра ТСХ20. Действительно, выборки во временной области, используемые в зоне FAC, должны быть теми же, что и выборки во временной области в начале кодированного в области преобразований кадра. Таким образом, факторы масштабирования, используемые в устройстве квантования, применяемом к кодированному в области преобразований кадру, являются приблизительно такими же, что и факторы масштабирования, используемые в устройстве квантования, применяемом к коррекции FAC. Разумеется, число выборок, или коэффициентов в частотной области, в коррекции FAC является не совсем таким, как в кодированном в области преобразований кадре: кодированный в области преобразований кадр имеет больше выборок, чем коррекция FAC, которая охватывает лишь часть кодированного в области преобразований кадра. Важно поддерживать тот же уровень шума квантования на коэффициент в частотной области в сигнале коррекции FAC, как и в соответствующем кодированном в области преобразований кадре (например, кадре ТСХ20).

Рассматривая конкретный пример метода Алгебраического векторного квантования (AVQ), используемого в стандарте кодирования звуковых сигналов 3GPP AMR-WB+ для квантования спектральных коэффициентов, и применяя его к квантованию коррекции FAC, можно получить следующий результат. Общий коэффициент усиления при AVQ, рассчитанный при квантовании кодированного в области преобразований кадра, например, кадра ТСХ20, причем данный общий коэффициент усиления используется для масштабирования амплитуд коэффициентов в частотной области с целью поддержания расхода бит ниже заданного битового бюджета, может являться эталонным коэффициентом усиления для использования при квантовании кадра FAC. Это относится также к любым другим факторам масштабирования, например, к факторам масштабирования, используемым в Адаптивном усилителе низких частот (ALFE), таким как используемые в стандарте AMR-WB+. Другие примеры включают в себя факторы масштабирования при кодировании ААС. В данной категории также могут рассматриваться любые иные факторы масштабирования, которые управляют уровнем шума и формой спектра.

В зависимости от длины кодированного в области преобразований кадра между кодированным в области преобразований кадром и коррекцией FAC применяется отображение указанных параметров факторов масштабирования m в 1. Например, в случае, в котором используются три длины кадра ТСХ - 20 мс, 40 мс или 80 мс, как в аудиокодеке MPEG USAC, факторы масштабирования, такие как, например, факторы масштабирования, используемые в ALFE, используемые для m последовательных спектральных коэффициентов в кодированном в области преобразований кадре, могут использоваться для 1 спектрального коэффициента в коррекции FAC.

Для согласования уровня ошибок квантования коррекции FAC с уровнем ошибок квантования кодированного с преобразованием кадра целесообразно учитывать в кодере ошибку кодирования оконно взвешенного кодированного с преобразованием кадра. Фиг. 11 представляет собой блок-схему квантования FAC, включающего в себя коррекцию ошибок ТСХ. Сначала вычисляется разность 1102 между оконно взвешенным и свернутым сигналом в кадре 1104 ТСХ и оконно взвешенным и свернутым ТСХ синтезом этого кадра 1106. ТСХ синтез 1106 в данном контексте - это попросту обратное преобразование - включая оконное взвешивание, применяемое в декодере - квантованных коэффициентов в области преобразования данного кадра ТСХ. Затем разностный сигнал 1108, или ошибка кодирования ТСХ, добавляется в 1110 к сигналу 1112 коррекции FAC, синхронизованному с зоной FAC. Затем этот составной сигнал 1114, содержащий сигнал 1112 коррекции FAC плюс ошибку 1108 кодирования кадра ТСХ, квантуется квантователем 1116 для передачи в декодер. В связи с этим, такой квантованный сигнал 1118 коррекции FAC, в соответствии с фиг. 11, корректирует в декодере эффект оконного взвешивания и эффект наложения спектров, а также ошибку кодирования ТСХ в зоне FAC. Использование факторов 1120 масштабирования, как показано на фиг. 11, позволяет согласовывать искажение коррекции FAC с искажением в кадре ТСХ.

Фиг. 12 представляет собой схему случая использования коррекции FAC в многорежимной системе кодирования. Представлены примеры, на которых показано переключение между окнами обычной формы с перекрытием 50% или более и окнами переменной формы, включая окна FAC. На фиг. 12 нижнюю часть можно рассматривать как продолжение верхней части по оси времени. На фиг. 12 предполагается, что все кадры кодируются после предварительной обработки входного звукового сигнала с помощью варьирующегося во времени процесса фильтрации, которым может быть, например, взвешивающий фильтр, получаемый в результате LPC-анализа входного сигнала или какая-либо иная обработка с помощью взвешивания входного сигнала. В данном примере входной сигнал кодируется вплоть до «Точки А переключения» с использованием такого подхода из семейства современных методов кодирования звуковых сигналов, как ААС, при котором окна анализа оптимизируются для кодирования в частотной области. Как правило, это означает использование окон с перекрытием 50% и обычной формы, как в косинусоидальном окне, используемом при кодировании с MDCT, хотя для этой цели могут использоваться и окна другой формы. Далее, между «Точкой А переключения» и «Точкой В переключения» входной сигнал кодируется с использованием окна переменной длины и формы, не обязательно оптимизированного для кодирования в области преобразований, а скорее предназначенного для достижения некоторого компромисса между временным и частотным разрешением для режимов кодирования, используемых в данном сегменте. Фиг. 12 показывает конкретный пример режимов кодирования ACELP и ТСХ, используемых в данном сегменте. Видно, что формы окон для данных режимов кодирования являются в значительной степени разнородными и варьируются по форме и длине. Окно ACELP является прямоугольным и неперекрывающимся, в то время как окно для ТСХ является непрямоугольным и перекрывающимся. Именно в данном случае окно FAC используется для компенсации наложения спектров во временной области, как описывалось выше. Само окно FAC, показанное жирным на фиг. 12, при его особой форме и длине, является одним из окон переменной формы, заключенным в сегменте между «Точкой А переключения» и «Точкой В переключения».

Фиг. 13 представляет собой схему другого случая использования коррекции FAC в многорежимной системе кодирования. На фиг. 13 показано, как окно FAC может использоваться в контексте, в котором кодер локально переключается с окон обычной формы на окна переменной формы для кодирования кратковременного сигнала. Это аналогично контексту кодирования ААС, при котором окно запуска и остановки применяется для локального использования окон с обеспечением меньшего времени на кодирование кратковременного сигнала. В данном случае вместо этого, в соответствии с фиг. 13, сигнал между «Точкой А переключения» и «точкой В переключения», который предполагается кратковременным, кодируется с использованием многорежимного кодирования, включающего в себя ACELP и ТСХ в представленном примере, что требует использования окна FAC для надлежащего управления переходом при использовании способа кодирования ACELP.

Фиг. 14 и 15 представляют собой схемы первого и второго случаев использования коррекции FAC при переключении между короткими кадрами с преобразованием и кадрами ACELP. Это случаи, в которых выполняется переключение между короткими кадрами с преобразованием в области LPC, например, короткими кадрами ТСХ, и кадрами ACELP. Представленный на фиг. 14 и 15 пример можно рассматривать как локальную ситуацию в более продолжительном сигнале, в которой также могут использоваться иные режимы кодирования в других кадрах (не показаны). Следует отметить, что окно для коротких кадров ТСХ на фиг. 14 и 15 может иметь перекрытие более 50%. Например, это может иметь место в кодеке ААС с малой задержкой, в котором используется длинное асимметричное окно. В этом случае некоторые специальные окна запуска и остановки предназначены для обеспечения надлежащего переключения между этими длинными асимметричными окнами и короткими окнами ТСХ, показанными на фиг. 14 и 15.

Фиг. 16 представляет собой блок-схему неограничительного примера устройства 1600 для прямой компенсации наложения спектров во временной области в кодированном сигнале, принимаемом в битовом потоке 1601. С целью иллюстрации устройство 1600 представлено со ссылкой на коррекцию FAC на фиг. 7 с использованием информации из режима ACELP. Специалистам в данной области техники должно быть понятно, что соответствующее устройство 1600 может быть реализовано применительно ко всем остальным примерам коррекции FAC, представленным в настоящем описании.

Устройство 1600 содержит приемник 1610 для приема битового потока 1601, представляющего собой кодированный звуковой сигнал, включающий в себя коррекцию FAC.

Кадры ACELP из битового потока 1601 подаются в декодер 1611 ACELP, включающий в себя синтезирующий фильтр ACELP. Декодер 1611 ACELP формирует отклик при отсутствии входного сигнала (ZIR) 704 синтезирующего фильтра ACELP. Кроме того, синтезирующий декодер 1611 ACELP формирует синтезированный сигнал 702 ACELP. Синтезированный сигнал 702 ACELP и ZIR 704 объединяются так, чтобы образовать синтезированный сигнал ACELP, за которым следует ZIR. Несвернутое окно 502 FAC при этом применяется к объединенным сигналам 702 и 704, затем свертывается и суммируется в процессоре 1605, а затем применяется к положительному входу сумматора 1620 для получения первой (необязательной) части звукового сигнала в кадрах ТСХ.

Параметры (prm) для кадров ТСХ 20 из битового потока 1601 подаются на декодер 1606 ТСХ, после чего следует IMDCT-преобразование и окно 1613 для IMDCT для формирования синтезированного сигнала 1602 ТСХ 20, подаваемого к положительному входу сумматора 1616 для получения второй части звукового сигнала в кадрах ТСХ 20.

Однако при переходе между режимами кодирования (например, от кадра ACELP к кадру ТСХ 20) часть звукового сигнала не декодируется надлежащим образом без использования компенсатора 1615 FAC. В приведенном на фиг. 16 примере компенсатор 1615 FAC содержит декодер 1617 FAC для декодирования из принимаемого битового потока 1601 сигнала 504 коррекции (фиг. 5), который соответствует сигналу 706 коррекции (фиг. 7) после свертывания, как на фиг. 5, и обратного DCT (IDCT). Выходной сигнал 1618 IDCT подается на положительный вход сумматора 1620. Выходной сигнал сумматора 1620 подается на положительный вход сумматора 1616.

Общий выходной сигнал сумматора 1616 представляет собой скомпенсированный с помощью FAC синтезированный сигнал для кадра ТСХ, следующего после кадра ACELP.

Фиг. 17 представляет собой блок-схему неограничительного примера устройства 1700 для прямой компенсации наложения спектров во временной области в кодированном сигнале для передачи на декодер. С целью иллюстрации устройство 1700 представлено со ссылкой на коррекцию FAC на фиг. 7 с использованием информации из способа ACELP. Специалистам в данной области техники должно быть понятно, что соответствующее устройство 1700 может быть реализовано применительно ко всем остальным примерам коррекции FAC, представленным в настоящем описании.

На устройство 1700 подается подлежащий кодированию звуковой сигнал 1701. Логика (не показана) подает ACELP-кадры звукового сигнала 1701 на ACELP-кодер 1710. Выходной сигнал ACELP-кодера 1710 - кодированные с помощью ACELP параметры 1702 - подается на первый вход мультиплексора (MUX) 1711. Другой выходной сигнал ACELP-кодера представляет собой синтезированный сигнал 1760, сопровождаемый откликом при отсутствии входного сигнала (ZIR) 1761 синтезирующего фильтра ACELP кодера 1710. Окно 502 FAC применяется к объединению сигналов 1760 и 1761. Выходной сигнал процессора окна 502 FAC подается на отрицательный вход сумматора 1751.

Логика (не показана) также подает кадры ТСХ 20 звукового сигнала 1701 на модуль 1712 кодирования MDCT для формирования кодированных с ТСХ 20 параметров 1703, подаваемых на второй вход мультиплексора 1711. Модуль 1712 кодирования MDCT содержит окно 1731 MDCT, преобразование 1732 MDCT и квантователь 1733. Оконно взвешенный входной сигнал MDCT-модуля 1732 подается на положительный вход сумматора 1750. Квантованные MDCT-коэффициенты 1704 применяются к обратному MDCT (IMDCT) 1733, а выходной сигнал IMDCT 1733 подается на отрицательный вход сумматора 1750. Выходной сигнал сумматора 1750 образует ошибку квантования ТСХ, которая оконно взвешивается в процессоре 1736. Выходной сигнал процессора 1736 подается на положительный вход сумматора 1751. Как показано на фиг. 17, выходной сигнал процессора 1736 может использоваться в устройстве по необходимости.

При переходе между режимами кодирования (например, от кадра ACELP к кадру ТСХ) некоторые из звуковых кадров, кодированных MDCT-модулем 1712, могут не декодироваться надлежащим образом без дополнительной информации. Калькулятор 1713 выдает эту дополнительную информацию, в частности, сигнал 706 коррекции (фиг. 7). Все компоненты калькулятора 1713 могут рассматриваться как формирователь сигнала коррекции FAC. Формирователь сигнала коррекции FAC содержит применение окна 502 FAC к звуковому сигналу 1701, подачу выходного сигнала окна 502 FAC на положительный вход сумматора 1751, подачу выходного сигнала сумматора 1751 на MDCT 1734 и квантование выходного сигнала MDCT 1734 в квантователе 1737 для формирования параметров 706 FAC, которые подаются на вход мультиплексора 1711.

Сигнал на выходе мультиплексора 1711 представляет собой кодированный звуковой сигнал 1755, подлежащий передаче на декодер (не показан) через передатчик 1756 в кодированном битовом потоке 1757.

Специалистам в данной области техники должно быть понятно, что описание устройств и способов прямой компенсации наложения спектров во временной области в кодированном сигнале является всего лишь иллюстративным и никоим образом не предполагает ограничений. Таким специалисты в данной области техники без труда смогут реализовать другие варианты осуществления, имеющие преимущества данного изобретения. Кроме того, описанные системы могут быть изменены для реализации полезных решений с учетом имеющихся потребностей и задач компенсации наложения спектров во временной области в кодированном сигнале.

Специалистам в данной области техники должно быть также понятно, что в многочисленных типах оконечных устройств и приспособлений могут быть реализованы как аспекты кодирования для передачи кодированного звука, так и аспекты декодирования последующего приема кодированного звука в одном и том же устройстве.

В интересах ясности не все из обычных признаков реализаций прямой компенсации наложения спектров во временной области в кодированном сигнале показаны и описаны. Разумеется, понятно, что при разработке любой такой фактической реализации кодирования звуковых сигналов должны приниматься многочисленные специфичные для реализации решения с целью достижения конкретных задач разработчика, таких как соответствие ограничениям, связанным с приложениями, системами, сетями и бизнесом, и что указанные конкретные задачи будут варьироваться от одной реализации к другой и от одного разработчика к другому. Кроме того, понятно, что проектно-конструкторские работы могут оказаться сложными и требующими больших затрат времени, но, тем не менее, являются стандартными задачами проектирования для специалистов в области систем кодирования звуковых сигналов, в которых реализуются преимущества данного изобретения.

В соответствии с данным раскрытием, описанные здесь компоненты, этапы обработки и/или структуры данных могут быть реализованы с использованием различных типов операционных систем, вычислительных платформ, сетевых устройств, компьютерных программ и/или машин общего назначения. Кроме того, специалистам в данной области техники должно быть понятно, что могут также использоваться устройства менее общего назначения, такие как жестко запрограммированные устройства, программируемые пользователем вентильные матрицы (FPGA), специализированные интегральные схемы (ASIC) и т.п. В случае если способ, содержащий серию этапов обработки, реализуется с помощью компьютера или вычислительной машины, а указанные этапы обработки могут сохраняться в виде ряда инструкций, считываемых данной машиной, они могут сохраняться на материальном носителе.

В описанных здесь целях описанные здесь системы и модули могут содержать программное обеспечение, микропрограммное обеспечение, аппаратное обеспечение либо совокупность (совокупности) программного обеспечения, микропрограммного обеспечения или аппаратного обеспечения. Программное обеспечение и прочие модули могут располагаться на серверах, рабочих станциях, персональных компьютерах, компьютеризированных планшетах, карманных персональных компьютерах (PDA) и иных устройствах, подходящих для описанных здесь целей. Программное обеспечение и прочие модули могут быть доступны через локальное запоминающее устройство, через сеть, через браузер или иное приложение в контексте поставщика прикладных услуг (ASP) или через иные средства, подходящие для описанных здесь целей. Описанные здесь структуры данных могут содержать компьютерные файлы, переменные, программные массивы, программные структуры, либо какие-либо схемы или способы хранения электронной информации, либо их совокупности, подходящие для описанных здесь целей.

Хотя настоящее изобретение описано выше посредством его неограничительных иллюстративных вариантов осуществления, эти варианты осуществления по усмотрению могут быть модифицированы в пределах объема прилагаемой формулы изобретения и в пределах сущности настоящего изобретения.

1. Способ прямой компенсации наложения спектров во временной области в кодированном сигнале, принимаемом в битовом потоке в декодере, содержащий этапы, на которых:
принимают в битовом потоке в декодере от кодера дополнительную информацию, относящуюся к коррекции наложения спектров во временной области в кодируемом сигнале, причем дополнительная информация представляет собой сигнал коррекции прямой компенсации наложения спектров (FAC), относящийся к разностному сигналу, основанному на разности между сигналом, подлежащим кодированию при переходе от первого режима кодирования ко второму режиму кодирования, и синтезированным сигналом, полученным с использованием первого режима кодирования; и
компенсируют наложение спектров во временной области в кодированном сигнале в декодере в ответ на дополнительную информацию.

2. Способ по п. 1, используемый при переходах между кадром с использованием прямоугольного неперекрывающегося окна и кадром с использованием непрямоугольного перекрывающегося окна.

3. Способ по п. 1, в котором сигнал коррекции FAC представляет собой оконно взвешенный, либо оконно взвешенный и свернутый, сигнал коррекции FAC.

4. Способ по п. 1, в котором сигнал коррекции FAC является кодированным с преобразованием с использованием преобразования для кодирования кадра с использованием непрямоугольного перекрывающегося окна.

5. Способ по п. 1, в котором первым режимом кодирования является режим Линейного предсказания с кодовым возбуждением (CELP), а вторым режимом кодирования является режим кодирования с преобразованием.

6. Способ по п. 1, в котором разностный сигнал основан на разности между подлежащим кодированию сигналом и синтезированным сигналом, объединенным с откликом при отсутствии входного сигнала синтезирующего фильтра при первом режиме кодирования.

7. Способ по п. 1, в котором компенсация наложения спектров во временной области содержит этапы, на которых, в декодере:
декодируют разностный сигнал; и
повторно вычисляют сигнал коррекции FAC с использованием синтезированного сигнала и декодированного разностного сигнала.

8. Способ по п. 1, в котором компенсация наложения спектров во временной области содержит этапы, на которых, в декодере:
декодируют сигнал коррекции FAC; и
суммируют декодированный сигнал коррекции FAC с кодированным сигналом.

9. Способ по п. 1, в котором сигнал коррекции FAC является квантованным с использованием факторов масштабирования, используемых в непрямоугольных перекрывающихся окнах.

10. Способ прямой компенсации наложения спектров во временной области в кодированном сигнале для передачи от кодера к декодеру, содержащий этапы, на которых:
вычисляют в кодере дополнительную информацию, относящуюся к коррекции наложения спектров во временной области в кодированном сигнале, причем вычисление дополнительной информации содержит этап, на котором формируют сигнал коррекции прямой компенсации наложения спектров (FAC), относящийся к разностному сигналу, основанному на разности между сигналом, подлежащим кодированию при переходе от первого режима кодирования ко второму режиму кодирования, и синтезированным сигналом, полученным с использованием первого режима кодирования; и
отправляют в битовом потоке от кодера к декодеру упомянутую дополнительную информацию, относящуюся к коррекции наложения спектров во временной области в кодированном сигнале.

11. Способ по п. 10, используемый при переходах между кадром с использованием прямоугольного неперекрывающегося окна и кадром с использованием непрямоугольного перекрывающегося окна.

12. Способ по п. 10, в котором вычисление дополнительной информации содержит этап, на котором оконно взвешивают, либо оконно взвешивают и свертывают, сигнал коррекции FAC.

13. Способ по п. 10, в котором вычисление дополнительной информации содержит этап, на котором кодируют с преобразованием сигнал коррекции FAC с использованием преобразования для кодирования кадра с использованием непрямоугольного перекрывающегося окна.

14. Способ по п. 10, в котором первым режимом кодирования является режим Линейного предсказания с кодовым возбуждением (CELP), а вторым режимом кодирования является режим кодирования с преобразованием.

15. Способ по п. 10, в котором разностный сигнал основан на разности между подлежащим кодированию сигналом и синтезированным сигналом, объединенным с откликом при отсутствии входного сигнала синтезирующего фильтра при первом режиме кодирования.

16. Способ по п. 10, содержащий этап, на котором квантуют сигнал коррекции FAC с использованием факторов масштабирования, используемых в непрямоугольных перекрывающихся окнах.

17. Способ по п. 16, содержащий этап, на котором вычитают ошибку квантования кодированного с преобразованием кадра из сигнала коррекции FAC до квантования сигнала коррекции FAC.

18. Устройство для прямой компенсации наложения спектров во временной области в кодированном сигнале, принимаемом в битовом потоке, содержащее:
приемник из битового потока от кодера дополнительной информации, относящейся к коррекции наложения спектров во временной области в кодированном сигнале, причем дополнительная информация содержит сигнал коррекции прямой компенсации наложения спектров (FAC), относящийся к разностному сигналу, основанному на разности между сигналом, подлежащим кодированию при переходе от первого режима кодирования ко второму режиму кодирования, и синтезированным сигналом, полученным с использованием первого режима кодирования; и
компенсатор наложения спектров во временной области в кодированном сигнале в ответ на дополнительную информацию.

19. Устройство по п. 18, используемое при переходах между кадром с использованием прямоугольного неперекрывающегося окна и кадром с использованием непрямоугольного перекрывающегося окна.

20. Устройство по п. 18, в котором сигнал коррекции FAC представляет собой оконно взвешенный, либо оконно взвешенный и свернутый, сигнал коррекции FAC.

21. Устройство по п. 18, в котором сигнал коррекции FAC является кодированным с преобразованием с использованием преобразования для кодирования кадра с использованием непрямоугольного перекрывающегося окна.

22. Устройство по п. 18, в котором первым режимом кодирования является режим Линейного предсказания с кодовым возбуждением (CELP), а вторым режимом кодирования является режим кодирования с преобразованием.

23. Устройство по п. 18, в котором разностный сигнал основан на разности между подлежащим кодированию сигналом и синтезированным сигналом, объединенным с откликом при отсутствии входного сигнала синтезирующего фильтра при первом режиме кодирования.

24. Устройство по п. 18, в котором компенсатор в декодере:
декодирует разностный сигнал; и
повторно вычисляет сигнал коррекции FAC с использованием синтезированного сигнала и декодированный разностный сигнал.

25. Устройство по п. 18, в котором компенсатор в декодере:
декодирует сигнал коррекции FAC; и
суммирует декодированный сигнал коррекции FAC с кодированным сигналом.

26. Устройство по п. 18, в котором сигнал коррекции FAC является квантованным с использованием факторов масштабирования, используемых в непрямоугольных перекрывающихся окнах.

27. Устройство для прямой компенсации наложения спектров во временной области в кодированном сигнале для передачи в декодер, содержащее:
вычислитель дополнительной информации, относящейся к коррекции наложения спектров во временной области в кодированном сигнале, причем вычислитель дополнительной информации содержит формирователь сигнала коррекции прямой компенсации наложения спектров (FAC), относящегося к разностному сигналу, основанному на разности между сигналом, подлежащим кодированию при переходе от первого режима кодирования ко второму режиму кодирования, и синтезированным сигналом, полученным с использованием первого режима кодирования; и
передатчик для отправки в битовом потоке на декодер упомянутой дополнительной информации, относящейся к коррекции наложения спектров во временной области в кодированном сигнале.

28. Устройство по п. 27, используемое при переходах между кадром с использованием прямоугольного неперекрывающегося окна и кадром с использованием непрямоугольного перекрывающегося окна.

29. Устройство по п. 27, в котором формирователь сигнала коррекции FAC оконно взвешивает, либо оконно взвешивает и свертывает, сигнал коррекции FAC.

30. Устройство по п. 27, в котором формирователь сигнала коррекции FAC кодирует с преобразованием сигнал коррекции FAC с использованием преобразования для кодирования кадра с использованием непрямоугольного перекрывающегося окна.

31. Устройство по п. 27, в котором первым режимом кодирования является режим Линейного предсказания с кодовым возбуждением (CELP), а вторым режимом кодирования является режим кодирования с преобразованием.

32. Устройство по п. 27, в котором разностный сигнал основан на разности между подлежащим кодированию сигналом и синтезированным сигналом, объединенным с откликом при отсутствии входного сигнала синтезирующего фильтра при первом режиме кодирования.

33. Устройство по п. 27, содержащее квантователь сигнала коррекции FAC с использованием факторов масштабирования, используемых в непрямоугольных перекрывающихся окнах.

34. Устройство по п. 33, содержащее вычитатель ошибки синтезированного ТСХ-кадра из сигнала коррекции FAC до квантования сигнала коррекции FAC.



 

Похожие патенты:

Изобретение относится к области систем обработки данных. Техническим результатом является сокращение времени ожидания при исполнении видеоигр или приложений.

Изобретение относится к области систем обработки данных. .

Изобретение относится к области систем обработки данных. .

Изобретение относится к вычислительной технике и технике связи. .

Изобретение относится к вычислительной технике, а именно к устройствам контроля запоминающих устройств, и может быть использовано для повышения достоверности информации, хранимой в запоминающих устройствах.

Изобретение относится к вычислительной технике и передаче данных, может быть использовано для последовательного обнаружения и исправления ошибок. .

Изобретение относится к технике связи и вычислительной технике. .

Изобретение относится к автоматике и вычислительной технике. .

Изобретение относится к вычислительной технике. .

Изобретение относится к обработке звука. Технический результат - улучшенный захват пространственного звука.

Изобретение относится к аудиообработке и, в частности, к разложению аудиосигналов на различные компоненты. Технический результат - повышение точности воспроизведения стереофонического звука.

Изобретение относится к средствам канального кодирования на основе комплексного преобразования с частотным кодированием с расширенной полосой. Технический результат заключается в улучшении качества многоканального звука.

Изобретение относится к средствам для стереофонического кодирования и декодирования с использованием комплексного предсказания в частотной области. Технический результат заключается в обеспечении высокого качества звука при уменьшении вычислительных затрат.

Изобретение относится к аудиообработке и, в частности, к разложению аудиосигналов на различные компоненты, к примеру, различно воспринимаемые компоненты. Технический результат - разложение сигнала с использованием заранее вычисленной частотно-зависимой кривой подобия в качестве эталонной кривой.

Изобретение относится к средствам оценки аудио сигнала. Техническим результатом является повышение эффективности кодирования аудио сигнала.

Изобретение относится к средствам для расширения полосы частот. Технический результат заключается в улучшении восприятия расширенного звукового сигнала.

Изобретение относится к кодированию и декодированию аудиосигнала, в которых звуковые образы для каждого объектного аудиосигнала могут быть локализованы в любой требуемой позиции.

Изобретение относится к области связи. .

Изобретение относится к кодированию речевого сигнала в телекоммуникационных системах, в частности, к способам и устройствам для управления сглаживанием стационарного фонового шума в таких системах.

Изобретение относится к декодеру аудиосигнала, генерирующему на выходе представление сигнала повышающего микширования на базе представления сигнала понижающего микширования и объектно-ориентированной параметрической информации. Технический результат - повышение точности воспроизведения аудиосигналов. Для этого декодер аудиосигнала содержит разделитель объектов, предназначенный для разложения представления сигнала понижающего микширования на первую аудиоинформацию, описывающую первую комбинацию из одного или более аудиообъектов первого типа, и вторую аудиоинформацию, описывающую вторую комбинацию из одного или более аудиообъектов второго типа, в зависимости от представления сигнала понижающего микширования с использованием, по меньшей мере, части объектно-ориентированной параметрической информации, процессор аудиосигналов, предназначенный для приема второй аудиоинформации и обработки второй аудиоинформации, исходя из объектно-ориентированной параметрической информации, с получением обработанной версии второй аудиоинформации, комбинатор аудиосигнала, выполняющий объединение первой аудиоинформации с обработанной версией второй аудиоинформации с формированием на выходе представления сигнала повышающего микширования. 12 н. и 27 з.п. ф-лы, 22 ил.
Наверх