Уменьшение наложения спектров во временной области для неравномерных гребенок фильтров, которые используют спектральный анализ с последующим частичным синтезом

Изобретение относится к средствам для обработки аудиосигнала. Технический результат заключается в повышении эффективности обработки аудиосигнала за счет уменьшения избыточности и задержки. Выполняют каскадное перекрывающееся критически дискретизированное преобразование по меньшей мере для двух частично перекрывающихся блоков выборок аудиосигнала для получения набора поддиапазонных выборок на основе первого блока выборок аудиосигнала и получения соответствующего набора поддиапазонных выборок на основе второго блока выборок аудиосигнала. Выполняют комбинирование со взвешиванием двух соответствующих наборов поддиапазонных выборок, причем один из них получен на основе первого блока выборок аудиосигнала, и один из них получен на основе второго блока выборок аудиосигнала, для получения поддиапазонного представления с уменьшенным наложением спектров аудиосигнала. Выполняют перекрывающиеся критически дискретизированные преобразования для первого блока выборок и второго блока выборок по меньшей мере из двух частично перекрывающихся блоков выборок аудиосигнала. 13 н. и 8 з.п. ф-лы, 14 ил.

 

Варианты осуществления относятся к аудиопроцессору/способу обработки аудиосигнала для получения поддиапазонное представление аудиосигнала. Дополнительные варианты осуществления относятся к аудиопроцессору/способу обработки поддиапазонного представления аудиосигнала для получения аудиосигнала. Некоторые варианты осуществления относятся к уменьшению наложения спектров во временной области в поддиапазонах частот неравномерных ортогональных гребенок фильтров на основе анализа/синтеза на основе MDCT (MDCT=модифицированное дискретное косинусное преобразование), например, в поддиапазонах частот неравномерных ортогональных гребенок MDCT-фильтров.

MDCT широко используется в вариантах применения для кодирования аудио вследствие своих свойств, таких как хорошее энергетическое уплотнение и ортогональность, при использовании перекрывающимся способом. Тем не менее, MDCT демонстрирует равномерное частотно-временное разрешение [J. Princen, A. Johnson и A. Bradley, "Subband/transform coding using filter bank designs based on time domain aliasing cancellation", in Acoustics, Speech and Signal Processing, IEEE International Conference on ICASSP '87, апрель 1987 года, издание 12, стр. 2161-2164]. Тем не менее, при выполнении перцепционно обусловленной аудиообработки, неравномерное частотно-временное разрешение может быть более желательным представлением.

Один способ проектирования неравномерного преобразования представляет собой повторное применение одного из нескольких равномерных преобразований.

Для поддиапазонного объединения, сначала применяется длинное преобразование, преобразование сигнала из временной в спектральную область. Результат представляет собой спектр с высоким спектральным, но низким временным разрешением. Впоследствии, несколько спектральных элементов разрешения преобразуются обратно во временную область. Это увеличивает временное разрешение при сокращении спектрального разрешения в этом выбранном поддиапазоне частот.

Поддиапазонное разбиение представляет собой комплементарную операцию: сначала применяется короткое преобразование. Результат представляет собой спектр с низким спектральным, но высоким временным разрешением. Впоследствии, спектральные элементы разрешения двух или более смежных кадров преобразования преобразуются снова, увеличивая свое спектральное разрешение за счет временного разрешения.

Эти этапы могут смешиваться и повторяться при необходимости. Выбор преобразования может быть произвольным; тем не менее, для каждого этапа обычно выбираются одинаковые или аналогичные преобразования.

Предусмотрено множество способов упрощения неравномерных частотно-временных преобразований:

При использовании двух последовательных быстрых преобразований Фурье, существует ERBLet-преобразование, преобразование с поддиапазонным объединением со шкалой частот ERB [T. Necciari, P. Balazs, N. Holighaus и P.L. Sondergaard, "The erblet transform: An auditory-based time-frequency representation with perfect reconstruction", in Acoustics, Speech and Signal Processing (ICASSP), 2013 IEEE International Conference on, май 2013 года, стр. 498-502]. В последнее время те же авторы распространяют свой подход на спектр дискретного косинусного преобразования типа 4 (DCT4) и MDCT-преобразование с поддиапазонным объединением [Olivier Derrien, Thibaud Necciari и Peter Balazs, "A quasi-orthogonal, invertible and perceptually relevant time-frequency transform for audio coding", in EUSIPCO, Ницца, Франция, август 2015 года].

Тем не менее, оба подхода спроектированы таким образом, что они требуют очень длинных перекрывающихся окон преобразования на основе кодирования со взвешиванием с некритической дискретизацией или даже преобразованием всего сигнала за один этап. Эти длинные окна преобразования на основе кодирования со взвешиванием и некритическая дискретизация запрещают точную временную локализацию в области преобразования и приводят к тому, что они являются неподходящими для вариантов применения кодирования вследствие большого упреждающего просмотра и высокой избыточности.

Технология поддиапазонного объединения с использованием MDCT и элементов на основе принципа «бабочки» для комбинирования выбранных коэффициентов одного MDCT-кадра, введена в [J. Mau, J. Valot и D. Minaud, "Time-varying orthogonal filter banks without transient filters", in Proceedings of the Acoustics, Speech and Signal Processing, 1995 год, On International Conference - Volume 02, Вашингтон, округ Колумбия, США, 1995 г., ICASSP '95, стр. 1328-1331, EEE Computer Society] и обобщена до матриц Адамара в [O.A. Niamut и R. Heusdens, "Flexible frequency decompositions for cosine-modulated filter banks", in Acoustics, Speech and Signal Processing, 2003 год, Proceedings (ICASSP '03), 2003 IEEE International Conference on, апрель 2003 г., издание 5, стр. V-449-52, издание 5]. Комплементарная операция поддиапазонного разбиения введена в [Jean-Marc Valin, Gregory Maxwell, Timothy B. Terriberry и Koen Vos, "High-quality, low-delay music coding in the opus codec", in Audio Engineering Society Convention 135, октябрь 2013 г.].

При обеспечении возможности прямой интеграции в общие конвейеры перекрывающегося MDCT-преобразования, эти реализации на основе принципа «бабочки» и матрицы Адамара обеспечивают только проектные решения с очень ограниченной шкалой частот, например, с размерами, ограниченными до k=2n с n∈N. Кроме того, матрица Адамара лишь очень примерно аппроксимирует DCT и в силу этого обеспечивает лишь очень ограниченное временно-спектральное разрешение, как подробнее описано ниже.

Кроме того, хотя некоторые из этих способов используют MDCT, они не пытаются уменьшать результирующее наложение спектров в поддиапазонах частот, формируя размытую временную компактность результирующего импульса гребенки фильтров.

Следовательно, задача настоящего изобретения состоит в создании принципа, обеспечивающего по меньшей мере одно из улучшенной временной компактности импульсной характеристики, обработки произвольных шкал частот и уменьшенной избыточности и задержки.

Эта задача решается посредством независимых пунктов формулы изобретения.

Варианты осуществления предусматривают аудиопроцессор для обработки аудиосигнала для получения поддиапазонного представления аудиосигнала. Аудиопроцессор содержит каскад каскадного перекрывающегося критически дискретизированного преобразования и каскад уменьшения наложения спектров во временной области. Каскад каскадного перекрывающегося критически дискретизированного преобразования выполнен с возможностью выполнения каскадного перекрывающегося критически дискретизированного преобразования по меньшей мере для двух частично перекрывающихся блоков выборок аудиосигнала для получения набора поддиапазонных выборок на основе первого блока выборок аудиосигнала и получения соответствующего набора поддиапазонных выборок на основе второго блока выборок аудиосигнала. Каскад уменьшения наложения спектров во временной области выполнен с возможностью выполнения комбинирования со взвешиванием двух соответствующих наборов поддиапазонных выборок, причем один из них получен на основе первого блока выборок аудиосигнала, и один из них получен на основе второго блока выборок аудиосигнала для получения поддиапазонного представления с уменьшенным наложением спектров аудиосигнала.

Дополнительные варианты осуществления предусматривают аудиопроцессор для обработки поддиапазонного представления аудиосигнала для получения аудиосигнала. Аудиопроцессор содержит каскад обратного уменьшения наложения спектров во временной области и каскад каскадного обратного перекрывающегося критически дискретизированного преобразования. Каскад обратного уменьшения наложения спектров во временной области выполнен с возможностью выполнения комбинирования со взвешиванием (и сдвигом) двух соответствующих поддиапазонных представлений с уменьшенным наложением спектров (различных блоков частично перекрывающихся выборок) аудиосигнала для получения поддиапазонного представления с наложением спектров, при этом поддиапазонное представление с наложением спектров представляет собой набор поддиапазонных выборок. Каскад каскадного обратного перекрывающегося критически дискретизированного преобразования выполнен с возможностью выполнения каскадного обратного перекрывающегося критически дискретизированного преобразования для набора поддиапазонных выборок для получения набора выборок, ассоциированных с блоком выборок аудиосигнала.

Согласно принципу настоящего изобретения, дополнительный каскад постобработки добавляется в конвейер перекрывающегося критически дискретизированного преобразования (например, MDCT), причем дополнительный каскад постобработки содержит другое перекрывающееся критически дискретизированное преобразование (например, MDCT) вдоль частотной оси и уменьшение наложения спектров во временной области вдоль каждой поддиапазонной временной оси. Это обеспечивает возможность извлечения произвольных шкал частот из спектрограммы перекрывающегося критически дискретизированного преобразования (например, MDCT) с улучшенной временной компактностью импульсной характеристики, при отсутствии введения дополнительной избыточности и уменьшенной кадровой задержки перекрывающегося критически дискретизированного преобразования.

Дополнительные варианты осуществления предусматривают способ обработки аудиосигнала для получения поддиапазонного представления аудиосигнала. Способ содержит:

- выполнение каскадного перекрывающегося критически дискретизированного преобразования по меньшей мере для двух частично перекрывающихся блоков выборок аудиосигнала для получения набора поддиапазонных выборок на основе первого блока выборок аудиосигнала и получения соответствующего набора поддиапазонных выборок на основе второго блока выборок аудиосигнала; и

- выполнение комбинирования со взвешиванием двух соответствующих наборов поддиапазонных выборок, причем один из них получен на основе первого блока выборок аудиосигнала, и один из них получен на основе второго блока выборок аудиосигнала для получения поддиапазонного представления с уменьшенным наложением спектров аудиосигнала.

Дополнительные варианты осуществления предусматривают способ обработки поддиапазонного представления аудиосигнала для получения аудиосигнала. Способ содержит:

- выполнение комбинирования со взвешиванием (и сдвигом) двух соответствующих поддиапазонных представлений с уменьшенным наложением спектров (различных блоков частично перекрывающихся выборок) аудиосигнала для получения поддиапазонного представления с наложением спектров, при этом поддиапазонное представление с наложением спектров представляет собой набор поддиапазонных выборок; и

- выполнение каскадного обратного перекрывающегося критически дискретизированного преобразования для набора поддиапазонных выборок для получения набора выборок, ассоциированных с блоком выборок аудиосигнала.

Предпочтительные реализации рассмотрены в зависимых пунктах формулы изобретения.

Ниже описаны предпочтительные реализации аудиопроцессора для обработки аудиосигнала для получения поддиапазонного представления аудиосигнала.

В вариантах осуществления, каскад каскадного перекрывающегося критически дискретизированного преобразования может представлять собой каскад каскадного MDCT (MDCT=модифицированное дискретное косинусное преобразование), MDST (MDST=модифицированное дискретное синусное преобразование) или MLT (MLT=модулированное перекрывающееся преобразование).

В вариантах осуществления, каскад каскадного перекрывающегося критически дискретизированного преобразования может содержать первый каскад перекрывающегося критически дискретизированного преобразования, выполненный с возможностью выполнения перекрывающихся критически дискретизированных преобразований для первого блока выборок и второго блока выборок по меньшей мере из двух частично перекрывающихся блоков выборок аудиосигнала для получения первого набора элементов разрешения для первого блока выборок и второго набора элементов разрешения (перекрывающихся критически дискретизированных коэффициентов) для второго блока выборок.

Первый каскад перекрывающегося критически дискретизированного преобразования может представлять собой первый MDCT-, MDST- или MLT-каскад.

Каскад каскадного перекрывающегося критически дискретизированного преобразования дополнительно может содержать второй каскад перекрывающегося критически дискретизированного преобразования, выполненный с возможностью выполнения перекрывающегося критически дискретизированного преобразования для сегмента (собственного поднабора) первого набора элементов разрешения и выполнения перекрывающегося критически дискретизированного преобразования для сегмента (собственного поднабора) второго набора элементов разрешения, причем каждый сегмент ассоциирован с поддиапазоном частот аудиосигнала, для получения набора поддиапазонных выборок для первого набора элементов разрешения и набора поддиапазонных выборок для второго набора элементов разрешения.

Второй каскад перекрывающегося критически дискретизированного преобразования может представлять собой второй MDCT-, MDST- или MLT-каскад.

В силу этого, первый и второй каскады перекрывающегося критически дискретизированного преобразования могут иметь одинаковый тип, т.е. представлять собой один из MDCT-, MDST- или MLT-каскадов.

В вариантах осуществления, второй каскад перекрывающегося критически дискретизированного преобразования может быть выполнен с возможностью выполнения перекрывающихся критически дискретизированных преобразований по меньшей мере для двух частично перекрывающихся сегментов (собственных поднаборов) первого набора элементов разрешения и выполнения перекрывающихся критически дискретизированных преобразований по меньшей мере для двух частично перекрывающихся сегментов (собственных поднаборов) второго набора элементов разрешения, причем каждый сегмент ассоциирован с поддиапазоном частот аудиосигнала, для получения по меньшей мере двух наборов поддиапазонных выборок для первого набора элементов разрешения и по меньшей мере двух наборов поддиапазонных выборок для второго набора элементов разрешения.

В силу этого, первый набор поддиапазонных выборок может представлять собой результат первого перекрывающегося критически дискретизированного преобразования на основе первого сегмента первого набора элементов разрешения, при этом второй набор поддиапазонных выборок может представлять собой результат второго перекрывающегося критически дискретизированного преобразования на основе второго сегмента первого набора элементов разрешения, при этом третий набор поддиапазонных выборок может представлять собой результат третьего перекрывающегося критически дискретизированного преобразования на основе первого сегмента второго набора элементов разрешения, при этом четвертый набор поддиапазонных выборок может представлять собой результат четвертого перекрывающегося критически дискретизированного преобразования на основе второго сегмента второго набора элементов разрешения. Каскад уменьшения наложения спектров во временной области может быть выполнен с возможностью выполнения комбинирования со взвешиванием первого набора поддиапазонных выборок и третьего набора поддиапазонных выборок для получения первого поддиапазонного представления с уменьшенным наложением спектров аудиосигнала, и выполнения комбинирования со взвешиванием второго набора поддиапазонных выборок и четвертого набора поддиапазонных выборок для получения второго поддиапазонного представления с уменьшенным наложением спектров аудиосигнала.

В вариантах осуществления, каскад каскадного перекрывающегося критически дискретизированного преобразования может быть выполнен с возможностью сегментирования набора элементов разрешения, полученного на основе первого блока выборок с использованием по меньшей мере двух функций кодирования со взвешиванием, и получения по меньшей мере двух наборов поддиапазонных выборок на основе сегментированного набора элементов разрешения, соответствующих первому блоку выборок, при этом каскад каскадного перекрывающегося критически дискретизированного преобразования может быть выполнен с возможностью сегментирования набора элементов разрешения, полученного на основе второго блока выборок с использованием по меньшей мере двух функций кодирования со взвешиванием, и получения по меньшей мере двух наборов поддиапазонных выборок на основе сегментированного набора элементов разрешения, соответствующих второму блоку выборок, при этом по меньшей мере две функции кодирования со взвешиванием содержат различную ширину окна кодирования со взвешиванием.

В вариантах осуществления, каскад каскадного перекрывающегося критически дискретизированного преобразования может быть выполнен с возможностью сегментирования набора элементов разрешения, полученного на основе первого блока выборок с использованием по меньшей мере двух функций кодирования со взвешиванием, и получения по меньшей мере двух наборов поддиапазонных выборок на основе сегментированного набора элементов разрешения, соответствующих первому блоку выборок, при этом каскад каскадного перекрывающегося критически дискретизированного преобразования может быть выполнен с возможностью сегментирования набора элементов разрешения, полученного на основе второго блока выборок с использованием по меньшей мере двух функций кодирования со взвешиванием, и получения по меньшей мере двух наборов поддиапазонных выборок на основе сегментированного набора элементов разрешения, соответствующих второму блоку выборок, при этом наклоны фильтра функций кодирования со взвешиванием, соответствующих смежным наборам поддиапазонных выборок, являются симметричными.

В вариантах осуществления, каскад каскадного перекрывающегося критически дискретизированного преобразования может быть выполнен с возможностью сегментирования выборок аудиосигнала на первый блок выборок и второй блок выборок с использованием первой функции кодирования со взвешиванием, при этом каскад перекрывающегося критически дискретизированного преобразования может быть выполнен с возможностью сегментирования набора элементов разрешения, полученного на основе первого блока выборок, и набора элементов разрешения, полученного на основе второго блока выборок с использованием второй функции кодирования со взвешиванием, для получения соответствующих поддиапазонных выборок, при этом первая функция кодирования со взвешиванием и вторая функция кодирования со взвешиванием содержат различную ширину окна кодирования со взвешиванием.

В вариантах осуществления, каскад каскадного перекрывающегося критически дискретизированного преобразования может быть выполнен с возможностью сегментирования выборок аудиосигнала на первый блок выборок и второй блок выборок с использованием первой функции кодирования со взвешиванием, при этом каскад перекрывающегося критически дискретизированного преобразования может быть выполнен с возможностью сегментирования набора элементов разрешения, полученного на основе первого блока выборок, и набора элементов разрешения, полученного на основе второго блока выборок с использованием второй функции кодирования со взвешиванием, для получения соответствующих поддиапазонных выборок, при этом ширина окна кодирования со взвешиванием первой функции кодирования со взвешиванием и ширина окна кодирования со взвешиванием второй функции кодирования со взвешиванием отличаются друг от друга, при этом ширина окна кодирования со взвешиванием первой функции кодирования со взвешиванием и ширина окна кодирования со взвешиванием второй функции кодирования со взвешиванием отличаются друг от друга на коэффициент, отличный от степени двух.

Ниже описаны предпочтительные реализации аудиопроцессора для обработки поддиапазонного представления аудиосигнала для получения аудиосигнала.

В вариантах осуществления, каскад обратного каскадного перекрывающегося критически дискретизированного преобразования может представлять собой каскад обратного каскадного MDCT (MDCT=модифицированное дискретное косинусное преобразование), MDST (MDST=модифицированное дискретное синусное преобразование) или MLT (MLT=модулированное перекрывающееся преобразование).

В вариантах осуществления, каскад каскадного обратного перекрывающегося критически дискретизированного преобразования может содержать первый каскад обратного перекрывающегося критически дискретизированного преобразования, выполненный с возможностью выполнения обратного перекрывающегося критически дискретизированного преобразования для набора поддиапазонных выборок для получения набора элементов разрешения, ассоциированного с данной поддиапазоном частот аудиосигнала.

Первый каскад обратного перекрывающегося критически дискретизированного преобразования может представлять собой первый обратный MDCT-, MDST- или MLT-каскад.

В вариантах осуществления, каскад каскадного обратного перекрывающегося критически дискретизированного преобразования может содержать первый каскад суммирования с перекрытием, выполненный с возможностью выполнения конкатенации набора элементов разрешения, ассоциированного с множеством поддиапазонов частот аудиосигнала, что содержит комбинирование со взвешиванием набора элементов разрешения, ассоциированного с данной поддиапазоном частот аудиосигнала, с набором элементов разрешения, ассоциированным с другой поддиапазоном частот аудиосигнала, для получения набора элементов разрешения, ассоциированного с блоком выборок аудиосигнала.

В вариантах осуществления, каскад каскадного обратного перекрывающегося критически дискретизированного преобразования может содержать второй каскад обратного перекрывающегося критически дискретизированного преобразования, выполненный с возможностью выполнения обратного перекрывающегося критически дискретизированного преобразования для набора элементов разрешения, ассоциированных с блоком выборок аудиосигнала, для получения набора выборок, ассоциированных с блоком выборок аудиосигнала.

Второй каскад обратного перекрывающегося критически дискретизированного преобразования может представлять собой второй обратный MDCT-, MDST- или MLT-каскад.

В силу этого, первый и второй каскады обратного перекрывающегося критически дискретизированного преобразования могут иметь одинаковый тип, т.е. представлять собой один из обратных MDCT-, MDST- или MLT-каскадов.

В вариантах осуществления, каскад каскадного обратного перекрывающегося критически дискретизированного преобразования может содержать второй каскад суммирования с перекрытием, выполненный с возможностью суммирования с перекрытием набора выборок, ассоциированных с блоком выборок аудиосигнала, и другого набора выборок, ассоциированных с другим блоком выборок аудиосигнала, причем блок выборок и другой блок выборок аудиосигнала частично перекрываются, для получения аудиосигнала.

Варианты осуществления настоящего изобретения описаны в данном документе со ссылкой на прилагаемые чертежи.

Фиг. 1 показывает принципиальную блок-схему аудиопроцессора, выполненного с возможностью обработки аудиосигнала для получения поддиапазонного представления аудиосигнала, согласно варианту осуществления;

Фиг. 2 показывает принципиальную блок-схему аудиопроцессора, выполненного с возможностью обработки аудиосигнала для получения поддиапазонного представления аудиосигнала, согласно дополнительному варианту осуществления;

Фиг. 3 показывает принципиальную блок-схему аудиопроцессора, выполненного с возможностью обработки аудиосигнала для получения поддиапазонного представления аудиосигнала, согласно дополнительному варианту осуществления;

Фиг. 4 показывает принципиальную блок-схему аудиопроцессора для обработки поддиапазонного представления аудиосигнала для получения аудиосигнала согласно варианту осуществления;

Фиг. 5 показывает принципиальную блок-схему аудиопроцессора для обработки поддиапазонного представления аудиосигнала для получения аудиосигнала согласно дополнительному варианту осуществления;

Фиг. 6 показывает принципиальную блок-схему аудиопроцессора для обработки поддиапазонного представления аудиосигнала для получения аудиосигнала согласно дополнительному варианту осуществления;

Фиг. 7 показывает на схемах пример поддиапазонных выборок (верхний график) и распределение их выборок по времени и частоте (нижний график);

Фиг. 8 показывает на схеме спектральную и временную неопределенность, полученную посредством нескольких различных преобразований;

Фиг. 9 показывает на схемах сравнение двух примерных импульсных характеристик, сформированных посредством поддиапазонного объединения с и без TDAR, простых коротких MDCT-блоков и поддиапазонного объединения на основе матрицы Адамара;

Фиг. 10 показывает блок-схему способа обработки аудиосигнала для получения поддиапазонного представления аудиосигнала согласно варианту осуществления;

Фиг. 11 показывает блок-схему способа обработки поддиапазонного представления аудиосигнала для получения аудиосигнала согласно варианту осуществления;

Фиг. 12 показывает принципиальную блок-схему аудиокодера, согласно варианту осуществления;

Фиг. 13 показывает принципиальную блок-схему аудиодекодера, согласно варианту осуществления;

Фиг. 14 показывает принципиальную блок-схему аудиоанализатора, согласно варианту осуществления.

Одинаковые или эквивалентные элементы либо элементы с одинаковой или эквивалентной функциональностью обозначены в нижеприведенном описании одинаковыми или эквивалентными ссылочными позициями.

В нижеприведенном описании приведено множество подробностей для обеспечения более полного пояснения вариантов осуществления настоящего изобретения. Тем не менее, специалистам в данной области техники должно быть очевидным, что варианты осуществления настоящего изобретения могут быть использованы на практике без этих конкретных подробностей. В других случаях, известные структуры и устройства показаны в форме блок-схемы, а не подробно, чтобы не затруднять понимание вариантов осуществления настоящего изобретения. Помимо этого, признаки различных вариантов осуществления, описанных ниже, могут комбинироваться между собой, если прямо не указано иное.

Фиг. 1 показывает принципиальную блок-схему аудиопроцессора 100, выполненного с возможностью обработки аудиосигнала 102 для получения поддиапазонного представления аудиосигнала, согласно варианту осуществления. Аудиопроцессор 100 содержит каскад 104 каскадного перекрывающегося критически дискретизированного преобразования (LCST) и каскад 106 уменьшения наложения спектров во временной области (TDAR).

Каскад 104 каскадного перекрывающегося критически дискретизированного преобразования выполнен с возможностью выполнения каскадного перекрывающегося критически дискретизированного преобразования по меньшей мере для двух частично перекрывающихся блоков 108_1 и 108_2 выборок аудиосигнала 102 для получения набора 110_1,1 поддиапазонных выборок на основе первого блока 108_1 выборок (по меньшей мере из двух перекрывающихся блоков 108_1 и 108_2 выборок) аудиосигнала 102 и получения соответствующего набора 110_2,1 поддиапазонных выборок на основе второго блока 108_2 выборок (по меньшей мере из двух перекрывающихся блоков 108_1 и 108_2 выборок) аудиосигнала 102.

Каскад 104 уменьшения наложения спектров во временной области выполнен с возможностью выполнения комбинирования со взвешиванием двух соответствующих наборов 110_1,1 и 110_2,1 поддиапазонных выборок (т.е. поддиапазонных выборок, соответствующих тому же поддиапазону частот), причем один из них получен на основе первого блока 108_1 выборок аудиосигнала 102 и один из них получен на основе второго блока 108_2 выборок аудиосигнала, для получения поддиапазонного представления 112_1 с уменьшенным наложением спектров аудиосигнала 102.

В вариантах осуществления, каскад 104 каскадного перекрывающегося критически дискретизированного преобразования может содержать по меньшей мере два каскада каскадного перекрывающегося критически дискретизированного преобразования, или другими словами, причем два каскада перекрывающегося критически дискретизированного преобразования соединяются каскадным способом.

Каскад каскадного перекрывающегося критически дискретизированного преобразования может представлять собой каскад каскадного MDCT (MDCT=модифицированное дискретное косинусное преобразование). Каскадный MDCT-каскад может содержать по меньшей мере два MDCT-каскада.

Естественно, каскад каскадного перекрывающегося критически дискретизированного преобразования также может представлять собой каскад каскадного MDST (MDST=модифицированное дискретное синусное преобразование) или MLT (MLT=модулированное перекрывающееся преобразование), содержащий по меньшей мере два MDST- или MLT-каскада, соответственно.

Два соответствующих набора 110_1,1 и 110_2,1 поддиапазонных выборок могут представлять собой поддиапазонные выборки, соответствующие тому же поддиапазону частот (т.е. диапазону частот).

Фиг. 2 показывает принципиальную блок-схему аудиопроцессора 100, выполненного с возможностью обработки аудиосигнала 102 для получения поддиапазонного представления аудиосигнала, согласно дополнительному варианту осуществления.

Как показано на фиг. 2, каскад 104 каскадного перекрывающегося критически дискретизированного преобразования может содержать первый каскад 120 перекрывающегося критически дискретизированного преобразования, выполненный с возможностью выполнения перекрывающихся критически дискретизированных преобразований для первого блока 108_1 (2M) выборок (xi-1(n), 0≤n≤2M-1) и второй блок 108_2 (2M) выборок (xi(n), 0≤n≤2M-1) по меньшей мере из двух частично перекрывающихся блоков 108_1 и 108_2 выборок аудиосигнала 102, для получения первого набора 124_1 (M) элементов разрешения (LCST-коэффициентов) (Xi-1(k), 0≤k≤M-1) для первого блока 108_1 выборок и второго набора 124_2 (M) элементов разрешения (LCST-коэффициентов) (Xi(k), 0≤k≤M-1) для второго блока 108_2 выборок.

Каскад 104 каскадного перекрывающегося критически дискретизированного преобразования может содержать второй каскад 126 перекрывающегося критически дискретизированного преобразования, выполненный с возможностью выполнения перекрывающегося критически дискретизированного преобразования для сегмента 128_1,1 (собственного поднабора) (Xv,i-1(k)) первого набора 124_1 элементов разрешения и выполнения перекрывающегося критически дискретизированного преобразования для сегмента 128_2,1 (собственного поднабора) (Xv,i(k)) второго набора 124_2 элементов разрешения, причем каждый сегмент ассоциирован с поддиапазоном частот аудиосигнала 102, для получения набора 110_1,1 поддиапазонных выборок [ŷv,i-1(m)] для первого набора 124_1 элементов разрешения и набора 110_2,1 поддиапазонных выборок (ŷv,i(m)) для второго набора 124_2 элементов разрешения.

Фиг. 3 показывает принципиальную блок-схему аудиопроцессора 100, выполненного с возможностью обработки аудиосигнала 102 для получения поддиапазонного представления аудиосигнала, согласно дополнительному варианту осуществления. Другими словами, фиг. 3 показывает схему гребенки аналитических фильтров. В силу этого, предполагаются соответствующие функции кодирования со взвешиванием. Следует отметить, что для простоты, на фиг. 3 указывается (только) обработка первой половины поддиапазонного кадра (y[m], 0<=m<N/2) (т.е. только первая строка уравнения (6)).

Как показано на фиг. 3, первый каскад 120 перекрывающегося критически дискретизированного преобразования может быть выполнен с возможностью выполнения первого перекрывающегося критически дискретизированного преобразования 122_1 (например, MDCT i-1) для первого блока 108_1 (2M) выборок (xi-1(n), 0≤n≤2M-1) для получения первого набора 124_1 (M) элементов разрешения (LCST-коэффициентов) (Xi-1(k), 0≤k≤M-1) для первого блока 108_1 выборок, и выполнения второго перекрывающегося критически дискретизированного преобразования 122_2 (например, MDCT i) для второго блока 108_2 (2M) выборок (xi(n), 0≤n≤2M-1) для получения второго набора 124_2 (M) элементов разрешения (LCST-коэффициентов) (Xi(k), 0≤k≤M-1) для второго блока 108_2 выборок.

Подробно, второй каскад 126 перекрывающегося критически дискретизированного преобразования может быть выполнен с возможностью выполнения перекрывающихся критически дискретизированных преобразований по меньшей мере для двух частично перекрывающихся сегментов 128_1,1 и 128_1,2 (собственных поднаборов) (Xv,i-1(k)) первого набора 124_1 элементов разрешения и выполнения перекрывающихся критически дискретизированных преобразований по меньшей мере для двух частично перекрывающихся сегментов 128_2,1 и 128_2,2 (собственных поднаборов) (Xv,i(k)) второго набора элементов разрешения, причем каждый сегмент ассоциирован с поддиапазоном частот аудиосигнала, для получения по меньшей мере двух наборов 110_1,1 и 110_1,2 поддиапазонных выборок (ŷv,i-1(m)) для первого набора 124_1 элементов разрешения и по меньшей мере двух наборов 110_2,1 и 110_2,2 поддиапазонных выборок (ŷv,i(m)) для второго набора 124_2 элементов разрешения.

Например, первый набор 110_1,1 поддиапазонных выборок может представлять собой результат первого перекрывающегося критически дискретизированного преобразования 132_1,1 на основе первого сегмента 132_1,1 первого набора 124_1 элементов разрешения, при этом второй набор 110_1,2 поддиапазонных выборок может представлять собой результат второго перекрывающегося критически дискретизированного преобразования 132_1,2 на основе второго сегмента 128_1,2 первого набора 124_1 элементов разрешения, при этом третий набор 110_2,1 поддиапазонных выборок может представлять собой результат третьего перекрывающегося критически дискретизированного преобразования 132_2,1 на основе первого сегмента 128_2,1 второго набора 124_2 элементов разрешения, при этом четвертый набор 110_2,2 поддиапазонных выборок может представлять собой результат четвертого перекрывающегося критически дискретизированного преобразования 132_2,2 на основе второго сегмента 128_2,2 второго набора 124_2 элементов разрешения.

В силу этого, каскад 106 уменьшения наложения спектров во временной области может быть выполнен с возможностью выполнения комбинирования со взвешиванием первого набора 110_1,1 поддиапазонных выборок и третьего набора 110_2,1 поддиапазонных выборок для получения первого поддиапазонного представления 112_1 с уменьшенным наложением спектров (y1,i[m1]) аудиосигнала, при этом каскад 106 уменьшения наложения спектров в области может быть выполнен с возможностью выполнения комбинирования со взвешиванием второго набора 110_1,2 поддиапазонных выборок и четвертого набора 110_2,2 поддиапазонных выборок для получения второго поддиапазонного представления 112_2 с уменьшенным наложением спектров (y2,i[m2]) аудиосигнала.

Фиг. 4 показывает принципиальную блок-схему аудиопроцессора 200 для обработки поддиапазонного представления аудиосигнала для получения аудиосигнала 102 согласно варианту осуществления. Аудиопроцессор 200 содержит каскад 202 обратного уменьшения наложения спектров во временной области (TDAR) и каскад 204 каскадного обратного перекрывающегося критически дискретизированного преобразования (LCST).

Каскад 202 обратного уменьшения наложения спектров во временной области выполнен с возможностью выполнения комбинирования со взвешиванием (и сдвигом) двух соответствующих поддиапазонных представлений 112_1 и 112_2 с уменьшенным наложением спектров (yv,i(m), yv,i-1(m)) аудиосигнала 102 для получения поддиапазонного представления 110_1 с наложением спектров (ŷv,i(m)), при этом поддиапазонное представление с наложением спектров представляет собой набор 110_1 поддиапазонных выборок.

Каскад 204 каскадного обратного перекрывающегося критически дискретизированного преобразования выполнен с возможностью выполнения каскадного обратного перекрывающегося критически дискретизированного преобразования для набора 110_1 поддиапазонных выборок для получения набора выборок, ассоциированных с блоком 108_1 выборок аудиосигнала 102.

Фиг. 5 показывает принципиальную блок-схему аудиопроцессора 200 для обработки поддиапазонного представления аудиосигнала для получения аудиосигнала 102 согласно дополнительному варианту осуществления. Каскад 204 каскадного обратного перекрывающегося критически дискретизированного преобразования может содержать первый каскад 208 обратного перекрывающегося критически дискретизированного преобразования (LCST) и первый каскад 210 суммирования с перекрытием.

Первый каскад 208 обратного перекрывающегося критически дискретизированного преобразования может быть выполнен с возможностью выполнения обратного перекрывающегося критически дискретизированного преобразования для набора 110_1,1 поддиапазонных выборок для получения набора 128_1,1 элементов разрешения, ассоциированных с данной поддиапазоном частот аудиосигнала (v,i(k)).

Первый каскад 210 суммирования с перекрытием может быть выполнен с возможностью выполнения конкатенации наборов элементов разрешения, ассоциированных с множеством поддиапазонов частот аудиосигнала, что содержит комбинирование со взвешиванием набора 128_1,1 элементов (v,i(k)) разрешения, ассоциированных с данной поддиапазоном (v) частот аудиосигнала 102, с набором 128_1,2 элементов (v-1,(k)) разрешения, ассоциированных с другой поддиапазоном (v-1) частот аудиосигнала 102, для получения набора 124_1 элементов разрешения, ассоциированных с блоком 108_1 выборок аудиосигнала 102.

Как показано на фиг. 5, каскад 204 каскадного обратного перекрывающегося критически дискретизированного преобразования может содержать второй каскад 212 обратного перекрывающегося критически дискретизированного преобразования (LCST), выполненный с возможностью выполнения обратного перекрывающегося критически дискретизированного преобразования для набора 124_1 элементов разрешения, ассоциированных с блоком 108_1 выборок аудиосигнала 102, для получения набора 206_1,1 выборок, ассоциированных с блоком 108_1 выборок аудиосигнала 102.

Кроме того, каскад 204 каскадного обратного перекрывающегося критически дискретизированного преобразования может содержать второй каскад 214 суммирования с перекрытием, выполненный с возможностью суммирования с перекрытием набора 206_1,1 выборок, ассоциированных с блоком 108_1 выборок аудиосигнала 102, и другого набора 206_2,1 выборок, ассоциированных с другим блоком 108_2 выборок аудиосигнала, причем блок 108_1 выборок и другой блок 108_2 выборок аудиосигнала 102 частично перекрываются, для получения аудиосигнала 102.

Фиг. 6 показывает принципиальную блок-схему аудиопроцессора 200 для обработки поддиапазонного представления аудиосигнала для получения аудиосигнала 102 согласно дополнительному варианту осуществления. Другими словами, фиг. 6 показывает схему гребенки синтезирующих фильтров. В силу этого, предполагаются соответствующие функции кодирования со взвешиванием. Следует отметить, что для простоты, на фиг. 6 указывается (только) обработка первой половины поддиапазонного кадра (y[m], 0<=m<N/2) (т.е. только первая строка уравнения (6)).

Как описано выше, аудиопроцессор 200 содержит каскад 202 обратного уменьшения наложения спектров во временной области и каскад 204 обратного каскадного перекрывающегося критически дискретизированного преобразования, содержащий первый каскад 208 обратного перекрывающегося критически дискретизированного преобразования и второй каскад 212 обратного перекрывающегося критически дискретизированного преобразования.

Каскад 104 обратного уменьшения во временной области выполнен с возможностью выполнения первого комбинирования 220_1 со взвешиванием и сдвигом первого и второго поддиапазонных представлений y1,i-1[m1] и y1,i[m1] с уменьшенным наложением спектров для получения первого поддиапазонного представления 110_1,1 ŷ1,i[m1] с наложением спектров, при этом поддиапазонное представление с наложением спектров представляет собой набор поддиапазонных выборок, и выполнения второго комбинирования 220_2 со взвешиванием и сдвигом третьего и четвертого поддиапазонных представлений y2,i-1[m1] и y2,i[m1] с уменьшенным наложением спектров для получения второго поддиапазонного представления 110_2,1 ŷ2,i[m1] с наложением спектров, при этом поддиапазонное представление с наложением спектров представляет собой набор поддиапазонных выборок.

Первый каскад 208 обратного перекрывающегося критически дискретизированного преобразования выполнен с возможностью выполнения первого обратного перекрывающееся критически дискретизированного преобразования 222_1 для первого набора 110_1,1 ŷ1,i[m1] поддиапазонных выборок для получения набора 128_1,1 элементов разрешения, ассоциированных с данной поддиапазоном частот аудиосигнала (1,1(k)), и выполнения второго обратного перекрывающегося критически дискретизированного преобразования 222_2 для второго набора 110_2,1 ŷ2,i[m1] поддиапазонных выборок для получения набора 128_2,1 элементов разрешения, ассоциированных с данным поддиапазоном частот аудиосигнала (2,1(k)).

Второй каскад 212 обратного перекрывающегося критически дискретизированного преобразования выполнен с возможностью выполнения обратного перекрывающегося критически дискретизированного преобразования для перекрывающегося и добавленного набора элементов разрешения, полученных посредством перекрытия и добавления наборов 128_1,1 и 128_2,1 элементов разрешения, обеспеченных первым каскадом 208 обратного перекрывающегося критически дискретизированного преобразования, для получения блока 108_2 выборок.

Ниже описаны варианты осуществления аудиопроцессоров, показанных на фиг. 1-6, в которых в качестве примера предполагается, что каскад 104 каскадного перекрывающегося критически дискретизированного преобразования представляет собой MDCT-каскад, т.е. первый и второй каскады 120 и 126 перекрывающегося критически дискретизированного преобразования представляют собой MDCT-каскады, и каскад 204 обратного каскадного перекрывающегося критически дискретизированного преобразования представляет собой обратный каскадный MDCT-каскад, т.е. первый и второй каскады обратного перекрывающегося критически дискретизированного преобразования 120 и 126 представляют собой обратные MDCT-каскады. Естественно, нижеприведенное описание также является применимым к другим вариантам осуществления каскада 104 каскадного перекрывающегося критически дискретизированного преобразования и каскада 204 обратного перекрывающегося критически дискретизированного преобразования, к примеру, к каскадном MDST- или MLT-каскаду или к обратному каскадному MDST- или MLT-каскаду.

В силу этого, описанные варианты осуществления могут работать для последовательности MDCT-спектров ограниченной длины и использовать MDCT и уменьшение наложения спектров во временной области (TDAR) в качестве операции поддиапазонного объединения. Результирующая неравномерная гребенка фильтров является перекрывающейся, ортогональной и обеспечивает поддиапазонные ширины k=2n с n∈N. Вследствие TDAR, может достигаться временно и спектрально более компактная поддиапазонная импульсная характеристика.

Ниже описаны варианты осуществления гребенки фильтров.

Реализация гребенки фильтров непосредственно основана на общих схемах перекрывающегося MDCT-преобразования: Исходное преобразование с перекрытием и кодированием со взвешиванием остается неизменным.

Без потери общности, следующая система обозначений допускает ортогональные MDCT-преобразования, например, в которых функции аналитического и синтезирующего кодирования со взвешиванием являются одинаковыми.

(1)

, (2)

где является ядром MDCT-преобразования, и является подходящей функцией аналитического кодирования со взвешиванием

. (3)

Вывод этого преобразования после этого сегментируется на поддиапазонов частот с отдельными ширинами и преобразуется снова с использованием MDCT. Это приводит к гребенке фильтров с перекрытием во временном и спектральном направлении.

Для упрощения системы обозначений в данном документе, используется один общий коэффициент N объединения для всех поддиапазонов частот; тем не менее, любое допустимое переключение/упорядочение функции MDCT-кодирования со взвешиванием может использоваться для того, чтобы реализовывать требуемое частотно-временное разрешение. Ниже содержится дополнительная информация относительно проектирования разрешения.

(4)

, (5)

где является подходящей функцией аналитического кодирования со взвешиванием и, в общем, отличается от по размеру и может отличаться по типу функции кодирования со взвешиванием. Поскольку варианты осуществления применяют функцию кодирования со взвешиванием в частотной области, следует заметить, что временная и частотная избирательность функции кодирования со взвешиванием переставляются.

Для надлежащей обработки границ, дополнительное смещение в N/2 может вводиться в уравнении (4), комбинированном с прямоугольными половинами начального/конечного окна кодирования со взвешиванием на границах. Также для упрощения системы обозначений, это смещение не учитывается здесь.

Вывод представляет собой список векторов отдельных длин коэффициентов с соответствующими полосами пропускания и временным разрешением, пропорциональным этой полосе пропускания.

Тем не менее, эти векторы содержат наложение спектров из исходного MDCT-преобразования и в силу этого демонстрируют плохую временную компактность. Чтобы компенсировать это наложение спектров, TDAR может упрощаться.

Выборки, используемые для TDAR, извлекаются из двух смежных блоков поддиапазонных выборок в текущем и предыдущем MDCT-кадре и . Результат представляет собой уменьшенное наложение спектров во второй половине предыдущего кадра и в первой половине второго кадра.

(6)

для с:

(7)

TDAR-коэффициенты , , и могут быть спроектированы с возможностью минимизации остаточного наложения спектров. Ниже вводится простой способ оценки на основе функции синтезирующего кодирования со взвешиванием.

Также следует отметить, что, если A является несингулярным, операции (6) и (8) соответствуют биортогональной системе. Кроме того, если и , например, оба MDCT являются ортогональными, и матрица A является ортогональной, полный конвейер составляет ортогональное преобразование.

Чтобы вычислять обратное преобразование, выполняется первое обратное TDAR,

(8)

после которого выполняется обратное MDCT, и должно выполняться подавление наложения спектров во временной области (TDAC, хотя подавление наложения спектров здесь осуществляется вдоль частотной оси), для подавления наложения спектров, сформированное в уравнении 5:

В завершение, начальное MDCT в уравнении 2 инвертируется, и снова выполняется TDAC:

Ниже описаны проектные ограничения частотно-временного разрешения. Хотя любое требуемое частотно-временное разрешение является возможным, некоторые ограничения для проектирования результирующих функций кодирования со взвешиванием должны соблюдаться с тем, чтобы обеспечивать обратимость. В частности, наклоны двух смежных поддиапазонов частот могут быть симметричными таким образом, что уравнение (6) удовлетворяет условию Принцена-Брэдли [J. Princen, A. Johnson и A. Bradley, "Subband/transform coding using filter bank designs based on time domain aliasing cancellation", in Acoustics, Speech and Signal Processing, IEEE International Conference on ICASSP '87, апрель 1987 г., издание 12, стр. 2161-2164]. Здесь может применяться схема переключения окон кодирования со взвешиванием, введенная в [B. Edler, "Codierung von Audiosignalen mit überlappender Transformation und adaptiven Fensterfunktionen", Frequenz, издание 43, стр. 252-256, сентябрь 1989 г.], первоначально разработанная с возможностью противостояния эффектам опережающего эхо. См. [Olivier Derrien, Thibaud Necciari и Peter Balazs, "A quasi-orthogonal, invertible and perceptually relevant time-frequency transform for audio coding", in EUSIPCO, Ницца, Франция, август 2015 г.].

Во-вторых, сумма всех длин вторых MDCT-преобразований должна составлять в сумме общую длину обеспечиваемых MDCT-коэффициентов. Диапазоны частот могут выбираться с возможностью не преобразовываться с использованием единичной ступенчатой функции кодирования со взвешиванием с нулями в требуемых коэффициентах. Тем не менее, должны отслеживаться свойства симметрии соседних функций кодирования со взвешиванием [B. Edler, "Codierung von Audiosignalen mit überlappender Transformation und adaptiven Fensterfunktionen", Frequenz, издание 43, стр. 252-256, сентябрь 1989 г.]. Результирующее преобразование должно давать в результате нули в этих диапазонах частот, так что исходные коэффициенты могут непосредственно использоваться.

В качестве возможного частотно-временного разрешения, могут непосредственно использоваться диапазоны частот коэффициентов масштабирования из наиболее современных аудиокодеров.

Ниже описано вычисление коэффициентов уменьшения наложения спектров во временной области (TDAR).

Согласно вышеуказанному временному разрешению, каждая поддиапазонная выборка соответствует исходных выборок или интервалу , умноженному на размер, в качестве одной исходной выборки.

Кроме того, величина наложения спектров в каждой поддиапазонной выборке зависит от величины наложения спектров в интервале, который она представляет. Поскольку наложение спектров взвешивается с помощью функции аналитического кодирования со взвешиванием, использование приближенного значения функции синтезирующего кодирования со взвешиванием в каждом интервале поддиапазонной выборки предполагается в качестве хорошей первой оценки для TDAR-коэффициента.

Эксперименты демонстрируют, что две очень простых схемы вычисления коэффициентов обеспечивают хорошие начальные значения с улучшенной временной и спектральной компактностью. Оба способа основаны на гипотетической функции синтезирующего кодирования со взвешиванием длины .

1) Для параметрических функций кодирования со взвешиванием, таких как синусоидальные или производные методом Кайзера-Бесселя, может задаваться простое более короткое окно кодирования со взвешиванием одинакового типа.

2) Как для параметрических, так и для табличных функций кодирования со взвешиванием без закрытого представления, окно может разделяться на секций равного размера, обеспечивая возможность получения коэффициентов с использованием среднего значения каждой секции:

(15)

С учетом граничных MDCT-условий и зеркалирования наложения спектров, в таком случае в результате получаются TDAR-коэффициенты:

(16)

(17)

(18)

(19)

или в случае ортогонального преобразования:

(20)

. (21)

Независимо от того, какое решение по аппроксимации коэффициентов выбрано, при условии, что A является несингулярным, идеальное восстановление всей гребенки фильтров сохраняется. В других отношениях субоптимальный выбор коэффициентов должен затрагивать только величину остаточного наложения спектров в поддиапазонном сигнале ; тем не менее, не в сигнале , синтезированном посредством гребенки обратных фильтров.

Фиг. 7 показывает на схемах пример поддиапазонных выборок (верхний график) и распределение их выборок по времени и частоте (нижний график). Снабженная примечаниями выборка имеет более широкую полосу пропускания, но меньшее распределение по времени, чем нижние выборки. Функции аналитического кодирования со взвешиванием (нижний график) имеют полное разрешение одного коэффициента в расчете на исходную временную выборку. TDAR-коэффициенты в силу этого должны быть аппроксимированы (отмечены точкой) для каждой временной области поддиапазонных выборок (m=256:::384).

Ниже описаны результаты (моделирования).

Фиг. 8 показывает спектральную и временную неопределенность, полученную посредством нескольких различных преобразований, как показано в [Frederic Bimbot, Ewen Camberlein и Pierrick Philippe, "Adaptive filter banks using fixed size mdct and subband merging for audio coding-comparison with the mpeg aac filter banks", in Audio Engineering Society Convention, октябрь 2006 года].

Можно видеть, что преобразования на основе матрицы Адамара предлагают сильно ограниченные характеристики частотно-временного компромисса. Для растущих размеров объединения, дополнительное временное разрешение приводит к непропорционально высоким затратам в спектральной неопределенности.

Другими словами, фиг. 8 показывает сравнение спектрального и временного энергетического уплотнения различных преобразований. Встроенные метки обозначают длины кадров для MDCT, коэффициенты разбиения для разбиения Гейзенберга и коэффициенты объединения для всего остального.

Тем не менее, поддиапазонное объединение с TDAR имеет линейный компромисс между временной и спектральной неопределенностью, параллельно простому равномерному MDCT. Их произведение является постоянным, хотя немного выше, чем простое равномерное MDCT. Для этого анализа, синусоидальная функция аналитического кодирования со взвешиванием и производная методом Кайзера-Бесселя функция кодирования со взвешиванием при поддиапазонном объединении демонстрируют наиболее компактные результаты и в силу этого выбираются.

Тем не менее, кажется, что использование TDAR для коэффициента объединения снижает временную и спектральную компактность. Это обусловлено тем, что схема вычисления коэффициентов, введенная в разделе II-B, является слишком упрощенной и не аппроксимирует надлежащим образом значения для крутых наклонов функции кодирования со взвешиванием. Схема числовой оптимизации должна представляться в последующей публикации.

Эти значения компактности вычислены с использованием центра cog тяжести и эффективной длины квадратной формы импульсной характеристики , заданной как [Athanasios Papoulis, "Signal analysis", Electrical and electronic engineering series, McGraw-Hill, Нью-Йорк, Сан-Франциско, Париж, 1977 год]

Показаны средние значения всех импульсных характеристик каждой отдельной гребенки фильтров.

Фиг. 9 показывает сравнение двух примерных импульсных характеристик, сформированных посредством поддиапазонного объединения с и без TDAR, простых коротких MDCT-блоков и поддиапазонного объединения на основе матрицы Адамара, как предложено в [O.A. Niamut и R. Heusdens, "Flexible frequency decompositions for cosine-modulated filter banks", in Acoustics, Speech and Signal Processing, 2003. Proceedings (ICASSP '03), 2003 IEEE International Conference on, апрель 2003 года, издание 5, стр. V-449-52, издание 5].

Плохая временная компактность преобразования с объединением на основе матрицы Адамара является четко видимой. Также можно четко видеть, что большинство артефактов наложения спектров в поддиапазоне частот значительно уменьшаются посредством TDAR.

Другими словами, фиг. 9 показывает примерные импульсные характеристики объединенного поддиапазонного фильтра, содержащего 8 из 1024 исходных элементов разрешения, с использованием способа, предложенного здесь без TDAR, с TDAR, способа, предложенного в [O.A. Niamut и R. Heusdens, "Subband merging in cosine-modulated filter banks", Signal Processing Letters, IEEE, издание 10, № 4, стр. 111-114, апрель 2003 года], и с использованием меньшей длины MDCT-кадра в 256 выборок.

Фиг. 10 показывает блок-схему способа 300 обработки аудиосигнала для получения поддиапазонного представления аудиосигнала. Способ 300 содержит этап 302 выполнения каскадного перекрывающегося критически дискретизированного преобразования по меньшей мере для двух частично перекрывающихся блоков выборок аудиосигнала для получения набора поддиапазонных выборок на основе первого блока выборок аудиосигнала и получения соответствующего набора поддиапазонных выборок на основе второго блока выборок аудиосигнала. Кроме того, способ 300 содержит этап 304 выполнения комбинирования со взвешиванием двух соответствующих наборов поддиапазонных выборок, причем один из них получен на основе первого блока выборок аудиосигнала, и один из них получен на основе второго блока выборок аудиосигнала для получения поддиапазонного представления с уменьшенным наложением спектров аудиосигнала.

Фиг. 11 показывает блок-схему способа 400 обработки поддиапазонного представления аудиосигнала для получения аудиосигнала. Способ 400 содержит этап 402 выполнения комбинирования со взвешиванием (и сдвигом) двух соответствующих поддиапазонных представлений с уменьшенным наложением спектров (различных блоков частично перекрывающихся выборок) аудиосигнала для получения поддиапазонного представления с наложением спектров, при этом поддиапазонное представление с наложением спектров представляет собой набор поддиапазонных выборок. Кроме того, способ 400 содержит этап 404 выполнения каскадного обратного перекрывающегося критически дискретизированного преобразования для набора поддиапазонных выборок для получения набора выборок, ассоциированных с блоком выборок аудиосигнала.

Фиг. 12 показывает принципиальную блок-схему аудиокодера 150, согласно варианту осуществления. Аудиокодер 150 содержит аудиопроцессор (100), как описано выше, кодер 152, выполненный с возможностью кодирования поддиапазонного представления с уменьшенным наложением спектров аудиосигнала для получения кодированного поддиапазонного представления с уменьшенным наложением спектров аудиосигнала, и модуль 154 формирования потоков битов, выполненный с возможностью формирования потока 156 битов из кодированного поддиапазонного представления с уменьшенным наложением спектров аудиосигнала.

Фиг. 13 показывает принципиальную блок-схему аудиодекодера 250, согласно варианту осуществления. Аудиодекодер 250 содержит синтаксический анализатор 252 потоков битов, выполненный с возможностью синтаксического анализа потока 154 битов для получения кодированного поддиапазонного представления с уменьшенным наложением спектров, декодер 254, выполненный с возможностью декодирования кодированного поддиапазонного представления с уменьшенным наложением спектров для получения поддиапазонного представления с уменьшенным наложением спектров аудиосигнала, и аудиопроцессор 200, как описано выше.

Фиг. 14 показывает принципиальную блок-схему аудиоанализатора 180, согласно варианту осуществления. Аудиоанализатор 180 содержит аудиопроцессор 100, как описано выше, модуль 182 извлечения информации, выполненный с возможностью анализа поддиапазонного представления с уменьшенным наложением спектров для обеспечения информации, описывающей аудиосигнал.

Варианты осуществления обеспечивают уменьшение наложения спектров во временной области (TDAR) в поддиапазонах частот гребенок фильтров неравномерного ортогонального модифицированного дискретного косинусного преобразования (MDCT).

Варианты осуществления добавляют дополнительный этап постобработки в широко используемый конвейер MDCT-преобразования, причем непосредственно этап содержит только другое перекрывающееся MDCT-преобразование вдоль частотной оси и уменьшение наложения спектров во временной области (TDAR) вдоль каждой поддиапазонной временной оси, обеспечивая возможность извлекать произвольные шкалы частот из MDCT-спектрограммы с улучшенной временной компактностью импульсной характеристики, при отсутствии введения дополнительной избыточности и только одной кадровой MDCT-задержки.

Хотя некоторые аспекты описаны в контексте устройства, очевидно, что эти аспекты также представляют описание соответствующего способа, при этом блок или устройство соответствует этапу способа либо признаку этапа способа. Аналогично, аспекты, описанные в контексте этапа способа, также представляют описание соответствующего блока или элемента, или признака соответствующего устройства. Некоторые или все этапы способа могут быть выполнены посредством (или с использованием) устройства, такого как, например, микропроцессор, программируемый компьютер либо электронная схема. В некоторых вариантах осуществления, один или более наиболее важных этапов способа могут выполняться посредством этого устройства.

В зависимости от определенных требований к реализации, варианты осуществления изобретения могут быть реализованы в аппаратных средствах или в программном обеспечении. Реализация может выполняться с использованием цифрового носителя хранения данных, например, гибкого диска, DVD, Blu-Ray, CD, ROM, PROM, EPROM, EEPROM или флэш-памяти, имеющего сохраненные электронно считываемые управляющие сигналы, которые взаимодействуют (или допускают взаимодействие) с программируемой компьютерной системой, так что осуществляется соответствующий способ. Следовательно, цифровой носитель хранения данных может быть машиночитаемым.

Некоторые варианты осуществления согласно изобретению содержат носитель данных, имеющий электронночитаемые управляющие сигналы, которые допускают взаимодействие с программируемой компьютерной системой таким образом, что осуществляется один из способов, описанных в данном документе.

В общем, варианты осуществления настоящего изобретения могут быть реализованы как компьютерный программный продукт с программным кодом, при этом программный код выполнен с возможностью осуществления одного из способов, когда компьютерный программный продукт работает на компьютере. Программный код, например, может сохраняться на машиночитаемом носителе.

Другие варианты осуществления содержат компьютерную программу для осуществления одного из способов, описанных в данном документе, сохраненную на машиночитаемом носителе.

Другими словами, вариант осуществления изобретаемого способа в силу этого представляет собой компьютерную программу, имеющую программный код для осуществления одного из способов, описанных в данном документе, когда компьютерная программа работает на компьютере.

Следовательно, дополнительный вариант осуществления изобретаемых способов представляет собой носитель хранения данных (цифровой носитель хранения данных или машиночитаемый носитель), содержащий записанную компьютерную программу для осуществления одного из способов, описанных в данном документе. Носитель данных, цифровой носитель хранения данных или носитель с записанными данными типично является материальным и/или энергонезависимым.

Следовательно, дополнительный вариант осуществления изобретаемого способа представляет собой поток данных или последовательность сигналов, представляющих компьютерную программу для осуществления одного из способов, описанных в данном документе. Поток данных или последовательность сигналов, например, может быть выполнена с возможностью передачи через соединение для передачи данных, например, через Интернет.

Дополнительный вариант осуществления содержит средство обработки, например, компьютер или программируемое логическое устройство, выполненное с возможностью осуществления одного из способов, описанных в данном документе.

Дополнительный вариант осуществления содержит компьютер, имеющий установленную компьютерную программу для осуществления одного из способов, описанных в данном документе.

Дополнительный вариант осуществления согласно изобретению содержит устройство или систему, выполненную с возможностью передачи (например, электронным или оптическим способом) компьютерной программы для осуществления одного из способов, описанных в данном документе, в приемное устройство. Приемное устройство, например, может представлять собой компьютер, мобильное устройство, запоминающее устройство и т.п. Устройство или система, например, может содержать файловый сервер для передачи компьютерной программы в приемное устройство.

В некоторых вариантах осуществления, программируемое логическое устройство (например, программируемая пользователем вентильная матрица) может использоваться для того, чтобы выполнять часть или все из функциональностей способов, описанных в данном документе. В некоторых вариантах осуществления, программируемая пользователем вентильная матрица может взаимодействовать с микропроцессором, чтобы осуществлять один из способов, описанных в данном документе. В общем, способы предпочтительно осуществляются посредством любого аппаратного устройства.

Устройство, описанное в данном документе, может реализовываться с использованием аппаратного устройства либо с использованием компьютера, либо с использованием комбинации аппаратного устройства и компьютера.

Устройство, описанное в данном документе, или любые компоненты устройства, описанного в данном документе, могут реализовываться по меньшей мере частично в аппаратных средствах и/или в программном обеспечении.

Способы, описанные в данном документе, могут осуществляться с использованием аппаратного устройства либо с использованием компьютера, либо с использованием комбинации аппаратного устройства и компьютера.

Способы, описанные в данном документе, или любые компоненты устройства, описанного в данном документе, могут быть реализованы по меньшей мере частично посредством аппаратных средств и/или посредством программного обеспечения.

Вышеописанные варианты осуществления являются лишь иллюстративными в отношении принципов настоящего изобретения. Следует понимать, что модификации и изменения конструкций и подробностей, описанных в данном документе, должны быть очевидными для специалистов в данной области техники. Таким образом, подразумевается ограничение лишь объемом нижеприведенной формулы изобретения, а не конкретными подробностями, представленными в описании и пояснении вариантов осуществления в данном документе.

1. Аудиопроцессор (100) для обработки аудиосигнала (102) для получения поддиапазонного представления аудиосигнала (102), причем аудиопроцессор (100) содержит:

- каскад (104) каскадного перекрывающегося критически дискретизированного преобразования, выполненный с возможностью выполнения каскадного перекрывающегося критически дискретизированного преобразования по меньшей мере для двух частично перекрывающихся блоков (108_1; 108_2) выборок аудиосигнала (102) для получения набора (110_1,1) поддиапазонных выборок на основе первого блока (108_1) выборок аудиосигнала (102) и получения соответствующего набора (110_2,1) поддиапазонных выборок на основе второго блока (108_2) выборок аудиосигнала (102); и

- каскад (106) уменьшения наложения спектров во временной области, выполненный с возможностью выполнения комбинирования со взвешиванием двух соответствующих наборов (110_1,1; 110_1,2) поддиапазонных выборок, причем один из них получен на основе первого блока (108_1) выборок аудиосигнала (102), и один из них получен на основе второго блока (108_2) выборок аудиосигнала, для получения поддиапазонного представления (112_1) с уменьшенным наложением спектров аудиосигнала (102);

при этом каскад (104) каскадного перекрывающегося критически дискретизированного преобразования содержит:

- первый каскад (120) перекрывающегося критически дискретизированного преобразования, выполненный с возможностью выполнения перекрывающихся критически дискретизированных преобразований для первого блока (108_1) выборок и второго блока (108_2) выборок по меньшей мере из двух частично перекрывающихся блоков (108_1; 108_2) выборок аудиосигнала (102), для получения первого набора (124_1) элементов разрешения для первого блока (108_1) выборок и второго набора (124_2) элементов разрешения для второго блока (108_2) выборок;

при этом каскад (104) каскадного перекрывающегося критически дискретизированного преобразования дополнительно содержит:

- второй каскад (126) перекрывающегося критически дискретизированного преобразования, выполненный с возможностью выполнения перекрывающегося критически дискретизированного преобразования для сегмента (128_1,1) первого набора (124_1) элементов разрешения и выполнения перекрывающегося критически дискретизированного преобразования для сегмента (128_2,1) второго набора (124_2) элементов разрешения, причем каждый сегмент ассоциирован с поддиапазоном частот аудиосигнала (102), для получения набора (110_1,1) поддиапазонных выборок для первого набора элементов разрешения и набора (110_2,1) поддиапазонных выборок для второго набора элементов разрешения;

при этом первый набор (110_1,1) поддиапазонных выборок представляет собой результат первого перекрывающегося критически дискретизированного преобразования (132_1,1) на основе первого сегмента (128_1,1) первого набора (124_1) элементов разрешения, при этом второй набор (110_1,2) поддиапазонных выборок представляет собой результат второго перекрывающегося критически дискретизированного преобразования (132_1,2) на основе второго сегмента (128_1,2) первого набора (124_1) элементов разрешения, при этом третий набор (110_2,1) поддиапазонных выборок представляет собой результат третьего перекрывающегося критически дискретизированного преобразования (132_2,1) на основе первого сегмента (128_2,1) второго набора (128_2,1) элементов разрешения, при этом четвертый набор (110_2,2) поддиапазонных выборок представляет собой результат четвертого перекрывающегося критически дискретизированного преобразования (132_2,2) на основе второго сегмента (128_2,2) второго набора (128_2,1) элементов разрешения; и

- при этом каскад (106) уменьшения наложения спектров во временной области выполнен с возможностью выполнения комбинирования со взвешиванием первого набора (110_1,1) поддиапазонных выборок и третьего набора (110_2,1) поддиапазонных выборок для получения первого поддиапазонного представления (112_1) с уменьшенным наложением спектров аудиосигнала, при этом каскад (106) уменьшения наложения спектров во временной области выполнен с возможностью выполнения комбинирования со взвешиванием второго набора (110_1,2) поддиапазонных выборок и четвертого набора (110_2,2) поддиапазонных выборок для получения второго поддиапазонное представление (112_2) с уменьшенным наложением спектров аудиосигнала.

2. Аудиопроцессор (100) по п. 1, в котором каскад (104) каскадного перекрывающегося критически дискретизированного преобразования выполнен с возможностью сегментирования набора (124_1) элементов разрешения, полученных на основе первого блока (108_1) выборок с использованием по меньшей мере двух функций кодирования со взвешиванием, и получения по меньшей мере двух сегментированных наборов (128_1,1; 128_1,2) поддиапазонных выборок на основе сегментированного набора элементов разрешения, соответствующих первому блоку (108_1) выборок;

- при этом каскад (104) каскадного перекрывающегося критически дискретизированного преобразования выполнен с возможностью сегментирования набора (124_2) элементов разрешения, полученных на основе второго блока (108_2) выборок с использованием по меньшей мере двух функций кодирования со взвешиванием, и получения по меньшей мере двух сегментированных наборов (128_2,1; 128_2,2) поддиапазонных выборок на основе сегментированного набора элементов разрешения, соответствующих второму блоку (108_2) выборок; и

- при этом по меньшей мере две функции кодирования со взвешиванием содержат различную ширину окна кодирования со взвешиванием.

3. Аудиопроцессор (100) по п. 1, в котором каскад (104) каскадного перекрывающегося критически дискретизированного преобразования выполнен с возможностью сегментирования набора (124_1) элементов разрешения, полученных на основе первого блока (108_1) выборок с использованием по меньшей мере двух функций кодирования со взвешиванием, и получения по меньшей мере двух сегментированных наборов (128_1,1; 128_1,2) поддиапазонных выборок на основе сегментированного набора элементов разрешения, соответствующих первому блоку (108_1) выборок;

- при этом каскад (104) каскадного перекрывающегося критически дискретизированного преобразования выполнен с возможностью сегментирования набора (124_2) элементов разрешения, полученных на основе второго блока (108_2) выборок с использованием по меньшей мере двух функций кодирования со взвешиванием, и получения по меньшей мере двух наборов (128_2,1; 128_2,2) поддиапазонных выборок на основе сегментированного набора элементов разрешения, соответствующих второму блоку (108_2) выборок; и

- при этом наклоны фильтра функций кодирования со взвешиванием, соответствующих смежным наборам поддиапазонных выборок, являются симметричными.

4. Аудиопроцессор (100) по п. 1, в котором каскад (104) каскадного перекрывающегося критически дискретизированного преобразования выполнен с возможностью сегментирования выборок аудиосигнала на первый блок (108_1) выборок и второй блок (108_2) выборок с использованием первой функции кодирования со взвешиванием;

- при этом каскад перекрывающегося критически дискретизированного преобразования (104) выполнен с возможностью сегментирования набора (124_1) элементов разрешения, полученных на основе первого блока (108_1) выборок, и набора (124_2) элементов разрешения, полученных на основе второго блока (108_2) выборок с использованием второй функции кодирования со взвешиванием, для получения соответствующих поддиапазонных выборки; и

- при этом первая функция кодирования со взвешиванием и вторая функция кодирования со взвешиванием содержат различную ширину окна кодирования со взвешиванием.

5. Аудиопроцессор (100) по п. 1, в котором каскад (104) каскадного перекрывающегося критически дискретизированного преобразования выполнен с возможностью сегментирования выборок аудиосигнала на первый блок (108_1) выборок и второй блок (108_2) выборок с использованием первой функции кодирования со взвешиванием;

- при этом каскад (104) каскадного перекрывающегося критически дискретизированного преобразования выполнен с возможностью сегментирования набора (124_1) элементов разрешения, полученных на основе первого блока (108_1) выборок, и набор (124_2) элементов разрешения, полученных на основе второго блока (108_2) выборок с использованием второй функции кодирования со взвешиванием, для получения соответствующих поддиапазонных выборок; и

- при этом ширина окна кодирования со взвешиванием первой функции кодирования со взвешиванием и ширина окна кодирования со взвешиванием второй функции кодирования со взвешиванием отличаются друг от друга, при этом ширина окна кодирования со взвешиванием первой функции кодирования со взвешиванием и ширина окна кодирования со взвешиванием второй функции кодирования со взвешиванием отличаются друг от друга на коэффициент, отличный от степени двух.

6. Аудиопроцессор (100) по п. 1, в котором каскад (106) уменьшения наложения спектров во временной области выполнен с возможностью выполнения комбинирования со взвешиванием двух соответствующих наборов поддиапазонных выборок согласно следующему уравнению:

для с:

,

для получения поддиапазонного представления с уменьшенным наложением спектров аудиосигнала, при этом yv,i(m) представляет собой первое поддиапазонное представление с уменьшенным наложением спектров аудиосигнала, yv,i-1(N-1-m) представляет собой второе поддиапазонное представление с уменьшенным наложением спектров аудиосигнала, ŷv,i(m) представляет собой набор поддиапазонных выборок на основе второго блока выборок аудиосигнала, ŷv,i-1(N-1-m) представляет собой набор поддиапазонных выборок на основе первого блока выборок аудиосигнала, и av(m), bv(m), cv(m) и dv(m) представляют собой коэффициенты уменьшения наложения спектров во временной области, причём N - общий коэффициент объединения, который используется для всех поддиапазонов.

7. Аудиопроцессор (100) для обработки аудиосигнала (102) для получения поддиапазонного представления аудиосигнала (102), причем аудиопроцессор (100) содержит:

- каскад (104) каскадного перекрывающегося критически дискретизированного преобразования, выполненный с возможностью выполнения каскадного перекрывающегося критически дискретизированного преобразования по меньшей мере для двух частично перекрывающихся блоков (108_1; 108_2) выборок аудиосигнала (102) для получения набора (110_1,1) поддиапазонных выборок на основе первого блока (108_1) выборок аудиосигнала (102) и получения соответствующего набора (110_2,1) поддиапазонных выборок на основе второго блока (108_2) выборок аудиосигнала (102); и

- каскад (106) уменьшения наложения спектров во временной области, выполненный с возможностью выполнения комбинирования со взвешиванием двух соответствующих наборов (110_1,1; 110_1,2) поддиапазонных выборок, причем один из них получен на основе первого блока (108_1) выборок аудиосигнала (102), и один из них получен на основе второго блока (108_2) выборок аудиосигнала, для получения поддиапазонного представления (112_1) с уменьшенным наложением спектров аудиосигнала (102);

- при этом каскад (104) каскадного перекрывающегося критически дискретизированного преобразования выполнен с возможностью сегментирования набора (124_1) элементов разрешения, полученных на основе первого блока (108_1) выборок с использованием по меньшей мере двух функций кодирования со взвешиванием, и получения по меньшей мере двух сегментированных наборов (128_1,1; 128_1,2) поддиапазонных выборок на основе сегментированного набора элементов разрешения, соответствующих первому блоку (108_1) выборок;

- при этом каскад (104) каскадного перекрывающегося критически дискретизированного преобразования выполнен с возможностью сегментирования набора (124_2) элементов разрешения, полученных на основе второго блока (108_2) выборок с использованием по меньшей мере двух функций кодирования со взвешиванием, и получения по меньшей мере двух сегментированных наборов (128_2,1; 128_2,2) поддиапазонных выборок на основе сегментированного набора элементов разрешения, соответствующих второму блоку (108_2) выборок; и

- при этом по меньшей мере две функции кодирования со взвешиванием содержат различную ширину окна кодирования со взвешиванием.

8. Аудиопроцессор (100) для обработки аудиосигнала (102) для получения поддиапазонного представления аудиосигнала (102), причем аудиопроцессор (100) содержит:

- каскад (104) каскадного перекрывающегося критически дискретизированного преобразования, выполненный с возможностью выполнения каскадного перекрывающегося критически дискретизированного преобразования по меньшей мере для двух частично перекрывающихся блоков (108_1; 108_2) выборок аудиосигнала (102) для получения набора (110_1,1) поддиапазонных выборок на основе первого блока (108_1) выборок аудиосигнала (102) и получения соответствующего набора (110_2,1) поддиапазонных выборок на основе второго блока (108_2) выборок аудиосигнала (102); и

- каскад (106) уменьшения наложения спектров во временной области, выполненный с возможностью выполнения комбинирования со взвешиванием двух соответствующих наборов (110_1,1; 110_1,2) поддиапазонных выборок, причем один из них получен на основе первого блока (108_1) выборок аудиосигнала (102), и один из них получен на основе второго блока (108_2) выборок аудиосигнала, для получения поддиапазонного представления (112_1) с уменьшенным наложением спектров аудиосигнала (102);

- при этом каскад (104) каскадного перекрывающегося критически дискретизированного преобразования выполнен с возможностью сегментирования набора (124_1) элементов разрешения, полученных на основе первого блока (108_1) выборок с использованием по меньшей мере двух функций кодирования со взвешиванием, и получения по меньшей мере двух сегментированных наборов (128_1,1; 128_1,2) поддиапазонных выборок на основе сегментированного набора элементов разрешения, соответствующих первому блоку (108_1) выборок;

- при этом каскад (104) каскадного перекрывающегося критически дискретизированного преобразования выполнен с возможностью сегментирования набора (124_2) элементов разрешения, полученных на основе второго блока (108_2) выборок с использованием по меньшей мере двух функций кодирования со взвешиванием, и получения по меньшей мере два набора (128_2,1; 128_2,2) поддиапазонных выборок на основе сегментированного набора элементов разрешения, соответствующих второму блоку (108_2) выборок; и

- при этом наклоны фильтра функций кодирования со взвешиванием, соответствующих смежным наборам поддиапазонных выборок, являются симметричными.

9. Аудиопроцессор (200) для обработки поддиапазонного представления аудиосигнала для получения аудиосигнала (102), причем аудиопроцессор (200) содержит:

- каскад (202) обратного уменьшения наложения спектров во временной области, выполненный с возможностью выполнения комбинирования со взвешиванием двух соответствующих поддиапазонных представлений с уменьшенным наложением спектров аудиосигнала (102) для получения поддиапазонного представления с наложением спектров, при этом поддиапазонное представление с наложением спектров представляет собой набор (110_1,1) поддиапазонных выборок; и

- каскад (204) каскадного обратного перекрывающегося критически дискретизированного преобразования, выполненный с возможностью выполнения каскадного обратного перекрывающегося критически дискретизированного преобразования для набора (110_1,1) поддиапазонных выборок для получения набора выборок, ассоциированных с блоком выборок аудиосигнала (102);

- при этом каскад (204) каскадного обратного перекрывающегося критически дискретизированного преобразования содержит первый каскад (208) обратного перекрывающегося критически дискретизированного преобразования, выполненный с возможностью выполнения обратного перекрывающегося критически дискретизированного преобразования для набора (110_1,1) поддиапазонных выборок для получения набора (128_1,1) элементов разрешения, ассоциированного с данным поддиапазоном частот аудиосигнала; и

- первый каскад (210) суммирования с перекрытием, выполненный с возможностью выполнения конкатенации наборов элементов разрешения, ассоциированных с множеством поддиапазонов частот аудиосигнала, что содержит комбинирование со взвешиванием набора (128_1,1) элементов разрешения, ассоциированных с данным поддиапазоном частот аудиосигнала (102), с набором (128_1,2) элементов разрешения, ассоциированных с другим поддиапазоном частот аудиосигнала (102), для получения набора (124_1) элементов разрешения, ассоциированных с блоком выборок аудиосигнала (102).

10. Аудиопроцессор (200) по п. 9, в котором каскад (204) каскадного обратного перекрывающегося критически дискретизированного преобразования содержит второй каскад (212) обратного перекрывающегося критически дискретизированного преобразования, выполненный с возможностью выполнения обратного перекрывающегося критически дискретизированного преобразования для набора (124_1) элементов разрешения, ассоциированных с блоком выборок аудиосигнала (102), для получения набора выборок, ассоциированных с блоком выборок аудиосигнала (102).

11. Аудиопроцессор (200) по п. 10, в котором каскад (204) каскадного обратного перекрывающегося критически дискретизированного преобразования содержит второй каскад (214) суммирования с перекрытием, выполненный с возможностью суммирования с перекрытием набора выборок, ассоциированных с блоком выборок аудиосигнала (102), и другого набора выборок, ассоциированных с другим блоком выборок аудиосигнала (102), причем блок выборок и другой блок выборок аудиосигнала (102) частично перекрываются, для получения аудиосигнала (102).

12. Аудиопроцессор (200) по п. 9, в котором каскад (202) обратного уменьшения наложения спектров во временной области выполнен с возможностью выполнения комбинирования со взвешиванием двух соответствующих поддиапазонных представлений с уменьшенным наложением спектров аудиосигнала (102) на основе следующего уравнения:

для с:

,

для получения поддиапазонного представления с наложением спектров, при этом yv,i(m) представляет собой первое поддиапазонное представление с уменьшенным наложением спектров аудиосигнала, yv,i-1(N-1-m) представляет собой второе поддиапазонное представление с уменьшенным наложением спектров аудиосигнала, ŷv,i(m) представляет собой набор поддиапазонных выборок на основе второго блока выборок аудиосигнала, ŷv,i-1(N-1-m) представляет собой набор поддиапазонных выборок на основе первого блока выборок аудиосигнала, и av(m), bv(m), cv(m) и dv(m) представляют собой коэффициенты уменьшения наложения спектров во временной области, причём N - общий коэффициент объединения, который используется для всех поддиапазонов.

13. Аудиокодер, содержащий:

- аудиопроцессор (100) по п. 1, или 7, или 8;

- кодер, выполненный с возможностью кодирования поддиапазонного представления с уменьшенным наложением спектров аудиосигнала для получения кодированного поддиапазонного представления с уменьшенным наложением спектров аудиосигнала; и

- модуль формирования потоков битов, выполненный с возможностью формирования потока битов из кодированного поддиапазонного представления с уменьшенным наложением спектров аудиосигнала.

14. Аудиодекодер, содержащий:

- синтаксический анализатор потоков битов, выполненный с возможностью синтаксического анализа потока битов для получения кодированного поддиапазонного представления с уменьшенным наложением спектров;

- декодер, выполненный с возможностью декодирования кодированного поддиапазонного представления с уменьшенным наложением спектров для получения поддиапазонного представления с уменьшенным наложением спектров аудиосигнала; и

- аудиопроцессор (200) по п. 9.

15. Аудиоанализатор, содержащий:

- аудиопроцессор (100) по п. 1, или 7, или 8; и

- модуль извлечения информации, выполненный с возможностью анализа поддиапазонного представления с уменьшенным наложением спектров для обеспечения информации, описывающей аудиосигнал.

16. Способ (300) обработки аудиосигнала для получения поддиапазонного представления аудиосигнала, при этом способ содержит этапы, на которых:

- выполняют (302) каскадное перекрывающееся критически дискретизированное преобразование по меньшей мере для двух частично перекрывающихся блоков выборок аудиосигнала для получения набора поддиапазонных выборок на основе первого блока выборок аудиосигнала и получения соответствующего набора поддиапазонных выборок на основе второго блока выборок аудиосигнала; и

- выполняют (304) комбинирование со взвешиванием двух соответствующих наборов поддиапазонных выборок, причем один из них получен на основе первого блока выборок аудиосигнала, и один из них получен на основе второго блока выборок аудиосигнала, для получения поддиапазонного представления с уменьшенным наложением спектров аудиосигнала;

- при этом выполнение (302) каскадного перекрывающегося критически дискретизированного преобразования содержит этап, на котором выполняют перекрывающиеся критически дискретизированные преобразования для первого блока (108_1) выборок и второго блока (108_2) выборок по меньшей мере из двух частично перекрывающихся блоков (108_1; 108_2) выборок аудиосигнала (102) для получения первого набора (124_1) элементов разрешения для первого блока (108_1) выборок и второго набора (124_2) элементов разрешения для второго блока (108_2) выборок;

- при этом выполнение (302) каскадного перекрывающегося критически дискретизированного преобразования содержит этап, на котором выполняют перекрывающееся критически дискретизированное преобразование для сегмента (128_1,1) первого набора (124_1) элементов разрешения и выполняют перекрывающееся критически дискретизированное преобразование для сегмента (128_2,1) второго набора (124_2) элементов разрешения, причем каждый сегмент ассоциирован с поддиапазоном частот аудиосигнала (102), для получения набора (110_1,1) поддиапазонных выборок для первого набора элементов разрешения и набора (110_2,1) поддиапазонных выборок для второго набора элементов разрешения;

- при этом первый набор (110_1,1) поддиапазонных выборок представляет собой результат первого перекрывающегося критически дискретизированного преобразования (132_1,1) на основе первого сегмента (128_1,1) первого набора (124_1) элементов разрешения, при этом второй набор (110_1,2) поддиапазонных выборок представляет собой результат второго перекрывающегося критически дискретизированного преобразования (132_1,2) на основе второго сегмента (128_1,2) первого набора (124_1) элементов разрешения, при этом третий набор (110_2,1) поддиапазонных выборок представляет собой результат третьего перекрывающегося критически дискретизированного преобразования (132_2,1) на основе первого сегмента (128_2,1) второго набора (128_2,1) элементов разрешения, при этом четвертый набор (110_2,2) поддиапазонных выборок представляет собой результат четвертого перекрывающегося критически дискретизированного преобразования (132_2,2) на основе второго сегмента (128_2,2) второго набора (128_2,1) элементов разрешения; и

- при этом выполнение (304) комбинирования со взвешиванием двух соответствующих наборов поддиапазонных выборок содержит этап, на котором выполняют комбинирование со взвешиванием первого набора (110_1,1) поддиапазонных выборок и третьего набора (110_2,1) поддиапазонных выборок для получения первого поддиапазонного представления (112_1) с уменьшенным наложением спектров аудиосигнала, при этом каскад (106) уменьшения наложения спектров во временной области выполнен с возможностью выполнения комбинирования со взвешиванием второго набора (110_1,2) поддиапазонных выборок и четвертого набора (110_2,2) поддиапазонных выборок, для получения второго поддиапазонного представления (112_2) с уменьшенным наложением спектров аудиосигнала.

17. Способ (300) обработки аудиосигнала для получения поддиапазонного представления аудиосигнала, при этом способ содержит этапы, на которых:

- выполняют (302) каскадное перекрывающееся критически дискретизированное преобразование по меньшей мере для двух частично перекрывающихся блоков выборок аудиосигнала для получения набора поддиапазонных выборок на основе первого блока выборок аудиосигнала и получения соответствующего набора поддиапазонных выборок на основе второго блока выборок аудиосигнала; и

- выполняют (304) комбинирование со взвешиванием двух соответствующих наборов поддиапазонных выборок, причем один из них получен на основе первого блока выборок аудиосигнала, и один из них получен на основе второго блока выборок аудиосигнала, для получения поддиапазонного представления с уменьшенным наложением спектров аудиосигнала;

- при этом выполнение (302) каскадного перекрывающегося критически дискретизированного преобразования содержит этап, на котором сегментируют набор (124_1) элементов разрешения, полученных на основе первого блока (108_1) выборок с использованием по меньшей мере двух функций кодирования со взвешиванием, и получают по меньшей мере два сегментированных набора (128_1,1; 128_1,2) поддиапазонных выборок на основе сегментированного набора элементов разрешения, соответствующих первому блоку (108_1) выборок;

- при этом выполнение (302) каскадного перекрывающегося критически дискретизированного преобразования содержит этап, на котором сегментируют набор (124_2) элементов разрешения, полученных на основе второго блока (108_2) выборок с использованием по меньшей мере двух функций кодирования со взвешиванием, и получают по меньшей мере два сегментированных набора (128_2,1; 128_2,2) поддиапазонных выборок на основе сегментированного набора элементов разрешения, соответствующих второму блоку (108_2) выборок; и

- при этом по меньшей мере две функции кодирования со взвешиванием содержат различную ширину окна кодирования со взвешиванием.

18. Способ (300) обработки аудиосигнала для получения поддиапазонного представления аудиосигнала, при этом способ содержит этапы, на которых:

- выполняют (302) каскадное перекрывающееся критически дискретизированное преобразование по меньшей мере для двух частично перекрывающихся блоков выборок аудиосигнала для получения набора поддиапазонных выборок на основе первого блока выборок аудиосигнала и получения соответствующего набора поддиапазонных выборок на основе второго блока выборок аудиосигнала; и

- выполняют (304) комбинирование со взвешиванием двух соответствующих наборов поддиапазонных выборок, причем один из них получен на основе первого блока выборок аудиосигнала, и один из них получен на основе второго блока выборок аудиосигнала, для получения поддиапазонного представления с уменьшенным наложением спектров аудиосигнала;

- при этом выполнение (302) каскадного перекрывающегося критически дискретизированного преобразования содержит этап, на котором сегментируют набор (124_1) элементов разрешения, полученных на основе первого блока (108_1) выборок с использованием по меньшей мере двух функций кодирования со взвешиванием, и получают по меньшей мере два сегментированных набора (128_1,1; 128_1,2) поддиапазонных выборок на основе сегментированного набора элементов разрешения, соответствующих первому блоку (108_1) выборок;

- при этом выполнение (302) каскадного перекрывающегося критически дискретизированного преобразования содержит этап, на котором сегментируют набор (124_2) элементов разрешения, полученных на основе второго блока (108_2) выборок с использованием по меньшей мере двух функций кодирования со взвешиванием, и получают по меньшей мере два набора (128_2,1; 128_2,2) поддиапазонных выборок на основе сегментированного набора элементов разрешения, соответствующих второму блоку (108_2) выборок; и

- при этом наклоны фильтра функций кодирования со взвешиванием, соответствующих смежным наборам поддиапазонных выборок, являются симметричными.

19. Способ (400) обработки поддиапазонного представления аудиосигнала для получения аудиосигнала, при этом способ содержит этапы, на которых:

- выполняют (402) комбинирование со взвешиванием двух соответствующих поддиапазонных представлений с уменьшенным наложением спектров аудиосигнала для получения поддиапазонного представления с наложением спектров, при этом поддиапазонное представление с наложением спектров представляет собой набор поддиапазонных выборок; и

- выполняют (404) каскадное обратное перекрывающееся критически дискретизированное преобразование для набора поддиапазонных выборок для получения набора выборок, ассоциированных с блоком выборок аудиосигнала;

- при этом выполнение (404) каскадного обратного перекрывающегося критически дискретизированного преобразования содержит этап, на котором выполняют обратное перекрывающееся критически дискретизированное преобразование для набора (110_1,1) поддиапазонных выборок для получения набора (128_1,1) элементов разрешения, ассоциированного с данным поддиапазоном частот аудиосигнала; и

- при этом выполнение (404) каскадного обратного перекрывающегося критически дискретизированного преобразования содержит этап, на котором выполняют конкатенацию наборов элементов разрешения, ассоциированных с множеством поддиапазонов частот аудиосигнала, что содержит комбинирование со взвешиванием набора (128_1,1) элементов разрешения, ассоциированных с данным поддиапазоном частот аудиосигнала (102), с набором (128_1,2) элементов разрешения, ассоциированных с другим поддиапазоном частот аудиосигнала (102), для получения набора (124_1) элементов разрешения, ассоциированных с блоком выборок аудиосигнала (102).

20. Машиночитаемый носитель, на котором сохранена компьютерная программа для осуществления способа по п. 16, или 17, или 18.

21. Машиночитаемый носитель, на котором сохранена компьютерная программа для осуществления способа по п. 19.



 

Похожие патенты:

Изобретение относится к средствам для кодирования и декодирования аудио. Технический результат заключается в повышении эффективности кодирования.

Изобретение относится к средствам для кодирования и декодирования речи. Технический результат заключается в уменьшении опережающего и запаздывающего эха.

Изобретение относится к средствам для кодирования и декодирования аудио. Технический результат заключается в улучшении качества аудиосигнала за счет снижения искажения компонента частотного диапазона, кодированного с малым числом битов во временной области.

Изобретение относится к средствам для кодирования многоканального сигнала. Технический результат заключается в повышении эффективности кодирования многоканального сигнала.

Изобретение относится к акустике. Устройство для вывода стереофонического звукового сигнала, имеющего левый канал и правый канал, причем устройство содержит: демультиплексор, выполненный с возможностью получения битового аудиопотока и извлечения из него коэффициента предсказания для каждой из множества полос частот; декодер, выполненный с возможностью генерирования сигнала понижающего микширования и остаточного сигнала из кодированного битового аудиопотока; и устройство повышающего микширования, выполненное с возможностью работы либо в режиме с предсказанием, либо в режиме без предсказания на основании параметра, закодированного в битовом аудиопотоке, и вывода левого канала и правого канала в качестве стереофонического звукового сигнала, причем, когда устройство повышающего микширования работает в режиме с предсказанием, остаточный сигнал представляет разницу между побочным сигналом и предсказанной версией побочного сигнала, и устройство повышающего микширования генерирует левый канал и правый канал из комбинации сигнала понижающего микширования, остаточного сигнала и коэффициентов предсказания для каждой из множества полос частот, и причем, когда устройство повышающего микширования работает в режиме без предсказания, остаточный сигнал представляет побочный сигнал, устройство повышающего микширования генерирует левый канал на основании суммы сигнала понижающего микширования и остаточного сигнала, прошедших через декодер, и устройство повышающего микширования генерирует правый канал на основании разницы между сигналом понижающего микширования и остаточным сигналом, прошедшими через декодер.

Изобретение относится к средствам для кодирования и декодирования множественных аудиосигналов. Технический результат заключается в повышении эффективности кодирования и декодирования смеси аудиосигналов с улучшением их разделения.

Изобретение относится к обработке аудиоданных. Технический результат изобретения заключается в обработке сигналов звуковых объектов за счет указания местоположения каждого объекта.

Изобретение относится к области кодирования/декодирования сигналов. Технический результат изобретения заключается улучшении эффективности кодирования/декодирования сигналов за счет перцептивного взвешивания на основе входного сигнала.

Изобретение относится к обработке аудиосигнала и предназначено для разделения гармонического ударного остаточного звука с использованием структурного тензора на спектрограммах.

Изобретение относится к средствам для преобразования коэффициентов линейного предсказания. Технический результат заключается в повышении эффективности оценивания фильтра синтеза линейного предсказания после преобразования внутренней частоты дискретизации.

Изобретение относится к средствам для кодирования и декодирования аудио. Технический результат заключается в повышении эффективности кодирования.

Изобретение относится к средствам для кодирования и декодирования речи. Технический результат заключается в уменьшении опережающего и запаздывающего эха.

Изобретение относится к средствам для кодирования и декодирования аудио. Технический результат заключается в улучшении качества аудиосигнала за счет снижения искажения компонента частотного диапазона, кодированного с малым числом битов во временной области.

Изобретение относится к средствам кодирования и декодирования аудио. Технический результат заключается в повышении эффективности кодирования.

Изобретение относится к средствам для кодирования и декодирования множественных аудиосигналов. Технический результат заключается в повышении эффективности кодирования и декодирования смеси аудиосигналов с улучшением их разделения.

Изобретение относится к средствам для гибридного маскирования потери пакетов в частотной и временной области в аудиокодеках. Технический результат заключается в повышении эффективности маскирования потери пакетов.

Изобретение относится к средствам для оценивания фонового шума в аудиосигнале. Технический результат заключается в повышении точности оценивания, содержит ли аудиосигнал активную речь или музыку.

Изобретение относится к кодированию и декодированию аудиосигналов. Технический результат – улучшение реконструкции высокочастотных полос аудиосигнала.

Изобретение относится к средствам для кодирования аудиосигналов. Технический результат заключается в повышении эффективности кодирования аудиосигналов.

Изобретение относится к средствам для оценивания межканальной разницы во времени. Технический результат заключается в повышении точности определения межканальной разницы во времени.

Изобретение относится к средствам моделирования процесса поддержания работы сложного технического объекта. Технический результат заключается в расширении арсенала средств моделирования.
Наверх