Устройство и способы для адаптации аудиоинформации при пространственном кодировании аудиообъектов

Авторы патента:

КАСТНЕР Торстен (DE)

РИДДЕРБУШ Фалько (DE)

ХЕРРЕ Юрген (DE)

ТЕРЕНТИВ Леон (DE)

ХЕЛЛЬМУТ Оливер (DE)

ПАУЛУС Йоуни (DE)

G10L19/008 - Техника анализа-синтеза речи для уменьшения избыточности, например в вокодерах ; кодирование или декодирование речи

Владельцы патента RU 2609097:

ФРАУНХОФЕР-ГЕЗЕЛЛЬШАФТ ЦУР ФЕРДЕРУНГ ДЕР АНГЕВАНДТЕН ФОРШУНГ Е.Ф. (DE)

Изобретение относится к средствам для адаптации входной аудиоинформации, кодирующей один или более аудиообъектов. Технический результат заключается в повышении эффективности адаптации аудиоинформации к конкретному целевому сценарию применения. Входная аудиоинформация содержит два или более входных аудиоканалов понижающего микширования и дополнительно содержит входную параметрическую побочную информацию. Адаптированная аудиоинформация содержит один или более адаптированных аудиоканалов понижающего микширования и дополнительно содержит адаптированную параметрическую побочную информацию. Устройство содержит модификатор сигнала понижающего микширования для адаптации, в зависимости от адаптационной информации, двух или более входных аудиоканалов понижающего микширования для получения одного или более адаптированных аудиоканалов понижающего микширования. Кроме того, устройство содержит средство адаптации параметрической побочной информации для адаптации, в зависимости от адаптационной информации, входной параметрической побочной информации для получения адаптированной параметрической побочной информации. 4 н. и 9 з.п. ф-лы, 9 ил.

Настоящее изобретение относится к декодированию аудиосигнала и обработке аудиосигнала и, в частности, к декодеру и способам адаптации аудиоинформации при пространственном кодировании аудиообъектов (SAOC).

В современных цифровых аудиосистемах основной тенденцией является обеспечение возможности внесения модификаций, связанных с аудиообъектом, передаваемого контента на стороне приемника. Эти модификации включают в себя изменение коэффициента усиления выбранных частей аудиосигнала и/или изменение положения в пространстве конкретных аудиообъектов в случае многоканального воспроизведения посредством пространственно распределенных громкоговорителей. Этого можно добиться путем индивидуальной доставки разных частей аудиоконтента на разные громкоговорители.

Другими словами, в области обработки аудиосигнала, передачи аудиосигнала и хранения аудиосигнала наблюдается растущая потребность в обеспечении взаимодействия с пользователем при воспроизведении объектно-ориентированного аудиоконтента, а также потребность в использовании расширенных возможностей многоканального воспроизведения для индивидуальной рендеризации аудиоконтента или его частей для улучшения слухового впечатления. Таким образом, использование многоканального аудиоконтента способствует значительным усовершенствованиям для пользователя. Например, можно получить трехмерное слуховое впечатление, которое способствует повышению удовлетворенности пользователя в развлекательных приложениях. Однако многоканальный аудиоконтент также полезен в профессиональных окружениях, например в приложениях телефонной конференцсвязи, поскольку разборчивость речи можно повысить с использованием воспроизведения многоканального аудиосигнала. Другим возможным применением является предложение слушателю музыкального произведения индивидуально регулировать уровень воспроизведения и/или пространственное положение разных частей (также именуемых “аудиообъектами”) или дорожек, например, вокальной партии или разных инструментов. Пользователь может осуществлять такую регулировку по причинам личного вкуса для упрощения транскрибирования одной или более частей из музыкального произведения, в образовательных целях, караоке, репетиции и т.д.

Непосредственная дискретная передача всего цифрового многоканального или многообъектного аудиоконтента, например, в форме данных импульсно-кодовой модуляции (ИКМ) или даже в форматах сжатого аудиосигнала, требует очень высоких битовых скоростей. Однако желательно также передавать и сохранять аудиоданные эффективно с точки зрения битовой скорости. Поэтому может быть желателен разумный компромисс между качеством аудиосигнала и требованиям к битовой скорости во избежание чрезмерного расходования ресурсов, обусловленного многоканальными/многообъектными приложениями.

Недавно, в области аудиокодирования, параметрические методы эффективных с точки зрения битовой скорости передачи/хранения многоканальных/многообъектных аудиосигналов были предложены, например, Экспертной группой по вопросам движущегося изображения (MPEG) и другими. Одним примером является MPEG Surround (MPS) в качестве канально-ориентированного подхода [MPS, BCC] или пространственное кодирование аудиообъектов (SAOC) MPEG в качестве объектно-ориентированного подхода [JSC, SAOC, SAOC1, SAOC2]. Другой объектно-ориентированный подход именуется “informed source separation” [ISS1, ISS2, ISS3, ISS4, ISS5, ISS6]. Эти методы ставят своей целью реконструкцию желаемой выходной аудиосцены или желаемого объекта источника аудиосигнала на основе понижающего микширования каналов/объектов и дополнительной побочной информации, описывающей передаваемую/сохраненную аудиосцену и/или объекты источника аудиосигнала в аудиосцене.

Оценивание и применение побочной информации, связанной с каналом/объектом, в таких системах осуществляется избирательно по времени и частоте. Поэтому такие системы применяют частотно-временные преобразования, например дискретное преобразование Фурье (DFT), кратковременное преобразование Фурье (STFT) или наборы фильтров наподобие наборов квадратурных зеркальных фильтров (QMF) и т.д. Основной принцип таких систем изображен на фиг. 3 на примере MPEG SAOC.

В случае STFT, временное измерение представлено количеством временных блоков и спектральное измерение захватывается количеством спектральных коэффициентов (“бинов”). В случае QMF, временное измерение представлено количеством временных интервалов, и спектральное измерение захватывается количеством поддиапазонов. Если спектральное разрешение QMF повышается за счет последующего применения второго каскада фильтров, весь набор фильтров именуется гибридным QMF, и поддиапазоны высокого разрешения именуются гибридными поддиапазонами.

Как упомянуто выше, в SAOC общая обработка осуществляется избирательно по времени и частоте и может быть описана следующим образом в каждой полосе частот, как показано на фиг. 3:

- осуществляется понижающее микширование N входных сигналов аудиообъектов s₁…s_N в P каналов x₁…x_P как часть обработки кодера с использованием матрицы понижающего микширования, состоящей из элементов d_1,1…d_N,P. Кроме того, кодер извлекает побочную информацию, описывающую характеристики входных аудиообъектов (модуль оценивания побочной информации (SIE)). Для MPEG SAOC, соотношения мощностей объектов относительно друг друга являются наиболее основной формой такой побочной информации.

Сигнал(ы) понижающего микширования и побочная информация передаются/сохраняются. Для этого аудиосигнал(ы) понижающего микширования можно сжимать, например, с использованием общеизвестных перцептивных аудиокодеров, например, MPEG-1/2 уровня II или III (иначе называемый .mp3), MPEG-2/4 Advanced Audio Coding (AAC) и т.д.

На принимающей стороне, декодер, в принципе, пытается восстановить сигналы исходного объекта (“разделение объекта”) из (декодированных) сигналов понижающего микширования, с использованием передаваемой побочной информации. Затем эти приближенные сигналы ŝ₁…ŝ_N объекта микшируются в целевую сцену, представленную M выходными аудиоканалами ŷ₁…ŷ_Mс использованием матрицы рендеризации, описанной коэффициентами r_1,1…r_N,M на фиг. 3. Желаемая целевая сцена, в предельном случае, может рендеризовать сигнал только одного источника из смеси (сценарий разделения источников), а также из любой другой произвольной акустической сцены, состоящей из передаваемых объектов. Например, выходом может быть одноканальной, 2-канальной стереофонической или многоканальной 5.1 целевой сценой.

На Фиг. 6 схематически представлен принцип схемы кодирования/декодирования аудиосигнала. В частности, на фиг. 6 приведено принципиальное описание цепи кодирования/декодирования аудиосигнала.

На стороне кодирования аудиосигнал сжимается схемой аудиокодирования (обычно использующей перцептивные эффекты), и параметрическая побочная информация (PSI) вычисляется (см. кодер 601). Результирующий битовый поток, состоящий из кодированного аудиосигнала и PSI, сохраняются (или передаются) на сторону декодера, где они могут декодироваться различными экземплярами 620, 621, 622 декодера, обозначенными “A”, “B” и т.д. На фиг. 6 эти экземпляры декодера могут отличаться друг от друга (например, разные уровни сложности в стандартной спецификации, ограничения на применение или реализацию и т.д.) [SAOC, SAOC1, SAOC2].

Схемы кодирования, отвечающие уровню техники, не способны эффективно адаптировать PSI к конкретному целевому сценарию применения или платформе. Это может приводить к более высокой (чем необходимо) вычислительной сложности на стороне декодера или может приводить к проблемам совместимости.

Задачей настоящего изобретения является обеспечение усовершенствованных подходов к кодированию аудиообъектов. Задача настоящего изобретения решается посредством декодера по п. 1, посредством способа кодирования по п. 14 и посредством компьютерной программы по п. 15.

Предусмотрено устройство для адаптации входной аудиоинформации, кодирующей один или более аудиообъектов, для получения адаптированной аудиоинформации. Входная аудиоинформация содержит два или более входных аудиоканалов понижающего микширования и дополнительно содержит входную параметрическую побочную информацию. Адаптированная аудиоинформация содержит один или более адаптированных аудиоканалов понижающего микширования и дополнительно содержит адаптированную параметрическую побочную информацию.

Устройство содержит модификатор сигнала понижающего микширования для адаптации, в зависимости от адаптационной информации, двух или более входных аудиоканалов понижающего микширования для получения одного или более адаптированных аудиоканалов понижающего микширования.

Кроме того, устройство содержит средство адаптации параметрической побочной информации для адаптации, в зависимости от адаптационной информации, входной параметрической побочной информации для получения адаптированной параметрической побочной информации.

Согласно варианту осуществления, модификатор сигнала понижающего микширования может быть выполнен с возможностью адаптации двух или более входных аудиоканалов понижающего микширования в зависимости от адаптационной информации, чтобы количество одного или более адаптированных аудиоканалов понижающего микширования было меньше количества двух или более входных аудиоканалов понижающего микширования.

Согласно варианту осуществления, адаптационная информация может зависеть от экземпляра декодера. Модификатор сигнала понижающего микширования может быть выполнен с возможностью адаптации двух или более входных аудиоканалов понижающего микширования в зависимости от экземпляра декодера. Здесь и в дальнейшем, термины “декодер” и “экземпляр декодера” следует понимать в одном и том же смысле.

Согласно варианту осуществления, экземпляр декодера может быть способен декодировать, самое большее, максимальное количество каналов понижающего микширования. Адаптационная информация может зависеть от упомянутого максимального количества каналов понижающего микширования. Кроме того, модификатор сигнала понижающего микширования может быть выполнен с возможностью адаптации двух или более входных аудиоканалов понижающего микширования в зависимости от адаптационной информации для получения одного или более адаптированных аудиоканалов понижающего микширования, чтобы количество одного или более адаптированных каналов понижающего микширования было равно упомянутому максимальному количеству каналов понижающего микширования.

Согласно варианту осуществления, адаптационная информация может содержать адаптационную матрицу ().

Согласно варианту осуществления, модификатор сигнала понижающего микширования может быть выполнен с возможностью адаптации, в зависимости от адаптационной матрицы (), двух или более входных аудиоканалов () понижающего микширования для получения одного или более адаптированных аудиоканалов () понижающего микширования.

Согласно варианту осуществления, модификатор сигнала понижающего микширования может быть выполнен с возможностью адаптации, в зависимости от адаптационной матрицы , двух или более входных аудиоканалов понижающего микширования для получения одного или более адаптированных аудиоканалов понижающего микширования с применением формулы

Согласно варианту осуществления, средство адаптации параметрической побочной информации может быть выполнено с возможностью адаптации, в зависимости от адаптационной матрицы (), входной параметрической побочной информации () для получения адаптированной параметрической побочной информации ().

Согласно варианту осуществления, средство адаптации параметрической побочной информации может быть выполнено с возможностью адаптации, в зависимости от адаптационной матрицы , входной параметрической побочной информации для получения адаптированной параметрической побочной информации с применением формулы:

Согласно варианту осуществления, входная параметрическая побочная информация () может указывать начальную матрицу понижающего микширования, так что два или более входных аудиоканалов () понижающего микширования получают, применяя начальную матрицу () понижающего микширования к одному или более аудиообъектам (S). Средство адаптации параметрической побочной информации может быть выполнено с возможностью определения адаптированной матрицы () понижающего микширования в качестве адаптированной параметрической побочной информации, так что один или более адаптированных аудиоканалов () понижающего микширования получают, применяя адаптированную матрицу () понижающего микширования к одному или более аудиообъектам (S).

Кроме того, согласно варианту осуществления, предусмотрено устройство для генерирования одного или более аудиоканалов из входной аудиоинформации, кодирующей один или более аудиообъектов.

Устройство для генерирования одного или более аудиоканалов содержит устройство согласно одному из вышеописанных вариантов осуществления для адаптации входной аудиоинформации для получения адаптированной аудиоинформации, при этом входная аудиоинформация содержит два или более входных аудиоканалов понижающего микширования и дополнительно содержит входную параметрическую побочную информацию, причем адаптированная аудиоинформация содержит один или более адаптированных аудиоканалов понижающего микширования и дополнительно содержит адаптированную параметрическую побочную информацию.

Кроме того, устройство для генерирования одного или более аудиоканалов содержит экземпляр декодера для декодирования, в зависимости от адаптированной параметрической побочной информации, одного или более адаптированных аудиоканалов понижающего микширования для получения одного или более аудиоканалов.

Согласно варианту осуществления, средство адаптации параметрической побочной информации устройства для адаптации входной аудиоинформации может быть выполнено с возможностью приема входного битового потока, содержащего входную параметрическую побочную информацию. Средство адаптации параметрической побочной информации устройства для адаптации входной аудиоинформации может быть выполнено с возможностью адаптации входной параметрической побочной информации для получения адаптированной параметрической побочной информации и подачи адаптированной параметрической побочной информации на экземпляр декодера. Экземпляр декодера может быть выполнен с возможностью декодирования одного или более адаптированных аудиоканалов понижающего микширования в зависимости от адаптированной параметрической побочной информации.

В другом варианте осуществления, средство адаптации параметрической побочной информации устройства для адаптации входной аудиоинформации может быть выполнено с возможностью приема входного битового потока, содержащего входную параметрическую побочную информацию. Средство адаптации параметрической побочной информации устройства для адаптации входной аудиоинформации может быть выполнено с возможностью замены входной параметрической побочной информации во входном битовом потоке адаптированной параметрической побочной информацией для получения модифицированного битового потока. Средство адаптации параметрической побочной информации устройства для адаптации входной аудиоинформации может быть выполнено с возможностью подачи модифицированного битового потока на экземпляр декодера. Кроме того, экземпляр декодера может быть выполнен с возможностью декодирования одного или более адаптированных аудиоканалов понижающего микширования в зависимости от модифицированного битового потока.

Кроме того, предусмотрен способ адаптации входной аудиоинформации, кодирующей один или более аудиообъектов, для получения адаптированной аудиоинформации. Входная аудиоинформация содержит два или более входных аудиоканалов понижающего микширования и дополнительно содержит входную параметрическую побочную информацию. Адаптированная аудиоинформация содержит один или более адаптированных аудиоканалов понижающего микширования и дополнительно содержит адаптированную параметрическую побочную информацию. Способ содержит этапы, на которых:

- адаптируют, в зависимости от адаптационной информации, два или более входных аудиоканалов понижающего микширования для получения одного или более адаптированных аудиоканалов понижающего микширования, и

- адаптируют, в зависимости от адаптационной информации, входную параметрическую побочную информацию для получения адаптированной параметрической побочной информации.

Кроме того, предусмотрена компьютерная программа для реализации вышеописанного способа при выполнении компьютером или процессором сигналов.

Предпочтительные варианты осуществления будут обеспечены в зависимых пунктах формулы изобретения.

Далее описаны варианты осуществления настоящего изобретения более подробно со ссылкой на чертежи, на которых:

фиг. 1 демонстрирует устройство для адаптации входной аудиоинформации, кодирующей один или более аудиообъектов, для получения адаптированной аудиоинформации согласно варианту осуществления.

Фиг. 2 демонстрирует устройство для адаптации входной аудиоинформации, кодирующей один или более аудиообъектов, для получения адаптированной аудиоинформации согласно другому варианту осуществления.

Фиг. 3 демонстрирует упрощенную блок-схему принципиального обзора системы SAOC,

фиг. 4 демонстрирует схематическую и иллюстративную диаграмму спектрально-временного представления одноканального аудиосигнала,

фиг. 5 демонстрирует упрощенную блок-схему избирательного по времени и частоте вычисления побочной информации в кодере SAOC,

фиг. 6 схематически изображает принцип схемы кодирования/декодирования аудиосигнала,

фиг. 7 демонстрирует устройство для генерирования одного или более аудиоканалов из входной аудиоинформации, кодирующей один или более аудиообъектов согласно варианту осуществления,

фиг. 8 демонстрирует приложение объединенного PSIA в схеме кодирования/декодирования согласно варианту осуществления, и

фиг. 9 демонстрирует приложение разъединенного PSIA в схеме кодирования/декодирования согласно варианту осуществления.

Прежде чем перейти к описанию вариантов осуществления настоящего изобретения, рассмотрим более подробно традиционные системы SAOC.

Фиг. 3 демонстрирует общую конфигурацию кодера 10 SAOC и декодера 12 SAOC. Кодер 10 SAOC принимает в качестве входного сигнала N объектов, т.е. аудиосигналы с s₁ по s_N. В частности, кодер 10 содержит понижающий микшер 16, который принимает аудиосигналы с s₁ по s_N и осуществляет их понижающее микширование с образованием сигнала 18 понижающего микширования. Альтернативно, понижающее микширование может обеспечиваться извне (“художественное понижающее микширование”), и система оценивает дополнительную побочную информацию для согласования обеспеченного понижающего микширования с расчетным понижающим микшированием. На фиг. 3 сигнал понижающего микширования показан как P-канальный сигнал. Таким образом, допустима любая конфигурация монофонического (P=1), стереофонического (P=2) или многоканального (P>2) сигнала понижающего микширования.

В случае стереофонического понижающего микширования, каналы сигнала 18 понижающего микширования обозначаются L0 и R0, в случае монофонического понижающего микширования канал обозначается просто L0. Чтобы декодер 12 SAOC мог восстанавливать отдельные объекты с s₁ по s_N, блок 17 оценки побочной информации снабжает декодер 12 SAOC побочной информацией, включающей в себя параметры SAOC. Например, в случае стереофонического понижающего микширования, параметры SAOC содержат разности уровней объектов (OLD), межобъектные корреляции (IOC) (параметры межобъектной кросс-корреляции), значения коэффициента усиления при понижающем микшировании (DMG) и разности уровней каналов понижающего микширования (DCLD). Побочная информация 20, включающая в себя параметры SAOC, совместно с сигналом 18 понижающего микширования, образует выходной поток данных SAOC принимаемый декодером 12 SAOC.

Декодер 12 SAOC содержит повышающий микшер, который принимает сигнал 18 понижающего микширования, а также побочную информацию 20 для восстановления и рендеризации аудиосигналов ŝ₁ и ŝ_N в любой выбранный пользователем набор каналов сŷ₁ по ŷ_M, причем рендеризация предписана информацией 26 рендеризации, поступающей на декодер 12 SAOC.

Аудиосигналы с s₁ по s_N могут поступать на кодер 10 в любой области кодирования, например, во временной или спектральной области. В случае, когда аудиосигналы с s₁ по s_N поступают на кодер 10 во временной области, например ИКМ-кодированные, кодер 10 может использовать набор фильтров, например набор гибридных QMF, для преобразования сигналов в спектральную область, в которой аудиосигналы представлены в нескольких поддиапазонах, связанных с разными спектральными участками, с конкретным разрешением набора фильтров. Если аудиосигналы с s₁ по s_N уже находятся в представлении, ожидаемом кодером 10, ему не нужно осуществлять спектральное разложение.

Фиг. 4 демонстрирует аудиосигнал в вышеупомянутой спектральной области. Как можно видеть, аудиосигнал представлен в виде множества поддиапазонных сигналов. Каждый поддиапазонный сигнал с 30₁ по 30_K состоит из временной последовательности значений поддиапазона, указанных малыми прямоугольниками 32. Как можно видеть, значения 32 поддиапазона поддиапазонных сигналов с 30₁ по 30_K синхронизируются друг с другом по времени таким образом, что для каждого из последовательных временных интервалов 34 набора фильтров каждый поддиапазон с 30₁ по 30_K содержит в точности одно значение 32 поддиапазона. Как показано на частотной оси 36, поддиапазонные сигналы с 30₁ по 30_K связаны с разными частотными областями, и как показано на временной оси 38, временные интервалы 34 набора фильтров последовательно размещены по времени.

Как указано выше, экстрактор 17 побочной информации, показанный на фиг. 3, вычисляет параметры SAOC из входных аудиосигналов с s₁ по s_N. Согласно реализованному в настоящее время стандарту SAOC, кодер 10 осуществляет это вычисление с временным/частотным разрешением, которое может уменьшаться относительно исходного временного/частотного разрешения, которое определяется временными интервалами 34 набора фильтров и разложением на поддиапазоны, на определенную величину, причем эта определенная величина сигнализируется стороне декодера с побочной информацией 20. Группы последовательных временных интервалов 34 набора фильтров могут образовывать кадр 41 SAOC. Количество диапазонов параметра в кадре 41 SAOC также переносится с побочной информацией 20. Следовательно, временная/частотная область делится на временные/частотные плитки, представленные на фиг. 4 пунктирными линиями 42. На фиг. 4 диапазоны параметра распределены одинаково в различных изображенных кадрах 41 SAOC таким образом, что получается правильное размещение временных/частотных плиток. Однако в общем случае диапазоны параметра могут изменяться от одного кадра 41 SAOC к следующему, в зависимости от разных потребностей в спектральном разрешении в соответствующих кадрах 41 SAOC. Кроме того, длина кадров 41 SAOC также может изменяться. В результате, размещение временных/частотных плиток может быть неправильным. Тем не менее, временные/частотные плитки в конкретном кадре 41 SAOC обычно имеют одинаковую длительность и выровнены во временном направлении, т.е. все t/f-плитки в упомянутом кадре 41 SAOC начинаются в начале данного кадра 41 SAOC и заканчиваются в конце упомянутого кадра 41 SAOC.

Экстрактор 17 побочной информации, изображенный на фиг. 3, вычисляет параметры SAOC согласно следующим формулам. В частности, экстрактор 17 побочной информации вычисляет разности уровней объектов для каждого объекта i как

где суммы и индексы n и k соответственно пробегают по всем временным индексам 34, и все спектральные индексы 30, которые принадлежат определенной временной/частотной плитке 42, указаны индексами l для кадра SAOC (или временного интервала обработки) и m для диапазона параметра. Таким образом, энергии всех значений поддиапазона x_i аудиосигнала или объекта i суммируются и нормализуются к наивысшему значению энергии этой плитки из всех объектов или аудиосигналов. обозначает комплексно сопряженную величину .

Кроме того, экстрактор 17 побочной информации SAOC способен вычислять меру подобия соответствующих временных/частотных плиток пар разных входных объектов с s₁ по s_N. Хотя экстрактор 17 побочной информации SAOC может вычислять меру подобия между всеми парами входных объектов с s₁ по s_N, экстрактор 17 побочной информации также может подавлять сигнализацию мер подобия или ограничивать вычисление мер подобия аудиообъектами с s₁ по s_N, которые формируют левый или правый каналы общего стереоканала. В любом случае, мера подобия называется параметром межобъектной кросс-корреляции . Вычисление осуществляется следующим образом:

где индексы n и k, опять же, пробегают по всем значениям поддиапазона, принадлежащим определенной временной/частотной плитке 42, i и j обозначают определенную пару аудиообъектов с s₁ по s_N, и обозначает операцию отбрасывания мнимой части комплексного аргумента.

Понижающий микшер 16, показанный на фиг. 3, осуществляет понижающее микширование объектовс s₁ по s_N с использованием коэффициентов усиления, применяемых к каждому объекту с s₁ по s_N. Таким образом, коэффициент усиления d_i применяется к объекту i и затем все взвешенные таким образом объекты с s₁ по s_Nсуммируются для получения монофонического сигнала понижающего микширования, который представлен на фиг. 3, если P=1. В другом примерном случае двухканального сигнала понижающего микширования, изображенного на фиг. 3, если P=2, коэффициент усиления d₁,_i применяется к объекту i, и затем все такие объекты, усиленные с коэффициентом усиления, суммируются для получения левого канала понижающего микширования L0, и коэффициенты усиления d₂,_i применяются к объекту i и затем усиленные таким образом с коэффициентом усиления объекты суммируются для получения правого канала понижающего микширования R0. Обработка, аналогичная вышеописанной, подлежит применению в случае многоканального понижающего микширования (P>2).

Это предписание понижающего микширования сигнализируется стороне декодера посредством коэффициентов DMG_i усиления понижающего микширования и, в случае стереосигнала понижающего микширования, разностей DCLD_i уровней каналов понижающего микширования.

Коэффициенты усиления понижающего микширования вычисляются согласно

, (монофоническое понижающее микширование),

, (стереофоническое понижающее микширование),

где - малая величина, например 10^-9.

Для DCLD применяется следующая формула:

В нормальном режиме понижающий микшер 16 генерирует сигнал понижающего микширования согласно

для монофонического понижающего микширования или

для стереофонического понижающего микширования соответственно.

Таким образом, в вышеупомянутых формулах параметры OLD и IOC являются функцией аудиосигналов, и параметры DMG и DCLD являются функцией d. Между прочим, заметим, что d может изменяться по времени и частоте.

Таким образом, в нормальном режиме, понижающий микшер 16 микширует все объекты с s₁ по s_N без предпочтений, т.е. одинаково манипулируя всеми объектами с s₁ по s_N.

На стороне декодера повышающий микшер осуществляет процедуру, обратную понижающему микшированию, и реализует “информацию рендеризации” 26, представленную матрицей R (в литературе иногда также именуемый A) на одном этапе вычисления, а именно, в случае двухканального понижающего микширования

где матрица E является функцией параметров OLD и IOC, и матрица содержит коэффициенты понижающего микширования в виде

Матрица E является оцененной ковариационной матрицей аудиообъектов с s₁ по s_N. В современных реализациях SAOC вычисление оцененной ковариационной матрицы E обычно осуществляется в спектральном/временном разрешении параметров SAOC, т.е. для каждого (l,m) таким образом, что оцененную ковариационную матрицу можно записать как E^l,m. Оцененная ковариационная матрица E^l,m имеет размер N x N и ее коэффициенты заданы как

Таким образом, матрица E^l,m с

имеет по диагонали разности уровней объектов, т.е. для i=j, поскольку и для i=j. Вне диагонали оцененная ковариационная матрица E имеет коэффициенты матрицы, представляющие среднее геометрическое разностей уровней объектов объектов i и j соответственно, взвешенных мерой межобъектной кросс-корреляции .

Фиг. 5 демонстрирует один возможный принцип реализации на примере блока оценки побочной информации (SIE) как часть кодера 10 SAOC. Кодер 10 SAOC содержит микшер 16 и блок 17 оценки побочной информации (SIE). SIE, в принципе, состоит из двух модулей: один модуль 45 для вычисления t/f-представления на кратковременной основе (например, STFT или QMF) каждого сигнала. Вычисленное кратковременное t/f-представление поступает на второй модуль 46, модуль t/f-избирательной оценки побочной информации (t/f-SIE). Модуль 46 t/f-SIE вычисляет побочную информацию для каждой t/f-плитки. В современных реализациях SAOC преобразование времени/частоты является фиксированным и одинаковым для всех аудиообъектов с s₁ по s_N. Кроме того, параметры SAOC определяются по кадрам SAOC, которые одинаковы для всех аудиообъектов и имеют одинаковое временное/частотное разрешение для всех аудиообъектов с s₁ по s_N, таким образом, невзирая на объектно-специфические потребности в высоком временном разрешении в ряде случаев или высоком спектральном разрешении в других случаях.

Далее описаны варианты осуществления настоящего изобретения.

Фиг. 1 демонстрирует устройство для адаптации входной аудиоинформации, кодирующей один или более аудиообъектов, для получения адаптированной аудиоинформации согласно варианту осуществления.

Входная аудиоинформация содержит два или более входных аудиоканалов понижающего микширования и дополнительно содержит входную параметрическую побочную информацию. Адаптированная аудиоинформация содержит один или более адаптированных аудиоканалов понижающего микширования и дополнительно содержит адаптированную параметрическую побочную информацию.

Устройство содержит модификатор 110 сигнала понижающего микширования (DSM) для адаптации, в зависимости от адаптационной информации, двух или более входных аудиоканалов понижающего микширования для получения одного или более адаптированных аудиоканалов понижающего микширования.

Кроме того, устройство содержит средство 120 адаптации параметрической побочной информации (PSIA) для адаптации, в зависимости от адаптационной информации, входной параметрической побочной информации для получения адаптированной параметрической побочной информации.

Согласно варианту осуществления, адаптационная информация может зависеть от экземпляра декодера, и модификатор 110 сигнала понижающего микширования может быть выполнен с возможностью адаптации двух или более входных аудиоканалов понижающего микширования в зависимости от экземпляра декодера.

Например, модификатор 110 сигнала понижающего микширования, показанный на фиг. 2, адаптирует понижающее микширование к возможностям конкретного экземпляра декодера.

Согласно варианту осуществления, модификатор 110 сигнала понижающего микширования может быть выполнен с возможностью адаптации двух или более входных аудиоканалов понижающего микширования в зависимости от адаптационной информации, чтобы количество одного или более адаптированных аудиоканалов понижающего микширования было меньше количества двух или более входных аудиоканалов понижающего микширования.

Например, согласно варианту осуществления, показанному фиг. 2, модификатор 110 сигнала понижающего микширования сокращает количество транспортных каналов /каналы понижающего микширования.

Например, входные аудиоканалы понижающего микширования 22.2 (= 24 входных аудиоканала понижающего микширования) можно свести к адаптированным аудиоканалам понижающего микширования 7.1 (= 8 адаптированных аудиоканалов понижающего микширования).

Или, например, входные аудиоканалы понижающего микширования 5.1 (= 6 входных аудиоканалов понижающего микширования) сводятся к адаптированным аудиоканалам понижающего микширования 2.0 (= 2 адаптированных аудиоканала понижающего микширования).

Или, например, 2 входных аудиоканала понижающего микширования сводятся к 1 адаптированному аудиоканалу понижающего микширования.

Возможны различные другие комбинации входных аудиоканалов понижающего микширования и адаптированные аудиоканалы понижающего микширования.

Согласно варианту осуществления, экземпляр декодера может быть способен декодировать, самое большее, максимальное количество каналов понижающего микширования. Адаптационная информация может зависеть от упомянутого максимального количества каналов понижающего микширования. Кроме того, модификатор 110 сигнала понижающего микширования может быть выполнен с возможностью адаптации двух или более входных аудиоканалов понижающего микширования в зависимости от адаптационной информации для получения одного или более адаптированных аудиоканалов понижающего микширования, чтобы количество одного или более адаптированных каналов понижающего микширования было равно упомянутому максимальному количеству каналов понижающего микширования.

Например, модификатор 110 сигнала понижающего микширования, показанный на фиг. 2, преобразует результат понижающего микширования в аудиосигнал, который соответствует максимальную поддерживаемую конфигурацию выходных каналов конкретного экземпляра декодера.

Согласно варианту осуществления, адаптационная информация может содержать, например, адаптационную матрицу ().

Средство 120 адаптации параметрической побочной информации может, например, адаптировать PSI в соответствии с модифицированным результатом понижающего микширования для уменьшения вычислительной сложности декодера и для снижения размера битового потока /битовой скорости соответствующих данных без оказания отрицательного влияния на качество аудиосигнала на выходе декодера.

Например, PSIA 120 изменяет соответствующий битовый поток PSI, заменяя информацию, представляющую начальную матрицу понижающего микширования обновленной информацией, описывающей полученный результат понижающего микширования (с учетом модификаций DSM) в соответствии с конкретной спецификацией декодера.

Например, кодер SAOC обеспечивает стереосигнал понижающего микширования, полученный применением матрицы понижающего микширования кодера к входным сигналам аудиообъектов :

Согласно варианту осуществления, модификатор 110 сигнала понижающего микширования может быть выполнен с возможностью адаптации, в зависимости от адаптационной матрицы , двух или более входных аудиоканалов понижающего микширования для получения одного или более адаптированных аудиоканалов понижающего микширования . Согласно варианту осуществления, это реализуется, например, с применением формулы .

Например, согласно варианту осуществления, когда предполагается, что конкретный экземпляр декодера SAOC поддерживает только монофоническое понижающее микширование (например, профиль низкой задержки SAOC / уровень 1). В этом случае DSM 110 преобразует стереофоническое понижающее микширование в монофонический сигнал с использованием заранее заданной матрицы понижающего микширования следующим образом:

Согласно варианту осуществления, средство 120 адаптации параметрической побочной информации может быть выполнено с возможностью адаптации, в зависимости от адаптационной матрицы , входной параметрической побочной информации для получения адаптированной параметрической побочной информации . Согласно варианту осуществления, это можно реализовать, например, с применением формулы .

Например, согласно варианту осуществления, PSIA 120 разлагает соответствующий битовый поток PSI; извлекает информацию, которая описывает матрицу понижающего микширования; заменяет эти данные обновленной информацией, которая описывает новую матрицу понижающего микширования:

Таким образом, согласно варианту осуществления, входная параметрическая побочная информация () может указывать начальную матрицу понижающего микширования, так что два или более входных аудиоканалов () понижающего микширования получают, применяя начальную матрицу () понижающего микширования к одному или более аудиообъектам (S). Средство адаптации параметрической побочной информации может быть выполнено с возможностью определения адаптированной матрицы () понижающего микширования в качестве адаптированной параметрической побочной информации, так что один или более адаптированных аудиоканалов () понижающего микширования получают, применяя адаптированную матрицу () понижающего микширования к одному или более аудиообъектам (S).

Согласно варианту осуществления, PSIA форматирует новый модифицированный битовый поток или непосредственно передает эти параметры на декодер.

Этот процесс кодирования и декодирования, осуществляемый PSIA, также может включать в себя преобразование разных форматов представления матрицы понижающего микширования (например, преобразование из полярной в декартову систему координат и т.д.).

Эта описанная функция PSIA может разрешать потенциальные проблемы совместимости и сокращать размер соответствующего битового потока.

Фиг. 7 демонстрирует устройство 700 для генерирования одного или более аудиоканалов из входной аудиоинформации, кодирующей один или более аудиообъектов согласно варианту осуществления.

Устройство 700 для генерирования одного или более аудиоканалов содержит устройство 710 согласно одному из вышеописанных вариантов осуществления для адаптации входной аудиоинформации для получения адаптированной аудиоинформации. Входная аудиоинформация содержит два или более входных аудиоканалов понижающего микширования и дополнительно содержит входную параметрическую побочную информацию. Адаптированная аудиоинформация содержит один или более адаптированных аудиоканалов понижающего микширования и дополнительно содержит адаптированную параметрическую побочную информацию.

Устройство 710 согласно одному из вышеописанных вариантов осуществления для адаптации входной аудиоинформации содержит модификатор 110 сигнала понижающего микширования и средство 120 адаптации параметрической побочной информации.

Кроме того, устройство 700 для генерирования одного или более аудиоканалов содержит экземпляр 720 декодера для декодирования, в зависимости от адаптированной параметрической побочной информации, одного или более адаптированных аудиоканалов понижающего микширования для получения одного или более аудиоканалов.

Согласно варианту осуществления, средство 120 адаптации параметрической побочной информации устройства 710 для адаптации входной аудиоинформации может быть выполнено с возможностью приема входного битового потока, содержащего входную параметрическую побочную информацию. Средство 120 адаптации параметрической побочной информации устройства 710 для адаптации входной аудиоинформации может быть выполнено с возможностью адаптации входной параметрической побочной информации для получения адаптированной параметрической побочной информации и подачи адаптированной параметрической побочной информации на экземпляр 720 декодера. Экземпляр 720 декодера может быть выполнен с возможностью декодирования одного или более адаптированных аудиоканалов понижающего микширования в зависимости от адаптированной параметрической побочной информации.

В другом варианте осуществления, средство 120 адаптации параметрической побочной информации устройства 710 для адаптации входной аудиоинформации может быть выполнено с возможностью приема входного битового потока, содержащего входную параметрическую побочную информацию. Средство 120 адаптации параметрической побочной информации устройства 710 для адаптации входной аудиоинформации может быть выполнено с возможностью замены входной параметрической побочной информации во входном битовом потоке адаптированной параметрической побочной информацией для получения модифицированного битового потока. Средство 120 адаптации параметрической побочной информации устройства 710 для адаптации входной аудиоинформации может быть выполнено с возможностью подачи модифицированного битового потока на экземпляр 720 декодера. Кроме того, экземпляр 720 декодера может быть выполнен с возможностью декодирования одного или более адаптированных аудиоканалов понижающего микширования в зависимости от модифицированного битового потока.

Фиг. 8 и 9 изображают две возможности включения устройства для адаптации входной аудиоинформации в цепь обработки декодирования.

В частности, фиг. 8 демонстрирует приложение объединенного PSIA в схеме кодирования/декодирования согласно варианту осуществления.

Фиг. 8 демонстрирует множество устройств 800, 801, 802 для генерирования одного или более аудиоканалов из входной аудиоинформации, кодирующей один или более аудиообъектов, причем устройство 800 для генерирования одного или более аудиоканалов содержит устройство 810 для адаптации входной аудиоинформации и экземпляр 820 декодера, причем устройство 801 для генерирования одного или более аудиоканалов содержит устройство 811 для адаптации входной аудиоинформации и экземпляр 821 декодера, и устройство 802 для генерирования одного или более аудиоканалов содержит устройство 812 для адаптации входной аудиоинформации и экземпляр 822 декодера. Следует отметить, что, например, устройство 800 для генерирования одного или более аудиоканалов, содержащее устройство 810 для адаптации входной аудиоинформации и экземпляр 820 декодера, не обязательно реализовывать как единый аппаратный блок 800, но, альтернативно, может быть реализовано двумя отдельными блоками 810, 820 соединенными проводом или соединенными без помощи проводов.

Объединенную (интегральную) реализацию устройства для адаптации входной аудиоинформации можно реализовать для снижения вычислительной сложности декодирования (см. фиг. 8). Кроме того, это позволяет реализовать неквантованный (некодированный) интерфейс между устройством для адаптации входной аудиоинформации и декодером. Это может относиться, в частности, к устройствам мобильного применения для снижения энергопотребления.

Фиг. 9 демонстрирует приложение разъединенного PSIA в схеме кодирования/декодирования согласно варианту осуществления.

В частности, фиг. 9 демонстрирует множество устройств 900, 901, 902 для генерирования одного или более аудиоканалов из входной аудиоинформации, кодирующей один или более аудиообъектов, причем устройство 900 для генерирования одного или более аудиоканалов содержит устройство 910 для адаптации входной аудиоинформации и экземпляр 920 декодера, причем устройство 901 для генерирования одного или более аудиоканалов содержит устройство 911 для адаптации входной аудиоинформации и экземпляр 921 декодера, и устройство 902 для генерирования одного или более аудиоканалов содержит устройство 912 для адаптации входной аудиоинформации и экземпляр 922 декодера. Следует отметить, что, например, устройство 900 для генерирования одного или более аудиоканалов, содержащее устройство 910 для адаптации входной аудиоинформации и экземпляр 920 декодера, не обязательно реализовывать как единый аппаратный блок 900, но, альтернативно, может быть реализовано двумя отдельными блоками 910, 920 соединенными проводом или соединенными без помощи проводов.

Разъединенную (раздельную) реализацию устройства для адаптации входной аудиоинформации можно реализовать для снижения размера битового потока /битовой скорости соответствующих данных, см. фиг. 9. Это может относиться, в частности, к устройствам мобильного применения с ограниченной емкостью хранения и передачи и системам многоточечного блока управления (MCU) с узкими каналами передачи данных.

Хотя некоторые аспекты были описаны в контексте устройства, ясно, что эти аспекты также представляют описание соответствующего способа, где блок или устройство соответствует этапу способа или признаку этапа способа. Аналогично, аспекты, описанные в контексте этапа способа, также представляют описание соответствующего блока или элемента или признака соответствующего устройства.

Разложенный сигнал, отвечающий изобретению, может храниться на цифровом носителе данных или может передаваться по среде передачи, например беспроводной среде передачи или проводной среде передачи, например, интернету.

В зависимости от определенных требований к реализации, варианты осуществления изобретения можно реализовать аппаратными средствами или программными средствами. Реализация может осуществляться с использованием цифрового носителя данных, например флоппи-диска, DVD, CD, ПЗУ, ППЗУ, СППЗУ, ЭСППЗУ или флэш-памяти, где хранятся электронно считываемые сигналы управления, которые взаимодействуют (или способны взаимодействовать) с программируемой компьютерной системой для осуществления соответствующего способа.

Некоторые варианты осуществления согласно изобретению содержат нетранзиторный носитель данных, имеющий электронно считываемые сигналы управления, которые способны взаимодействовать с программируемой компьютерной системой, благодаря чему осуществляется один из описанных здесь способов.

В общем случае, варианты осуществления настоящего изобретения можно реализовать в виде компьютерного программного продукта с программным кодом, причем программный код предназначен для осуществления одного из способов, когда компьютерный программный продукт выполняется на компьютере. Программный код может храниться, например, на машиночитаемом носителе.

Другие варианты осуществления содержат компьютерную программу для осуществления одного из описанных здесь способов, хранящуюся на машиночитаемом носителе.

Другими словами, вариант осуществления способа, отвечающего изобретению, предусматривает компьютерную программу, имеющую программный код для осуществления одного из описанных здесь способов, когда компьютерная программа выполняется на компьютере.

Дополнительный вариант осуществления способов, отвечающих изобретению, предусматривает носитель данных (или цифровой носитель данных, или компьютерно-считываемый носитель), на котором записана компьютерная программа для осуществления одного из описанных здесь способов.

Дополнительный вариант осуществления способа, отвечающего изобретению, предусматривает поток данных или последовательность сигналов, представляющих компьютерную программу для осуществления одного из описанных здесь способов. Поток данных или последовательность сигналов может быть сконфигурирован, например, для переноса через соединение для передачи данных, например через интернет.

Дополнительный вариант осуществления содержит средство обработки, например компьютер или программируемое логическое устройство, выполненное с возможностью или адаптированное для осуществления одного из описанных здесь способов.

Дополнительный вариант осуществления содержит компьютер, на котором установлена компьютерная программа для осуществления одного из описанных здесь способов.

В некоторых вариантах осуществления, программируемое логическое устройство (например, вентильная матрица, программируемая пользователем) может использоваться для осуществления некоторых или всех функциональных возможностей описанных здесь способов. В некоторых вариантах осуществления, вентильная матрица, программируемая пользователем, может взаимодействовать с микропроцессором для осуществления одного из описанных здесь способов. В общем случае способы, предпочтительно, осуществляются любым аппаратным устройством.

Вышеописанные варианты осуществления призваны иллюстрировать принципы настоящего изобретения. Следует понимать, что специалисты в данной области техники могут предложить модификации и вариации описанных здесь конфигураций и деталей. Поэтому они подлежат ограничению только объемом нижеследующей формулы изобретения, но не конкретными деталями, представленными посредством описания и объяснения рассмотренных здесь вариантов осуществления.

Библиография

[MPS] ISO/IEC 23003-1:2007, MPEG-D (MPEG audio technologies), Part 1: MPEG Surround, 2007.

[BCC] C. Faller and F. Baumgarte, “Binaural Cue Coding - Part II: Schemes and applications,” IEEE Trans. on Speech and Audio Proc., vol. 11, no. 6, Nov. 2003.

[JSC] C. Faller, “Parametric Joint-Coding of Audio Sources”, 120th AES Convention, Paris, 2006.

[SAOC1] J. Herre, S. Disch, J. Hilpert, O. Hellmuth: "From SAC To SAOC - Recent Developments in Parametric Coding of Spatial Audio", 22nd Regional UK AES Conference, Cambridge, UK, April 2007.

[SAOC2] J. Engdegård, B. Resch, C. Falch, O. Hellmuth, J. Hilpert, A. Hölzer, L. Terentiev, J. Breebaart, J. Koppens, E. Schuijers and W. Oomen: " Spatial Audio Object Coding (SAOC) - The Upcoming MPEG Standard on Parametric Object Based Audio Coding", 124th AES Convention, Amsterdam 2008.

[SAOC] ISO/IEC, “MPEG audio technologies - Part 2: Spatial Audio Object Coding (SAOC),” ISO/IEC JTC1/SC29/WG11 (MPEG) International Standard 23003-2.

[ISS1] M. Parvaix and L. Girin: “Informed Source Separation of underdetermined instantaneous Stereo Mixtures using Source Index Embedding”, IEEE ICASSP, 2010.

[ISS2] M. Parvaix, L. Girin, J.-M. Brossier: “A watermarking-based method for informed source separation of audio signals with a single sensor”, IEEE Transactions on Audio, Speech and Language Processing, 2010.

[ISS3] A. Liutkus and J. Pinel and R. Badeau and L. Girin and G. Richard: “Informed source separation through spectrogram coding and data embedding”, Signal Processing Journal, 2011.

[ISS4] A. Ozerov, A. Liutkus, R. Badeau, G. Richard: “Informed source separation: source coding meets source separation”, IEEE Workshop on Applications of Signal Processing to Audio and Acoustics, 2011.

[ISS5] Shuhua Zhang and Laurent Girin: “An Informed Source Separation System for Speech Signals”, INTERSPEECH, 2011.

[ISS6] L. Girin and J. Pinel: “Informed Audio Source Separation from Compressed Linear Stereo Mixtures”, AES 42nd International Conference: Semantic Audio, 2011.

1. Устройство для адаптации входной аудиоинформации, кодирующей один или более аудиообъектов, для получения адаптированной аудиоинформации, при этом входная аудиоинформация содержит два или более входных аудиоканалов понижающего микширования и дополнительно содержит входную параметрическую побочную информацию, причем адаптированная аудиоинформация содержит один или более адаптированных аудиоканалов понижающего микширования и дополнительно содержит адаптированную параметрическую побочную информацию, причем устройство содержит:

модификатор (110) сигнала понижающего микширования для адаптации, в зависимости от адаптационной информации, двух или более входных аудиоканалов понижающего микширования для получения одного или более адаптированных аудиоканалов понижающего микширования, и

средство (120) адаптации параметрической побочной информации для адаптации, в зависимости от адаптационной информации, входной параметрической побочной информации для получения адаптированной параметрической побочной информации,

причем адаптационная информация содержит адаптационную матрицу (),

причем модификатор (110) сигнала понижающего микширования выполнен с возможностью адаптации, в зависимости от адаптационной матрицы (), двух или более входных аудиоканалов () понижающего микширования для получения одного или более адаптированных аудиоканалов () понижающего микширования,

причем средство (120) адаптации параметрической побочной информации выполнено с возможностью адаптации, в зависимости от адаптационной матрицы (), входной параметрической побочной информации () для получения адаптированной параметрической побочной информации ().

2. Устройство по п. 1,

в котором входная параметрическая побочная информация () указывает начальную матрицу понижающего микширования, так что два или более входных аудиоканалов () понижающего микширования получают, применяя начальную матрицу () понижающего микширования к одному или более аудиообъектам (S), и

причем средство (120) адаптации параметрической побочной информации выполнено с возможностью определения адаптированной матрицы () понижающего микширования в качестве адаптированной параметрической побочной информации, так что один или более адаптированных аудиоканалов () понижающего микширования получают, применяя адаптированную матрицу () понижающего микширования к одному или более аудиообъектам (S).

3. Устройство по п. 1, в котором модификатор (110) сигнала понижающего микширования выполнен с возможностью адаптации двух или более входных аудиоканалов понижающего микширования, в зависимости от адаптационной информации, чтобы количество одного или более адаптированных аудиоканалов понижающего микширования было меньше количества двух или более входных аудиоканалов понижающего микширования.

4. Устройство по п. 1, в котором адаптационная информация зависит от экземпляра декодера, и причем модификатор (110) сигнала понижающего микширования выполнен с возможностью адаптации двух или более входных аудиоканалов понижающего микширования в зависимости от экземпляра декодера.

5. Устройство по п. 4,

в котором экземпляр декодера способен декодировать, самое большее, максимальное количество каналов понижающего микширования,

причем адаптационная информация зависит от упомянутого максимального количества каналов понижающего микширования, и

причем модификатор (110) сигнала понижающего микширования выполнен с возможностью адаптации двух или более входных аудиоканалов понижающего микширования, в зависимости от адаптационной информации, для получения одного или более адаптированных аудиоканалов понижающего микширования, чтобы количество одного или более адаптированных каналов понижающего микширования было равно упомянутому максимальному количеству каналов понижающего микширования.

6. Устройство по п. 1, в котором модификатор (110) сигнала понижающего микширования выполнен с возможностью адаптации, в зависимости от адаптационной матрицы , двух или более входных аудиоканалов понижающего микширования для получения одного или более адаптированных аудиоканалов понижающего микширования с применением формулы

7. Устройство по п. 1, в котором средство (120) адаптации параметрической побочной информации выполнено с возможностью адаптации, в зависимости от адаптационной матрицы , входной параметрической побочной информации для получения адаптированной параметрической побочной информации с применением формулы

8. Устройство (700; 800, 801, 802; 900, 901, 902) для генерирования одного или более аудиоканалов из входной аудиоинформации, кодирующей один или более аудиообъектов, причем устройство содержит:

устройство (710; 810, 811, 812; 910, 911, 912) по одному из пп. 1-6 для адаптации входной аудиоинформации для получения адаптированной аудиоинформации, при этом входная аудиоинформация содержит два или более входных аудиоканалов понижающего микширования и дополнительно содержит входную параметрическую побочную информацию, причем адаптированная аудиоинформация содержит один или более адаптированных аудиоканалов понижающего микширования и дополнительно содержит адаптированную параметрическую побочную информацию, и

экземпляр (720; 820, 821, 822; 920, 921, 922) декодера для декодирования, в зависимости от адаптированной параметрической побочной информации, одного или более адаптированных аудиоканалов понижающего микширования для получения одного или более аудиоканалов.

9. Устройство (700; 800, 801, 802) по п. 8,

в котором средство (120) адаптации параметрической побочной информации устройства (710; 810, 811, 812) по одному из пп. 1-7 выполнено с возможностью приема входного битового потока, содержащего входную параметрическую побочную информацию,

причем средство (120) адаптации параметрической побочной информации устройства (710; 810, 811, 812) по одному из пп. 1-7 выполнено с возможностью адаптации входной параметрической побочной информации для получения адаптированной параметрической побочной информации и подачи адаптированной параметрической побочной информации на экземпляр (720; 820, 821, 822) декодера, и

причем экземпляр (720; 820, 821, 822) декодера выполнен с возможностью декодирования одного или более адаптированных аудиоканалов понижающего микширования в зависимости от адаптированной параметрической побочной информации.

10. Устройство (700; 900, 901, 902) по п. 8,

в котором средство (120) адаптации параметрической побочной информации устройства (710; 910, 911, 912) по одному из пп. 1-7 выполнено с возможностью приема входного битового потока, содержащего входную параметрическую побочную информацию,

причем средство (120) адаптации параметрической побочной информации устройства (710; 910, 911, 912) по одному из пп. 1-7 выполнено с возможностью замены входной параметрической побочной информации во входном битовом потоке адаптированной параметрической побочной информацией для получения модифицированного битового потока,

причем средство (120) адаптации параметрической побочной информации устройства (710; 910, 911, 912) по одному из пп. 1-7 выполнено с возможностью подачи модифицированного битового потока на экземпляр (720; 920, 921, 922) декодера и

причем экземпляр (720; 920, 921, 922) декодера выполнен с возможностью декодирования одного или более адаптированных аудиоканалов понижающего микширования в зависимости от модифицированного битового потока.

11. Способ адаптации входной аудиоинформации, кодирующей один или более аудиообъектов, для получения адаптированной аудиоинформации, при этом входная аудиоинформация содержит два или более входных аудиоканалов понижающего микширования и дополнительно содержит входную параметрическую побочную информацию, причем адаптированная аудиоинформация содержит один или более адаптированных аудиоканалов понижающего микширования и дополнительно содержит адаптированную параметрическую побочную информацию, причем способ содержит этапы, на которых:

адаптируют, в зависимости от адаптационной информации, два или более входных аудиоканалов понижающего микширования для получения одного или более адаптированных аудиоканалов понижающего микширования, и

адаптируют, в зависимости от адаптационной информации, входную параметрическую побочную информацию для получения адаптированной параметрической побочной информации,

причем адаптационная информация содержит адаптационную матрицу (),

причем этап адаптации двух или более входных аудиоканалов понижающего микширования содержит адаптацию, в зависимости от адаптационной матрицы (), двух или более входных аудиоканалов () понижающего микширования для получения одного или более адаптированных аудиоканалов () понижающего микширования,

причем этап адаптации входной параметрической побочной информации содержит адаптацию, в зависимости от адаптационной матрицы (), входной параметрической побочной информации () для получения адаптированной параметрической побочной информации ().

12. Способ по п. 11,

причем этап адаптации входной параметрической побочной информации содержит определение адаптированной матрицы () понижающего микширования в качестве адаптированной параметрической побочной информации, так что один или более адаптированных аудиоканалов () понижающего микширования получают, применяя адаптированную матрицу () понижающего микширования к одному или более аудиообъектам (S).

13. Считываемый компьютером носитель, содержащий компьютерную программу для реализации способа по п. 11 или 12 при выполнении компьютером или процессором сигналов.

Похожие патенты:

Генерация комфортного шума // 2609080

Изобретение относится к средствам для генерации комфортного шума. Технический результат заключается в повышении воспринимаемого качества звука.

Регулировка уровня во временной области для декодирования или кодирования аудиосигналов // 2608878

Изобретение относится к кодированию, декодированию и обработке аудиосигналов. Технический результат – возможность регулировки уровня сигнала в динамическом диапазоне без потери точности данных.

Кодирование звуковых сцен // 2608847

Изобретение относится к кодированию и декодированию звука. Технический результат – обеспечение менее сложного и более гибкого восстановления звуковых объектов.

Эффективное ослабление опережающих эхо-сигналов в цифровом звуковом сигнале // 2607418

Изобретение относится к средствам ослабления опережающих эхо-сигналов в цифровом звуковом сигнале. Технический результат заключается в обеспечении возможности ослабления высоких частот и паразитных опережающих эхо-сигналов при декодировании без передачи кодирующим устройством какой-либо вспомогательной информации.

Устройство для обеспечения представления сигнала повышающего микширования на основе представления сигнала понижающего микширования, устройство для обеспечения битового потока, представляющего многоканальный звуковой сигнал, способы, компьютерные программы и битовый поток, представляющий многоканальный звуковой сигнал посредством использования параметра линейной комбинации // 2607267

Изобретение относится к средствам для обеспечения представления сигнала повышающего микширования на основе представления сигнала понижающего микширования. Технический результат заключается в обеспечении высокого качества звука даже в случае выбора пользователем матрицы аудиокодирования при сохранении низкого уровня вычислительной эффективности на стороне аудиокодера.

Устройство, способ и компьютерная программа для формирования с использованием среднего значения параметров сигнала, подстроенных для обеспечения представления микшированного с повышением сигнала на базе представления микшированного с понижением сигнала и параметрической сторонней информации, связанной с представлением микшированного с понижением сигнала // 2607266

Изобретение относится к области микширования. Технический результат – устранение слышимого искажения в сигнале.

Декодер звукового сигнала, кодирующее устройство звукового сигнала, способ декодирования звукового сигнала, способ кодирования звукового сигналя и компьютерная программа, использующая зависящую от высоты звука адаптацию кодируемого контекста // 2607264

Изобретение относится к средствам кодирования и декодирования звукового сигнала. Технический результат заключается в повышении эффективности кодирования при наличии колебаний основной частоты.

Устройство и способ для кодирования и декодирования кодированного аудиосигнала с использованием временного формирования шума/наложений // 2607263

Изобретение относится к средствам для кодирования и декодирования кодированного аудиосигнала. Технический результат заключается в предоставлении усовершенствованного принципа кодирования/декодирования, позволяющего уменьшить скорость передачи битов.

Устройство и способ для воспроизведения аудиосигнала, устройство и способ для генерирования кодированного аудиосигнала, компьютерная программа и кодированный аудиосигнал // 2607262

Изобретение относится к средствам для генерирования и воспроизведения аудиосигнала. Технический результат заключается в обеспечении возможности генерирования и воспроизведения аудиосигнала при уменьшении доступной скорости передачи данных.

Системы и способы для определения набора коэффициентов интерполяции // 2607260

Изобретение относится к системам и способам определения набора коэффициентов интерполяции. Технический результат изобретения заключается в оптимизировании пропускной способности, уравновешивая тем самым желаемую среднюю битовую скорость восстанавливаемого речевого сигнала. Способ для определения набора коэффициентов интерполяции посредством электронного устройства включает в себя определение значения на основе свойства текущего кадра и свойства предыдущего кадра, определение того, находится или нет значение за пределами диапазона, определение набора коэффициентов интерполяции на основе значения и индикатора режима прогнозирования, если значение находится за пределами диапазона.

Устройство и способ для совмещения потоков пространственного аудиокодирования на основе геометрии // 2609102

Изобретение относится к средствам для формирования совмещенного потока аудиоданных. Технический результат заключается в обеспечении возможности формирования совмещенного потока аудиоданных. Устройство содержит демультиплексор для получения множества одноуровневых потоков аудиоданных, где демультиплексор приспособлен для приема одного или более входных потоков аудиоданных, где каждый входной поток аудиоданных содержит один или более уровней, где демультиплексор приспособлен для демультиплексирования каждого из входных потоков аудиоданных, имеющих один или более уровней, на два или более демультиплексированных потоков аудиоданных, имеющих ровно один уровень, так что упомянутые два или более демультиплексированных потоков аудиоданных вместе содержат упомянутый один или более уровней входного потока аудиоданных. Кроме того, устройство содержит модуль совмещения для формирования совмещенного потока аудиоданных, имеющего один или более уровней, на основе упомянутого множества одноуровневых потоков аудиоданных. 3 н. и 15 з.п. ф-лы, 44 ил.

Способ распознавания протоколов низкоскоростного кодирования // 2610285

Изобретение предназначено для распознавания протоколов низкоскоростного кодирования речи (НСКР). Технический результат заключается в повышении точности распознавания протоколов НСКР. Технический результат достигается благодаря увеличению размерности измеренного вектора коэффициентов избыточности ϕZ до ϕL, L=Z+2 и учету эффекта сдвига элементов вектора ϕL путем формирования квадратной эталонной матрицы ΦLj эт для всех J известных протоколов НСКР, j=1, 2 …, J. Для этого принимают цифровой поток Y в течение заданного интервала времени ΔT. Формируют прямоугольную информационную матрицу YK×L, строками которой являются последовательно размещенные друг под другом информационные блоки. Вычисляют вектор коэффициентов избыточности ϕL, поэлементно сравнивают измеренный вектор ϕL со строками всех J квадратных эталонных матриц ΦLj эт, определяют отклонение между измеренным вектором ϕL и строками всех J эталонных матриц ΦLj эт, принимают решение в пользу j-го протокола НСКР, для которого обеспечивается минимальное отклонение измеренного вектора ϕL от строки j-й квадратной эталонной матрицы ΦLj эт. 2 з.п. ф-лы, 9 ил.

Расширение полосы частот гармонического аудиосигнала // 2610293

Изобретение относится к средствам для управления усилениями в полосах в расширенной области полосы частот на основе информации о положениях пиков. Технический результат заключается в повышении качества расширения полосы частот гармонических аудиосигналов. Принимают множество значений усиления, ассоциированных с полосой b частот, и множество соседних полос частот для полосы b. Определяют, содержит ли реконструированная соответствующая полоса b’ частот спектральный пик. Когда полоса b’ содержит спектральный пик, значение усиления, ассоциированное с полосой b’, устанавливают как первое значение на основе принятого множества значений усиления; и в противном случае, значение усиления устанавливают как второе значение на основе принятого множества значений усиления. 4 н. и 8 з.п. ф-лы, 10 ил.

Воспроизведение многоканального аудио // 2610416

Изобретение относится к воспроизведению многоканального аудио и используется, в частности, в системе воспроизведения домашнего кинотеатра/объемного звучания с использованием беспроводных блоков динамиков. Технический результат – увеличение гибкости и облегчение эксплуатации путем сокращения потребности в проводных соединениях. Система воспроизведения многоканального аудио содержит модуль воспроизведения аудио, который генерирует аудиосигналы для множества аудиоканалов. Множество взаимозаменяемых блоков динамиков содержит аккумулятор и аудиопреобразователь для воспроизведения аудиосигнала. Зарядный блок связан с конкретным аудиоканалом и содержит источник зарядки, который может заряжать аккумулятор присоединенного блока динамика. Связующая схема может связать блок динамика, когда он присоединен к зарядному блоку, с первым аудиоканалом. Система может непрерывно ассоциировать конкретные каналы с зарядными блоками (или пассивными основаниями динамиков, которые не могут осуществлять зарядку), а взаимозаменяемые блоки динамиков могут адаптироваться в зависимости от их присоединения. Данный подход может позволить осуществлять зарядку блока динамика (возможно, беспроводного) просто путем замены данного блока динамика на присоединенный к зарядному блоку. 2 н. и 13 з.п. ф-лы, 16 ил.

Вычисление отношения сигнал-шум конвертора с уменьшенной сложностью // 2610588

Настоящее изобретение относится к средствам кодирования и декодирования звука. Технический результат заключается в уменьшении вычислительной сложности процесса распределения битов, используемого в процессе кодирования/декодирования звука. Аудиокодер содержит модуль преобразования, сконфигурированный для определения на основе указанного кадра звукового сигнала набора спектральных коэффициентов. Кроме того, кодер содержит модуль кодирования с плавающей запятой, выполненный с возможностью определения набора масштабных коэффициентов и набора масштабированных значений на основе указанного набора спектральных коэффициентов; и кодирования указанного набора масштабных коэффициентов для получения набора кодированных масштабных коэффициентов. В дополнение, кодер содержит модуль распределения битов и квантования, сконфигурированный для определения общего числа доступных битов для квантования набора масштабированных значений на основе первой целевой скорости передачи данных и на основе числа битов, использованных для набора кодированных масштабных коэффициентов; определения первого параметра управления, служащего признаком распределения общего числа доступных битов для квантования масштабированных значений из набора масштабированных значений; и для квантования набора масштабированных значений. 7 н. и 25 з.п. ф-лы, 12 ил.

Преобразующее кодирование/декодирование гармонических звуковых сигналов // 2611017

Изобретение относится к средствам для кодирования и декодирования гармонических звуковых сигналов. Технический результат заключается в повышении качества кодированного гармонического звукового сигнала. Кодер для кодирования коэффициентов частотного преобразования гармонического звукового сигнала включает в себя следующие элементы: определитель местоположения пика, выполненный с возможностью определения местоположения спектральных пиков, имеющих величины, превышающие предопределенный зависящий от частоты порог. Кодер пиковой области, выполненный с возможностью кодирования пиковых областей, включающих в себя и окружающих обнаруженные пики. Кодер низкочастотного набора, выполненный с возможностью кодирования по меньшей мере одного низкочастотного набора коэффициентов за пределами пиковых областей и ниже переходной частоты, которая зависит от количества битов, используемых для кодирования пиковых областей. Кодер коэффициента усиления уровня шума, выполненный с возможностью кодирования коэффициента усиления уровня шума по меньшей мере одного высокочастотного набора еще не кодированных коэффициентов за пределами пиковых областей. 6 н. и 14 з.п. ф-лы, 23 ил., 1 табл.

Устройство кодирования аудио, способ кодирования аудио, программа кодирования аудио, устройство декодирования аудио, способ декодирования аудио и программа декодирования аудио // 2612581

Изобретение относится к средствам для кодирования и декодирования аудио. Технический результат заключается в уменьшении задержки при восстановлении аудио после потери пакета при кодировании. Устройство передачи аудиосигнала для кодирования аудиосигнала включает в себя блок кодирования аудио, который кодирует аудиосигнал, и блок кодирования побочной информации, который вычисляет и кодирует побочную информацию из прогнозного сигнала. Устройство приема аудиосигнала для декодирования аудиокода и вывода аудиосигнала включает в себя буфер аудиокода, который обнаруживает потерю пакета на основе состояния приема аудиопакета, блок декодирования аудиопараметров, который декодирует аудиокод, когда аудиопакет принят корректно, блок декодирования побочной информации, который декодирует код побочной информации, когда аудиопакет принят корректно, блок сбора побочной информации, который собирает побочную информацию, получаемую посредством декодирования кода побочной информации, блок обработки отсутствующих аудиопараметров, который выводит аудиопараметр, когда обнаружена потеря аудиопакета, и блок синтеза аудио, который синтезирует декодированное аудио из аудиопараметра. 4 н. и 4 з.п. ф-лы, 43 ил.

Декорреляция сигналов в системе обработки аудиоданных // 2614381

Изобретение относится к области обработки сигнала. Техническим результатом является уменьшение сложности алгоритмов кодирования и декодирования за счет декорреляции только вещественнозначных коэффициентов. Способ обработки аудиоданных включает прием из битового потока аудиоданных, соответствующих ряду звуковых каналов, применение процесса декорреляции к некоторым из аудиоданных, причем процесс декорреляции включает применение алгоритма декорреляции, действующего полностью на вещественнозначных коэффициентах. 3 н. и 13 з.п. ф-лы, 37 ил.

Усовершенствованное стереофоническое кодирование на основе комбинации адаптивно выбираемого левого/правого или среднего/побочного стереофонического кодирования и параметрического стереофонического кодирования // 2614573

Изобретение относится к средствам кодирования и декодирования звуковых сигналов. Технический результат заключается в повышении качества кодирования сигнала. Генерируют низведенный сигнал и остаточный сигнал на основе стереофонического сигнала. Определяют разность интенсивностей между каналами и взаимную корреляцию между каналами. Предпочтительно параметры параметрического стереофонического кодирования являются зависящими от времени и от частоты. Этап преобразования генерирует псевдолевый/правый стереофонический сигнал путем выполнения преобразования на основе низведенного сигнала и остаточного сигнала. Псевдостереофонический сигнал обрабатывается перцептуальным стереофоническим кодером. Для стереофонического кодирования может быть выбрано левое/правое кодирование или среднее/побочное кодирование. Предпочтительно выбор между левым/правым кодированием и средним/побочным кодированием является зависящим от времени и от частоты. 4 н. и 16 з.п. ф-лы, 26 ил.

Генератор водяного знака, декодер водяного знака, способ генерации сигнала водяного знака, способ формирования данных двоичного сообщения в зависимости от сигнала с водяным знаком и компьютерная программа на основе усовершенствованной концепции синхронизации // 2614855

Изобретение относится к средствам генерации, кодирования и декодирования водяного знака. Технический результат заключается в обеспечении надежной синхронизации при передаче водяного знака. Генератор водяного знака, вырабатывающий сигнал электронного водяного знака на основе данных двоичного сообщения, включающий в свою конструкцию расширитель информации, расширяющий информационную единицу до множества значений время-частотной области с формированием представления информации о расширении. Генератор водяного знака, также включающий в свою конструкцию модулятор синхронности, выполняющий мультипликативное совмещение представления информации о расширении с последовательностью синхронизации для формирования совокупного представления информации и синхронизации. Генератор водяного знака, наряду с этим включающий в себя питатель сигнала водяного знака, вырабатывающий сигнал водяного знака на основе совокупного представления информации и синхронизации. Кроме того, описаны декодер водяного знака, способы и компьютерные программы. 6 н. и 13 з.п. ф-лы, 41 ил.