Устройство и способ декодирования кодированного аудиосигнала для получения модифицированных выходных сигналов

Авторы патента:

РИДДЕРБУШ Фалько (DE)

ТЕРЕНТИВ Леон (DE)

ФУКС Харальд (DE)

ХЕЛЛЬМУТ Оливер (DE)

МУРТАЗА Адриан (RO)

ПАУЛУС Йоуни (DE)

H04S3/02 - матричного типа, т.е. в которых входные сигналы совмещены алгебраически, например после фазового сдвига сигналов относительно друг друга

H04S2400/01 - Стереофонические системы (хранение информации, записанной на дисках или ленте G11B; широковещательные системы для распределения стереофонической информации H04H 5/00; многоканальные системы вообще H04J)

G10L19/08 - определение или кодирование функций возбуждения; определение или кодирование параметров долгосрочных прогнозов

G10L19/008 - Техника анализа-синтеза речи для уменьшения избыточности, например в вокодерах ; кодирование или декодирование речи

Владельцы патента RU 2653240:

ФРАУНХОФЕР-ГЕЗЕЛЛЬШАФТ ЦУР ФЕРДЕРУНГ ДЕР АНГЕВАНДТЕН ФОРШУНГ Е.Ф. (DE)

Изобретение относится к кодированию аудиообъектов. Технический результат изобретения заключается в сокращении вычислительных ресурсов, что минимизирует обработку пространственного кодирования аудиообъектов SAOC. Устройство для декодирования кодированного аудиосигнала (100) для получения модифицированных выходных сигналов (160) содержит входной интерфейс (110) для приема переданного сигнала (112) понижающего микширования и параметрических данных (114); модификатор (116) понижающего микширования для модификации переданного сигнала понижающего микширования с использованием функции модификации понижающего микширования; средство (118) рендеринга объектов для осуществления рендеринга аудиообъектов с использованием модифицированного сигнала понижающего микширования и параметрических данных для получения выходных сигналов; модификатор (120) выходного сигнала для модификации выходных сигналов с использованием функции модификации выходного сигнала. 3 н. и 12 з.п. ф-лы, 9 ил.

Настоящее изобретение относится к кодированию аудиообъектов и, в частности, к кодированию аудиообъектов с использованием сигнала понижающего микширования после мастеринга в качестве транспортного канала.

Недавно были предложены параметрические методы эффективной в отношении битовой скорости передачи/хранения аудиосцен, содержащих множество аудиообъектов, в области аудиокодирования [BCC, JSC, SAOC, SAOC1, SAOC2] и разделения информационных источников [ISS1, ISS2, ISS3, ISS4, ISS5, ISS6]. Эти методы предназначены для реконструкции нужной выходной аудиосцены или объекта источника аудиосигнала на основании дополнительной вспомогательной информации, описывающей переданную/сохраненную аудиосцену и/или объекты источника в аудиосцене. Эта реконструкция происходит на декодере с использованием схемы параметрического разделения информационных источников.

Здесь, в основном, делается упор на операцию пространственного кодирования аудиообъектов (SAOC) [SAOC] MPEG, но те же принципы также справедливы для других систем. Основные операции системы SAOC представлены на фиг. 5. Без потери общности, для улучшения удобочитаемости уравнений, для всех введенных переменных индексы, обозначающие зависимость от времени и частоты, опущены в этом документе, если не указано обратное. Система принимает N входных аудиообъектов и инструкции, как следует микшировать эти объекты, например, в форме матрицы D понижающего микширования. Входные объекты можно представить в виде матрицы S размером . Кодер извлекает параметрическую и, возможно, также вспомогательную информацию на основе формы волны, описывающую объекты. В SAOC вспомогательная информация состоит, в основном, из информации относительной энергии объекта, параметризованной разностями на уровне объектов (OLD) и из информации корреляций между объектами, параметризованными межобъектными корреляциями (IOC). Необязательная вспомогательная информация на основе формы волны в SAOC описывает ошибку реконструкции параметрической модели. Помимо извлечения этой вспомогательной информации, кодер обеспечивает сигнал понижающего микширования с M каналами, созданными с использованием информации в матрице понижающего микширования D размером . Сигналы понижающего микширования можно представить в виде матрицы X размером со следующим соотношением с входными объектами: . Обычно выполняется соотношение , но это не является строгим требованием. Сигналы понижающего микширования и вспомогательная информация передаются или сохраняются, например, с помощью аудиокодека, например MPEG-2/4 AAC. Декодер SAOC принимает сигналы понижающего микширования и вспомогательную информацию, и дополнительная информация рендеринга, часто в форме матрицы M рендеринга размером , описывающей, как выводить с K каналами, относится к исходным входным объектам.

Основные операционные блоки декодера SAOC изображены на фиг. 6 и будут кратко рассмотрены ниже. Сначала вспомогательная информация декодируется и надлежащим образом интерпретируется. Блок разделения (виртуальных) объектов использует вспомогательную информацию и пытается (виртуально) реконструировать входные аудиообъекты. Операция именуется “виртуальной”, поскольку обычно не требуется в явном виде реконструировать объекты, но следующий этап рендеринга может объединяться с этим этапом. Реконструкции (виртуальных) объектов все же могут содержать ошибки реконструкции. Реконструкции (виртуальных) объектов можно представить в виде матрицы размером . Система принимает информацию рендеринга извне, например, из взаимодействия с пользователем. В контексте SAOC, информация рендеринга описана как матрица M рендеринга, задающая, как следует объединять реконструкции объектов для создания выходных сигналов . Выходные сигналы можно представить в виде матрицы Y размером , которая является результатом применения матрицы M рендеринга к реконструированным объектам в виде .

Разделение (виртуальных) объектов в SAOC действует, в основном, с использованием параметрической вспомогательной информации для определения коэффициентов без микширования, которые затем будут применяться к сигналам понижающего микширования для получения реконструкций (виртуальных) объектов. Заметим, что полученное таким образом воспринимаемое качество может быть недостаточно для некоторых применений. По этой причине SAOC обеспечивает также режим улучшенного качества для до четырех исходных входных аудиообъектов. Эти объекты, именуемые расширенными аудиообъектами (EAO), связаны с сигналами коррекции во временной области, минимизирующими разность между реконструкциями (виртуальных) объектов и исходными входными аудиообъектами. EAO можно реконструировать с помощью очень малых разностей формы волны от исходного входного аудиообъекта.

Одно основное свойство системы SAOC состоит в том, что сигналы понижающего микширования могут быть построены таким образом, что их можно слушать, и они образуют семантически значимую аудиосцену. Это позволяет пользователям без приемника, способного декодировать информацию SAOC, все же наследоваться основным аудиоконтентом без возможных улучшений SAOC. Например, будет возможно применять вышеописанную систему SAOC с радио или телевизионным вещанием с обратной совместимостью. Было бы практически невозможно обменять все приемники, установленные только для добавления некоторых несущественных функциональных возможностей. Вспомогательная информация SAOC обычно является довольно компактной, и ее можно включать в транспортный поток сигнала понижающего микширования. Традиционные приемники просто игнорируют вспомогательную информацию SAOC и выводят сигналы понижающего микширования, и приемники, включающие в себя декодер SAOC, может декодировать вспомогательную информацию и обеспечивать некоторые дополнительные функциональные возможности.

Однако, в особенности, в случае широковещательного использования, сигнал понижающего микширования, созданный кодером SAOC, будет дополнительно подвергаться последующей обработке широковещательной станцией по эстетическим или техническим соображениям до передачи. Возможно, что звукооператор захочет отрегулировать аудиосцену в соответствии со своим художественным видением, или сигнал нужно манипулировать для согласования со звуковым изображением товарного знака вещателя, или сигнал следует манипулировать для согласования с некоторыми техническими правилами, например, рекомендациями и правилами, касающимися громкости аудиосигнала. При манипулировании сигнала понижающего микширования, блок-схема операций над сигналом, показанная на фиг. 5, меняется на показанную на фиг. 7. Здесь предполагается, что исходная манипуляция понижающего микширования мастеринга сигнала понижающего микширования применяет некоторую функцию к каждому из сигналов понижающего микширования, получая манипулированные сигналы понижающего микширования. Также возможно, что фактически передаваемые сигналы понижающего микширования не происходят из сигналов, созданных кодером SAOC, но целиком обеспечиваются извне, но эта ситуация включена в рассмотрение, поскольку также является манипуляцией созданного кодером сигнала понижающего микширования.

Манипуляция сигналов понижающего микширования может создавать проблемы на декодере SAOC при разделении (виртуальных) объектов, поскольку сигналам понижающего микширования на декодере больше не обязательно совпадать с моделью, передаваемой через вспомогательную информацию. В особенности, когда вспомогательная информация формы волны ошибки предсказания передается для EAO, она очень чувствительна к изменениям формы волны в сигналах понижающего микширования.

Следует отметить, что MPEG SAOC [SAOC] задан для максимального из двух сигналов понижающего микширования и одного или двух выходных сигналов, т.е., . Однако размеры распространены здесь на общий случай, поскольку это распространение довольно очевидно и помогает описанию.

В [PDG, SAOC] было предложено маршрутизировать манипулированные сигналы понижающего микширования также на кодер SAOC, извлекать некоторую дополнительную вспомогательную информацию и использовать эту вспомогательную информацию на декодере для снижения разностей между сигналами понижающего микширования, отвечающими модели микширования SAOC, и манипулированными сигналами понижающего микширования, доступными на декодере. Основная идея маршрутизации представлена на фиг. 8А с дополнительным соединением обратной связи от манипуляции понижающего микширования на кодер SAOC. Современный стандарт MPEG для SAOC [SAOC] включает в себя части предложения [PDG], в основном, фокусируясь на параметрической компенсации. Оценивание параметров компенсации здесь не описано, но читателю предлагается обратиться к информативному приложению D.8 стандарта MPEG SAOC [SAOC].

Вспомогательная информация коррекции упаковывается в поток вспомогательной информации и передается и/или сохраняется поблизости. Декодер SAOC декодирует вспомогательную информацию и использует вспомогательную информацию модификации понижающего микширования для компенсации манипуляций до основной обработки SAOC. Это представлено на фиг. 8В. Стандарт MPEG SAOC задает, что вспомогательная информация компенсации состоит из коэффициентов усиления для каждого сигнала понижающего микширования. Они обозначаются как , где – индекс сигнала понижающего микширования. Отдельные параметры сигнала можно собирать в матрицу . Когда манипулированные сигналы понижающего микширования обозначаются как матрица , скомпенсированные сигналы понижающего микширования, подлежащие использованию в основной обработке SAOC можно получить согласно .

В [PDG] также предложено включать остаточные сигналы формы волны, описывающие разность между параметрически скомпенсированными манипулированными сигналами понижающего микширования и сигналами понижающего микширования, созданными кодером SAOC. Однако это не является частью стандарта MPEG SAOC [SAOC].

Преимущество компенсации состоит в том, что сигналы понижающего микширования, принятые блоком разделения (виртуальных) объектов SAOC, ближе к сигналам понижающего микширования, созданным кодером SAOC и лучше совпадают с переданной вспомогательной информацией. Часто это приводит к снижению артефактов в реконструкциях (виртуальных) объектов.

Сигналы понижающего микширования, используемые разделением (виртуальных) объектов, аппроксимируют неманипулированные сигналы понижающего микширования, созданные на кодере SAOC. В результате, выходной сигнал после рендеринга будет аппроксимировать результат, который был бы получен путем применения, часто заданных пользователем, инструкций рендеринга на исходных входных аудиообъектах. Если задано, что информация рендеринга должна быть идентична или очень близка к информации понижающего микширования, другими словами, выходные сигналы будут напоминать созданные кодером сигналы понижающего микширования: . Помня, что манипуляция сигнала понижающего микширования может осуществляться по веским причинам, может быть желательно, чтобы выходной сигнал напоминал манипулированный сигнал понижающего микширования, вместо .

Проиллюстрируем это на более конкретном примере возможного применения улучшения диалога в широковещательной передаче.

Исходные входные аудиообъекты S состоят из (возможно, многоканального) сигнала заднего плана, например, шума публики и окружения в спортивной широковещательной передаче, и (возможно, многоканального) сигнала переднего плана, например, комментатора.

Сигнал X понижающего микширования содержит смесь заднего плана и переднего плана.

Сигнал понижающего микширования манипулируется согласно f(X), состоящей, в случае реального мира, например, из многополосного эквалайзера, компрессора динамического диапазона, и лимитера (любая производимая здесь манипуляция в дальнейшем именуется “мастерингом”).

На декодере, информация рендеринга аналогична информации понижающего микширования. Единственное отличие состоит в том, что баланс относительного уровня между сигналами заднего плана и переднего плана может регулироваться конечным пользователем. Другими словами, пользователь может ослаблять шум публики, чтобы голос комментатора был лучше слышен, например, для повышения разборчивости. В качестве противоположного примера, конечный пользователь может ослаблять голос комментатора, чтобы можно было сосредоточиться на акустической сцене мероприятия.

Если компенсация манипуляции понижающего микширования не используется, реконструкции (виртуальных) объектов могут содержать артефакты, обусловленные различиями между реальными свойствами принятых сигналов понижающего микширования и свойствами, переданными в качестве вспомогательной информации.

Если компенсация манипуляции понижающего микширования используется, мастеринг будет удален из выходного сигнала. Даже в случае, когда конечный пользователь не модифицирует баланс микширования, сигнал понижающего микширования по умолчанию (т.е. выходной сигнал приемников, не способных декодировать вспомогательную информацию SAOC) и выходной сигнал после рендеринга будут отличаться, возможно, весьма значительно.

В конце, вещатель получают следующие близкие к оптимальным возможности:

принимать артефакты SAOC из рассогласования между сигналами понижающего микширования и вспомогательной информацией;

не включать в себя никакие передовые функциональные возможности улучшения диалога; и/или

терять изменения мастеринга выходного сигнала.

Задачей настоящего изобретения является обеспечение усовершенствованного принципа декодирования кодированного аудиосигнала.

Эта задача решается посредством устройства для декодирования кодированного аудиосигнала по п. 1, способа декодирования кодированного аудиосигнала по п. 14 или компьютерной программы по п. 15.

В основе настоящего изобретения лежит тот факт, что усовершенствованный принцип рендеринга с использованием сигналов кодированных аудиообъектов получается, когда манипуляции понижающего микширования, примененные на этапе мастеринга не просто отвергаются для улучшения разделения объектов, но повторно применяются к выходным сигналам, генерируемым на этапе рендеринга. Таким образом, гарантируется, что никакие художественные или другие манипуляции понижающего микширования нельзя просто потерять в случае сигналов, кодированных аудиообъектами, но можно найти в окончательном результате операции декодирования. Для этого, устройство для декодирования кодированного аудиосигнала содержит входной интерфейс, последовательно подключенный модификатор понижающего микширования для модификации переданного сигнала понижающего микширования с использованием функции модификации понижающего микширования, средство рендеринга объектов для осуществления рендеринга аудиообъектов с использованием модифицированного сигнала понижающего микширования и параметрических данных и окончательный модификатор выходного сигнала для модификации выходных сигналов с использованием функции модификации выходного сигнала, где модификация происходит таким образом, что модификация посредством функции модификации понижающего микширования, по меньшей мере, частично обращается или, другими словами, манипуляция понижающего микширования восстанавливается, но повторно применяется не к сигналу понижающего микширования, а к выходным сигналам средства рендеринга объектов. Другими словами, функция модификации выходного сигнала, предпочтительно, обратна модификации сигнала понижающего микширования, или, по меньшей мере, частично обратна функции модификации сигнала понижающего микширования. Другими словами, функция модификации выходного сигнала такова, что операция манипуляции, применяемая к исходному сигналу понижающего микширования для получения переданного сигнала понижающего микширования, по меньшей мере, частично применяется к выходному сигналу, и, предпочтительно, применяется идентичная операция.

В предпочтительных вариантах осуществления настоящего изобретения, обе функции модификации отличаются друг от друга и, по меньшей мере, частично обратны друг другу. В дополнительном варианте осуществления, функция модификации понижающего микширования и функция модификации выходного сигнала содержат соответствующие коэффициенты усиления для разных временных кадров или полос частот, и либо коэффициенты усиления модификации понижающего микширования, либо коэффициенты усиления модификации выходного сигнала выводятся друг из друга. Таким образом, либо коэффициенты усиления модификации сигнала понижающего микширования, либо коэффициенты усиления модификации выходного сигнала могут передаваться, и тогда декодер способен выводить другие коэффициенты из переданных, обычно путем их инвертирования.

Дополнительные варианты осуществления предусматривают наличие информации модификации понижающего микширования в передаваемом сигнале в качестве вспомогательной информации, и декодер извлекает вспомогательную информацию, осуществляет модификацию понижающего микширования с одной стороны, вычисляет обратную или, по меньшей мере, частично или приблизительно обратную функцию и применяет эту функцию к выходным сигналам из средства рендеринга объектов.

Дополнительные варианты осуществления содержат передачу информации управления для избирательной активации/деактивации модификатора выходного сигнала, чтобы гарантировать, что эта модификация выходного сигнала осуществляется только когда она обусловлена художественными соображениями, тогда как модификация выходного сигнала, например, не осуществляется, когда она обусловлена чисто техническими соображениями, например манипуляцией, сигнала для получения более высоких характеристик передачи для определенных форматов передачи/ способов модуляции.

Дополнительные варианты осуществления относятся к кодированному сигналу, в котором сигнал понижающего микширования манипулирован путем осуществления операции оптимизации громкости, эквализации, многополосной эквализации, компрессии динамического диапазона или лимитирования, и в этом случае модификатор выходного сигнала выполнен с возможностью повторного применения операции эквализации, операции оптимизации громкости, операции многополосной эквализации, операции компрессии динамического диапазона или операции лимитирования к выходным сигналам.

Дополнительные варианты осуществления содержат средство рендеринга объектов, которое генерирует выходные сигналы на основании переданной параметрической информации и на основании информации положения, относящейся к размещению аудиообъектов на установке воспроизведения. Генерация выходных сигналов может осуществляться либо путем воссоздания сигналов отдельных объектов и затем, в необязательном порядке, модификации воссозданных сигналов объектов и затем распределения модифицированных, в необязательном порядке, реконструированных объектов по сигналам каналов для громкоговорителей согласно любого рода общеизвестному принципу рендеринга, например, амплитудному панорамированию на векторной основе и т.п. Другие варианты осуществления не опираются на явную реконструкцию виртуальных объектов, но осуществляют непосредственную обработку из модифицированного сигнала понижающего микширования в сигналы громкоговорителей без явного вычисления реконструированных объектов, поскольку оно известно в технике пространственного аудиокодирования, например, MPEG-Surround или MPEG-SAOC.

В дополнительных вариантах осуществления, входной сигнал содержит нормальные аудиообъекты и расширенные аудиообъекты, и средство рендеринга объектов выполнено с возможностью реконструкции аудиообъектов или непосредственной генерации выходных каналов с использованием нормальных аудиообъектов и расширенных аудиообъектов.

Затем, предпочтительные варианты осуществления настоящего изобретения описаны со ссылкой на прилагаемые чертежи, в которых:

фиг. 1 – блок-схема варианта осуществления аудиодекодера;

фиг. 2 – дополнительный вариант осуществления аудиодекодера;

фиг. 3 демонстрирует способ вывода функции модификации выходного сигнала из функции модификации сигнала понижающего микширования;

фиг. 4 демонстрирует процесс вычисления коэффициентов усиления модификации выходного сигнала из интерполированных коэффициентов усиления модификации понижающего микширования;

фиг. 5 демонстрирует основную блок-схему работы системы SAOC;

фиг. 6 демонстрирует блок-схему работы декодера SAOC;

фиг. 7 демонстрирует блок-схему работы системы SAOC, включающей в себя манипуляцию сигнала понижающего микширования;

фиг. 8А демонстрирует блок-схему работы системы SAOC, включающей в себя манипуляцию сигнала понижающего микширования; и

фиг. 8В демонстрирует блок-схему работы декодера SAOC, включающего в себя компенсацию манипуляции сигнала понижающего микширования до основной обработки SAOC.

Фиг. 1 демонстрирует устройство для декодирования кодированного аудиосигнала 100 для получения модифицированных выходных сигналов 160. Устройство содержит входной интерфейс 110 для приема переданного сигнала понижающего микширования и параметрических данных, относящихся к двум аудиообъектам, включенным в переданный сигнал понижающего микширования. Входной интерфейс извлекает переданный сигнал 112 понижающего микширования и параметрические данные 114 из кодированного аудиосигнала 100. В частности, сигнал 112 понижающего микширования, т.е. переданный сигнал понижающего микширования, отличается от сигнала понижающего микширования кодера, с которым связаны параметрические данные 114. Кроме того, устройство содержит модификатор 116 понижающего микширования для модификации переданного сигнала 112 понижающего микширования с использованием функции модификации понижающего микширования. Модификация понижающего микширования осуществляется таким образом, что модифицированный сигнал понижающего микширования идентичен сигналу понижающего микширования кодера или, по меньшей мере, более аналогичен сигналу понижающего микширования кодера по сравнению с переданным сигналом понижающего микширования. Предпочтительно, модифицированный сигнал понижающего микширования на выходе блока 116 идентичен сигналу понижающего микширования кодера, с которым связаны параметрические данные. Однако модификатор 116 понижающего микширования также может быть выполнен с возможностью не полностью обращать манипуляцию сигнала понижающего микширования кодера, но лишь частично удалять эту манипуляцию. Таким образом, модифицированный сигнал понижающего микширования, по меньшей мере, более аналогичен сигналу понижающего микширования кодера, чем переданный сигнал понижающего микширования. Сходство можно измерять, например, путем вычисления квадратичного расстояния между отдельными выборками либо во временной области, либо в частотной области, где разности формируются выборка за выборкой, например, между соответствующими кадрами и/или полосами модифицированного сигнала понижающего микширования и сигнала понижающего микширования кодера. Затем эта квадратичная мера расстояния, т.е., сумма по всем квадратам разностей, меньше соответствующей суммы квадратов разностей между переданным сигналом 112 понижающего микширования (сгенерированным блоком манипуляции понижающего микширования на фиг. 7 или 8a) и сигналом понижающего микширования кодера (генерируемым на блоке кодера SAOC на фиг. 5, 6, 7 8А.

Таким образом, модификатор 116 понижающего микширования может быть сконфигурирован аналогично блоку модификации понижающего микширования, рассмотренному в контексте фиг. 8В.

Кроме того, устройство на фиг. 1 содержит средство 118 рендеринга объектов для осуществления рендеринга аудиообъектов с использованием модифицированного сигнала понижающего микширования и данных 114 параметров для получения выходных сигналов. Кроме того, важно, что устройство содержит модификатор 120 выходного сигнала для модификации выходных сигналов с использованием функции модификации выходного сигнала. Предпочтительно, модификация выходного сигнала осуществляется таким образом, что модификация, применяемая модификатором 116 понижающего микширования, по меньшей мере, частично обращается. В других вариантах осуществления, функция модификации выходного сигнала обращается или, по меньшей мере, частично обращается в функцию модификации сигнала понижающего микширования. Таким образом, модификатор выходного сигнала выполнен с возможностью модификации выходных сигналов с использованием функции модификации выходного сигнала, таким образом, что операция манипуляции, применяемая к сигналу понижающего микширования кодера для получения переданного сигнала понижающего микширования, по меньшей мере, частично применяется к выходному сигналу и, предпочтительно, полностью применяется к выходным сигналам.

Согласно варианту осуществления, модификатор 116 понижающего микширования и модификатор 120 выходного сигнала выполнены таким образом, что функция модификации выходного сигнала отличается от функции модификации понижающего микширования и, по меньшей мере, частично обращена относительно функции модификации понижающего микширования.

Кроме того, вариант осуществления модификатора понижающего микширования содержит функцию модификации понижающего микширования, содержащую применение коэффициентов усиления модификации понижающего микширования к разным временным кадрам или полосам частот переданного сигнала 112 понижающего микширования. Кроме того, функция модификации выходного сигнала содержит применение коэффициентов усиления модификации выходного сигнала к разным временным кадрам или полосам частот выходных сигналов. Кроме того, коэффициенты усиления модификации выходного сигнала выводятся из обратных значений функции модификации сигнала понижающего микширования. Этот сценарий применяется, когда коэффициенты усиления модификации сигнала понижающего микширования доступны, например, посредством отдельного ввода на стороне декодера или доступны, поскольку они были переданы в кодированном аудиосигнале 100. Однако альтернативные варианты осуществления также содержат ситуацию, когда коэффициенты усиления модификации выходного сигнала, используемые модификатором 120 выходного сигнала, передаются или вводятся пользователем, и в этом случае модификатор 116 понижающего микширования выполнен с возможностью вывода коэффициентов усиления модификации сигнала понижающего микширования из доступных коэффициентов усиления модификации выходного сигнала.

В дополнительном варианте осуществления, входной интерфейс 110 выполнен с возможностью дополнительно принимать информацию о функции модификации понижающего микширования и эта информация 115 модификации извлекается входным интерфейсом 110 из кодированного аудиосигнала и поступает на модификатор 116 понижающего микширования и модификатор 120 выходного сигнала. Опять же, функция модификации понижающего микширования может содержать коэффициенты усиления модификации сигнала понижающего микширования или коэффициенты усиления модификации выходного сигнала и затем, в зависимости от того, какой набор коэффициентов усиления доступен, соответствующий элемент 116 или 120 выводит свои коэффициенты усиления из доступных данных.

В дополнительном варианте осуществления, осуществляется интерполяция коэффициентов усиления модификации сигнала понижающего микширования или коэффициентов усиления модификации выходного сигнала. Альтернативно или дополнительно, сглаживание также осуществляется таким образом, что ситуации, в которых эти данные передачи изменяются слишком быстро, не привносят никаких артефактов.

Согласно варианту осуществления, модификатор 120 выходного сигнала выполнен с возможностью вывода своих коэффициентов усиления модификации выходного сигнала путем инвертирования коэффициентов усиления модификации понижающего микширования. Затем, во избежание численных проблем, используется либо максимальный из инвертированного коэффициента усиления модификации понижающего микширования и постоянного значения, либо сумма инвертированного коэффициента усиления модификации понижающего микширования и того же или другого постоянного значения. Таким образом, функция модификации выходного сигнала не обязательно является обратной функции модификации сигнала понижающего микширования, но является, по меньшей мере, частично обратной.

Кроме того, модификатор 120 выходного сигнала управляется сигналом управления, указанным позицией 117 как флаг управления. Таким образом, существует возможность, что модификатор 120 выходного сигнала избирательно активируется или деактивируется для определенных полос частот и/или временных кадров. Согласно варианту осуществления, флаг является просто 1-битовым флагом, и когда сигнал управления таков, что модификатор выходного сигнала деактивируется, то это сигнализируется, например, состоянием "нуль" флага, и затем сигнал управления таков, что модификатор выходного сигнала активируется, то это сигнализируется, например, состоянием "единица" или состоянием "установлен" флага. Естественно, правило управления может быть обратным.

В дополнительном варианте осуществления, модификатор 116 понижающего микширования выполнен с возможностью снижения или отмены операции оптимизации громкости или эквализации или многополосной эквализации или компрессии динамического диапазона или лимитирования, применяемой к передаваемому каналу понижающего микширования. Другими словами, эти операции обычно применяются на стороне кодера блоком манипуляции понижающего микширования, показанным на фиг. 7, или блоком манипуляции понижающего микширования, показанным на фиг. 8А, для вывода переданного сигнала понижающего микширования из сигнала понижающего микширования кодера, генерируемого, например, блоком кодера SAOC, показанного на фиг. 5, кодера SAOC, показанного на фиг. 7, или кодера SAOC, показанного на фиг. 8А.

В этом случае, модификатор 120 выходного сигнала выполнен с возможностью повторного применения операция оптимизации громкости или эквализации или многополосной эквализации или компрессии динамического диапазона или лимитирования к выходным сигналам, генерируемым средством 118 рендеринга объектов для окончательного получения модифицированных выходных сигналов 160.

Кроме того, средство 118 рендеринга объектов может быть выполнено с возможностью вычисления выходных сигналов как сигналов каналов для громкоговорителей схемы воспроизведения из модифицированного сигнала понижающего микширования, параметрических данных 114 и информации 121 положения, которые могут, например, вводиться в средство 118 рендеринга объектов через интерфейс 122 пользовательского ввода или которые могут, дополнительно, передаваться от кодера на декодер по отдельности или в кодированном сигнале 100, например, как “матрица рендеринга”.

В этом случае, модификатор 120 выходного сигнала выполнен с возможностью применения функции модификации выходного сигнала к этим сигналам каналов для громкоговорителей, и затем модифицированные выходные сигналы 116 могут непосредственно ретранслироваться на громкоговорители.

В другом варианте осуществления, средство рендеринга объектов выполнено с возможностью осуществления двухэтапной обработки, т.е., чтобы, прежде всего, реконструировать отдельные объекты и затем распределять сигналы объектов по соответствующим сигналам громкоговорителей любым из общеизвестных средств, например, амплитудным панорамированием на векторной основе и т.п. Затем выходной сигнал 120 также может быть сконфигурирован для применения модификации выходного сигнала к сигналам реконструированных объектов до осуществления распределения на отдельные громкоговорители. Таким образом, выходные сигналы, генерируемые средством 118 рендеринга объектов на фиг. 1, могут быть либо сигналами реконструированных объектов, либо сразу (немодулированными) сигналами громкоговорителей каналов.

Кроме того, интерфейс 110 входного сигнала выполнен с возможностью приема расширенного аудиообъекта и нормальных аудиообъектов, например, известных из SAOC. В частности, расширенный аудиообъект является, как известно в технике, разностью форм волны между исходным объектом и реконструированной версией этого объекта с использованием параметрических данных, например, параметрических данных 114. Это допускает, что отдельные объекты, например, четыре объекта в наборе из, например, двадцати объектов и т.п. могут передаваться очень хорошо, естественно, ценой дополнительной битовой скорости вследствие необходимой информации для расширенного аудиосигнала. Затем средство 118 рендеринга объектов выполнено с возможностью использования нормальных объектов и расширенного аудиообъекта для вычисления выходных сигналов.

В дополнительном варианте осуществления средство рендеринга объектов выполнено с возможностью приема пользовательского ввода 123 для манипулирования одним или более объектами, например, для манипулирования объектом переднего плана FGO или объектом заднего плана BGO или обоими, и затем средство 118 рендеринга объектов выполнено с возможностью манипулирования одним или более объектами, определенными пользовательским вводом при осуществлении рендеринга выходных сигналов. В этом варианте осуществления, предпочтительно фактически реконструировать сигналы объектов и затем манипулировать сигналом объект переднего плана или ослаблять сигнал объекта заднего плана и затем происходит распределение по каналам, и затем сигналы каналов модифицируются. Однако, альтернативно, выходные сигналы уже могут быть сигналами отдельных объектов, и распределение сигналов объектов после осуществления модификации блоком 120 происходит до распределения сигналов объектов по сигналам отдельных каналов с использованием информации 121 положения и любого общеизвестного процесса для генерации сигналов громкоговорителей каналов из сигналов объектов, например амплитудного панорамирования на векторной основе.

Затем на фиг. 2 описан предпочтительный вариант осуществления устройства для декодирования кодированного аудиосигнала. Принимается кодированная вспомогательная информация, которая содержит, например, параметрические данные 114, показанные на фиг. 1, и информацию 115 модификации. Кроме того, принимаются модифицированные сигналы понижающего микширования которые соответствуют переданному сигналу 112 понижающего микширования. Из фиг. 2 можно видеть, что переданный сигнал понижающего микширования может быть единичным каналом или несколькими каналами, например M каналами, где M – целое число. Вариант осуществления, представленный на фиг. 2, содержит декодер 111 вспомогательной информации для декодирования вспомогательной информации в случае, когда кодируется вспомогательная информация. Затем декодированная вспомогательная информация ретранслируется на блок модификации понижающего микширования, соответствующий модификатору 116 понижающего микширования, показанному на фиг. 1. Затем скомпенсированные сигналы понижающего микширования ретранслируются на средство 118 рендеринга объектов, который состоит, в варианте осуществления, показанном на фиг. 2, из блока 118a разделения (виртуальных) объектов и блока 118b средства рендеринга, который принимает информацию M рендеринга, соответствующую информации 121 положения для объектов, показанной на фиг. 1. Кроме того, средство 118b рендеринга генерирует выходные сигналы или, как они называются на фиг. 2, промежуточные выходные сигналы, и блок 120 восстановления модификации понижающего микширования соответствует модификатору 120 выходного сигнала на фиг. 1. Окончательные выходные сигналы, генерируемые блоком 160 восстановления модификации понижающего микширования, соответствуют модифицированным выходным сигналам применительно к фиг. 1.

Предпочтительные варианты осуществления используют ранее включенную вспомогательную информацию модификации понижающего микширования и процесс, обратный модификации, после рендеринга выходных сигналов. Это представлено в виде блок-схемы на фиг. 2. Сравнивая ее с фиг. 8В, можно заметить, что добавление блока “восстановление модификации понижающего микширования” на фиг. 2 или модификатора выходного сигнала на фиг. 1 реализует этот вариант осуществления.

Созданный кодером сигнал X понижающего микширования манипулируется (или манипуляцию можно аппроксимировать) функцией f(X). Кодер включает информацию, касающуюся этой функции, во вспомогательную информацию, подлежащую передаче и/или сохранению. Декодер принимает вспомогательную информацию и инвертирует ее для получения функции модификации или компенсации. (В MPEG SAOC кодер осуществляет инверсию и передает инвертированные значения.) Декодер применяет функцию компенсации к принятым сигналам понижающего микширования и получает скомпенсированные сигналы понижающего микширования, подлежащие использованию при разделении (виртуальных) объектов. На основании информации M рендеринга (от пользователя), выходная сцена реконструируется из реконструкций (виртуальных) объектов согласно . Можно включать дополнительные этапы обработки, например, модификацию ковариационных свойств выходных сигналов с помощью декорреляторов. Однако такая обработка не изменяет тот факт, что целью этапа рендеринга является получение выходного сигнала, который аппроксимирует результат применения процесса рендеринга к исходным входным аудиообъектам, т.е. . Добавление предложено для применения функции, обратной функции компенсации к выходному сигналу после рендеринга для получения окончательных выходных сигналов , что позволяет аппроксимировать функцию манипуляции понижающего микширования.

На фиг. 3 представлен предпочтительный вариант осуществления для вычисления функции модификации выходного сигнала из функции модификации сигнала понижающего микширования, и, в частности, в ситуации, когда обе функции представлены соответствующими коэффициентами усиления для полос частот и/или временных кадров.

Вспомогательная информация, касающаяся модификации сигнала понижающего микширования в системе SAOC [SAOC], ограничивается коэффициентами усиления для каждого сигнала понижающего микширования, что описано ранее. Другими словами, в SAOC, инвертированная функция компенсации передается, и скомпенсированные сигналы понижающего микширования можно получить, как проиллюстрировано в первом уравнении, показанном на фиг. 3.

Используя это определение для функции компенсации, можно задать функцию, обратную функции компенсации, как . В случае вышеприведенного определения , это можно выразить вторым уравнением на фиг. 3. Если один или более параметров компенсации могут быть равны нулю, нужно принять некоторые превентивные меры во избежание арифметический проблем. Для этого, например, можно прибавлять малую постоянную (например, ) к каждой (неотрицательной) величине, как показано в третьем уравнении, представленном на фиг. 3, или использовать максимальную величину из параметра компенсации и малой постоянной, как показано в четвертом уравнении, представленном на фиг. 3. Существуют и другие способы определения значения .

Что касается переноса информации, необходимой для повторного применения манипуляции понижающего микширования к выходному сигналу после рендеринга, никакой дополнительной информации не требуется, если параметры компенсации (в MPEG SAOC это PDG) уже переданы. Что касается добавления функциональных возможностей, можно также добавлять сигнализацию в битовый поток, если нужно применять восстановление манипуляции понижающего микширования. В контексте MPEG SAOC это можно осуществлять посредством следующего синтаксиса битового потока:

Когда переменная 117 bsPdgInvFlag битового потока принимает значение 0 или опущена, и переменная bsPdgFlag битового потока принимает значение 1, декодер действует, как указано в стандарте MPEG [SAOC], т.е. компенсация применяется к сигналам понижающего микширования, принятым декодером, до разделения (виртуальных) объектов. Когда переменная bsPdgInvFlag битового потока принимает значение 1, сигналы понижающего микширования обрабатываются как раньше, и выходной сигнал после рендеринга будет обрабатываться предложенным способом, путем аппроксимации манипуляции понижающего микширования.

На фиг. 4 представлен предпочтительный вариант осуществления для использования интерполированных коэффициентов усиления модификации понижающего микширования, которые также указаны как “PDG” на фиг. 4 и в этом описании изобретения. Первый этап содержит обеспечение текущих и будущих или предыдущих и текущих значения PDG, например, значения PDG текущего момента времени и значение PDG следующего (будущего) момента времени, указанного позицией 40. На этапе 42, интерполированные значения PDG вычисляются и используются в модификаторе 116 понижающего микширования. Затем, на этапе 44, коэффициенты усиления модификации выходного сигнала выводятся из интерполированных коэффициентов усиления, генерируемых блоком 42, и затем вычисленные коэффициенты усиления модификации выходного сигнала используются в модификаторе 120 выходного сигнала. Таким образом, очевидно, что в зависимости от того, какие коэффициенты модификации сигнала понижающего микширования рассматриваются, коэффициенты усиления модификации выходного сигнала не полностью обратны переданным коэффициентам, но являются только частично или полностью обратными интерполированным коэффициентам усиления.

Обработка PDG задана в стандарте MPEG SAOC [SAOC] для осуществления в параметрических кадрах. Это означает, что умножение компенсации происходит в каждом кадре с использованием постоянных значений параметров. В случае, когда значения параметров значительно изменяются между последовательными кадрами, это может приводить к нежелательным артефактам. Таким образом, желательно включать сглаживание параметров до применения их к сигналам. Сглаживание может осуществляться различными способами, например, низкочастотной фильтрацией значений параметров в зависимости от времени, или интерполированием значений параметров между последовательными кадрами. Предпочтительный вариант осуществления включает в себя линейную интерполяцию между кадрами параметров. Пусть – значение параметра для i-го сигнала понижающего микширования в момент времени n, и – значение параметра для того же канала понижающего микширования в момент времени n+J. Интерполированные значения параметров в моменты времени можно получить из уравнения

. Когда используется такая интерполяция, инвертированные значения для восстановления модификации понижающего микширования следует получать из интерполированных значений, т.е. вычисляя матрицу для каждого промежуточного момента времени и затем инвертируя каждый из них для получения , которую можно применять к промежуточному выходному сигналу Y.

Варианты осуществления решают проблему, которая возникает, когда манипуляции применяются к сигналам понижающего микширования SAOC. Традиционные подходы будут либо обеспечивать близкое к оптимальному воспринимаемое качество в отношении разделения объектов, если не осуществляется компенсация мастеринга, или будут терять преимущества мастеринга в случае компенсации мастеринга. Это в особенности проблематично, если результат мастеринга представляет что-то, что было бы полезно сохранять в окончательном выходном сигнале, например, оптимизации громкости, эквализацию, и т.д. Основные преимущества предложенного способа включают в себя, но без ограничения:

Базовая обработка SAOC, т.е. разделение (виртуальных) объектов, может осуществляться на сигналах понижающего микширования, которые аппроксимируют исходные созданные кодером сигналы понижающего микширования точнее, чем сигналы понижающего микширования, принятые декодером. Это минимизирует артефакты обработки SAOC.

Манипуляция понижающего микширования (“результат мастеринга ”) остается в окончательном выходном сигнале, по меньшей мере, в приближенной форме. Когда информация рендеринга идентична информации понижающего микширования, окончательный выходной сигнал будет аппроксимировать сигналы понижающего микширования по умолчанию очень точно, если не идентично.

Поскольку сигналы понижающего микширования напоминают созданные кодером сигналы понижающего микширования более точно, можно использовать режим повышенного качества для объектов, т.е., включающие в себя сигналы коррекции формы волны для EAO.

Когда используются EAO, и реконструируются близкие приближения исходными входных аудиообъектов, предложенный способ также применяет к ним “результат мастеринга”.

Предложенный способ не требует никакой дополнительной вспомогательной информации, подлежащей передаче, если вспомогательная информация PDG MPEG SAOC уже передана.

При желании, предложенный способ можно реализовать в виде инструмента, который может активироваться или деактивироваться конечным пользователем или вспомогательной информацией, отправленной с кодера.

Предложенный способ требует очень малых вычислительных ресурсов по сравнению с разделением (виртуальных) объектов в SAOC.

Хотя настоящее изобретение описано в контексте блок-схем, где блоки представляют фактические или логические аппаратные компоненты, настоящее изобретение можно также реализовать посредством компьютерно-реализуемого способа. В последнем случае, блоки представляют соответствующие этапы способа, где эти этапы отражают функции, осуществляемые соответствующими логическими или физическими аппаратными блоками.

Хотя некоторые аспекты были описаны в контексте устройства, ясно, что эти аспекты также представляют описание соответствующего способа, где блок или устройство соответствует этапу способа или признаку этапа способа. Аналогично, аспекты, описанные в контексте этапа способа, также представляют описание соответствующего блока или элемента или признака соответствующего устройства. Некоторые или все этапы способа могут выполняться посредством (или с использованием) аппаратного устройства, например, микропроцессора, программируемого компьютера или электронной схемы. В некоторых вариантах осуществления, некоторые один или более из наиболее важных этапов способа может выполняться таким устройством.

В зависимости от определенных требований к реализации, варианты осуществления изобретения можно реализовать аппаратными средствами или программными средствами. Реализация может осуществляться с использованием цифрового носителя данных, например, флоппи-диска, DVD, CD, ROM, PROM, EPROM, EEPROM или флэш-памяти, где хранятся электронно считываемое сигналы управления, которые взаимодействуют (или способны взаимодействовать) с программируемой компьютерной системой для осуществления соответствующего способа. Таким образом, цифровой носитель данных может быть компьютерно-считываемым.

Некоторые варианты осуществления согласно изобретению содержат носитель данных, имеющий электронно считываемое сигналы управления, которые способны взаимодействовать с программируемой компьютерной системой, благодаря чему осуществляется один из описанных здесь способов.

В общем случае, варианты осуществления настоящего изобретения можно реализовать в виде компьютерного программного продукта с программным кодом, причем программный код предназначен для осуществления одного из способов, когда компьютерный программный продукт выполняется на компьютере. Программный код может храниться, например, на машиночитаемом носителе.

Другие варианты осуществления содержат компьютерную программу для осуществления одного из описанных здесь способов, хранящуюся на машиночитаемом носителе.

Другими словами, вариант осуществления способа, отвечающего изобретению предусматривает компьютерную программу, имеющую программный код для осуществления одного из описанных здесь способов, когда компьютерная программа выполняется на компьютере.

Таким образом, дополнительный вариант осуществления способа, отвечающего изобретению, предусматривает носитель данных (или нетранзиторный носитель данных, например, цифровой носитель данных, или компьютерно-считываемый носитель), на котором записана компьютерная программа для осуществления одного из описанных здесь способов. Носитель данных, цифровой носитель данных или носитель записи обычно являются вещественным и/или нетранзиторным.

Таким образом, дополнительный вариант осуществления способа, отвечающего изобретению, предусматривает поток данных или последовательность сигналов, представляющих компьютерную программу для осуществления одного из описанных здесь способов. Поток данных или последовательность сигналов может быть сконфигурирован, например, для переноса через соединение для передачи данных, например через интернет.

Дополнительный вариант осуществления содержит средство обработки, например, компьютер или программируемое логическое устройство, выполненное с возможностью или адаптированное для осуществления одного из описанных здесь способов.

Дополнительный вариант осуществления содержит компьютер, на котором установлена компьютерная программа для осуществления одного из описанных здесь способов.

Дополнительный вариант осуществления согласно изобретению содержит устройство или систему, выполненное/ю с возможностью переноса (например, электронно или оптически) компьютерной программы для осуществления одного из описанных здесь способов на приемник. Приемником может быть, например, компьютер, мобильное устройство, запоминающее устройство и т.п. Например, устройство или система может содержать файловый сервер для переноса компьютерной программы на приемник.

В некоторых вариантах осуществления, программируемое логическое устройство (например, вентильная матрица, программируемая пользователем) может использоваться для осуществления некоторых или всех функциональных возможностей описанных здесь способов. В некоторых вариантах осуществления, вентильная матрица, программируемая пользователем могут взаимодействовать с микропроцессором для осуществления одного из описанных здесь способов. В общем случае, способы, предпочтительно, осуществляются любым аппаратным устройством.

Вышеописанные варианты осуществления призваны иллюстрировать принципы настоящего изобретения. Следует понимать, что специалисты в данной области техники могут предложить модификации и вариации описанных здесь конфигураций и деталей. Поэтому они подлежат ограничению только объемом нижеследующей формулы изобретения, но не конкретными деталями, представленными посредством описания и объяснения рассмотренных здесь вариантов осуществления.

ЛИТЕРАТУРА

[BCC] C. Faller and F. Baumgarte, “Binaural Cue Coding - Part II: Schemes and applications,” IEEE Trans. on Speech and Audio Proc., vol. 11, no. 6, Nov. 2003.

[JSC] C. Faller, “Parametric Joint-Coding of Audio Sources”, 120th AES Convention, Paris, 2006.

[ISS1] M. Parvaix and L. Girin: “Informed Source Separation of underdetermined instantaneous Stereo Mixtures using Source Index Embedding”, IEEE ICASSP, 2010.

[ISS2] M. Parvaix, L. Girin, J.-M. Brossier: “A watermarking-based method for informed source separation of audio signals with a single sensor”, IEEE Transactions on Audio, Speech and Language Processing, 2010.

[ISS3] A. Liutkus and J. Pinel and R. Badeau and L. Girin and G. Richard: “Informed source separation through spectrogram coding and data embedding”, Signal Processing Journal, 2011.

[ISS4] A. Ozerov, A. Liutkus, R. Badeau, G. Richard: “Informed source separation: source coding meets source separation”, IEEE Workshop on Applications of Signal Processing to Audio and Acoustics, 2011.

[ISS5] S. Zhang and L. Girin: “An Informed Source Separation System for Speech Signals”, INTERSPEECH, 2011.

[ISS6] L. Girin and J. Pinel: “Informed Audio Source Separation from Compressed Linear Stereo Mixtures”, AES 42nd International Conference: Semantic Audio, 2011.

[PDG] J. Seo, S. Beack, K. Kang, J. W. Hong, J. Kim, C. Ahn, K. Kim, and M. Hahn, “Multi-object audio encoding and decoding apparatus supporting post downmix signal”, United States Patent Application Publication US2011/0166867, Jul 2011.

[SAOC1] J. Herre, S. Disch, J. Hilpert, O. Hellmuth: "From SAC To SAOC - Recent Developments in Parametric Coding of Spatial Audio", 22nd Regional UK AES Conference, Cambridge, UK, April 2007.

[SAOC2] J. Engdegård, B. Resch, C. Falch, O. Hellmuth, J. Hilpert, A. Hölzer, L. Terentiev, J. Breebaart, J. Koppens, E. Schuijers and W. Oomen: " Spatial Audio Object Coding (SAOC) – The Upcoming MPEG Standard on Parametric Object Based Audio Coding", 124th AES Convention, Amsterdam 2008.

[SAOC] ISO/IEC, “MPEG audio technologies – Part 2: Spatial Audio Object Coding (SAOC),” ISO/IEC JTC1/SC29/WG11 (MPEG) International Standard 23003-2.

1. Устройство для декодирования кодированного аудиосигнала (100) для получения модифицированных выходных сигналов (160), содержащее:

входной интерфейс (110) для приема переданного сигнала (112) понижающего микширования и параметрических данных (114), относящихся к аудиообъектам, включенным в переданный сигнал (112) понижающего микширования, причем переданный сигнал понижающего микширования отличается от сигнала понижающего микширования кодера, с которым связаны параметрические данные;

модификатор (116) понижающего микширования для модификации переданного сигнала понижающего микширования с использованием функции модификации понижающего микширования, причем модификация понижающего микширования осуществляется таким образом, что модифицированный сигнал понижающего микширования идентичен сигналу понижающего микширования кодера или более аналогичен сигналу понижающего микширования кодера по сравнению с переданным сигналом (112) понижающего микширования;

средство (118) рендеринга объектов для осуществления рендеринга аудиообъектов с использованием модифицированного сигнала понижающего микширования и параметрических данных для получения выходных сигналов; и

модификатор (120) выходного сигнала для модификации выходных сигналов с использованием функции модификации выходного сигнала, причем функция модификации выходного сигнала такова, что операция манипуляции, применяемая к сигналу понижающего микширования кодера для получения переданного сигнала (112) понижающего микширования, по меньшей мере, частично применяется к выходным сигналам для получения модифицированных выходных сигналов (160).

2. Устройство по п. 1, в котором модификатор (116) понижающего микширования и модификатор (120) выходного сигнала выполнены таким образом, что функция модификации выходного сигнала отличается от функции модификации сигнала понижающего микширования и обратна функции модификации сигнала понижающего микширования.

3. Устройство по п. 1, в котором функция модификации понижающего микширования содержит применение коэффициентов усиления модификации понижающего микширования к разным временным кадрам или полосам частот переданного сигнала понижающего микширования,

причем функция модификации выходного сигнала содержит применение коэффициентов усиления модификации выходного сигнала к разным временным кадрам или полосам частот выходных сигналов, и

при этом коэффициенты усиления модификации выходного сигнала выводятся из обратных значений коэффициентов усиления модификации понижающего микширования и коэффициенты усиления модификации понижающего микширования выводятся из обратных значений коэффициентов усиления модификации выходного сигнала.

4. Устройство по п. 1,

в котором входной интерфейс (110) выполнен с возможностью дополнительно принимать информацию о функции модификации понижающего микширования, при этом модификатор (116) понижающего микширования выполнен с возможностью использования информации о функции модификации понижающего микширования, причем модификатор (120) выходного сигнала выполнен с возможностью вывода функции модификации выходного сигнала из информации (115) о модификации сигнала понижающего микширования, или

в котором входной интерфейс (110) выполнен с возможностью дополнительно принимать информацию о функции модификации выходного сигнала, причем модификатор (116) понижающего микширования выполнен с возможностью вывода функции модификации понижающего микширования из информации о принятой функции модификации выходного сигнала.

5. Устройство по п. 4, в котором информация о функции модификации понижающего микширования содержит коэффициенты усиления модификации понижающего микширования, и

модификатор (116) понижающего микширования выполнен с возможностью применения коэффициентов усиления модификации понижающего микширования или применения интерполированных или сглаженных коэффициентов усиления модификации понижающего микширования, и

модификатор (120) выходного сигнала выполнен с возможностью вычисления коэффициентов усиления модификации выходного сигнала с использованием максимального из инвертированного коэффициента усиления модификации понижающего микширования или интерполированного или сглаженного коэффициента усиления модификации понижающего микширования и постоянного значения или с использованием суммы инвертированного коэффициента усиления модификации понижающего микширования или интерполированного или сглаженного коэффициента усиления модификации понижающего микширования и постоянного значения соответственно.

6. Устройство по п. 1, в котором модификатор (120) выходного сигнала управляется сигналом (117) управления, причем входной интерфейс (110) выполнен с возможностью приема информации управления для временных кадров полос частот переданного сигнала понижающего микширования, и

модификатор (120) выходного сигнала выполнен с возможностью вывода сигнала управления из информации управления.

7. Устройство по п. 6, в котором информация управления является флагом, при этом сигнал управления таков, что модификатор (120) выходного сигнала деактивируется, если флаг находится в состоянии "установлен", и модификатор (120) выходного сигнала активируется, когда флаг находится в состоянии "не установлен", или наоборот.

8. Устройство по п. 1, в котором модификатор (116) понижающего микширования выполнен с возможностью снижения или отмены оптимизации громкости, операции эквализации, операции многополосной эквализации, операции компрессии динамического диапазона или операции лимитирования, применяемых к переданному сигналу (112) понижающего микширования, и

модификатор (120) выходного сигнала выполнен с возможностью применения операции оптимизации громкости или эквализации или операции многополосной эквализации или операции компрессии динамического диапазона или лимитирования к выходным сигналам.

9. Устройство по п. 1, в котором средство (118) рендеринга объектов выполнено с возможностью вычисления сигналов каналов из модифицированного сигнала понижающего микширования, параметрических данных (114) и информации (121) положения, указывающей размещение аудиообъектов в схеме воспроизведения.

10. Устройство по п. 1,

в котором средство (118) рендеринга объектов выполнено с возможностью реконструкции аудиообъектов с использованием параметрических данных (114) и распределения аудиообъектов по сигналам каналов для схемы воспроизведения с использованием информации (121) положения, указывающей размещение аудиообъектов в схеме воспроизведения.

11. Устройство по п. 1,

в котором входной интерфейс (110) выполнен с возможностью приема расширенного аудиообъекта, который является разностью форм волны между исходным аудиообъектом и реконструированным аудиообъектом, причем реконструкция для получения реконструированного аудиообъекта осуществлялась на основании параметрических данных (114), и нормальными аудиообъектами,

в котором средство (118) рендеринга объектов выполнено с возможностью использования нормальных аудиообъектов и расширенного аудиообъекта для вычисления выходных сигналов.

12. Устройство по п. 1,

в котором средство (118) рендеринга объектов выполнено с возможностью приема пользовательского ввода (123) для манипулирования одним или более аудиообъектами, при этом средство (118) рендеринга объектов выполнено с возможностью манипулирования одним или более аудиообъектами, определенными пользовательским вводом при осуществлении рендеринга выходных сигналов.

13. Устройство по п. 12, в котором средство (118) рендеринга объектов выполнено с возможностью манипулирования аудиообъектом переднего плана или аудиообъектом заднего плана, включенным в кодированные аудиосигналы.

14. Способ декодирования кодированного аудиосигнала (100) для получения модифицированных выходных сигналов (160), содержащий этапы, на которых:

принимают (110) переданный сигнал (112) понижающего микширования и параметрические данные (114), относящиеся к аудиообъектам, включенным в переданный сигнал (112) понижающего микширования, причем переданный сигнал понижающего микширования отличается от сигнала понижающего микширования кодера, с которым связаны параметрические данные;

модифицируют (116) переданный сигнал понижающего микширования с использованием функции модификации понижающего микширования, причем модификация понижающего микширования осуществляется таким образом, что модифицированный сигнал понижающего микширования идентичен сигналу понижающего микширования кодера или более аналогичен сигналу понижающего микширования кодера по сравнению с переданным сигналом (112) понижающего микширования;

осуществляют рендеринг (118) аудиообъектов с использованием модифицированного сигнала понижающего микширования и параметрических данных для получения выходных сигналов; и

модифицируют (120) выходные сигналы с использованием функции модификации выходного сигнала, причем функция модификации выходного сигнала такова, что операция манипуляции, применяемая к сигналу понижающего микширования кодера для получения переданного сигнала (112) понижающего микширования, по меньшей мере, частично применяется к выходным сигналам для получения модифицированных выходных сигналов (160).

15. Физический носитель данных, на котором сохранена компьютерная программа для осуществления способа по п. 14, когда компьютерная программа выполняется на компьютере или процессоре.

Похожие патенты:

Аудиокодер и аудиодекодер // 2643489

Изобретение относится к средствам аудиокодирования и аудиодекодирования. Технический результат заключается в повышении эффективности кодирования аудиоданных.

Способ трансаурального синтеза для придания звуку пространственной формы // 2639955

Изобретение относится к средствам для создания цифрового пространственного стереоаудиофайла из исходного многоканального аудиофайла. Технический результат заключается в формировании ощущения, что звуковая среда экстернализирована.

Усовершенствованное стереофоническое кодирование на основе комбинации адаптивно выбираемого левого/правого или среднего/побочного стереофонического кодирования и параметрического стереофонического кодирования // 2614573

Изобретение относится к средствам кодирования и декодирования звуковых сигналов. Технический результат заключается в повышении качества кодирования сигнала.

Способ кодирования и устройство для декодирования основывающегося на объектах аудиосигнала // 2544789

Изобретение относится к средствам кодирования и декодирования основывающихся на объектах аудиосигналов. Технический результат заключается в предоставлении средств кодирования и декодирования аудио.

Устройство для определения преобразованного пространственного звукового сигнала // 2499301

Использование: данное изобретение относится к сфере обработки звукового сигнала, главным образом, обработки пространственного звукового сигнала, и преобразования различных форматов пространственных звуковых сигналов.

Матричный декодер // 2456766

Изобретение относится к обработке аудиосигналов, в частности к матричному декодеру аудиосигнала. .

Способ и устройство для генерации бинаурального аудиосигнала // 2443075

Изобретение относится к способу и устройству для генерирования бинаурального звукового сигнала и, в частности, к генерированию бинаурального звукового сигнала из моносигнала понижающего микширования.

Устройство и способ для синтезирования выходного сигнала // 2439719

Изобретение относится к синтезированию с применением аудиорендеринга выходного стереосигнала или выходного многоканального аудиосигнала, сформированных в результате понижающего микширования с использованием дополнительных управляющих данных.

Улучшенное пространственное разрешение звукового поля для систем многоканального воспроизведения аудио посредством получения сигналов с угловыми членами высокого порядка // 2420027

Изобретение относится к технике связи и может быть использовано в многоканальных системах воспроизведения звука, воссоздающих точное восприятие таких акустических явлений, как музыкальное исполнение или спортивное соревнование.

Способ и устройство для обработки аудиосигнала // 2417549

Изобретение относится к способу и устройству для декодирования аудиосигнала, принятого на цифровом носителе, например сигнала вещания. .

Декодирующее устройство, способ декодирования, кодирующее устройство, способ кодирования и программа // 2652468

Изобретение относится к декодирующему устройству, способу декодирования, кодирующему устройству, способу кодирования. Технический результат изобретения заключается в получении высококачественного реалистичного звучания при воспроизведении принимаемых аудиоданных на аппаратуре.

Стереофонический кодер и декодер аудиосигналов // 2645271

Изобретение относится к средствам стереофонического кодирования и декодирования аудиосигналов. Технический результат заключается в повышении эффективности использования полосы частот.

Основанное на линейном предсказании кодирование аудио с использованием улучшенной оценки распределения вероятностей // 2651187

Изобретение относится к средствам для кодирования аудио. Технический результат заключается в повышении эффективности кодирования.

Принцип для кодирования аудиосигнала и декодирования аудиосигнала с использованием детерминированной и шумоподобной информации // 2644123

Изобретение относится к средствам для кодирования и декодирования аудиосигнала. Технический результат заключается в повышении качества кодируемого звука при низких скоростях передачи битов.

Способ, устройство и система кодирования/декодирования // 2644078

Изобретение относится к области кодирования и декодирования аудиосигналов. Технический результат заключается в снижении сигнального искажения аудиосигналов.

Способ и устройство предсказания сигнала возбуждения верхней полосы // 2637885

Изобретение относится к средствам для предсказания сигнала возбуждения верхней полосы частот. Технический результат заключается в повышении качества сигнала возбуждения верхней полосы.

Устройство и способ формирования множества параметрических звуковых потоков и устройство и способ формирования множества сигналов акустической системы // 2633134

Изобретение относится к средствам для формирования множества параметрических звуковых потоков. Технический результат заключается в улучшении качества пространственного звука.

Устройство и способ выбора одного из первого алгоритма кодирования и второго алгоритма кодирования с использованием уменьшения гармоник // 2632151

Изобретение относится к средствам для выбора алгоритма кодирования. Технический результат заключается в уменьшении сложности выбора между первым алгоритмом кодирования и вторым алгоритмом кодирования.

Способ низкоскоростного кодирования и декодирования речевого сигнала // 2631968

Изобретение относится к области цифровой связи, а именно к технике обработки речи на основе линейного предсказания, и может быть использовано в системах инфокоммуникаций для низкоскоростного кодирования речевых сигналов.

Устройство и способ обработки речевого/аудио сигнала // 2616557

Изобретение относится к средствам обработки речевого/аудио сигнала. Технический результат заключается в обеспечении комфортного воспроизведения звука во время переключения полосы пропускания речевых/аудио сигналов.

Шумоподавление на основе прогнозирования в стереофоническом радиосигнале с частотной модуляцией // 2576467

Изобретение относится к области шумоподавления в принимаемом многоканальном FM-радиосигнале и может использоваться, в частности в стереофоническом FM-радиоприемнике.