Манипулирование зоной наилучшего восприятия для многоканального сигнала



Манипулирование зоной наилучшего восприятия для многоканального сигнала
Манипулирование зоной наилучшего восприятия для многоканального сигнала
Манипулирование зоной наилучшего восприятия для многоканального сигнала
Манипулирование зоной наилучшего восприятия для многоканального сигнала
Манипулирование зоной наилучшего восприятия для многоканального сигнала
Манипулирование зоной наилучшего восприятия для многоканального сигнала
Манипулирование зоной наилучшего восприятия для многоканального сигнала
Манипулирование зоной наилучшего восприятия для многоканального сигнала
Манипулирование зоной наилучшего восприятия для многоканального сигнала
Манипулирование зоной наилучшего восприятия для многоканального сигнала
Манипулирование зоной наилучшего восприятия для многоканального сигнала
Манипулирование зоной наилучшего восприятия для многоканального сигнала
Манипулирование зоной наилучшего восприятия для многоканального сигнала
Манипулирование зоной наилучшего восприятия для многоканального сигнала
Манипулирование зоной наилучшего восприятия для многоканального сигнала
Манипулирование зоной наилучшего восприятия для многоканального сигнала
Манипулирование зоной наилучшего восприятия для многоканального сигнала
Манипулирование зоной наилучшего восприятия для многоканального сигнала
Манипулирование зоной наилучшего восприятия для многоканального сигнала
Манипулирование зоной наилучшего восприятия для многоканального сигнала
Манипулирование зоной наилучшего восприятия для многоканального сигнала
Манипулирование зоной наилучшего восприятия для многоканального сигнала
Манипулирование зоной наилучшего восприятия для многоканального сигнала
Манипулирование зоной наилучшего восприятия для многоканального сигнала
Манипулирование зоной наилучшего восприятия для многоканального сигнала
Манипулирование зоной наилучшего восприятия для многоканального сигнала
Манипулирование зоной наилучшего восприятия для многоканального сигнала
Манипулирование зоной наилучшего восприятия для многоканального сигнала
Манипулирование зоной наилучшего восприятия для многоканального сигнала
Манипулирование зоной наилучшего восприятия для многоканального сигнала
Манипулирование зоной наилучшего восприятия для многоканального сигнала
Манипулирование зоной наилучшего восприятия для многоканального сигнала

 


Владельцы патента RU 2454825:

КОНИНКЛЕЙКЕ ФИЛИПС ЭЛЕКТРОНИКС Н.В. (NL)

Изобретение относится к манипулированию зоной наилучшего восприятия для многоканального сигнала, в частности, для многоканального сигнала MPEG системы «окружающего звука». Техническим результатом является возможность осуществлять манипулирования уменьшенной сложности зоной наилучшего восприятия. Указанный результат достигается тем, что устройство для модификации зоны наилучшего восприятия пространственного М-канального аудиосигнала содержит приемник (201) для приема N-канального аудиосигнала, N<M, параметрическое средство (203) для определения пространственных параметров повышающего микширования, связывающих N-канальный аудиосигнал с пространственным М-канальным аудиосигналом, модифицирующее средство (207) для модификации зоны наилучшего восприятия пространственного М-канального аудиосигнала посредством модификации по меньшей мере одного из пространственных параметров повышающего микширования; средство (205) генерации для генерации пространственного М-канального аудиосигнала посредством повышающего микширования N-канального аудиосигнала с использованием по меньшей мере одного модифицированного пространственного параметра повышающего микширования. 7 н. и 13 з.п. ф-лы, 5 ил., 2 табл.

 

ОБЛАСТЬ ТЕХНИКИ, К КОТОРОЙ ОТНОСИТСЯ ИЗОБРЕТЕНИЕ

Данное изобретение относится к манипулированию зоной наилучшего восприятия для многоканального сигнала и, в частности, но не исключительно, к манипулированию зоной наилучшего восприятия для многоканального сигнала MPEG системы «окружающего звука».

УРОВЕНЬ ТЕХНИКИ ИЗОБРЕТЕНИЯ

Цифровое кодирование сигналов из различных источников становилось все более важным на протяжении последних десятилетий, по мере того как цифровое представление и передача сигналов все более заменяло аналоговое представление и передачу. Например, распространение мультимедийного контента, такого как видео и музыка, все более основывается на цифровом кодировании контента.

Кроме того, в последнее десятилетие наблюдается тенденция к многоканальному звуку и, в частности, к пространственному звуку, простирающемуся за пределы стандартных стереосигналов. Например, традиционные стереозаписи содержат только два канала, тогда как современные продвинутые аудиосистемы обычно используют пять или шесть каналов, как в популярных системах окружающего звука 5.1. Это обеспечивает опыт более включенного прослушивания, когда пользователь может быть окружен источниками звука.

Были разработаны различные способы и стандарты для передачи таких многоканальных сигналов. Например, шесть дискретных каналов, представляющих систему окружающего звука 5.1, могут передаваться в соответствии с такими стандартами, как продвинутое кодирование звука (AAC) или Dolby Digital.

Однако для обеспечения обратной совместимости, как известно, необходимо уменьшить большее число каналов до меньшего числа каналов, т.е. осуществить понижающее микширование, и, в частности, это часто используется для понижающего микширования сигнала окружающего звука 5.1 до стереосигнала, что позволяет воспроизводить стереосигнал обычными (стерео)декодерами, а 5.1 сигнал - декодерами окружающего звука.

Одним примером является способ обратно совместимого кодирования MPEG2. Многоканальный сигнал низводится в стереосигнал. Дополнительные сигналы кодируются во вспомогательный участок данных, позволяющий многоканальному MPEG2 декодеру генерировать представление многоканального сигнала. MPEG1 декодер проигнорирует эти вспомогательные данные и, таким образом, декодирует только стереопонижение. Основной недостаток этого способа кодирования, применяемого в MPEG2, состоит в том, что скорость передачи дополнительных данных, требуемая для дополнительных данных, имеет тот же самый порядок величины, что и скорость передачи данных, требуемая для кодирования стереосигнала. Дополнительная скорость передачи битов для расширения стерео до многоканального аудио, следовательно, является значительной.

Другие существующие способы обратно совместимой многоканальной передачи без дополнительной многоканальной информации могут быть охарактеризованы как матричные способы системы окружающего звука. Примеры матричного кодирования окружающего звука включают в себя такие способы, как Dolby Prologic II и Logic-7. Общий принцип этих способов состоит в том, что они матрично умножают множественные каналы входного сигнала посредством подходящей неквадратичной матрицы, тем самым генерируя выходной сигнал с меньшим числом каналов. В частности, матричный кодер обычно применяет фазовые сдвиги к каналам окружения перед микшированием их с передним и центральным каналами.

Другой причиной преобразования каналов является эффективность кодирования. Было обнаружено, что, например, сигналы окружающего звука могут быть кодированы как аудиосигналы стереоканалов, комбинированные с параметрическим потоком битов, описывающим пространственные свойства аудиосигнала. Этот декодер может воспроизводить звуковые стереосигналы с очень удовлетворительной степенью точности. Таким образом, может быть получена существенная экономия скорости передачи битов.

Таким образом, в (параметрических) пространственных аудиокодерах параметры извлекаются из первоначального аудиосигнала таким образом, чтобы сформировать аудиосигнал, имеющий уменьшенное число каналов, например только один канал, плюс множество параметров, описывающих пространственные свойства первоначального аудиосигнала. В (параметрических) пространственных аудиокодерах пространственные свойства, описываемые переданными пространственными параметрами, используются для воссоздания первоначального пространственного многоканального сигнала. Имеется несколько параметров, которые могут использоваться для описания пространственных свойств аудиосигналов. Одним таким параметром является межканальная кросс-корреляция, как, например, кросс-корреляция между левым каналом и правым каналом для стереосигналов. Другим параметром является отношение мощностей этих каналов.

Конкретным примером такого способа является подход MPEG Surround (окружающего звука) для эффективного кодирования многоканальных аудиосигналов.

MPEG Surround кодер низводит М-канальный входной сигнал к N-канальному сигналу понижающего микширования, где N<M, и извлекает пространственные параметры. Сигнал понижающего микширования обычно кодируется с использованием обычного кодера, такого как, например, MP3 или AAC кодер. Пространственные параметры кодируются и встраиваются в поток битов обратно совместимым образом таким образом, что обычные декодеры все же могут декодировать лежащий в основе сигнал понижающего микширования.

В MPEG Surround кодере сигнал понижающего микширования сначала декодируется с использованием обычного декодера. Многоканальный сигнал затем восстанавливается посредством пространственных параметров, которые извлекаются из потока битов.

Кроме типичного многоканального кодирования, описанного выше, MPEG Surround предлагает богатый набор дополнительных характеристик, например:

- Неуправляемое декодирование - MPEG Surround декодер способен создавать многоканальное повышающее микширование стереосигналов, когда пространственная боковая информация является недоступной. В этом режиме декодер вычисляет отношение мощностей и корреляцию стереосигнала, и эти характеристики используются для получения требуемых пространственных параметров посредством просмотра таблицы.

- Матричная совместимость - MPEG Surround кодер способен генерировать понижающее микширование, которое может быть декодировано с использованием схем матричного декодирования. Матричное понижающее микширование окружающего звука создается таким образом, что оно может быть инвертировано MPEG Surround декодером без уступок восприятия для работы декодера. Кроме того, матричное понижающее микширование окружающего звука улучшает работу неуправляемого режима.

- Бинауральное (стереофоническое) декодирование - MPEG Surround декодер способен трансформировать моно- или стереосигнал понижающего микширования непосредственно в трехмерный бинауральный стереосигнал с использованием пространственных параметров вместо вычисления многоканального сигнала в качестве промежуточной стадии.

- Высокопрофессиональное понижающее микширование - MPEG Surround дает возможность передавать созданное вручную понижающее микширование вместо автоматизированного MPEG Surround понижающего микширования.

- Произвольные деревья - MPEG Surround битовый поток поддерживает определение произвольных структур повышающего микширования, позволяющее иметь произвольное число выходных каналов.

MPEG Surround кодер нацелен на представление первоначального многоканального сигнала так точно, насколько это возможно для заданной настройки громкоговорителей, такой как, например, настройки 5.1. Однако он не позволяет иметь какую-либо гибкость по отношению к различным позициям прослушивания и окружениям, таким, которые обычно присутствуют дома или в транспортном средстве.

Воспроизведение для альтернативных позиций и окружений прослушивания может быть усовершенствовано посредством манипулирования зоной наилучшего восприятия (например, перемещения и/или расширения). Однако, хотя манипулирование зоной наилучшего восприятия является известным, стандартные подходы являются неоптимальными и обычно применяются как стадия окончательной обработки, требующая обработки высокой сложности индивидуальных выходных каналов.

Следовательно, усовершенствованная система для манипулирования зоной наилучшего восприятия была бы выгодной, и в частности, была бы выгодна система, обладающая увеличенной гибкостью, улучшенным качеством, улучшенным опытом прослушивания, уменьшенной сложностью, облегченной обработкой и/или улучшенной производительностью.

СУЩНОСТЬ ИЗОБРЕТЕНИЯ

Соответственно, данное изобретение предпочтительно стремится к ослаблению, смягчению или устранению одного или нескольких вышеупомянутых недостатков по одному или в любой комбинации.

Согласно первому аспекту изобретения обеспечено устройство для модификации зоны наилучшего восприятия пространственного М-канального аудиосигнала, причем это устройство содержит: приемник для принятия N-канального аудиосигнала, N<M; параметрическое средство для определения пространственных параметров повышающего микширования, связывающих N-канальный аудиосигнал с пространственным М-канальным аудиосигналом; модифицирующее средство для модификации зоны наилучшего восприятия пространственного М-канального аудиосигнала посредством модификации по меньшей мере одного из пространственных параметров повышающего микширования; средство генерации для генерации пространственного М-канального аудиосигнала посредством повышающего микширования N-канального аудиосигнала с использованием по меньшей мере одного модифицированного пространственного параметра повышающего микширования.

Данное изобретение может обеспечить улучшенный опыт прослушивания. Данное изобретение может дать возможность осуществлять манипулирование уменьшенной сложности зоной наилучшего восприятия посредством прямой модификации пространственных параметров как части процесса декодирования. Может быть достигнута облегченная обработка уменьшенной вычислительной сложности. Этим устройством может быть, в частности, декодер. Изобретение может позволить осуществить улучшенную производительность посредством интеграции декодирования и манипулирования зоной наилучшего восприятия выгодным образом.

N-канальным сигналом может быть, в частности, моно- или стереосигнал, а М-канальным сигналом может быть, в частности, сигнал окружающего звука 5.1, 6.1 или 7.1. Пространственными параметрами могут быть, в частности, параметры, отличающиеся временем и частотой, связывающие характеристики различных каналов пространственного М-канального аудиосигнала с сигналами N-канального сигнала (или наоборот). Например, пространственные параметры могут включать в себя параметры уровня и/или корреляции для индивидуальных временных частотных блоков. Повышающим микшированием N-канального аудиосигнала в пространственный М-канальный аудиосигнал может быть каскадное (последовательное) повышающее микширование.

Согласно возможной особенности изобретения, модифицирующее средство выполнено с возможностью модификации баланса переднего канала с задним каналом посредством модификации первого пространственного параметра повышающего микширования, указывающего разность интенсивности между по меньшей мере одним передним каналом и по меньшей мере одним задним каналом пространственного М-канального аудиосигнала.

Это может обеспечить улучшенный опыт прослушивания и/или облегченное манипулирование зоной наилучшего восприятия. В частности, эта особенность может дать улучшенный опыт прослушивания для (передних/задних) нецентральных позиций посредством простой и несложной обработки.

Согласно возможной особенности изобретения, первым пространственным параметром повышающего микширования является межканальная разность интенсивности между по меньшей мере одним передним каналом и по меньшей мере одним задним каналом.

Это может дать возможность осуществить реализацию особенно низкой сложности и/или эффективную реализацию. В частности, зона наилучшего восприятия может быть модифицирована с использованием простой модификации пространственного параметра повышающего микширования, уже используемого в операции декодирования.

Согласно возможной особенности изобретения, модифицирующее средство выполнено с возможностью модификации показателя квантования межканальной разности интенсивностей.

Это может дать возможность осуществить реализацию особенно низкой сложности и/или эффективную реализацию и может, в частности, дать возможность осуществить облегченное и более дружественное пользователю манипулирование при отражении восприятия звука человеком. Показатель квантования может быть модифицирован перед декодированием.

Согласно возможной особенности изобретения, модифицирующее средство дополнительно выполнено с возможностью масштабирования по меньшей мере одного переднего канала таким образом, что вариация отношения энергии переднего бокового канала к энергии центрального канала для пространственного М-канального аудиосигнала, вызванная модификацией первого параметра, уменьшена.

Это может дать возможность осуществить улучшенный опыт прослушивания и может во многих случаях дать возможность осуществить манипулируемую зону наилучшего восприятия с минимальным искажением восприятия. Модифицирующее средство может, в частности, по существу поддерживать то же самое отношение энергии переднего бокового канала к энергии центрального канала после модификации параметров, что и перед модификацией. Модифицирующее средство может, в частности, масштабировать центральный канал или может, например, масштабировать боковые каналы по существу равным образом относительно центрального канала и/или может масштабировать боковые каналы по-разному.

Согласно возможной особенности изобретения, модифицирующее средство выполнено с возможностью модификации рассредоточения центра посредством модификации первого пространственного параметра повышающего микширования, указывающего относительное распределение сигнала по меньшей мере одного канала n-канального аудиосигнала между центральным каналом и по меньшей мере одним боковым каналом.

Это может обеспечить улучшенный опыт прослушивания и/или облегченное манипулирование зоной наилучшего восприятия. В частности, эта особенность может дать возможность осуществить увеличенный пространственный опыт прослушивания.

В некоторых вариантах осуществления модифицирующее средство выполнено с возможностью модификации рассредоточения центра посредством модификации первого пространственного параметра, указывающего величину масштабирования между по меньшей мере одним каналом N-канального аудиосигнала и по меньшей мере одним передним каналом пространственного М-канального аудиосигнала.

Повышающее микширование N-канального аудиосигнала может, в частности, включать в себя повышающее микширование N-канального аудиосигнала в К-канальный сигнал (N<K<=M) посредством (К, N) матричного умножения повышающего микширования значений сигналов для N-канальных сигналов, и первым пространственным параметром повышающего микширования может быть матричный коэффициент матрицы повышающего микширования.

Согласно возможной особенности изобретения, первым пространственным параметром повышающего микширования является коэффициент предсказания каналов.

Это может дать возможность осуществить реализацию особенно низкой сложности и/или эффективную реализацию. В частности, зона наилучшего восприятия может быть модифицирована с использованием простой модификации пространственного параметра, обычно уже используемого в операции декодирования.

Согласно возможной особенности изобретения, модифицирующее средство выполнено с возможностью модификации баланса левого с правым посредством модификации первого пространственного параметра повышающего микширования, указывающего относительное распределение сигнала по меньшей мере одного канала N-канального аудиосигнала между по меньшей мере одним правым боковым каналом и по меньшей мере одним левым боковым каналом.

Это может обеспечить улучшенный опыт прослушивания и/или облегченное манипулирование зоной наилучшего восприятия. В частности, эта особенность может дать возможность осуществить улучшенный опыт прослушивания для (левых/правых) нецентральных позиций прослушивания посредством простой обработки низкой сложности.

Согласно возможной особенности изобретения, первым пространственным параметром повышающего микширования является коэффициент предсказания каналов.

Это может дать возможность осуществить реализацию особенно низкой сложности и/или эффективную реализацию. В частности, зона наилучшего восприятия может быть модифицирована с использованием простой модификации пространственного параметра, уже используемого в операции декодирования.

Согласно возможной особенности изобретения, модифицирующее средство выполнено с возможностью модификации дисперсии спереди назад посредством модификации первого пространственного параметра повышающего микширования, указывающего относительную корреляцию между по меньшей мере одним передним каналом и по меньшей мере одним задним каналом пространственного М-канального аудиосигнала.

Это может обеспечить улучшенный опыт прослушивания и/или облегченное манипулирование зоной наилучшего восприятия. В частности, эта особенность может дать возможность осуществить увеличенный пространственный опыт прослушивания.

Согласно возможной особенности изобретения, первым пространственным параметром повышающего микширования является коэффициент межканальной корреляции между по меньшей мере одним передним каналом и по меньшей мере одним задним каналом.

Это может дать возможность осуществить реализацию особенно низкой сложности. В частности, зона наилучшего восприятия может быть модифицирована с использованием простой модификации пространственного параметра, уже используемого в операции декодирования.

Согласно возможной особенности изобретения, N-канальный аудиосигнал соответствует понижающему микшированию пространственного М-канального аудиосигнала, и приемник выполнен с возможностью принятия пространственных параметров повышающего микширования кодера, связывающих низведенный N-канальный аудиосигнал с пространственным М-канальным аудиосигналом, и параметрическое средство выполнено с возможностью определения пространственных параметров повышающего микширования из пространственных параметров повышающего микширования кодера.

Это может обеспечить улучшенный опыт прослушивания и/или облегченное манипулирование зоной наилучшего восприятия. В частности, эта особенность может дать возможность осуществить улучшенный опыт прослушивания в системе, содержащей параметрический кодер, генерирующий N-канальный аудиосигнал.

Этот кодер может генерировать данные пространственных параметров при понижающем микшировании пространственного М-канального аудиосигнала в N-канальный аудиосигнал. Эти данные пространственных параметров могут быть переданы к устройству, и зона наилучшего восприятия может быть модифицирована посредством модификации этих данных. Пространственные параметры могут, в частности, содержать пространственные параметры кодера. N-канальным аудиосигналом может, в частности, быть MPEG Surround сигнал, содержащий параметрические данные.

Согласно возможной особенности изобретения, параметрическое средство выполнено с возможностью определения пространственных параметров повышающего микширования из характеристик сигналов каналов N-канального аудиосигнала.

Это может обеспечить улучшенный опыт прослушивания и/или облегченное манипулирование зоной наилучшего восприятия. В частности, эта особенность может дать возможность осуществить улучшенный опыт прослушивания в системе, не использующей явные параметрические кодеры, которые не передают параметрические данные для пространственного М-канального аудиосигнала. N-канальным аудиосигналом может быть, в частности, неуправляемый MPEG Surround сигнал, такой как матричный совместимый сигнал понижающего микширования. N-канальным аудиосигналом может также быть обычный стереосигнал, например стерео MP3 декодированный сигнал, или стерео FM сигнал.

Согласно другому аспекту изобретения, обеспечен приемник для принятия пространственного М-канального аудиосигнала, причем этот приемник содержит: приемник для принятия N-канального аудиосигнала, N<M; параметрическое средство для определения пространственных параметров повышающего микширования, связывающих N-канальный аудиосигнал с пространственным М-канальным аудиосигналом; модифицирующее средство для модификации зоны наилучшего восприятия пространственного М-канального аудиосигнала посредством модификации по меньшей мере одного из пространственных параметров повышающего микширования; средство генерации для генерации пространственного М-канального аудиосигнала посредством повышающего микширования N-канального аудиосигнала с использованием по меньшей мере одного модифицированного пространственного параметра повышающего микширования.

Согласно другому аспекту изобретения, обеспечена система передачи для передачи аудиосигнала, причем эта система содержит: передатчик, выполненный с возможностью передачи N-канального аудиосигнала; и приемник, содержащий: приемник для принятия N-канального аудиосигнала; параметрическое средство для определения пространственных параметров повышающего микширования, связывающих N-канальный аудиосигнал с пространственным М-канальным аудиосигналом, N<M; модифицирующее средство для модификации зоны наилучшего восприятия пространственного М-канального аудиосигнала посредством модификации по меньшей мере одного из пространственных параметров повышающего микширования; средство генерации для генерации пространственного М-канального аудиосигнала посредством повышающего микширования N-канального аудиосигнала с использованием по меньшей мере одного модифицированного пространственного параметра повышающего микширования.

Согласно другому аспекту изобретения, обеспечено воспроизводящее звук устройство для воспроизведения пространственного М-канального аудиосигнала, причем это воспроизводящее звук устройство содержит: приемник для принятия N-канального аудиосигнала, N<M; параметрическое средство для определения пространственных параметров повышающего микширования, связывающих N-канальный аудиосигнал с пространственным М-канальным аудиосигналом; модифицирующее средство для модификации зоны наилучшего восприятия пространственного М-канального аудиосигнала посредством модификации по меньшей мере одного из пространственных параметров повышающего микширования; средство генерации для генерации пространственного М-канального аудиосигнала посредством повышающего микширования N-канального аудиосигнала с использованием по меньшей мере одного модифицированного пространственного параметра повышающего микширования.

Согласно другому аспекту изобретения, обеспечен способ модификации зоны наилучшего восприятия пространственного М-канального аудиосигнала, причем этот способ предусматривает: принятие N-канального аудиосигнала, N<M; определение пространственных параметров повышающего микширования, связывающих N-канальный аудиосигнал с пространственным М-канальным аудиосигналом; модификацию зоны наилучшего восприятия пространственного М-канального аудиосигнала посредством модификации по меньшей мере одного из пространственных параметров повышающего микширования; генерацию пространственного М-канального аудиосигнала посредством повышающего микширования N-канального аудиосигнала с использованием по меньшей мере одного модифицированного пространственного параметра повышающего микширования.

Согласно другому аспекту изобретения, обеспечен способ принятия пространственного М-канального аудиосигнала, причем этот способ предусматривает: принятие N-канального аудиосигнала, N<M; определение пространственных параметров повышающего микширования, связывающих N-канальный аудиосигнал с пространственным М-канальным аудиосигналом; модификацию зоны наилучшего восприятия пространственного М-канального аудиосигнала посредством модификации по меньшей мере одного из пространственных параметров повышающего микширования; генерацию пространственного М-канального аудиосигнала посредством повышающего микширования N-канального аудиосигнала с использованием по меньшей мере одного модифицированного пространственного параметра повышающего микширования.

Согласно другому аспекту изобретения, обеспечен способ передачи и приема аудиосигнала, причем этот способ содержит: передатчик, передающий N-канальный аудиосигнал; и приемник, выполняющий стадии: принятия N-канального аудиосигнала; определения пространственных параметров повышающего микширования, связывающих N-канальный аудиосигнал с пространственным М-канальным аудиосигналом, N<M; модификации зоны наилучшего восприятия пространственного М-канального аудиосигнала посредством модификации по меньшей мере одного из пространственных параметров повышающего микширования; генерации пространственного М-канального аудиосигнала посредством повышающего микширования N-канального аудиосигнала с использованием по меньшей мере одного модифицированного пространственного параметра повышающего микширования.

Эти и другие аспекты, особенности и преимущества изобретения явствуют и разъясняются со ссылкой на вариант (варианты) осуществления, описываемые далее.

КРАТКОЕ ОПИСАНИЕ ЧЕРТЕЖЕЙ

Варианты осуществления изобретения будут описаны только посредством примера, со ссылкой на чертежи, в которых:

Фиг. 1 является иллюстрацией системы передачи для передачи аудиосигнала в соответствии с некоторыми вариантами осуществления изобретения;

Фиг. 2 является иллюстрацией декодера, способного модифицировать зону наилучшего восприятия пространственного М-канального аудиосигнала в соответствии с некоторыми вариантами осуществления изобретения;

Фиг. 3 является иллюстрацией настройки громкоговорителей для MPEG системы окружающего звука;

Фиг. 4 является иллюстрацией структуры MPEG Surround декодера; и

Фиг. 5 является иллюстрацией способа модификации зоны наилучшего восприятия пространственного М-канального аудиосигнала в соответствии с некоторыми вариантами осуществления изобретения.

ПОДРОБНОЕ ОПИСАНИЕ НЕКОТОРЫХ ВАРИАНТОВ ОСУЩЕСТВЛЕНИЯ ИЗОБРЕТЕНИЯ

Следующее описание фокусируется на вариантах осуществления изобретения, применимых к MPEG аудиосистеме окружающего звука. Однако будет ясно, что изобретение не ограничено этим применением, а может быть применено ко многим другим многоканальным аудиосистемам и стандартам.

Фиг. 1 иллюстрирует систему 100 передачи для передачи аудиосигнала в соответствии с некоторыми вариантами осуществления изобретения. Система 100 передачи содержит передатчик 101, который подключен к приемнику 103 через сеть 105, которой, в частности, может быть Интернет.

В этом конкретном примере передатчиком 101 является устройство записи сигналов, а приемником 103 является устройство воспроизведения сигналов, но будет ясно, что в других вариантах осуществления передатчик и приемник могут использоваться в других приложениях и с другими целями. Например, передатчик 101 и/или приемник 103 могут быть частью функциональности транскодирования и могут, например, обеспечивать сопряжение с другими источниками или назначениями сигналов.

В этом конкретном примере, когда поддерживается функция записи сигналов, передатчик 101 содержит дискретизатор 107, который принимает аналоговый многоканальный сигнал, который преобразуется в цифровой PCM (модулированный импульсным кодом) сигнал посредством дискретизации и аналого-цифрового преобразования.

Дискретизатор 107 подключен к кодеру 109 фиг. 1, который кодирует PCM сигнал в соответствии с алгоритмом кодирования. В этом примере кодером 109 является MPEG Surround кодер, который кодирует М-канальный сигнал как N-канальный сигнал, где M>N. MPEG Surround декодер, таким образом, генерирует N-канальный сигнал, а также пространственные параметрические данные, которые позволяют декодеру генерировать М-канальный сигнал. Кодер 109 может, например, кодировать 5.1, 6.1 или 7.1 сигнал окружающего звука как стереосигнал плюс пространственные параметрические данные. Следующее описание будет фокусироваться на сценарии, в котором 5.1 стереосигнал кодируется как стереосигнал плюс пространственные параметрические данные.

Кодер 109 подключен к сетевому передатчику 111, который принимает кодированный сигнал и сопрягается с Интернетом 105. Сетевой передатчик может передавать кодированный сигнал к приемнику 103 через Интернет 105.

Приемник 103 содержит сетевой приемник 113, который сопрягается с Интернетом 105 и который выполнен с возможностью принятия кодированного сигнала от передатчика 101.

Сетевой приемник 113 подключен к декодеру 115. Декодер 115 принимает кодированный сигнал и декодирует его в соответствии с алгоритмом декодирования. В этом примере декодер декодирует М-канальный сигнал из N-канального сигнала с использованием принятых параметрических данных после того, как они были модифицированы для того, чтобы модифицировать зону наилучшего восприятия первоначального сигнала. Зоной наилучшего восприятия пространственного многоканального сигнала является область/местоположения, в которой пространственное восприятие не отклоняется значительно от заданного пространственного восприятия, например заданного студийными инженерами для стандартизованной настройки многоканальных громкоговорителей.

В частности, в этом примере декодером 115 является MPEG Surround декодер, работающий в управляемом режиме, когда декодирование основано на пространственных параметрических данных, генерируемых кодером 109. Однако будет ясно, что в других вариантах осуществления пространственные параметрические данные могут генерироваться самим декодером и что декодером 115 может, в частности, быть MPEG Surround декодер, работающий в неуправляемом режиме.

В этом конкретном примере, когда поддерживается функция воспроизведения сигналов, приемник 103 дополнительно содержит проигрыватель 117 сигналов, который принимает декодированный аудиосигнал от декодера 115 и предоставляет его пользователю. В частности, проигрыватель 117 сигналов может содержать цифро-аналоговый преобразователь, усилители и громкоговорители, требуемые для выдачи декодированного аудиосигнала.

Фиг. 2 иллюстрирует декодер 115 более подробно.

Декодер 115 содержит блок 201 приемника, который принимает битовый поток от сетевого приемника 113. Этот приемник содержит как кодированный стереосигнал, так и параметрические данные.

Блок 201 приемника подключен к параметрическому блоку 203, который определяет пространственные параметры, которые должны быть использованы для генерации окружающего сигнала из стереосигнала. Этими пространственными параметрами являются, таким образом, параметрические данные, которые описывают характеристику канального сигнала М-канального сигнала относительно характеристики канального сигнала N-канального сигнала. Пространственные параметры могут, в частности, указывать, как N-канальный сигнал должен быть обработан для генерации М-канального сигнала.

В этом основном примере пространственные параметры просто генерируются посредством извлечения этих параметров из принимаемого битового потока, т.е. используются пространственные параметры, генерируемые кодером 109. Однако будет ясно, что в других вариантах осуществления пространственные параметры могут, например, определяться самим декодером, например, посредством оценки этих параметров из принимаемого сигнала. В частности, декодер 115 может быть MPEG Surround декодером, работающим в неуправляемом режиме, и может соответственно генерировать пространственные параметры из некоторых характеристик N-канального сигнала, таких как разность интенсивностей каналов и характеристики корреляции принимаемого стереосигнала.

Блок 201 приемника также подключен к декодирующему блоку 205, который декодирует стереосигнал и увеличивает число его каналов для генерации 5.1 канального окружающего сигнала. Повышающее микширование в этом примере выполняется в соответствии со стандартом MPEG Surround и основывается на определенных пространственных параметрах. Однако пространственные параметры не используются непосредственно, а декодер 115 содержит модифицирующий блок 207, который подключен к параметрическому блоку 203 и декодирующему блоку 205 и который изменяет один или несколько пространственных параметров для того, чтобы модифицировать зону наилучшего восприятия генерируемого окружающего сигнала.

Таким образом, декодер 115 фиг. 2 позволяет осуществить простое, эффективное, высокопроизводительное и несложное манипулирование зоной наилучшего восприятия выходного сигнала окружающего звука посредством модификации одного или нескольких пространственных параметров, используемых в процессе декодирования/повышающего микширования. Таким образом, путем интеграции манипулирования и декодирования/повышающего микширования может быть достигнута по существу облегченная и улучшенная работа.

Этот подход может использоваться для эффективной модификации формы и местоположения зоны наилучшего восприятия. Это особенно полезно для домашнего применения и применения в автомобиле, когда позиция слушателя отличается от первоначальной позиции зоны наилучшего восприятия. Это может быть также полезно для создания схожих восприятий звукового образа для множественных слушателей с различными позициями. Таким образом, этот подход позволяет осуществить легкое манипулирование наиболее желательными особенностями для управления звуковой сценой, включающими в себя:

- Управление передне-задним балансом может быть применено для постепенного акцентирования пространственного образа к передней части или к задней части.

- Управление центральной дисперсией может быть применено для создания менее (или более) направленного восприятия центрального канала.

- Управление лево-правым балансом может быть применено для обеспечения постепенного сдвига акцента влево или вправо.

- Управление корреляцией или передне-задней дисперсией может быть применено для осуществления управления передне-задней корреляцией, которая дает вклад в воспринимаемую ширину звука.

Этот подход приводит к очень не сложным решениям для манипулирования зоной наилучшего восприятия, и является выгодным то, что этот подход может применяться во всех рабочих режимах MPEG Surround. Кроме того, как будет описано далее, можно также улучшить пространственный образ при декодировании сигналов понижающего микширования ограниченного качества, таких как сигналы в FM и AM радиопередачах.

Далее более подробный пример различных манипуляций зоной наилучшего восприятия будет описан со ссылкой на 5.1 MPEG Surround систему.

Фиг. 3 иллюстрирует настройку громкоговорителей, на которой основаны 6-канальные выходные конфигурации MPEG Surround алгоритма.

Фиг. 4 иллюстрирует MPEG Surround структуру повышающего микширования для генерации 5.1 сигнала окружающего звука из принимаемого стереосигнала и пространственных параметров. В MPEG Surround повышающее микширование выполняется в каскадном процессе, где первоначально два коэффициента предсказания каналов (CPC) используются для создания левого, центрального и правого сигнала (L, C и R) в первой стадии повышающего микширования с использованием матрицы (3х2) предварительного усиления, заданной следующим образом:

.

Каждый из этих трех промежуточных каналов затем преобразуется в два дополнительных канала. В частности, промежуточный центральный канал разделяется на центральный канал и канал улучшения низких частот (LFE) с использованием пространственного параметра межканальной разности интенсивностей (IID). Кроме того, два IID и два коэффициента межканальной корреляции (ICC) используются для расщепления каждого из промежуточных левого и правого сигналов на передний и окружающий канал (Lf, Rf и Ls, Rs) посредством матрицы микширования 5×5 (где декоррелированные сигналы используются для введения уровня корреляции, указываемого посредством ICC).

В некоторых вариантах осуществления модифицирующий блок 207 может модифицировать передне-задний баланс посредством модификации пространственного параметра, который указывает относительную разность интесивностей между по меньшей мере одним передним каналом и по меньшей мере одним задним каналом пространственного М-канального аудиосигнала. В частности, модифицирующий блок может модифицировать один или несколько параметров IID.

Следующее описывает то, как простой параметр настройки может быть установлен для постепенного перемещения акцента пространственного образа (зоны наилучшего восприятия) назад и вперед между передней частью и задней частью. Таким образом, простой параметр настройки может использоваться для перемещения местоположения/области, где в позиции слушателя воспринимается оптимальный эффект окружения. Это особенно полезно в ситуациях, когда слушатель расположен либо спереди, либо сзади от центральной позиции громкоговорителей, как это обычно имеет место в домашнем применении и в применении в автомобиле.

В вариантах осуществления фиг. 2 управление передне-задним балансом достигается посредством модификации параметров IID для достижения желаемого эффекта. Параметры IID обычно выражаются на логарифмической шкале дБ и указывают относительное распределение энергии между передним и окружающим каналом.

В следующем конкретном примере параметры ICC и IID будут для краткости и ясности считаться равными для левой и правой сторон. Это обычно имеет место для MPEG Surround неуправляемых режимов. Для MPEG Surround управляемого режима, параметры ICC и IID обычно различны для левой и правой сторон, и будет ясно, что описанный подход может быть легко распространен на такие ситуации. В частности, описанный подход может быть независимо применен к обеим сторонам с использованием одного и того же параметра настройки, SFB.

В описанном подходе параметр IID используется для изменения передне-заднего распределения сигналов. В частности, увеличение IID подает больше энергии в передние боковые каналы, тогда как уменьшение IID подает больше энергии в окружающие каналы.

IID, который выражается в дБ, может быть обновлен посредством добавления величины смещения.

Эта величина смещения ΔFB может быть определена из параметра SFB простой настройки, который может быть, например, установлен вручную пользователем или оператором. Например, воспроизводящее устройство 103, содержащее декодер 115, может содержать ввод для выбора между различными настройками эмуляции звукового окружения, причем каждая настройка имеет некоторое количество связанных с ней заданных параметров настройки зоны наилучшего восприятия.

Слуховая система человека имеет уменьшающуюся чувствительность к изменениям в IID для увеличивающихся эталонных значений (как положительных, так и отрицательных). Например, следующая таблица иллюстрирует едва заметные различия (JND) для вариаций IID:

Эталонный IID (дБ) JND(дБ)
0 0,5-1
9 1,2
15 1,5-2

Для достижения подобного эффекта акцентирования для целого диапазона IID этот нелинейный эффект может быть включен в обновление IID:

Поскольку нелинейное поведение слуховой системы также отражается в векторе квантования IID, используемом в MPEG Surround для преобразования значений этого показателя в параметры IID, модификация IID может быть реализована посредством линейного обновления в области показателей. Пусть I IID,org - показатель, соответствующий IID org, тогда IID может быть обновлен посредством вычисления нового IID, который соответствует показателю, заданному следующим образом:

Таким образом, параметр S FB простой настройки, имеющий линейную связь со смещением передне-заднего баланса, может быть установлен для модификации передне-заднего баланса зоны наилучшего восприятия сигнала окружающего звука.

Если непосредственное использование показателя IID является непрактичным (например, так как он недоступен для модифицирующего блока), можно переключаться на область показателей и обратно посредством приближения полиномом второго порядка для (неотрицательной части) MPEG Surround вектора квантования для IID:

где

Таким образом, IID может быть преобразован обратно в область показателей посредством:

Этот новый показатель может быть затем определен путем добавления параметра SFB, и, таким образом, параметр IID может быть определен как:

Альтернативно для определения модифицированного IID может быть использована интерполяция, основанная на векторе квантования.

Уменьшение значения IID приводит к смещению энергии от передних каналов к окружающим каналам при поддержании когерентности и полной энергии. Однако эта модификация не изменяет энергию центрального (и LFE) каналов и, следовательно, может в некоторой степени деформировать пространственный образ. Увеличение значения IID может подобным же образом деформировать пространственный образ.

Для уменьшения этого эффекта предпочтительно сохраняется отношение энергий между передними боковыми каналами и центральным каналом. Микширование энергии центрального канала в боковые каналы или наоборот могло бы вызвать непреднамеренную утечку контента (например, голосов) к боковым каналам и, следовательно, изменение пространственного образа. Следующее описывает способ, который по существу сохраняет отношение энергий передних боковых каналов к центральному и препятствует утечке центрального контента в боковые каналы посредством масштабирования центрального канала.

В этом подходе передние каналы масштабируются при ограничении, что отношение энергий между передними боковыми каналами и центральным каналом сохраняется:

Масштабирование центрального сигнала имеет последствия для полной энергии и, следовательно, левый и правый боковые сигналы должны быть масштабированы одновременно для компенсации потери энергии. Таким образом, общая энергия предпочтительно должна также сохраняться:

где масштабирование представлено следующим образом:

.

В этом примере левый и правый каналы масштабированы посредством одного и того же коэффициента, так как предполагается, что пространственные параметры для двух боковых каналов равны (что соответствует MPEG Surround неуправляемому режиму), и, таким образом, они оба далее обрабатываются посредством одних и тех же пространственных параметров. Коэффициенты µ и λ масштабирования могут быть вычислены путем вставки равенств масштабирования в требования сохранения энергии. Это дает:

что приводит к равенству:

и

Переписывание дает:

и таким образом,

где

Таким образом, выражения для µ и λ следующие:

Компенсация распределения энергии для поддержания общего пространственного образа может быть выполнена посредством обработки относительно низкой сложности. В частности, MPEG Surround алгоритм повышающего микширования обновляет параметры с некоторой скоростью Т обновления. Таким образом, каждые Т выборок вычисляются новые матрицы повышающего микширования, и они интерполируются для выборок между ними. Масштабирование сигналов повышающего микширования может быть интегрировано с матрицей предварительного усиления, и, соответственно, значения масштабирования должны определяться только один раз на Т выборок.

С диапазоном параметров:

образ может быть смещен полностью назад (-30) и полностью вперед (+30) в смысле восприятия и с приблизительно линейной связью между значением параметра настройки и воспринимаемым смещением в передне-заднем балансе.

Кроме того, значения масштабирования определяются из величины Eratio, которая представляет собой отношение энергий промежуточных сигналов L, R и C. По причине стабильности, эти энергии могут быть сглажены (отфильтрованы фильтром нижних частот). Однако для MPEG Surround неуправляемого режима такие отфильтрованные фильтром нижних частот энергии сигналов Ldmx и Rdmx понижающего микширования являются уже доступными, так как они используются для определения параметров IIDи ICC для сигнала понижающего микширования. Они могут быть использованы в комбинации с матрицей предварительного усиления, которая определяется следующим образом:

Таким образом, E ratio может быть записана в виде:

что устраняет необходимость в повыборочных вычислениях для управления передне-задним балансом.

Дополнительное уменьшение сложности может быть получено, например, путем использования справочных таблиц для различных равенств или путем использования функций приближений низкой сложности.

В этом примерном варианте осуществления декодер 115 может, кроме того, настраивать центральную дисперсию, тем самым увеличивая зону наилучшего восприятия. В частности, параметр настройки центральной дисперсии используется для рассредоточения образа центрального канала в стороны для получения менее направленного центра. Таким образом, этот подход позволяет осуществить увеличение воспринимаемой ширины центра путем настройки пространственных параметров, и, таким образом, пространственные параметры используются для манипулирования размером зоны наилучшего восприятия.

В MPEG Surround первая стадия повышающего микширования создает три промежуточных сигнала L, C и R с использованием матрицы предварительного усиления (см., например, фиг. 4):

.

Для увеличения ширины центра часть центрального сигнала С может быть микширована в боковые каналы L и R. В частности, пространственными параметрами CPC1 и CPC2 этой первой стадии повышающего микширования можно манипулировать таким образом, что центральный сигнал микшируется (смешивается) с левым и правым сигналами. Как можно видеть из матрицы предварительного усиления, CPC параметры указывают относительное распределение энергии каждого из стереосигналов в каждый из промежуточных каналов. Таким образом, настройка CPC параметров дает возможность осуществить постепенное смещение энергии от центрального канала (или к нему) к боковым каналам (или от них). При изменении центральной дисперсии модификация обычно выполняется симметрично, и, таким образом, значения CPC изменяются идентично.

Как следует из матрицы предварительного усиления, если оба CPC параметра равны 1, то нижний ряд содержит только нули, и следовательно, центральный сигнал не генерируется. Также для этой настройки коэффициенты усиления (матричные коэффициенты) для левого и правого сигналов увеличиваются и, таким образом, весь центральный сигнал полностью рассредотачивается в левый и правый каналы. Наоборот, при уменьшении CPC центральная энергия увеличивается, тогда как энергия левого и правого сигналов уменьшается.

Таким образом, дисперсия центра может быть увеличена путем увеличения значений CPC параметров по направлению к 1. Таким образом, центральный сигнал (частично) микшируется в боковые каналы, что приводит к более широкому пространственному образу для сигнала центрального канала.

В частности, новые значения CPC могут быть определены из параметра SCD настройки согласно:

.

Для отрицательных значений SCD значения CPC перемещаются по направлению к -1, тем самым сужая ширину восприятия окружающего сигнала. Диапазон параметра SCD настройки может быть предпочтительно установлен на [-1, 1].

В этом примерном варианте осуществления декодер 115 может дополнительно смещать пространственный звуковой образ влево или вправо, тем самым позволяя зоне наилучшего восприятия перемещаться соответственно. Это может быть особенно важно, когда слушатель помещен слева или справа от первоначальной зоны наилучшего восприятия.

Лево-правое распределение энергии сигнала получается в первой стадии повышающего микширования, когда сигналы L, C и R генерируются с использованием параметров предсказания CPC1 и CPC2. Управление балансом использует эти параметры предсказания для достижения манипулирования низкой сложности местоположением зоны наилучшего восприятия.

В частности, поскольку параметр CPC1 управляет вкладом левого канала понижающего микширования, а параметр CPC2 управляет вкладом правого канала понижающего микширования, баланс может быть смещен влево или вправо путем уменьшения параметров относительно друг друга. Таким образом, уменьшение CPC1 смещает баланс вправо, тогда как уменьшение CPC2 смещает его влево.

В частности, настройка CPC параметров для управления балансом может быть выполнена подобно настройке, используемой для уменьшения ширины центра посредством параметра управления дисперсией центра. Эти параметры либо смещаются по направлению к значению CPC от -1, либо остаются немодифицированными в зависимости от знака параметра SLR настройки управления балансом:

Диапазон параметров:

обеспечивает разумную величину управления балансом без отрицательного влияния на эффекты восприятия, связанные с энергией центра.

Оценивание матрицы предварительного усиления иллюстрирует, что невозможно создать шкалу абсолютного баланса без увеличения энергии центрального сигнала просто посредством модификации CPC параметров. Однако уменьшенное управление балансом в общем является достаточным, так как наиболее типичные местоположения зоны наилучшего восприятия только относительно немного отклоняются от центральной позиции прослушивания.

В этом примерном варианте осуществления декодер 115 может, кроме того, модифицировать дисперсию спереди назад, тем самым позволяя управлять воспринимаемой шириной звука и, таким образом, увеличивать зону наилучшего восприятия.

В частности, ICC параметры, используемые во второй стадии повышающего микширования для генерации передних и окружающих каналов левой и правой стороны, модифицируются для увеличения или уменьшения корреляции, тем самым оказывается влияние на передне-заднюю дисперсию.

В частности, настройка параметра ICC подобна настройкам CPC параметров для управления дисперсией центра за исключением того, что настраиваемый параметр ICC ограничен диапазоном от 0 до 1. Таким образом, с использованием параметра SCR настройки передне-задней дисперсии новые корреляционные параметры могут быть определены как:

где:

Следующая таблица обеспечивает обзор конкретных пространственных параметров, которые модифицируются для достижения различных манипуляций зоной наилучшего восприятия:

Параметр настройки Влияющие пространственные параметры Параметр настройки Диапазон параметров
Передне-задняя дисперсия
Дисперсия центра
Управление лево-правым балансом
Управление передне-задним балансом

В этом конкретном примере все параметры настройки используются одновременно. Однако порядок, в котором применяются модификации, может влиять на достигнутое качество.

В частности, дисперсия центра и управление лево-правым балансом влияют друг на друга, так как они используют одни и те же пространственные параметры. Управление балансом поддерживает некоторую энергию в центральном канале, тогда как настройка дисперсии центра микширует (часть) энергии центра как влево, так и вправо. Следовательно, много энергии заканчивается в боковом канале, что должно быть смягчено управлением балансом при выполнении дисперсии центра после управления балансом. Следовательно, настройки дисперсии центра могут быть выполнены сначала, что позволяет управлению балансом правильно работать.

Управление передне-задним балансом использует CPC параметры в вычислении коэффициентов масштабирования. Обычно в этом вычислении должны использоваться действительные параметры, которые будут использоваться в процессе повышающего микширования. Следовательно, вычисления для управления передне-задним балансом может быть выполнено после вычислений для дисперсии центра и управления лево-правым балансом.

На вычисления для настройки передне-задней дисперсии не влияют никакие другие представленные параметры настройки. Настройка корреляции также не влияет на другие параметры настройки. Поэтому модификация этого параметра может быть расположена в произвольном порядке среди других вычислений.

Будет ясно, что описываемые принципы могут применяться в MPEG Surround декодерах, работающих как в управляемом режиме так и в неуправляемом режиме. При работе в неуправляемом режиме пространственные параметры определяются самим декодером на основе характеристик принимаемого стереосигнала, тогда как в управляемом режиме пространственные параметры генерируются и принимаются от кодера.

Конкретный пример, в котором описанный подход может обеспечить улучшенный опыт прослушивания в связи с неуправляемым режимом работы, состоит в том, что принимается стереосигнал (например, стандартный стереосигнал), который не имеет очень отчетливых левого и правого каналов. Для оптимизации опыта окружения для этого типа сигналов посредством этого алгоритма может быть обеспечена специфическая настройка или режим прослушивания.

Обычно плохой прием радиостанции может привести к двум видам эффектов для двухканального выхода приемника (комбинация обоих также является обычной):

- Звук с помехами.

- Отсутствие воспроизведения стереозвучания или переключения между стерео и моно.

Эксперименты показали, что стереосигнал со статическими помехами не влияет значительно на пространственный образ. Эти помехи прекращаются во всех выходах, как и для стереовыхода.

Однако более динамические помехи влияют на пространственные характеристики выхода приемника более ясно. В основном, этот вид помех приводит к быстрому переключению между стерео- и моновоспроизведением в радиоприемнике. Со стандартным MPEG Surround неуправляемым алгоритмом такой сигнал приводит к пространственной нестабильности, когда полный звук разрушается в центральный канал при переключении входа на моно.

Это также является недостатком для основанных на моно FM станций и всех AM станций, так как моносигнал (Ldmx=Rdmx) не имеет межканальной разности интенсивностей, и полная корреляция и, следовательно, пространственные параметры будут постоянными. Результирующие значения для CPC параметров помещают основную массу энергии сигнала в центральный канал, и обеспечивается плохой опыт окружающего звука.

Кроме того, из-за способа, которым передаются FM стереосигналы (моносигнал (суммарный сигнал) и дифференциальный сигнал), пространственные свойства понижающего микширования могут быть уменьшены, так как дифференциальный сигнал первым ухудшается для плохого приема. Следовательно, пространственное восстановление посредством MPEG Surround неуправляемого алгоритма гораздо больше имеет тенденцию к ориентации на центральный сигнал, а не на стандартные стереосигналы.

Таким образом, основным недостатком радиосигналов как источника неуправляемых MPEG Surround систем является высокая вероятность того, что пространственные характеристики, которые управляют этим алгоритмом, могут быть потеряны, что приводит к концентрации сигнала в переднем центральном громкоговорителе.

Однако описанный декодер обеспечивает манипулирование зоной наилучшего восприятия низкой сложности, что может улучшить обеспечиваемый опыт окружающего звука. В частности, решение низкой сложности, достигающее удовлетворительного пространственного образа для моносигналов, может использовать параметр настройки дисперсии центра. Установка этого параметра, например, на 0,5 вызывает дисперсию части энергии, которая была бы помещена в центральный сигнал, к боковым сигналам L и R. Для моносигналов IID в 0 дБ приводит к равномерному распределению между передними и задними громкоговорителями.

В результате, даже для моновхода, алгоритм может эффективно распределять сигнал по всем выходным каналам. Для стереосигналов расширение создает улучшенный пространственный образ.

Фиг. 5 иллюстрирует способ модификации зоны наилучшего восприятия пространственного М-канального аудиосигнала. Этот способ начинается на стадии 501, на которой принимается N-канальный аудиосигнал с N<M.

За стадией 501 следует стадия 503, на которой определяются пространственные параметры, связывающие N-канальный аудиосигнал с пространственным М-канальным аудиосигналом.

За стадией 503 следует стадия 505, на которой зона наилучшего восприятия пространственного М-канального аудиосигнала модифицируется посредством модификации по меньшей мере одного из пространственных параметров.

За стадией 505 следует стадия 507, на которой пространственный М-канальный аудиосигнал генерируется посредством повышающего микширования N-канального аудиосигнала с использованием по меньшей мере одного модифицированного пространственного параметра.

Будет ясно, что вышеприведенное описание для ясности описало варианты осуществления изобретения со ссылкой на различные функциональные блоки и процессоры. Однако будет очевидно, что любое подходящее распределение функциональности между различными функциональными блоками или процессорами может использоваться не выходя за рамки изобретения. Например, функциональность, иллюстрированная как подлежащая выполнению отдельными процессорами или контроллерами, может выполняться тем же самым процессором или контроллерами. Следовательно, ссылки на конкретные функциональные блоки должны рассматриваться только как ссылки на подходящие средства обеспечения описанной функциональности, а не как указания на строгую логическую или физическую структуру или организацию.

Данное изобретение может быть реализовано в любой подходящей форме, включающей в себя аппаратное обеспечение, программное обеспечение, программно-аппаратные средства или любую их комбинацию. Изобретение может быть реализовано по меньшей мере частично как компьютерное программное обеспечение, прогоняемое на одном или нескольких процессорах данных и/или процессорах цифровых сигналов. Элементы и компоненты некоторого варианта осуществления изобретения могут быть физически, функционально и логически реализованы любым подходящим способом. Фактически, эта функциональность может быть реализована в единственном блоке, в множестве блоков или как часть других функциональных блоков. Как таковое, изобретение может быть реализовано в единственном блоке или может быть физически и функционально распределено между различными блоками и процессорами.

Хотя данное изобретение было описано в связи с некоторыми вариантами осуществления, оно не предназначено для ограничения конкретной формой, изложенной здесь. Скорее, объем данного изобретения ограничен только сопутствующей формулой изобретения. Кроме того, хотя может оказаться, что некоторая особенность описана в связи с конкретными вариантами осуществления, специалисту в данной области техники будет ясно, что различные особенности описанных вариантов осуществления могут быть скомбинированы в соответствии с изобретением. В формуле изобретения термин «содержащий» не исключает присутствия других элементов или стадий.

Кроме того, несмотря на индивидуальное перечисление, множество средств, элементов или стадий способа может быть реализовано посредством единственного блока или процессора. Кроме того, хотя индивидуальные особенности могут быть включены в различные пункты формулы изобретения, они могут быть выгодным образом скомбинированы, и включение в различные пункты формулы изобретения не означает, что некоторая комбинация особенностей не является возможной и/или выгодной. Также включение некоторой особенности в одну категорию пунктов формулы изобретения не подразумевает ограничение этой категорией, а скорее указывает, что эта особенность равным образом применима и к другим категориям пунктов формулы изобретения подходящим образом. Кроме того, порядок особенностей в пунктах формулы изобретения не подразумевает какого-либо конкретного порядка, в котором эти особенности должны работать, и, в частности, порядок индивидуальных стадий в пункте способа не подразумевает, что эти стадии должны выполняться в этом порядке. Скорее, эти стадии могут выполняться в любом подходящем порядке. Кроме того, одиночные ссылки не исключают множественности. Таким образом, ссылки на «некоторый», «один», «первый», «второй» и т.д. не препятствуют множеству. Ссылочные позиции в формуле изобретения обеспечены только в качестве проясняющего примера и не должны толковаться как ограничивающие объем изобретения каким-либо образом.

1. Устройство для модификации зоны наилучшего восприятия пространственного М-канального аудиосигнала, причем упомянутое устройство содержит:
- приемник (201) для приема N-канального аудиосигнала, N<M;
- параметрическое средство (203) для определения пространственных параметров повышающего микширования, связывающих N-канальный аудиосигнал с пространственным М-канальным аудиосигналом;
- модифицирующее средство (207) для модификации зоны наилучшего восприятия пространственного М-канального аудиосигнала посредством модификации по меньшей мере одного из пространственных параметров повышающего микширования;
- средство (205) генерации для генерации пространственного М-канального аудиосигнала посредством повышающего микширования N-канального аудиосигнала с использованием по меньшей мере одного модифицированного пространственного параметра повышающего микширования.

2. Устройство по п.1, в котором модифицирующее средство (207) выполнено с возможностью модификации передне-заднего баланса посредством модификации первого пространственного параметра повышающего микширования, указывающего разность интенсивностей между по меньшей мере одним передним каналом и по меньшей мере одним задним каналом пространственного М-канального аудиосигнала.

3. Устройство по п.2, в котором первым пространственным параметром повышающего микширования является межканальная разность интенсивностей между по меньшей мере одним передним каналом и по меньшей мере одним задним каналом.

4. Устройство по п.3, в котором модифицирующее средство (207) выполнено с возможностью модификации показателя квантования межканальной разности интенсивностей.

5. Устройство по п.2, в котором модифицирующее средство (207) дополнительно выполнено с возможностью масштабирования по меньшей мере одного переднего канала таким образом, что вариация отношения энергии переднего бокового канала к энергии центрального канала для пространственного М-канального аудиосигнала, вызванное модификацией первого параметра, уменьшается.

6. Устройство по п.1, в котором модифицирующее средство (207) выполнено с возможностью модификации дисперсии центра посредством модификации первого пространственного параметра повышающего микширования, указывающего относительное распределение сигнала по меньшей мере одного канала N-канального аудиосигнала между центральным каналом и по меньшей мере одним боковым каналом.

7. Устройство по п.6, в котором первым пространственным параметром повышающего микширования является коэффициент предсказания каналов.

8. Устройство по п.1, в котором модифицирующее средство (207) выполнено с возможностью модификации лево-правого баланса посредством модификации первого пространственного параметра повышающего микширования, указывающего относительное распределение сигнала по меньшей мере одного канала N-канального аудиосигнала между по меньшей мере одним правым боковым каналом и по меньшей мере одним левым боковым каналом.

9. Устройство по п.8, в котором первым пространственным параметром повышающего микширования является коэффициент предсказания каналов.

10. Устройство по п.1, в котором модифицирующее средство (207) выполнено с возможностью модификации передне-задней дисперсии посредством модификации первого пространственного параметра повышающего микширования, указывающего относительную корреляцию между по меньшей мере одним передним каналом и по меньшей мере одним задним каналом пространственного М-канального аудиосигнала.

11. Устройство по п.10, в котором первым пространственным параметром повышающего микширования является коэффициент межканальной корреляции между по меньшей мере одним передним каналом и по меньшей мере одним задним каналом.

12. Устройство по п.1, в котором N-канальный аудиосигнал соответствует понижающему микшированию пространственного М-канального аудиосигнала, и приемник (201) выполнен с возможностью принятия пространственных параметров повышающего микширования кодера, связывающих низведенный N-канальный аудиосигнал с пространственным М-канальным аудиосигналом, и параметрическое средство (203) выполнено с возможностью определения пространственных параметров повышающего микширования из пространственных параметров повышающего микширования кодера.

13. Устройство по п.1, в котором параметрическое средство (203) выполнено с возможностью определения пространственных параметров повышающего микширования из характеристик сигналов каналов N-канального аудиосигнала.

14. Устройство по п.1, в котором N-канальным аудиосигналом является сигнал окружающего звука MPEG.

15. Приемник (103) для принятия пространственного М-канального аудиосигнала, причем упомянутый приемник (103) содержит:
- приемник (201) для принятия N-канального аудиосигнала, N<M;
- параметрическое средство (203) для определения пространственных параметров повышающего микширования, связывающих N-канальный аудиосигнал с пространственным М-канальным аудиосигналом;
- модифицирующее средство (207) для модификации зоны наилучшего восприятия пространственного М-канального аудиосигнала посредством модификации по меньшей мере одного из пространственных параметров повышающего микширования;
- средство (205) генерации для генерации пространственного М-канального аудиосигнала посредством повышающего микширования N-канального аудиосигнала с использованием по меньшей мере одного модифицированного пространственного параметра повышающего микширования.

16. Система (100) передачи для передачи аудиосигнала, причем упомянутая система передачи содержит:
- передатчик (101), выполненный с возможностью передачи N-канального аудиосигнала; и приемник (103), содержащий:
- приемник (201) для принятия N-канального аудиосигнала,
- параметрическое средство (203) для определения пространственных параметров повышающего микширования, связывающих N-канальный аудиосигнал с пространственным М-канальным аудиосигналом, N<M,
- модифицирующее средство (207) для модификации зоны наилучшего восприятия пространственного М-канального аудиосигнала посредством модификации по меньшей мере одного из пространственных параметров повышающего микширования,
- средство (205) генерации для генерации пространственного М-канального аудиосигнала посредством повышающего микширования N-канального аудиосигнала с использованием по меньшей мере одного модифицированного пространственного параметра повышающего микширования.

17. Устройство (103) воспроизведения звука для воспроизведения пространственного М-канального аудиосигнала, причем упомянутое устройство воспроизведения звука содержит:
- приемник (201) для принятия N-канального аудиосигнала, N<M;
- параметрическое средство (203) для определения пространственных параметров повышающего микширования, связывающих N-канальный аудиосигнал с пространственным М-канальным аудиосигналом;
- модифицирующее средство (207) для модификации зоны наилучшего восприятия пространственного М-канального аудиосигнала посредством модификации по меньшей мере одного из пространственных параметров повышающего микширования;
- средство (205) генерации для генерации пространственного М-канального аудиосигнала посредством повышающего микширования N-канального аудиосигнала с использованием по меньшей мере одного модифицированного пространственного параметра повышающего микширования.

18. Способ модификации зоны наилучшего восприятия пространственного М-канального аудиосигнала, причем упомянутый способ предусматривает:
- прием (501) N-канального аудиосигнала, N<M;
- определение (503) пространственных параметров повышающего микширования, связывающих N-канальный аудиосигнал с пространственным М-канальным аудиосигналом;
- модификацию (505) зоны наилучшего восприятия пространственного М-канального аудиосигнала посредством модификации по меньшей мере одного из пространственных параметров повышающего микширования;
- генерацию (507) пространственного М-канального аудиосигнала посредством повышающего микширования N-канального аудиосигнала с использованием по меньшей мере одного модифицированного пространственного параметра повышающего микширования.

19. Способ принятия пространственного М-канального аудиосигнала, причем упомянутый способ предусматривает:
- принятие (501) N-канального аудиосигнала, N<M;
- определение (503) пространственных параметров повышающего микширования, связывающих N-канальный аудиосигнал с пространственным М-канальным аудиосигналом;
- модификацию (505) зоны наилучшего восприятия пространственного М-канального аудиосигнала посредством модификации по меньшей мере одного из пространственных параметров повышающего микширования;
- генерацию (507) пространственного М-канального аудиосигнала посредством повышающего микширования N-канального аудиосигнала с использованием по меньшей мере одного модифицированного пространственного параметра повышающего микширования.

20. Способ передачи и приема аудиосигнала, причем упомянутый способ предусматривает:
- передатчик (101), передающий N-канальный аудиосигнал; и
- приемник (103), выполняющий стадии:
- приема (501) N-канального аудиосигнала;
- определения (503) пространственных параметров повышающего микширования, связывающих N-канальный аудиосигнал с пространственным М-канальным аудиосигналом, N<M;
- модификации (505) зоны наилучшего восприятия пространственного М-канального аудиосигнала посредством модификации по меньшей мере одного из пространственных параметров повышающего микширования;
- генерации (507) пространственного М-канального аудиосигнала посредством повышающего микширования N-канального аудиосигнала с использованием по меньшей мере одного модифицированного пространственного параметра повышающего микширования.



 

Похожие патенты:

Изобретение относится к средствам формирования стереофонического сигнала с улучшенным для восприятия качеством, в частности к способу обработки сигнала, представленного центральным сигналом и боковым сигналом, с получением стереофонического сигнала с расширенными характеристиками.

Изобретение относится к области аудио- и звуковоспроизведения, в частности к способам и системам для выравнивания частотных характеристик громкоговорителя в комнате с целью его адаптации.

Изобретение относится к способам и устройствам воспроизведения многоканальных звуковых сигналов. .

Описывается бинауральная визуализация многоканального звукового сигнала в бинауральный выходной сигнал (24). Многоканальный звуковой сигнал включает сигнал стерео понижающего микширования (18), в который множество звуковых сигналов микшируется с понижением; и дополнительная информация включает информацию о понижающем микшировании (DMG, DCLD), показывающую для каждого звукового сигнала, до какой степени соответствующий звуковой сигнал был микширован в первый канал и второй канал сигнала стерео понижающего микширования (18) соответственно, а также информацию об уровне объекта множества звуковых сигналов и информацию о межобъектной взаимной корреляции, описывающую сходство между парами звуковых сигналов множества звуковых сигналов. Основанный на первом предписании визуализации, предварительный бинауральный сигнал (54) вычисляется из первого и второго каналов сигнала стерео понижающего микширования (18). Декоррелированный сигнал генерируется как перцепционный эквивалент моно понижающего микширования (58) из первого и второго каналов сигнала стерео понижающего микширования (18), являющийся, однако, декодированным до моно понижающего микширования (58). Технический результат - улучшение бинауральной визуализации при уничтожении ограничения в отношении свободы создания сигнала понижающего микширования из оригинальных звуковых сигналов. 3 н. и 8 з.п. ф-лы, 6 ил., 3 табл.

Изобретение относится к средствам формирования выходного пространственного многоканального аудио сигнала на основе входного аудио сигнала. Технический результат заключается в уменьшении вычислительных затрат процесса декодирования/рендеринга. Раскладывают входной аудио сигнал на основе входного параметра для получения первой компоненты сигнала и второй компоненты сигнала, отличающихся друг от друга. Выполняют рендеринг первой компоненты сигнала для получения первого представления сигнала с первым семантическим свойством и рендеринг второй компоненты сигнала для получения второго представления сигнала с вторым семантическим свойством, отличающимся от первого семантического свойства. Обрабатывают первое представление сигнала и второе представление сигнала для получения выходного пространственного многоканального звукового сигнала. 3 н. и 2 з.п. ф-лы, 8 ил.

Изобретение относится к универсальным пультам дистанционного управления, спроектированным для управления большим количеством бытовых приборов. Техническим результатом является экономия энергии за счет более легкого способа определения кодового набора, который нужно использовать, из нескольких кодовых наборов, в пульте дистанционного управления. Описывается способ определения правильного кодового набора, который нужно использовать для управления бытовым прибором. К тому же пульт дистанционного управления отправляет в бытовой прибор одну или более команд с использованием соответствующего кода по меньшей мере из одного из нескольких кодовых наборов (3040). Кодовый набор, который нужно использовать для управления этим бытовым прибором, определяется на основе по меньшей мере команды, отправленной в бытовой прибор пользователем пульта дистанционного управления, в качестве реакции на это (3070). 5 н. и 7 з.п. ф-лы, 3 ил.

Изобретение относится к средствам формирования выходного пространственного многоканального аудиосигнала на основе входного аудиосигнала и входного параметра. Технический результат заключается в уменьшении вычислительных затрат процесса декодирования/рендеринга. Раскладывают входной аудио сигнал на основе входного параметра для получения первой компоненты сигнала и второй компоненты сигнала, отличающихся друг от друга. Выполняют рендеринг первой компоненты сигнала для получения первого представления сигнала с первым семантическим свойством и выполняют рендеринг второй компоненты сигнала для получения второго представления сигнала с вторым семантическим свойством, отличающимся от первого семантического свойства. Обрабатывают первое представление сигнала и второе представление сигнала для получения выходного пространственного многоканального звукового сигнала. 3 н. и 12 з.п. ф-лы, 8 ил.

Изобретение относится к средствам для определения оценок положений громкоговорителей в системах объемного звука. Технический результат заключается в повышении точности определения оценки положений громкоговорителей в системах объемного звука. Система содержит датчики движения (201, 203, 205), выполненные с возможностью определения данных движения для пользовательского переносного блока, где данные движения описывают перемещение пользовательского переносного блока. Пользовательское устройство ввода (207, 209) принимает пользовательские активизации, которые указывают, что по меньшей мере одно из текущего положения и ориентации пользовательского переносного блока ассоциируется с положением громкоговорителя, когда принимается пользовательская активизация. Пользовательская активизация может возникать в результате, например, нажатия на кнопку пользователем. Анализирующий процессор (211) затем формирует оценки положений громкоговорителей в ответ на данные движения и пользовательские активизации. Система может позволить, например, оценку положений динамиков на основе карманного устройства, например пульта дистанционного управления, направленного на динамик или размещенного на нем. 2 н. и 12 з.п. ф-лы, 6 ил.

Изобретение относится к средствам обработки звука. Технический результат заключается в улучшении пространственного восприятия звукового сигнала. Система обработки звука принимает стереосигнал, который с помощью блока сегментации делится на частотно-временные сегменты стереосигнала, каждый из которых может соответствовать выборке частотной области в данном временном сегменте. Блок разложения разлагает частотно-временные сегменты сигнала, для каждой пары частотно-временных сегментов стереосигнала, путем осуществления этапов: определения меры подобия, указывающей степень подобия частотно-временных сегментов стереосигнала; генерации частотно-временного сегмента суммарного сигнала, как суммы частотно-временных сегментов стереосигнала; и генерации центрального частотно-временного сегмента сигнала из частотно-временного сегмента суммарного сигнала и пары боковых частотно-временных сегментов стереосигнала из пары частотно-временных сегментов стереосигнала в соответствии с мерой подобия. Затем генератор сигнала генерирует многоканальный сигнал, содержащий центральный сигнал, генерируемый из частотно-временных сегментов суммарного сигнала, и боковые сигналы, генерируемые из боковых частотно-временных сегментов стереосигнала. 2 н. и 12 з.п. ф-лы, 5 ил.

Изобретение относится к средствам для обработки звуковых сигналов. Технический результат заключается в уменьшении шумов захваченных звуковых сигналов. Устройство содержит по меньшей мере один процессор и по меньшей мере один модуль памяти, в котором хранится компьютерный программный код, при этом по меньшей мере один модуль памяти и компьютерный программный код сконфигурированы таким образом, чтобы при взаимодействии по меньшей мере с одним процессором обеспечивать выполнение устройством по меньшей мере следующего: предоставления визуального представления по меньшей мере одного параметра звукового сигнала, связанного по меньшей мере с одним звуковым сигналом, при этом указанный по меньшей мере один звуковой сигнал представляет звуковое поле вокруг устройства в реальном времени с использованием по меньшей мере двух микрофонов; обнаружения, с использованием интерфейса, взаимодействия с указанным визуальным представлением параметра звукового сигнала и обработку по меньшей мере одного звукового сигнала, связанного с параметром звукового сигнала, в зависимости от указанного взаимодействия. 2 н. и 18 з.п. ф-лы, 7 ил.

Изобретение относится к средствам для усовершенствованной авторской разработки и представления трехмерных аудиоданных. Технический результат заключается в уменьшении вычислительной сложности обработки трехмерного звука. Представлены усовершенствованные инструментальные средства для авторской разработки и представления данных звуковоспроизведения. Некоторые указанные инструментальные средства авторской разработки позволяют обобщать данные звуковоспроизведения на широкий выбор воспроизводящих сред. Данные звуковоспроизведения могут авторски разрабатываться путем создания метаданных для звуковых объектов. Метаданные могут создаваться со ссылкой на зоны громкоговорителей. В ходе процесса представления данных данные звуковоспроизведения могут воспроизводиться в соответствии со схемой расположения воспроизводящих громкоговорителей конкретной воспроизводящей среды. 6 н. и 36 з.п. ф-лы, 47 ил.

Изобретение относится к средствам для пространственного воспроизведения звука. Технический результат заключается в улучшении пространственного восприятия при прослушивании. Устройство для пространственного воспроизведения звука содержит приемное устройство для приема многоканального аудиосигнала. Анализатор определяет пространственное свойство многоканального аудиосигнала, такое как пространственная сложность или организация. Процессор выбора затем выбирает режим воспроизведения из множества режимов воспроизведения звука, при этом режимы многоканального воспроизведения звука используют различные технологии пространственного рендеринга. Схема воспроизведения затем возбуждает набор громкоговорителей, чтобы воспроизводить многоканальный аудиосигнал с использованием выбранного режима воспроизведения. Переключение между режимами воспроизведения может быть быстрым (например, в порядке от 100 мс до 10 с), тем самым обеспечивая краткосрочную адаптацию режима воспроизведения к характеристикам сигналов. Подход может, в частности, предоставлять улучшенное пространственное восприятие для слушателя. 2 н. и 12 з.п. ф-лы, 3 ил.
Наверх