Применение многоканальной декорреляции для усовершенствованного многоканального повышающего микширования

Авторы патента:


Применение многоканальной декорреляции для усовершенствованного многоканального повышающего микширования
Применение многоканальной декорреляции для усовершенствованного многоканального повышающего микширования
Применение многоканальной декорреляции для усовершенствованного многоканального повышающего микширования
Применение многоканальной декорреляции для усовершенствованного многоканального повышающего микширования
Применение многоканальной декорреляции для усовершенствованного многоканального повышающего микширования
Применение многоканальной декорреляции для усовершенствованного многоканального повышающего микширования
Применение многоканальной декорреляции для усовершенствованного многоканального повышающего микширования
Применение многоканальной декорреляции для усовершенствованного многоканального повышающего микширования
Применение многоканальной декорреляции для усовершенствованного многоканального повышающего микширования
Применение многоканальной декорреляции для усовершенствованного многоканального повышающего микширования
Применение многоканальной декорреляции для усовершенствованного многоканального повышающего микширования
Применение многоканальной декорреляции для усовершенствованного многоканального повышающего микширования
Применение многоканальной декорреляции для усовершенствованного многоканального повышающего микширования
Применение многоканальной декорреляции для усовершенствованного многоканального повышающего микширования
Применение многоканальной декорреляции для усовершенствованного многоканального повышающего микширования

 


Владельцы патента RU 2519045:

ДОЛБИ ЛАБОРАТОРИС ЛАЙСЭНЗИН КОРПОРЕЙШН (US)

Изобретение относится к средствам многоканального повышающего микширования с применением многоканальной декорреляции. Технический результат заключается в повышении качества кодирования сигнала при уменьшении ресурсоемкости. Система линейных уравнений применяется для повышающего микширования количества N звуковых сигналов с целью генерирования большего количества М звуковых сигналов, которые являются психоакустически декоррелированными относительно друг друга, и может применяться для улучшения представления рассеянного звукового поля. Линейные уравнения определяются матрицей, которая устанавливает множество векторов в М-мерном пространстве, существенно ортогональных друг к другу. Раскрыты способы получения системы линейных уравнений. 4 н. и 6 з.п. ф-лы, 6 ил.

 

Перекрестная ссылка на родственные заявки

Данная заявка заявляет приоритет предварительной заявки на патент США №61/297699, поданной 22 января 2010 г., которая ссылкой полностью включается в настоящее описание.

Область техники изобретения

Настоящее изобретение, в общем, имеет отношение к обработке сигналов для звуковых сигналов и, в частности, имеет отношение к способам обработки сигналов, которые могут применяться для генерирования звуковых сигналов, представляющих рассеянное звуковое поле. Указанные способы обработки сигналов могут применяться в аудиоприложениях, таких как повышающее микширование, в котором получается некоторое количество сигналов выходных каналов из меньшего количества сигналов входных каналов.

Предпосылки изобретения

Настоящее изобретение может применяться для улучшения качества звуковых сигналов, получаемых при повышающем микшировании; однако настоящее изобретение может полезно применяться для, в значительной мере, любого приложения, которое требует одного или большего количества звуковых сигналов, представляющих рассеянное звуковое поле. Более конкретно, в нижеследующем описании упоминаются приложения, связанные с повышающим микшированием.

Процесс, известный как повышающее микширование, получает количество М каналов звукового сигнала из меньшего количества N каналов звукового сигнала. Например, звуковые сигналы для пяти каналов, обозначаемых как левый (L), правый (R), центральный (С), левый окружающий (LS) и правый окружающий (RS), могут быть получены путем повышающего микширования звуковых сигналов для двух входных каналов, обозначаемых здесь как левый входной (Li) и правый входной (Ri). Одним из примеров устройства повышающего микширования является декодер Dolby® Pro Logic® II, который описан в Gundry, "A New Active Matrix Decoder for Surround Sound," 19th AES Conference, May 2001. Повышающий микшер, который использует данную конкретную технологию, анализирует фазу и амплитуду двух каналов входного сигнала, определяя то, каким образом звуковое поле, которое они представляют, предназначено для передачи слушателю впечатлений о направленности. В зависимости от желаемого художественного эффекта входных звуковых сигналов повышающий микшер должен быть способен генерировать выходные сигналы пяти каналов для того, чтобы создать у слушателя ощущение одного или нескольких слуховых составляющих, имеющих выраженные направления в пределах, охватываемых рассеянным звуковым полем, не имеющим выраженного направления. Настоящее изобретение направлено на генерирование выходных звуковых сигналов для одного или нескольких каналов, которые могут, через один или несколько акустических преобразователей, создавать высококачественное рассеянное звуковое поле.

Звуковые сигналы, которые предназначены для представления рассеянного звукового поля, должны создавать у слушателя впечатление, что звук испускается из многих, если не всех, направлений вокруг слушателя. Данный эффект противоположен хорошо известному явлению создания кажущегося источника звука, или выраженного направления звука, между двумя громкоговорителями путем воспроизведения одного и того же звукового сигнала через каждый из этих громкоговорителей. Высококачественное рассеянное звуковое поле, как правило, не может создаваться путем воспроизведения одного и того же звукового сигнала через ряд громкоговорителей, расположенных вокруг слушателя. Результирующее звуковое поле имеет в различных положениях прослушивания широко варьирующуюся амплитуду, которая часто изменяется на большую величину при очень небольших изменениях в положении. Нередко определенные положения в пределах области прослушивания кажутся лишенными звука для одного уха, но не для второго. Результирующее звуковое поле кажется искусственным.

Раскрытие изобретения

Целью настоящего изобретения является создание способа обработки звуковых сигналов для получения двух или большего количества каналов звуковых сигналов, которые могут применяться для создания высококачественного рассеянного звукового поля через акустические преобразователи, такие как громкоговорители.

Согласно одной из особенностей настоящего изобретения, для представления рассеянного звукового поля, М выходных сигналов получается из N входных звуковых сигналов, где М больше N и больше двух. Это осуществляется путем получения К промежуточных звуковых сигналов из N входных звуковых сигналов так, чтобы каждый промежуточный сигнал был психоакустически декоррелирован с N входных звуковых сигналов и, если К больше единицы, был психоакустически декоррелирован со всеми остальными промежуточными сигналами. N входных звуковых сигналов и К промежуточных сигналов микшируются для получения М выходных звуковых сигналов в соответствии с системой линейных уравнений с коэффициентами матрицы, которая определяет множество из N+К векторов в М-мерном пространстве. По меньшей мере, К из N+K векторов существенно ортогональны всем остальным векторам в множестве. Величина К больше или равна единице и меньше или равна M-N.

Согласно другой особенности настоящего изобретения, матрица коэффициентов системы линейных уравнений получается для использования при микшировании N входных звуковых сигналов с целью получения М выходных звуковых сигналов для представления рассеянного звукового поля. Это осуществляется путем получения первой матрицы, содержащей коэффициенты, которые определяют множество из N первых векторов в М-мерном пространстве;

получения множества из К вторых векторов в М-мерном пространстве, где каждый второй вектор существенно ортогонален каждому первому вектору и, если К больше единицы, всем остальным вторым векторам; получения второй матрицы, содержащей коэффициенты, которые определяют множество из К вторых векторов;

конкатенация первой матрицы и второй матрицы для получения промежуточной матрицы, содержащей коэффициенты, которые определяют объединение множества из N первых векторов и множества из К вторых векторов; и, предпочтительно, масштабирование коэффициентов промежуточной матрицы для получения матрицы обработки сигнала, имеющей норму Фробениуса, находящуюся в пределах 10% нормы Фробениуса для первой матрицы, где коэффициенты матрицы обработки сигнала представляют собой коэффициенты системы линейных уравнений.

Различные характерные признаки настоящего изобретения и предпочтительные варианты его осуществления могут быть лучше поняты путем отсылки к нижеследующему обсуждению и сопроводительным графическим материалам, в которых сходные ссылочные позиции на некоторых фигурах относятся к сходным элементам. Содержимое нижеследующего обсуждения и графических материалов излагается лишь в качестве примеров, и его не следует понимать как представляющее ограничения объема настоящего изобретения.

Краткое описание графических материалов

Фиг.1 - принципиальная блок-схема устройства обработки звуковых сигналов, которое может включать особенности настоящего изобретения.

Фиг.2 - схематическая иллюстрация базисной матрицы повышающего микширования.

Фиг.3 - схематическая иллюстрация базисной матрицы повышающего микширования, конкатенированной с пополняющей матрицей повышающего микширования.

Фиг.4 - схематическая иллюстрация декоррелятора сигналов, использующего элементы задержки.

Фиг.5 - схематическая иллюстрация декоррелятора сигналов, использующего фильтр поддиапазона с зависящим от частоты бимодальным изменением по фазе и фильтр поддиапазона с зависящей от частоты задержкой.

Фиг.6 - принципиальная блок-схема устройства, которое может применяться для реализации различных особенностей настоящего изобретения.

Варианты осуществления изобретения

А. Введение

Фиг.1 представляет принципиальную блок-схему устройства 10, которое может включать особенности настоящего изобретения. Устройство 10 принимает звуковые сигналы для одного или нескольких входных каналов из тракта 19 сигнала и генерирует по тракту 59 сигнала звуковые сигналы для ряда выходных каналов. Малая линия, которая пересекает тракт 19 сигнала, а также малые линии, которые пересекают другие тракты сигнала, указывают на то, что эти тракты сигнала переносят сигналы для одного или нескольких каналов. Символы N и М непосредственно под малыми пересекающими линиями указывают на то, что различные тракты сигнала переносят сигналы для каналов N и М соответственно. Символы x и y непосредственно под некоторыми из пересекающих линий указывают, на то, что соответствующие тракты сигнала переносят неопределенное количество сигналов, что неважно для цели понимания настоящего изобретения.

В устройстве 10 анализатор 20 входного сигнала принимает звуковые сигналы для одного или нескольких входных каналов из тракта 19 сигнала и анализирует их с целью определения того, какие части входных сигналов представляют рассеянное звуковое поле и какие части представляют звуковое поле, которое не является рассеянным. Рассеянное звуковое поле создает у слушателя впечатление, что звук испускается из множества, если не из всех, направлений вокруг слушателя. Нерассеянное звуковое поле создает впечатление, что звук испускается из конкретного направления или из относительно узкого диапазона направлений. Отличие между рассеянным и нерассеянным звуковыми полями является субъективным и не всегда может быть точно определенным. Несмотря на то, что это может оказывать влияние на практические реализации, которые используют особенности настоящего изобретения, это не влияет на принципы, лежащие в основе настоящего изобретения.

Части входных звуковых сигналов, которые считаются представляющими нерассеянное звуковое поле, проходят по тракту 28 сигнала в процессор 30 нерассеянных сигналов, который генерирует по тракту 29 сигнала множество из М сигналов, которые предназначены для воспроизведения нерассеянного звукового поля через ряд акустических преобразователей, таких как громкоговорители. Одним из примеров устройства повышающего микширования, которое выполняет этот тип обработки, является упомянутый выше декодер Dolby Pro Logic II.

Части входных звуковых сигналов, которые считаются представляющими рассеянное звуковое поле, проходят по тракту 29 сигнала в процессор 40 рассеянных сигналов, который генерирует по тракту 49 сигнала множество из М сигналов, которые предназначены для воспроизведения рассеянного звукового поля через ряд акустических преобразователей, таких как громкоговорители. Настоящее изобретение направлено на обработку, которая выполняется в процессоре 40 рассеянных сигналов.

Суммирующий компонент 50 объединяет каждый из М сигналов из процессора 30 нерассеянных сигналов с соответствующим одним из М сигналов из процессора 40 рассеянных сигналов, генерируя звуковой сигнал для соответствующего одного из М выходных каналов. Звуковой сигнал каждого из выходных каналов предназначен для приведения в действие акустического преобразователя, такого как громкоговоритель.

Настоящее изобретение направлено на разработку и применение системы линейных уравнений микширования с целью генерирования множества звуковых сигналов, которые могут представлять рассеянное звуковое поле. Эти уравнения микширования могут применяться, например, в процессоре 40 рассеянных сигналов. В оставшейся части данного раскрытия принимается, что число N больше или равно единице, число М больше или равно трем и число М больше числа N.

Устройство 10 представляет только один из примеров того, как может применяться настоящее изобретение. Настоящее изобретение может включаться и в другие устройства, которые отличаются по функциям или по конструкции от устройства, проиллюстрированного на фиг.1. Например, сигналы, представляющие и рассеянные, и нерассеянные части звукового поля, могут обрабатываться единственным компонентом. Ниже описано несколько реализаций отдельного процессора 40 рассеянных сигналов, который микширует сигналы в соответствии с системой линейных уравнений, определяемой матрицей. Различные части процессов и для процессора 40 рассеянных сигналов, и для процессора 30 нерассеянных сигналов могут реализовываться системой линейных уравнений, которая определяется единственной матрицей. Кроме того, особенности настоящего изобретения могут включаться в устройство без включения также и анализатора 20 входного сигнала, процессора 30 нерассеянных сигналов или суммирующего компонента 50.

В. Первый способ получения

Процессор 40 рассеянных сигналов генерирует по тракту 49 сигнала множество из М сигналов путем микширования N каналов звуковых сигналов, принимаемых из тракта 29, в соответствии с системой линейных уравнений. Для облегчения описания в нижеследующем обсуждении части N каналов звукового сигнала, принимаемые из тракта 29, именуются промежуточными входными сигналами, и М каналов промежуточных сигналов, генерируемых по тракту 49, именуются промежуточными выходными сигналами. Данная операция микширования включает применение системы линейных уравнений, которая может быть представлена матричным умножением, как показано в выражении 1:

Y = [ Y 1 Y M ] = [ C 1.1 C 1. N + K C M .1 C M , N + K ] [ X 1 X N + K ] = C X д л я 1 K ( M N ) ( 1 )

где X =вектор-столбец, представляющий N+K сигналов, полученных из N промежуточных входных сигналов;

С=матрица, или массив, размера М×(N+K) коэффициентов микширования;

и Y =вектор-столбец, представляющий М промежуточных выходных сигналов.

Операция микширования может выполняться на сигналах, представленных во временной области или в частотной области. В частности, в нижеследующем описании упоминаются реализации во временной области.

При желании эта же система линейных уравнений микширования может быть выражена путем транспонирования векторов и матрицы следующим образом:

Y T = X T C T ( 2 )

где X T =вектор-строка, представляющий N+K сигналов, полученных из N промежуточных входных сигналов;

СT=транспонированная матрица С размера (N+K)×M; и

Y T =вектор-строка, представляющий М промежуточных выходных сигналов.

В нижеследующем описании используются обозначения и терминология, такие как строки и столбцы, которые согласуются с выражением 1; однако принципы настоящего изобретения могут быть получены и применены с использованием других форм или выражений, таких как выражение 2 или система линейных уравнений в явном виде.

Как показано в выражении 1, К больше или равно единице и меньше или равно разности (M-N). Как следствие, количество сигналов Xi и количество столбцов в матрице С находится между N+1 и М.

Коэффициенты матрицы С могут быть получены из множества N+K единичных векторов в М-мерном пространстве, которые «существенно ортогональны» друг другу. Два вектора считаются существенно ортогональными друг другу, если их скалярное произведение меньше 35% произведения их модулей. Это соответствует углу между векторами от приблизительно семидесяти градусов до приблизительно 110 градусов. Каждый столбец матрицы С может содержать М коэффициентов, которые соответствуют элементам одного из векторов в множестве. Например, коэффициенты, которые находятся в первом столбце матрицы С, соответствуют одному из векторов V в множестве, элементы которого обозначаются как (V1,…, VM), и, таким образом, C1,1=p·V1,…, CM,1=p·VM, где р - коэффициент масштабирования, используемый, когда это может потребоваться, для масштабирования коэффициентов матрицы. В альтернативном варианте коэффициенты в каждом столбце j матрицы С могут масштабироваться с различными коэффициентами масштабирования pj. Во многих приложениях коэффициенты масштабируются так, чтобы норма Фробениуса матрицы была равна или находилась в пределах 10% N . Дополнительные особенности масштабирования обсуждаются ниже.

Множество из N+K векторов может быть получено любым возможным желаемым способом. Один из способов создает матрицу G размера М×М из коэффициентов с псевдослучайными значениями, имеющими гауссово распределение, и вычисляет разложение по сингулярным числам этой матрицы для получения трех матриц размера М×М, обозначаемых здесь как U, S и V. Обе матрицы U и V являются единичными матрицами. Матрица С может быть получена путем выбора N+K столбцов или из матрицы U, или из матрицы V и масштабирования коэффициентов в этих столбцах для получения нормы Фробениуса, равной или находящейся в пределах 10% N . Ниже описан предпочтительный способ, который ослабляет некоторые требования к ортогональности.

N+K входных сигналов получаются путем декорреляции N промежуточных входных сигналов относительно друг друга. Требуемый тип декорреляции именуется здесь «психоакустической декорреляцией». Психоакустическая декорреляция является менее строгой, чем численная декорреляция, в том смысле, что два сигнала могут считаться психоакустически декоррелированными даже тогда, когда они в некоторой степени обладают численной корреляцией друг с другом.

Численная корреляция двух сигналов может быть вычислена с использованием множества известных численных алгоритмов. Эти алгоритмы вырабатывают критерий численной корреляции, называемый коэффициентом корреляции, который варьируется от минус единицы до плюс единицы. Коэффициент корреляции, модуль которого равен или близок к единице, указывает на то, что два сигнала тесно связаны. Коэффициент корреляции с модулем, равным или близким к нулю, указывает на то, что два сигнала в целом независимы друг от друга.

Психоакустическая корреляция относится к корреляционным свойствам звуковых сигналов, которые существуют в пределах частотных полос, имеющих так называемую критическую ширину полосы частот. Разрешающая способность по частоте слуховой системы человека изменяется с частотой по всему звуковому спектру. Человеческое ухо может различать спектральные составляющие, более близкие друг к другу по частоте, при менее высоких частотах ниже приблизительно 500 Гц, но не настолько близкие друг к другу по мере увеличения частоты до пределов слышимости. Ширина указанного разрешения по частоте именуется критической шириной полосы частот, и, как только что разъяснялось, она изменяется с частотой.

Два сигнала называются психоакустически декоррелированными один относительно другого, если средний коэффициент численной корреляции в пределах психоакустической критической ширины полосы частот равен или близок к нулю. Психоакустическая декорреляция достигается тогда, когда коэффициент численной корреляции между двумя сигналами равен или близок к нулю при всех частотах. Также психоакустическая декорреляция может достигаться даже тогда, когда коэффициент численной корреляции между двумя сигналами не равен или не близок к нулю при всех частотах, если численная корреляция варьируется так, чтобы ее среднее в пределах каждой психоакустической критической полосы частот было меньше половины максимального коэффициента корреляции для любой частоты в пределах этой критической полосы.

Психоакустическая декорреляция может достигаться с использованием задержек или специальных типов фильтров, которые описываются ниже. Во многих реализациях для достижения психоакустической декорреляции N из N+K сигналов Xi могут браться напрямую из N промежуточных входных сигналов без использования каких-либо задержек или фильтров, поскольку эти N сигналов представляют рассеянное звуковое поле и с большой вероятностью уже являются психоакустически декоррелированными.

С. Усовершенствованный способ получения

Если сигналы, которые генерируются процессором 40 рассеянных сигналов, комбинируются с другими сигналами, представляющими нерассеянное звуковое поле, как, например, показано на фиг.1, результирующая комбинация сигналов может генерировать нежелательные артефакты тогда, когда матрица С конструируется с использованием описанного выше способа. Указанные артефакты могут возникать в результате того, что конструкция матрицы С не учитывает возможные взаимодействия между рассеянными и нерассеянными частями звукового поля. Как упоминалось выше, отличие между рассеянным и нерассеянным не всегда является точно определенным, и анализатор 20 входного сигнала может генерировать по тракту 28 сигналы, которые в некоторой степени представляют рассеянное звуковое поле, и может генерировать по тракту 29 сигналы, которые в некоторой степени представляют нерассеянное звуковое поле. Если генератор 40 рассеянных сигналов нарушает или модифицирует нерассеянный характер звукового поля, представляемого сигналами в тракте 29, в звуковом поле, полученном из входных сигналов, которые генерируются по тракту 59, могут возникать нежелательные артефакты или слышимые искажения. Например, если сумма М рассеянных обработанных сигналов в тракте 49 и М нерассеянных обработанных сигналов в тракте 39 приводит к сокращению некоторых нерассеянных составляющих сигнала, то может ухудшаться субъективное впечатление, которое иначе достигалось бы путем применения настоящего изобретения.

Улучшения можно добиться, конструируя матрицу С так, чтобы она учитывала нерассеянную сущность звукового поля, которое обрабатывается процессором 30 нерассеянных сигналов. Это можно осуществить, вначале идентифицируя матрицу Е, которая или представляет, или предполагаемо представляет кодирование, которое обрабатывает М каналов звуковых сигналов, создавая N каналов входных звуковых сигналов, принимаемых из тракта 19, а затем получает матрицу, обратную этой матрице так, как это описывается ниже.

Одним из примеров матрицы Е является матрица размера 5×2, которая применяется для понижающего микширования пяти каналов, L, С, R, LS, RS, в два канала, обозначаемые как левый общий (LT) и правый общий (RT). Сигналы для каналов LT и RT представляют один из примеров входных звуковых сигналов для двух (N=2) каналов, которые принимаются из тракта 19. В этом примере устройство 10 может применяться для синтеза пяти (М=5) каналов выходных звуковых сигналов, которые могут создавать звуковое поле, сходное по восприятию, но не идентичное звуковому полю, которое могло бы создаваться из оригинальных пяти звуковых сигналов.

Один из примеров матрицы Е размера 5×2, которая может применяться для кодирования сигналов каналов LT и RT из сигналов каналов L, С, R, LS и RS, показан в следующем выражении:

E = [ 1 2 2 0 3 2 1 2 0 2 2 1 1 2 3 2 ] ( 3 )

Обычно из матрицы E размера N×М с использованием известных численных методов, включая такие реализованные в числовом программном обеспечении методы, как функция «pinv» в Matlab®, поставляемом MathWorks™, Натик, Массачусетс, или функция «Pseudolnverse» в Mathematica®, поставляемом Wolfram Research, Шампэйн, Иллинойс, можно получить псевдообратную матрицу В. Матрица В может не являться оптимальной, если ее коэффициенты создают нежелательные перекрестные помехи между какими-либо из каналов или если какие-либо коэффициенты представляют собой мнимые или комплексные числа. Матрица В может модифицироваться для удаления указанных нежелательных характеристик. Также она может модифицироваться для достижения любого желаемого художественного эффекта путем изменения коэффициентов с целью подчеркивания сигналов для выбранных громкоговорителей. Например, коэффициенты могут изменяться с целью увеличения энергии в сигналах, предназначенных для воспроизведения через громкоговорители для левого и правого каналов, и для снижения энергии в сигналах, предназначенных для воспроизведения через громкоговорители для центрального канала. Коэффициенты матрицы Е масштабируются так, чтобы каждый столбец матрицы представлял единичный вектор в М-мерном пространстве. В том, чтобы векторы, представленные столбцами матрицы В, были ортогональными друг другу, нет необходимости.

Один из примеров матрицы В размера 5×2 показан в следующем выражении:

B = [ 0.65 0 0.40 0.40 0 0.65 0.60 0.24 0.24 0.60 ] ( 4 )

Эта матрица может применяться для генерирования множества из М промежуточных выходных сигналов из N промежуточных входных сигналов при помощи следующей операции:

Y = B X ( 5 )

Данная операция схематически проиллюстрирована на фиг.2. Микшер 41 принимает N промежуточных входных сигналов из трактов 29-1 и 29-2 сигнала и микширует эти сигналы в соответствии с системой линейных уравнений, генерируя множество из М промежуточных выходных сигналов по трактам 49-1-49-5 сигнала. Блоки в микшере 41 представляют умножение, или усиление, сигнала посредством коэффициентов матрицы В в соответствии с системой линейных уравнений.

Несмотря на то, что матрица В может применяться сама по себе, эффективность улучшается путем применения дополнительной пополняющей матрицы А размера М×K, где 1≤K≤(M-N). Каждый столбец в матрице А представляет собой единичный вектор в М-мерном пространстве, который существенно ортогонален векторам, представленным N столбцами матрицы В. Если К больше единицы, каждый столбец представляет вектор, который также существенно ортогонален векторам, представленным всеми остальными столбцами матрицы A.

Векторы для столбцов матрицы А могут получаться практически любым желаемым способом. Могут применяться упомянутые выше способы. Ниже описывается предпочтительный способ.

Коэффициенты в пополняющей матрице A и в матрице B могут масштабироваться, как разъясняется ниже, и конкатенироваться, давая матрицу С. Масштабирование и конкатенация может алгебраически выражаться как:

C = [ β B | α A ] ( 6 )

где |=горизонтальная конкатенация столбцов матрицы В и матрицы А;

α=коэффициент масштабирования для коэффициентов матрицы А; и

β=коэффициент масштабирования для коэффициентов матрицы В.

Для многих приложений коэффициенты масштабирования α и β выбираются так, чтобы норма Фробениуса составной матрицы С была равна или находилась в пределах 10% нормы Фробениуса матрицы В. Норма Фробениуса матрицы С может быть выражена как:

C F = i j | c i j | 2

где ci,j=коэффициент матрицы в строке i и столбце j.

Если каждый из N столбцов матрицы В и каждый из К столбцов матрицы А представляет единичный вектор, то норма Фробениуса матрицы В равна N и норма Фробениуса матрицы А равна N . В этом случае можно показать, что если задать норму Фробениуса матрицы С равной N , то значения коэффициентов масштабирования α и β соотносятся друг с другом так, как показано в следующем выражении:

α = N ( 1 β 2 ) K ( 7 )

После задания значения коэффициента масштабирования β значение коэффициента масштабирования α можно вычислить по выражению 7. Предпочтительно, коэффициент масштабирования β выбирается так, чтобы сигналы, микшируемые посредством коэффициентов в столбцах матрицы В, давались с весом на, по меньшей мере, 5 дБ больше, чем сигналы, микшируемые посредством коэффициентов в столбцах пополняющей матрицы А. Разность весов в, по меньшей мере, 6 дБ может достигаться путем ограничения коэффициентов масштабирования так, чтобы α<1/2 β. Для достижения желаемого акустического баланса между звуковыми каналами могут применяться большие или меньшие разности весов масштабирования для столбцов матрицы В и матрицы А.

В альтернативном варианте коэффициенты в каждом столбце пополняющей матрицы А могут масштабироваться по отдельности, как показано в следующем выражении:

C = [ β B | α 1 A 1 α 2 A 2 α K A K ] ( 8 )

где Aj=столбец у пополняющей матрицы А; и

αj=соответствующий коэффициент масштабирования для столбца j.

В данном альтернативном варианте для каждого коэффициента масштабирования αj можно выбрать произвольные значения при условии, что каждый коэффициент масштабирования удовлетворяет ограничению αj<1/2 β. Предпочтительно, значения коэффициентов αj и β выбираются так, чтобы обеспечить норму Фробениуса С, приблизительно равную норме Фробениуса матрицы В.

Каждый из сигналов, которые микшируются в соответствии с пополняющей матрицей A, обрабатывается так, чтобы они были психоакустически декоррелированы относительно N промежуточных входных сигналов и всех остальных сигналов, которые микшируются в соответствии с пополняющей матрицей А. Это иллюстрируется на фиг.3, которая показывает пример двух (N=2) промежуточных входных сигналов, пяти (М=5) промежуточных выходных сигналов и трех (K=3) декоррелированных сигналов, микшируемых в соответствии с пополняющей матрицей А. В данном примере два промежуточных входных сигнала микшируются в соответствии с базисной обратной матрицей В, представленной блоком 41, и декоррелируются декоррелятором 43, образуя три декоррелированных сигнала, которые микшируются в соответствии с пополняющей матрицей A, представленной блоком 42.

Декоррелятор 43 может реализовываться различными способами. Одна из реализаций, показанная на фиг.4, достигает психоакустической декорреляции путем задержки ее входных сигналов на различные величины. Для различных применений пригодны задержки в диапазоне от одной до двадцати миллисекунд.

Часть другой реализации декоррелятора 43 показана на фиг.5. Эта часть обрабатывает один из промежуточных входных сигналов. Промежуточный входной сигнал проходит по различным трактам обработки сигнала, которые применяют фильтры к соответствующим им сигналам в двух перекрывающихся частотных поддиапазонах. Низкочастотный тракт включает фильтр 61 переворота фазы, который фильтрует его входной сигнал в первом частотном поддиапазоне в соответствии с первой импульсной характеристикой, и фильтр 62 нижних частот, который определяет первый частотный поддиапазон. Более высокочастотный тракт включает зависящую от частоты задержку 63, реализуемую фильтром, который фильтрует его входной сигнал во втором частотном поддиапазоне в соответствии со второй импульсной характеристикой, которая не равна первой импульсной характеристике, фильтр 64 верхних частот, который определяет второй частотный поддиапазон, и элемент 65 задержки. Выходные сигналы задержки 65 и фильтра 62 нижних частот объединяются в суммирующем узле 66. Выходной сигнал суммирующего узла 66 представляет собой сигнал, который является психоакустически декоррелированным относительно промежуточного входного сигнала.

Фазовая характеристика фильтра 61 переворота фазы является зависящей от частоты и имеет бимодальное распределение по частоте с пиками, в значительной степени равными плюс и минус девяносто градусов. Идеальная реализация фильтра 61 переворота фазы имеет единичную амплитудную характеристику и фазовую характеристику, которая чередуется, или переворачивается, между плюс девяносто градусов и минус девяносто градусов на краях двух или нескольких частотных полос в пределах полосы пропускания фильтра. Переворот фазы может реализовываться посредством разреженного преобразования Гильберта, которое имеет импульсную характеристику, показанную в следующем выражении:

H S ( k ) = { 2 / k ' π { o d d k ' = k / S } 0 { o t h e r w i s e } ( 9 )

Импульсная характеристика разреженного преобразования Гильберта может усекаться до длины, выбираемой с целью оптимизации рабочих характеристик декоррелятора, путем балансировки компромисса между переходными характеристиками и гладкостью частотной характеристики.

Количество переворотов фазы управляется значением параметра S. Этот параметр должен выбираться так, чтобы он балансировал компромисс между степенью декорреляции и длиной импульсной характеристики. Более длинная импульсная характеристика требуется тогда, когда значение S увеличивается. Если значение параметра S слишком мало, фильтр обеспечивает недостаточную декорреляцию. Если параметр S слишком велик, фильтр будет размывать кратковременные звуки по интервалу времени, достаточно длительному для того, чтобы создать нежелательные артефакты в декоррелированном сигнале.

Способность уравновешивать эти характеристики может быть улучшена путем реализации фильтра 21 переворота фазы, имеющего неоднородный интервал частот между смежными переворотами фазы, с более узким разносом при менее высоких частотах, и более широким разносом - при более высоких частотах. Предпочтительно, интервал между смежными переворотами фазы представляет собой логарифмическую функцию частоты.

Зависящая от частоты задержка 63 может реализовываться фильтром, который имеет импульсную характеристику, равную конечной синусоидальной последовательности h[n], мгновенная частота которой монотонно уменьшается от π до нуля по всей длине последовательности. Данная последовательность может быть выражена как:

h [ n ] = G | ω ' ( n ) | cos ( φ ( n ) ) , д л я 0 n L ( 10 )

где ω(n)=мгновенная частота;

ω'(n)=первая производная мгновенной частоты;

G=нормировочный множитель;

φ ( n ) = 0 n ω ( t ) d t =мгновенная фаза; и

L=длина фильтра задержки. Нормировочному множителю G присваивается такое значение:

n = 0 L 1 h 2 [ n ] = 1 ( 11 )

Фильтр с такой импульсной характеристикой иногда, когда он применяется к звуковым сигналам с переходными состояниями, может генерировать артефакты «линейной частотной модуляции». Данный эффект может быть подавлен путем добавления шумоподобного члена к члену мгновенной фазы, как показано в следующем выражении:

h [ n ] = G | ω ' ( n ) | cos ( φ ( n ) + N ( n ) ) , д л я 0 n < L ( 12 )

Если шумоподобный член представляет собой последовательность белого гауссова шума с дисперсией, которая представляет собой малую долю π, артефакты, которые генерируются переходными состояниями фильтрации, будут звучать больше как шум, чем как импульсы с линейной частотной модуляцией, а требуемая взаимосвязь между задержкой и частотой будет по-прежнему достигаться.

Частоты среза фильтра 62 нижних частот и фильтра 64 верхних частот должны выбираться так, чтобы они составляли приблизительно 2,5 кГц так, чтобы отсутствовала щель между полосами пропускания обоих фильтров и чтобы спектральная энергия их комбинированных выходных сигналов в области поблизости от частоты перехода, где полосы пропускания перекрываются, была, в значительной мере, равна спектральной энергии промежуточного входного сигнала в данной области. Величина задержки, налагаемой задержкой 65, должна задаваться так, чтобы задержки распространения высокочастотного и низкочастотного трактов обработки сигнала на частоте перехода были приблизительно равны.

Декоррелятор может реализовываться различными способами. Например, фильтр 62 нижних частот и фильтр 64 верхних частот вместе или по отдельности могут, соответственно, предшествовать фильтру 61 переворота фазы и зависящей от частоты задержке 63. Задержка 65 может реализовываться одним или несколькими элементами задержки, по желанию размещенными в трактах обработки сигнала.

Дополнительные подробности реализации могут быть получены из международной патентной заявки № PCT/US 2009/058590, озаглавленной "Decorrelator for Upmixing Systems", McGrath и др., поданной 28 сентября 2009 г.

D. Предпочтительный способ получения

Предпочтительный способ получения пополняющей матрицы А начинается с создания «исходной матрицы» Р. Исходная матрица Р содержит начальные приближения для коэффициентов пополняющей матрицы А. Из исходной матрицы Р выбираются столбцы, образующие промежуточную матрицу Q. Промежуточная матрица Q используется для формирования второй промежуточной матрицы R. Для получения пополняющей матрицы А столбцы коэффициентов извлекаются из промежуточной матрицы R. Способ, который может применяться для создания исходной матрицы Р, описывается ниже после описания процедуры формирования промежуточной матрицы Q, промежуточной матрицы R и пополняющей матрицы A.

1. Получение пополняющей матрицы А

Базисная обратная матрица В, описанная выше, содержит М строк и N столбцов, где 1≤K≤(M-N). Матрица В и исходная матрица Р горизонтально конкатенируются, образуя промежуточную матрицу Q, которая содержит М строк и N+K столбцов. Данную конкатенацию можно выразить как:

Q = [ B | P ] ( 13 )

Коэффициенты в каждом столбце j промежуточной матрицы Q масштабируются так, чтобы они представляли собой единичные векторы Q(j) в М-мерном пространстве. Это можно осуществить путем деления коэффициентов в каждом столбце на модуль вектора, который они представляют. Модуль любого из векторов может быть вычислен из квадратного корня суммы квадратов коэффициентов в столбце.

Затем из промежуточной матрицы Q получается промежуточная матрица R, которая содержит коэффициенты, упорядоченные в М строк и N+K столбцов. Коэффициенты в каждом столбце j промежуточной матрицы R представляют вектор R(j) в М-мерном пространстве. Эти векторы-столбцы вычисляются в процессе, представленном следующим фрагментом псевдокода:

(1) R(1)-Q(1);

(2) for j=2 to К {

(3) T(j)=(1-RR(j-1) * TRANSP[RR(j-1)]) * Q(j);

(4) if MAG[T(j)]>0.001 {

(5) R(j)=T(j)/MAG[T(j)];

(6) } else {

(7) R(j)=ZERO;

(8) }

(9) }

(10) forj=1 to K {

(11) A(j)=R(j+N);

(12) }

Операторы в данном фрагменте псевдокода содержат синтаксические признаки, сходные с признаками языка программирования С. Данный фрагмент кода не предназначен для практической реализации, но предназначается только для того, чтобы помочь в разъяснении процесса, который способен вычислять пополняющую матрицу А.

Обозначения R(j), Q(j), T(j) и A(j) соответственно представляют столбец j промежуточной матрицы R, промежуточной матрицы Q, временной матрицы Т и пополняющей матрицы А.

Обозначение RR(j-1) представляет подматрицу матрицы R с М строк и j-1 столбцов. Данная подматрица включает столбцы от 1 до j-1 промежуточной матрицы R.

Обозначение TRANSP[RR(j-1)] представляет функцию, которая возвращает транспонированную матрицу матрицы RR(j-1). Обозначение MAG[T(j)] представляет функцию, возвращающую модуль вектора-столбца T(j), который представляет собой эвклидову норму коэффициентов в столбце j во временной матрице Т.

С отсылкой к фрагменту псевдокода, оператор (1) инициализирует первый столбец матрицы R из первого столбца матрицы Q. Операторы (2) - (9) реализуют цикл, который вычисляет столбцы 2-K матрицы R.

Оператор (3) вычисляет столбец временной матрицы Г из подматрицы RR и промежуточной матрицы Q. Как разъяснялось выше, подматрица RR (j-1) включает первые 7-1 столбцов промежуточной матрицы R. Оператор (4) определяет, превышает ли модуль вектора-столбца T(j) 0,001. Если превышает, то оператор (5) приравнивает вектор R(j) к вектору T(j) после того, как он масштабируется до единичного модуля. Если модуль вектора-столбца T(j) не превышает 0,001, то вектор R(j) приравнивается к вектору ZERO, все элементы которого равны нулю.

Операторы (10) -(12) реализуют цикл, который получает пополняющую матрицу А размера М×K из последних K столбцов промежуточной матрицы R, которые представляют собой столбцы от N+1 до N+K. Векторы-столбцы в пополняющей матрице А существенно ортогональны друг другу, а также всем векторам-столбцам базисной матрицы В.

Если оператор (4) определяет, что модуль какого-либо вектора-столбца T(j) не превышает 0,001, то это указывает на то, что вектор T(j) является недостаточно линейно независимым от векторов-столбцов Q(1) - Q(j-1), и соответствующий вектор-столбец R(j) приравнивается к вектору ZERO. Если какой-либо вектор-столбец R(j) при N<j≤N+K равен вектору ZERO, то соответствующий столбец P(j) исходной матрицы не является линейно независимым от ее предшествующих столбцов. Последняя ситуация исправляется путем получения для исходной матрицы Р нового столбца P(j) и повторного выполнения процесса для получения другой пополняющей матрицы А.

а) Выбор исходной матрицы Р

Исходная матрица Р размера М х К может быть создана различными способами. В нижеследующих параграфах описаны два способа.

Первый способ создает исходную матрицу путем генерирования массива размера М×K из коэффициентов, имеющих псевдослучайные значения.

Второй способ генерирует исходную матрицу с коэффициентами, которые учитывают симметрию в ожидаемом положении акустических преобразователей, которые будут применяться для воспроизведения звукового поля, представляемого промежуточными выходными сигналами. Это может осуществляться путем временной перестановки столбцов исходной матрицы в ходе ее создания.

Например, описанная выше пятиканальная матрица генерирует сигналы для каналов, перечисленных в порядке L, С, R, LS и RS. Ожидаемая симметрия в расположении громкоговорителей для данного набора каналов может быть легче использована путем перестановки каналов в порядке, соответствующем азимутальному положению соответствующих им акустических преобразователей. Одним из подходящих порядков является порядок LS, L, С, R и RS, который помещает центральный канал в середину набора.

Используя указанный порядок, можно сконструировать множество векторов-кандидатов, имеющих подходящую симметрию. Один из примеров показан в таблице 1, где каждый вектор показан в соответствующей строке таблицы. Транспонирование этих векторов будет использоваться для определения столбцов исходной матрицы Р.

Таблица 1
LS L C R RS
Четная функция FE1 0 0 1 0 0
Четная функция FE2 0 1 0 1 0
Четная функция FE3 1 0 0 0 1
Нечетная функция FO1 0 -1 0 1 0
Нечетная функция FO2 1 0 0 0 -1

Каждая строка в таблице имеет либо четную, либо нечетную симметрию относительно столбца для центрального канала. Из таблицы выбирается сумма К векторов, которая транспонируется и используется для формирования исходной матрицы Р'. Например, если К=3 и векторы выбраны для функций FE1, FE2 и FO1, то исходная матрица Р' имеет вид:

P ' = [ 0 0 0 0 1 1 1 0 0 0 1 1 0 0 0 ] ( 14 )

Порядок элементов векторов затем изменяется для его приведения к соответствию с порядком каналов в требуемой исходной матрице Р. Это приводит к следующей матрице:

P = [ 0 1 1 0 0 0 0 1 1 0 0 0 0 0 0 ] ( 15 )

Если данная исходная матрица Р применяется с базисной матрицей В, показанной в выражении 4, промежуточная матрица Q, полученная в описанном выше процессе, имеет вид:

Q = [ 0.65 0 0 1 1 0.40 0.40 1 0 0 0 0.65 0 1 1 0.60 0.24 0 0 0 0.24 0.60 0 0 0 ] ( 16 )

Вторая промежуточная матрица R, образованная из этой матрицы Q, имеет вид:

R = [ 0.6500 0 0.3747 0.3426 0.5592 0.4000 0.0839 0.7957 0 0 0 0.4549 0.3747 0.3426 0.5592 0.6000 0.1646 0.2075 0.6186 0.4327 0.2400 0.5740 0.2075 0.6186 0.4327 ] ( 17 )

Пополняющая матрица А, полученная из этой промежуточной матрицы R, имеет вид:

A = [ 0.3747 0.3426 0.5592 0.7957 0 0 0.3747 0.3426 0.5592 0.2075 0.6186 0.4327 0.2075 0.6186 0.4327 ] ( 18 )

Е. Реализация

Устройства, которые включают различные особенности настоящего изобретения, могут реализовываться различными способами, включая программное обеспечение для исполнения компьютером или другое устройство, которое включает более специализированные компоненты, такое как схема процессора (DSP) цифровой обработки сигналов, связанная с компонентами, которые сходны с таковыми, находящимися в универсальном компьютере. Фиг.6 представляет собой принципиальную блок-схему устройства 70, которое может применяться для реализации особенностей настоящего изобретения. Процессор 72 обеспечивает вычислительные ресурсы. RAM 73 представляет собой системную память с произвольным доступом (RAM), которая используется процессором 72 для обработки. ROM 74 представляет какую-либо форму устройства долгосрочного хранения, такую как постоянное запоминающее устройство (ROM), предназначенное для хранения в памяти программ, необходимых для работы устройства 70 и, возможно, для осуществления различных особенностей настоящего изобретения. Управление 75 вводом-выводом представляет схему интерфейса для приема и передачи сигналов посредством трактов 19, 59 связных сигналов. В приведенном варианте осуществления изобретения все основные компоненты системы соединены с шиной 71, которая может представлять более одной физической или логической шины; однако для реализации настоящего изобретения архитектура шины не требуется.

В варианты осуществления изобретения, реализуемые универсальной компьютерной системой, могут включаться дополнительные компоненты, предназначенные для сопряжения с такими устройствами, как клавиатура или мышь и дисплей, а также для управления устройством хранения данных, содержащим такой носитель данных, как магнитная лента или диск или оптический носитель. Носитель данных может использоваться для записи программ, состоящих из команд для операционных систем, утилит и приложений, и может включать программы, которые реализуют различные особенности настоящего изобретения.

Функции, необходимые для практического применения различных особенностей настоящего изобретения, могут выполняться компонентами, которые реализуются различными способами, включая дискретные логические компоненты, интегральные микросхемы, один или несколько ASIC и/или процессоры с программным управлением. Способ, которым реализуются данные компоненты, для настоящего изобретения не важен.

Программные реализации настоящего изобретения могут передаваться посредством множества таких машин нечитаемых носителей данных, как немодулированные или модулированные каналы связи по всему спектру, включая частоты от сверхзвуковых до ультрафиолетовых, или носителей данных, которые передают информацию с использованием по существу любой технологии записи информации, включая магнитную ленту, карту или диск, оптические карты или диск, и обнаруживаемые метки на носителях, включая бумагу.

1. Способ получения M выходных звуковых сигналов из N выходных звуковых сигналов для представления рассеянного звукового поля, где M больше N и больше двух и где способ включает этапы, на которых:
принимают N входных звуковых сигналов, причем N входных звуковых сигналов представляют рассеянное звуковое поле;
получают K промежуточных звуковых сигналов из N входных звуковых сигналов так, чтобы каждый промежуточный сигнал был психоакустически декоррелирован с N выходными звуковыми сигналами и, если K больше единицы, был психоакустически декоррелирован со всеми остальными промежуточными сигналами, где K больше или равно единице и меньше или равно M-N; и
осуществляют микширование N входных звуковых сигналов и K промежуточных сигналов для получения М выходных звуковых сигналов, где микширование выполняется в соответствии с системой линейных уравнений с коэффициентами матрицы, которая определяет множество из N+K векторов в M-мерном пространстве, и где, по меньшей мере, K из N+K векторов существенно ортогональны всем остальным векторам в множестве.

2. Способ по п.1, отличающийся тем, что получают каждый из K промежуточных сигналов путем задержки одного из N входных звуковых сигналов.

3. Способ по п.1, отличающийся тем, что получают соответствующий промежуточный сигнал по способу, который включает этапы, на которых:
фильтруют один из N входных звуковых сигналов в соответствии с первой импульсной характеристикой в первом частотном поддиапазоне для получения сигнала первого частотного поддиапазона с зависящим от частоты изменением по фазе, имеющего бимодальное распределение по частоте с пиками, в значительной степени равными плюс и минус девяносто градусов, и в соответствии со второй импульсной характеристикой во втором частотном поддиапазоне - для получения сигнала второго поддиапазона с зависящей от частоты задержкой, где:
вторая импульсная характеристика не равна первой импульсной характеристике,
второй частотный поддиапазон включает частоты, которые являются более высокими, чем частоты, заключенные в первом частотном поддиапазоне, и
первый частотный поддиапазон включает частоты, которые являются менее высокими, чем частоты, заключенные во втором частотном поддиапазоне; и
получают соответствующий промежуточный сигнал из комбинации сигнала первого поддиапазона и сигнала второго поддиапазона.

4. Способ по одному из пп.1-3, отличающийся тем, что N больше единицы.

5. Способ по п.4, отличающийся тем, что:
матрица включает первую подматрицу коэффициентов для N векторов с коэффициентами, которые масштабированы посредством первого коэффициента масштабирования β, и вторую подматрицу коэффициентов для К векторов, которые масштабированы посредством одного или нескольких коэффициентов масштабирования α;
N входных звуковых сигналов микшируют в соответствии с системой линейных уравнений с коэффициентами первой подматрицы, масштабированными посредством первого коэффициента масштабирования;
К промежуточных звуковых сигналов микшируют в соответствии с системой линейных уравнений с коэффициентами второй подматрицы, масштабированными посредством одного или нескольких коэффициентов масштабирования.

6. Способ по п.5, отличающийся тем, что:
вторую подматрицу коэффициентов для K векторов масштабируют посредством одного коэффициента масштабирования α; и
первый коэффициент масштабирования и второй коэффициент масштабирования выбирают так, чтобы норма Фробениуса матрицы находилась в пределах 10% нормы Фробениуса первой подматрицы, не масштабированной посредством первого коэффициента масштабирования β; и

7. Способ получения матрицы коэффициентов системы линейных уравнений для применения при микшировании N входных звуковых сигналов, представляющих рассеянное звуковое поле, с целью получения M выходных звуковых сигналов с целью представления рассеянного звукового поля, где способ включает этапы, на которых:
получают первую матрицу, содержащую коэффициенты, которые определяют множество из N первых векторов в M-мерном пространстве;
получают множество из K вторых векторов в M-мерном пространстве, где каждый второй вектор существенно ортогонален каждому первому вектору и, если К больше единицы, всем остальным вторым векторам;
получают вторую матрицу, содержащую коэффициенты, которые определяют множество из K вторых векторов; и
осуществляют конкатенацию первой матрицы со второй матрицей для получения промежуточной матрицы, содержащей коэффициенты, которые определяют объединение множества из N первых векторов и множества из K вторых векторов, где коэффициенты матрицы обработки сигнала представляют собой коэффициенты системы линейных уравнений.

8. Способ по п.7, отличающийся тем, что включает масштабирование коэффициентов промежуточной матрицы так, чтобы норма Фробениуса масштабированной промежуточной матрицы находилась в пределах 10% нормы Фробениуса первой матрицы.

9. Устройство обработки звуковых сигналов для получения двух или большего количества выходных звуковых сигналов, отличающееся тем, что содержит:
один или несколько терминалов ввода данных, предназначенных для приема входных сигналов;
память;
носитель данных, на котором записана одна или несколько программ, состоящих из команд для выполнения способа по одному из пп.1-8;
схему обработки, связанную с одним или несколькими терминалами ввода данных, памятью, носителем данных и одним или несколькими терминалами вывода данных, предназначенную для исполнения одной или нескольких программ, состоящих из команд; и
один или несколько терминалов вывода данных, предназначенных для передачи выходных сигналов.

10. Носитель данных, на котором записана программа, состоящая из команд, исполняемых устройством для выполнения способа по одному из пп.1-8.



 

Похожие патенты:

Изобретение относится к вычислительной технике. Технический результат заключается в повышении точности квантования в векторном квантовании.

Изобретение относится к вычислительной технике. Технический результат заключается в улучшении качества расширенного выходного аудиосигнала.

Аудиокодер (100) для кодирования отсчетов аудиосигнала включает в себя первый кодер с временным наложением (алиасингом) (110) для кодирования аудиоотсчетов в первой области кодирования по первому правилу кадрирования, с приложением стартового окна и стопового окна.

Изобретение относится к аудиосигналам и к устройствам или способам для их получения, передачи, преобразования и воспроизведения. Технический результат заключается в улучшении стереофонического воспроизведения монофонически отображаемого источника звука.

Шумозаполнитель для создания шумозаполненного спектрального представления звукового сигнала на основе входного спектрального представления звукового сигнала состоит из идентификатора спектральной области, созданного для идентификации спектральных областей входного спектрального представления, отделенных от ненулевых спектральных областей входного спектрального представления, по крайней мере, одной промежуточной спектральной областью для того, чтобы получить идентифицированные спектральные области; и устройства для вставки шума, созданно для того, чтобы выборочно вносить шум в идентифицированные спектральные области для получения шумозаполненного спектрального представления звукового сигнала.

Изобретение относится к форматам данных мультимедийных приложений, которые используют иерархические слои данных. Техническим результатом является обеспечение возможности обнаружения потери синхронизации между данными улучшающего слоя и данными основного слоя во время декодирования, в то время как количество синхронизирующей информации и контрольной информации в потоке данных улучшающего слоя удерживается низким.

Изобретение относится к вычислительной технике. Технический результат заключается в повышении эффективности иерархического кодирования/декодирования аудио.

Изобретение относится к средствам кодирования и декодирования аудиоданных и включения их в цифровой транспортный поток данных. Технический результат заключается в повышении качества звука за счет точного выравнивания каналов аудиоданных относительно друг друга по времени.

Изобретение относится к технологиям обработки цифровых сигналов, в частности к способам внедрения цифровой информации в аудиосигнал для целей телекоммуникаций. Способ встраивания цифровой информации в аудиосигнал, включающий выполнение следующих операций: разделяют цифровую информацию на высокоприоритетный и низкоприоритетный потоки, причем высокоприоритетные данные встраивают посредством частотно-селективной эхо-модуляции, а низкоприоритетные данные встраивают посредством шумоподобных сигналов или с использованием цифровой модуляции с многими несущими; разделяют исходный аудиосигнал на первую частотную часть и вторую частотную часть, причем первую частотную часть исходного аудиосигнала модулируют посредством частотно-селективной эхо-модуляции с различными величинами задержки и амплитуды эхо-сигнала, а вторую частотную часть исходного аудиосигнала подают на блок психоакустического анализа на основе психоакустической модели, учитывающей эффект частотного и/или временного маскирования, при этом с помощью блока психоакустического анализа формируют на каждом интервале анализа спектральную маску, отражающую порог слышимости искажений, и данную спектральную маску применяют к сигналу со многими несущими или к шумоподобному сигналу с последующим добавлением полученного сигнала в блоке психоакустического анализа ко второй частотной части исходного аудиосигнала; комбинируют две модулированные частотные части акустического сигнала.

Изобретение относится к области аудио обработки, особенно обработки пространственных свойств аудио. Сущность изобретения состоит в том, что устройство (100) для формирования выходного пространственного многоканального аудио сигнала на основе входного аудио сигнала и входного параметра.

Изобретение относится к средствам кодирования и декодирования аудио потока на основе преобразования входного звукового сигнала. Технический результат заключается в уменьшении объема закодированных данных. Получают аудио поток, содержащий информацию, описывающую диапазон частот аудио контента, и информацию, описывающую ошибку многополосной дискретизации. Определяют ошибку многополосной дискретизации для множества диапазонов частот входного звукового сигнала, в котором имеется информация об усилении для отдельных диапазонов. Рассчитывают среднюю ошибку дискретизации для множества частотных диапазонов входного аудио сигнала. Исключаются диапазоны частот, спектральные компоненты которых полностью квантованы к нулю. Вводят шум в спектральные компоненты для множества диапазонов частот, причем информация об усилении в отдельных диапазонах частот связана с общим значением интенсивности многополосного шума. 7 н.з. и 11 з.п. ф-лы, 23 ил.

Изобретение относится к транскодировщику аудиоформата (100) для транскодирования входного аудиосигнала. Технический результат заключается в эффективном объединении возможностей направленного и пространственного аудиокодирования. Входной звуковой сигнал имеет не менее двух направленных аудиокомпонентов. Транскодировщик аудиоформата (100) включает преобразователь (110) для преобразования входного аудиосигнала в преобразованный сигнал, имеющий представление преобразованного сигнала и направление поступления преобразованного сигнала. Транскодировщик аудиоформата (100) дополнительно содержит определитель положения (120) для определения, по крайней мере, двух пространственных местоположений, по крайней мере, двух пространственных источников звука. Транскодировщик аудиоформата (100) также содержит процессор (130) для обработки представления преобразованного сигнала с использованием не менее двух пространственных местоположений для получения. по крайней мере, двух измерений разделенных источников звука. 3 н. и 9 з.п. ф-лы, 11 ил.

Изобретение относится к средствам кодирования и декодирования звуковых сигналов. Технический результат заключается в повышении качества кодирования сигнала. Генерируют низведенный сигнал и остаточный сигнал на основе стереофонического сигнала. Определяют разность интенсивностей между каналами и взаимную корреляцию между каналами. Предпочтительно, параметры параметрического стереофонического кодирования являются зависящими от времени и от частоты. Этап преобразования генерирует псевдолевый/правый стереофонический сигнал путем выполнения преобразования на основе низведенного сигнала и остаточного сигнала. Псевдостереофонический сигнал обрабатывается перцептуальным стереофоническим кодером. Для стереофонического кодирования может быть выбрано левое/правое кодирование или среднее/побочное кодирование. Предпочтительно, выбор между левым/правым кодированием и средним/побочным кодированием является зависящим от времени и от частоты. 8 н.з. и 58 з.п. ф-лы, 26 ил.

Изобретение относится к технологиям аудио кодирования. Техническим результатом является улучшение кодирования/декодирования аудио сигналов в схемах с низком битрейтом. Аудио кодирующее устройство для кодирования аудио сигнала включает в себя первый канал кодирования для кодирования аудио сигнала, используя первый кодирующий алгоритм. При этом первый канал кодирования содержит первый преобразователь время/частота для преобразования входного аудио сигнала в спектральную область. Аудио кодирующее устройство также включает в себя второй канал кодирования для кодирования аудио сигнала, используя второй кодирующий алгоритм. При этом первый кодирующий алгоритм отличается от второго кодирующего алгоритма. Второй канал кодирования включает в себя преобразователь области, который преобразует входной аудио сигнал из входной области в аудио сигнал выходной области. 6 н. и 15 з.п. ф-лы, 43 ил., 10 табл.

Изобретение относится к технологии кодирования и декодирования звука, в частности к иерархическому кодированию и декодированию звука и к иерархическому кодированию и декодированию звука для переходных сигналов. Технический результат - повышение качества иерархического кодирования и декодирования. Для этого способ иерархического кодирования звука обеспечивает обнаружение транзиентов (переходных процессов) на звуковом сигнале текущего кадра, выполнение временно-частотного преобразования, квантование и кодирование значения огибающей амплитуды поддиапазонов кодирования базового уровня и поддиапазонов кодирования расширенного уровня, квантование и кодирование коэффициентов частотной области базового уровня, выполнение обратного квантования на коэффициентах частотной области базового уровня, на которых проведено векторное квантование, выполнение расчета разности относительно первоначальных коэффициентов частотной области для получения разностного сигнала базового уровня, и расчет индексов квантования огибающей амплитуды разностных сигналов базового уровня, квантование и кодирование сигналов кодирования расширенного уровня, мультиплексирование и пакетирование кодированных битов огибающей амплитуды поддиапазонов кодирования базового уровня и расширенного уровня, кодированных битов коэффициентов частотной области базового уровня и кодированных битов сигналов кодирования расширенного уровня и передача в конец декодирования. 5 н. и 13 з.п. ф-лы, 9 ил., 11 табл.

Изобретение относится к системе обеспечения информацией для предоставления различных видов информации на оконечное устройство посредством акустических волн. Технический результат - передача информации посредством акустических волн. В окружающей среде, позволяющей передавать информацию посредством акустических волн, необходим передатчик, способный вызывать акустические волны для передачи информации, которые практически не будут восприниматься слухом человека. Передатчик представляет собой устройство для преобразования различных видов информации в акустические волну в звуковом спектре, и передачи, содержащей микрофон, для приема звука окружающей среды места, с которого осуществляется излучение акустической волны, служащий входным сигналом звука окружающей среды; детектор пиковой частоты для определения в сигнале) звука окружающей среды, пиковой частоты основной составляющей звука окружающей среды; генератор несущей для генерирования несущих, имеющих множество частот, равных произведению пиковой частоты и натурального числа и могут быть использованы для маскировки звуком окружающей среды; и модулятор для модулирования множества несущих основной полосой частот. 2 н. и 4 з.п.ф-лы, 5 ил.

Изобретение относится к цифровому радиовещанию, обеспечивающему звуковой индикатор качества канала связи. Технический результат - повышение качества цифровой радиопередачи звуковых сигналов путем точного обнаружения и коррекции однобитовых ошибок. Для этого после приема цифрового радиосигнала цифровым радиоприемником определяется качество полученной цифровой радиопередачи. Затем звуковое сообщение декодируется из полученной цифровой радиопередачи. Затем звуковой индикатор накладывается на звуковое сообщение для формирования композитного звукового сигнала. В конечном итоге, амплитуда звукового индикатора динамически регулируется с учетом амплитуды звукового сообщения в зависимости от качества полученной цифровой радиопередачи. 4 н. и 22 з.п.ф-лы, 5 ил.

Изобретение относится к средствам для стереофонического кодирования и декодирования с использованием комплексного предсказания в частотной области. Технический результат заключается в повышении скорости кодирования в диапазоне высоких скоростей передачи битов. Способ декодирования, предназначенный для получения выходного стереофонического сигнала из входного стереофонического сигнала, закодированного посредством стереофонического кодирования с комплексным предсказанием и включающего первые представления двух входных каналов в частотной области, содержит следующие этапы повышающего микширования: (i) вычисление второго представления первого входного канала в частотной области, и (ii) вычисление выходного канала на основе первого и второго представлений первого входного канала в частотной области, первого представления второго входного канала в частотной области и коэффициента комплексного предсказания. 2 н.з. и 12 з.п. ф-лы, 19 ил., 1 табл.

Изобретение относится к технике радиосвязи и может быть использовано для цифрового телевещания. Технический результат - снижение разрядности передаваемых кодов видеосигналов и звука в 1,6 раза, введение на передающей стороне цифровых микрофонов, на приемной стороне повышение разрешения экранов в два раза, достигаемое получением трех цветовых тонов R.G.B пикселя из одной излучающей ячейки. Сущность изобретения в ведении на передающей стороне в каждый канал обработки кодов видеосигналов преобразователя "код 2n-код 2n-1", в каждый канал обработки кодов звука преобразователя "звук-код", на приемной стороне выполнение каждого элемента матрицы экрана из одной излучающей ячейки. 7 табл., 16 ил.

Изобретение относится к средствам декодирования и/или транскодирования звука. Технический результат заключается в уменьшении сложности процесса уменьшения числа каналов при сохранении релевантной высокочастотной информации о каналах. Объединяют первый и второй исходные наборы параметров воспроизведения полосы спектра (SBR) в конечный набор параметров SBR. Первый и второй исходные наборы включают первое и второе разбиения полосы частот соответственно, которые отличны друг от друга. Первый исходный набор включает первый набор энергозависимых значений, связанных с полосами частот первого разбиения полосы частот. Второй исходный набор включает второй набор энергозависимых значений, связанных с полосами частот второго разбиения полосы частот. Конечный набор включает конечный набор энергозависимых значений, связанных с элементарной полосой частот. Способ включает этапы разделения первого и второго разбиений полосы частот в объединенную координатную сетку, включающую элементарную полосу частот; назначение первого значения первого набора энергозависимых значений в элементарную полосу частот; назначение второго значения второго набора энергозависимых значений в элементарную полосу частот; и объединение первого и второго значений для получения конечного энергозависимого значения элементарной полосы частот. 9 н. и 23 з.п. ф-лы, 9 ил.
Наверх