Матричный декодер



Матричный декодер
Матричный декодер
Матричный декодер
Матричный декодер
Матричный декодер
Матричный декодер

 


Владельцы патента RU 2456766:

ДОЛБИ ЛЭБОРЕТЕРИЗ ЛАЙСЕНСИНГ КОРПОРЕЙШН (US)

Изобретение относится к обработке аудиосигналов, в частности к матричному декодеру аудиосигнала. Техническим результатом является уменьшение объема цифровой обработки. Указанный результат достигается тем, что в способе матричного декодирования аудиосигнала, в котором принимают стереофоническую пару сигналов Lt, Rt, причем относительные амплитуды и полярности пары определяют воспроизводимое направление декодированных сигналов, панорамируют Lt и Rt на выходы, ассоциированные с передними направлениями, в зависимости от показателя суммы Lt и Rt, превышающего показатель разности между Lt и Rt, и панорамируют Lt и Rt на выходы, ассоциированные с задними направлениями, в зависимости от показателя суммы Lt и Rt, меньшего, чем показатель разности между Lt и Rt, и изменяют стереофоническую пару сигналов Lt и Rt для сдвига направления воспроизведенных сигналов путем формирования разностного сигнала из сигналов Lt и Rt, масштабирования упомянутого разностного сигнала на коэффициент усиления смещения и суммирования упомянутого масштабированного разностного сигнала с обоими сигналами Lt и Rt, чтобы создать измененные сигналы Lt и Rt, так что относительные амплитуды и полярности измененной пары Lt и Rt определяют воспроизведенное направление декодированных сигналов. 6 н. и 9 з.п. ф-лы, 6 ил.

 

Перекрестные ссылки на родственные заявки

Данная заявка испрашивает приоритет Предварительной заявки США №61/010896, поданной 11 января 2008 г., настоящим включенной в этот документ путем отсылки.

Область техники, к которой относится изобретение

Изобретение относится к обработке аудиосигналов. В частности, изобретение относится к матричному декодеру аудиосигнала или функции декодирования или компьютерной программе, сохраненной на машиночитаемом носителе, выполняющей функцию декодирования. Хотя декодер или функция декодирования, в частности, полезны для воспроизведения с портативного проигрывателя, использующего виртуализатор наушников или громкоговорителя, матричный декодер или функция декодирования в соответствии с особенностями настоящего изобретения не ограничивается такими использованиями.

Раскрытие изобретения

В соответствии с одним аспектом настоящего изобретения способ матричного декодирования аудиосигнала содержит этап, на котором принимают стереофоническую пару сигналов Lt, Rt, причем в способе относительные амплитуды и полярности пары определяют воспроизведенное направление декодированных сигналов, при этом способ содержит этап панорамирования Lt и Rt на выходы, ассоциированные с передними направлениями, в зависимости от показателя суммы Lt и Rt, превышающего показатель разности между Lt и Rt, и этап панорамирования Lt и Rt на выходы, ассоциированные с задними направлениями, в зависимости от показателя суммы Lt и Rt, не превышающего показатель разности между Lt и Rt, и этап изменения Lt и Rt для сдвига направления воспроизведенных сигналов.

Изменение Lt и Rt для сдвига направления воспроизведенных сигналов может сдвигать сигналы, панорамированные на выходы, ассоциированные с задними направлениями. Изменение Lt и Rt для сдвига направления воспроизведенных сигналов сдвигает сигналы, панорамированные на выходы, ассоциированные с задними направлениями, и может сдвигать сигналы от задне-центрального направления. Такой сдвиг от задне-центрального направления может происходить в направлении, в котором такие сигналы обладают наибольшей амплитудой. Такой сдвиг может постепенно уменьшаться для сигналов в направлениях, в большей степени удаленных от задне-центрального направления.

Изменение Lt и Rt для сдвига направления воспроизведенных сигналов также может сдвигать сигналы, панорамированные на выходы, ассоциированные с передними направлениями. Такой сдвиг сигналов, панорамированных на выходы, ассоциированные с передними направлениями, может сдвигать минимальное количество сигналов в передне-центральном направлении, и такой сдвиг может постепенно увеличиваться для сигналов в направлениях, в большей степени удаленных от передне-центрального направления.

Степень сдвига вперед либо назад может основываться на показателе разности между Lt и Rt.

Степень сдвига может изменяться, только когда Lt и Rt панорамируются на выходы, ассоциированные с задними направлениями.

В соответствии с дополнительным аспектом настоящего изобретения способ матричного декодирования аудиосигнала содержит этап, на котором принимают стереофоническую пару сигналов Lt, Rt, при этом в способе относительные амплитуды и полярности пары определяют воспроизведенное направление декодированных сигналов, причем способ также содержит этап, на котором сдвигают влево или вправо направления выходов, ассоциированных с передними и задними направлениями, причем направление выходов, ассоциированных с задними направлениями, сдвигается в большей степени, чем направление выходов, ассоциированных с передними направлениями, причем этап сдвига заключается в том, что изменяют стереофоническую пару сигналов Lt, Rt путем формирования разностного сигнала из сигналов Lt и Rt, масштабирования разностного сигнала на коэффициент усиления смещения и суммирования масштабированного разностного сигнала с обоими сигналами Lt и Rt, чтобы создать измененные сигналы Lt и Rt, так что относительные амплитуды и полярности измененной пары Lt и Rt определяют воспроизведенное направление декодированных сигналов.

В соответствии с дополнительным аспектом настоящего изобретения способ изменения стереофонической пары сигналов Lt, Rt перед тем, как пара сигналов декодируется матричным декодером аудиосигнала или способом декодирования, причем относительные амплитуды и полярности пары определяют воспроизведенное направление декодированных сигналов, содержит этапы, на которых изменяют стереофоническую пару сигналов Lt, Rt путем формирования разностного сигнала из сигналов Lt и Rt, масштабирования разностного сигнала на коэффициент усиления смещения и суммирования масштабированного разностного сигнала с обоими сигналами Lt и Rt, чтобы создать измененные сигналы Lt и Rt, так что относительные амплитуды и полярности измененной пары Lt и Rt определяют воспроизведенное направление декодированных сигналов.

Краткое описание чертежей

Фиг.1 - функциональная блок-схема, иллюстрирующая пример того, как сигналы Lt и Rt могут панорамироваться или направляться в передних и задних направлениях в соответствии с аспектами настоящего изобретения.

Фиг.2 - функциональная блок-схема, иллюстрирующая пример подробностей "Определения ориентирования вперед-назад" из Фиг.1.

Фиг.3 - функциональная блок-схема, иллюстрирующая пример того, как Lt и Rt могут быть изменены в соответствии с аспектами настоящего изобретения.

Фиг.4 - концептуальная схема, полезная для понимания результата изменения сигналов Lt и Rt в соответствии с аспектами настоящего изобретения.

Фиг.5 - функциональная блок-схема, иллюстрирующая пример того, как можно получить управляющий сигнал LR_bias из Фиг.3.

Фиг.6 - функциональная блок-схема, иллюстрирующая общую компоновку схем из Фиг.1, 2, 3 и 5.

Осуществление изобретения

Панорамирование вперед-назад

Матричный декодер в соответствии с аспектами настоящего изобретения рассматривает сигналы Lt и Rt, поданные на его выходы, как стереофоническую пару сигналов и панорамирует эти сигналы вперед (левый L и правый R) или назад (левый тыловой Ls и правый тыловой Rs). Lt и Rt панорамируются на выходы, ассоциированные с передними направлениями, в ответ на показатель суммы Lt и Rt, превышающий показатель разности между Lt и Rt. Lt и Rt панорамируются на выходы, ассоциированные с задними направлениями, в ответ на показатель суммы Lt и Rt, не превышающий показатель разности между Lt и Rt. Панорамирование вперед-назад может выполняться, например, как показано на Фиг.1. На этой блок-схеме сигналы panF и panB являются сигналами с медленно изменяющимся усилением (аудиосигналы неполной ширины полосы), которые могут меняться, например, между 0 и 1. Сигналы panF и panB работают вместе (они являются дополняющими друг друга), чтобы осуществить плавный переход между передними сигналами L и R и задними сигналами Ls и Rs.

Согласно Фиг.1 входной сигнал Lt подается на выход L через умножитель или функцию-множитель 2 и на выход Ls через умножитель или функцию-множитель 4. Входной сигнал Rt подается на выход R через умножитель или функцию-множитель 6 и на выход Rs через умножитель или функцию-множитель 8. Усиление каждого из умножителей 2 и 6 управляется сигналом усиления panF; усиление каждого из умножителей 4 и 8 управляется сигналом усиления panB. Входные сигналы Lt и Rt также подаются в схему или функцию 10 ("Определение ориентирования вперед-назад"), которая формирует сигналы panF и panB. Детали определения ориентирования вперед-назад показаны на Фиг.2.

В соответствии с временным сглаживанием, которое описано ниже, когда "Определение ориентирования вперед-назад" 10 обнаруживает сдвинутый по фазе аудиосигнал, но никакого синфазного аудиосигнала во входных сигналах Lt и Rt за достаточный период времени, оно устанавливает panB=1,0 и panF=0,0, посредством этого направляя, панорамируя или "ориентируя" входные сигналы Lt и Rt только в тыловые выходные каналы Ls и Rs (строгое ориентирование назад). Также, когда имеется синфазный аудиосигнал, но отсутствует сдвинутый по фазе аудиосигнал во входном сигнале за достаточный период времени, "Определение ориентирования вперед-назад" 10 устанавливает panB=0,0 и panF=1,0, посредством этого ориентируя входные сигналы Lt и Rt только в передние выходные каналы, L и R (строгое ориентирование вперед).

Схема на Фиг.2 формирует, на мгновенной основе, разность между величинами суммы и разности входных сигналов Lt и Rt (быстро меняющаяся форма сигнала, колеблющаяся как положительно, так и отрицательно) и сравнивает ее с небольшой пороговой величиной ε (эпсилон). Это выполняется сумматором или суммирующей функцией 12, которая принимает Lt и Rt, чтобы создать Lt+Rt на выходе, сумматором или суммирующей функцией 14, которая вычитает Rt из Lt, чтобы создать Lt-Rt на выходе, устройствами масштабирования или масштабирующими функциями 16 и 18, которые масштабируют амплитуды Lt+Rt и Lt-Rt, чтобы создать "передний" и "задний" сигналы F и B,

(1)

(2)

причем сигналы F и B взяты по модулю, что показано в устройствах или функциях 20 и 22 абсолютного значения, и сумматором или суммирующей функцией 24, которая вычитает абсолютное значение B из абсолютного значения F и добавляет малое значение эпсилон. Элементы 12, 14, 16, 18, 20, 22 и 24 могут рассматриваться вместе как "элемент 25" устройства или функции "Разность показателей суммы и разности", который показан в общей компоновке на Фиг.6.

Полярность результата |F|-|B|+ε определяется устройством или функцией 26 "Обнаружения полярности". Если она отрицательная, то ответом является одно значение, например минус 1, если положительная, то другое значение, например ноль. Безусловно, могут применяться значения, отличные от минус 1 и нуля. В этом примере результат является двузначной формой сигнала, меняющейся между двумя уровнями, минус 1 и 0. Применяется фильтр нижних частот или фильтрующая функция 28 (фильтр нижних частот (LPF)), приводя к медленнее меняющейся форме сигнала FB, которая может иметь любое значение в диапазоне между или включающем значения двух уровней, в зависимости от соотношения времени, которое прямоугольная волна проводит на каждом из уровней. В ответ на реальные аудиосигналы сглаженная форма сигнала, созданная LPF 28, стремится остаться около одного или другого экстремального значения. На самом деле LPF 28 дает кратковременное среднее его входа при постоянной времени в диапазоне, например, от 5 до 100 миллисекунд. Хотя 40-миллисекундная постоянная времени признана подходящей, это значение не является критичным. LPF 28 может быть реализован в виде однополюсного фильтра.

Согласно Фиг.2 после определения промежуточного управляющего сигнала FB можно затем получить два дополняющих коэффициента панорамирования panF и panB любым количеством способов с помощью устройства или функции 30 "Определение функций панорамирования". В принципе, может применяться любая из различных широко применяемых функций перекрестного затухания, например линейные быстроизменяющиеся функции, логарифмические функции, функции Хеннинга, Хемминга и синусоидальные функции. Следует понимать, что фактические формулы будут меняться в зависимости от выходных значений, выбранных для "Обнаружения полярности" 26.

Если нужно панорамирование при постоянной мощности, то могут применяться следующие формулы:

panF = sin(π/2*(1+FB)) (3)

panB = cos(π/2*(1+FB)) (4)

В качестве альтернативы, если считается предпочтительным или по меньшей мере приемлемым постоянное звуковое давление, то могут применяться следующие формулы:

panF = 1+FB (5)

panB = -FB (6)

Хотя уравнения 3 и 4 выше обеспечивают постоянную мощность (сумма квадратов коэффициентов panF и panB равна единице), постоянная мощность может приблизительно вычисляться путем применения следующих формул:

panF = 1-FB2 (7)

panB = 1-(FB+1)2 (8)

Значения каждого из panF и panB в примере уравнений 7 и 8 могут находиться где угодно между 0 и 1 и быть дополняющими друг для друга, причем каждый описывает траекторию параболы. Результат является двумя коэффициентами или управляющими сигналами с диапазонами между 0 и 1, чьи квадраты дополняют приблизительно до 1.

Если panF был согласованно больше, например, чем panB в любом из вышеприведенных наборов формул, что является результатом того, например, что Lt и Rt равны с одинаковой полярностью, так что вход в LPF 28 равен 0 в течение длительного времени, то панорамирование направлялось бы строго вперед (panF=1 и panB=0). Если panF был согласованно меньше panB, что является результатом того, например, что Lt и Rt равны, но не совпадают по фазе, так что вход в LPF был бы -1 в течение длительного времени, то панорамирование направлялось бы строго назад (panF=0 и panB=1). На реальных сигналах, как и в случае с промежуточным сигналом FB, панорамирование стремится остаться либо строго передним, либо строго задним. Таким образом, Lt и Rt панорамируются на выходы, ассоциированные с передними направлениями, в ответ на показатель суммы Lt и Rt, превышающий показатель разности между Lt и Rt, и Lt и Rt панорамируются на выходы, ассоциированные с задними направлениями, в ответ на показатель суммы Lt и Rt, не превышающий показатель разности между Lt и Rt. Когда показатель суммы Lt и Rt является таким же, как показатель разности между Lt и Rt, то Lt и Rt могут панорамироваться на выходы, ассоциированные с передними направлениями, хотя это не важно.

Фиг.2 предоставляет пример формирования подходящих управляющих сигналов panF и panB. Могут применяться модификации Фиг.2, например, которые предложены выше. В качестве альтернативы могут применяться другие компоновки, которые обеспечивают плавное панорамирование сигналов в ответ на показатели суммы и разности Lt и Rt.

Панорамирование влево-вправо (по ширине)

В идеале панорамирование влево-вправо выглядит следующим образом.

Когда Lt, Rt панорамируется вперед (L, R), используют ориентирование влево-вправо, нежели которое применяется, когда Lt, Rt панорамируется назад, потому что сигнал Lt, Rt, возможно, содержит компоненты полного сигнала L, С, R, уже сведенные в стереофоническую пару, которая, возможно, обеспечит хорошее левое-правое звуковое поле при воспроизведении, включая кажущийся центральный образ.

Когда Lt, Rt панорамируется назад (Ls, Rs), определяют, какой канал (Ls или Rs) обладает большей амплитудой, а затем изменяют сигналы Lt, Rt так, чтобы задние сигналы сдвигались к стороне, в которой такие сигналы обладают наибольшей амплитудой. Как дополнительно объясняется ниже, в реализации изобретения такой сдвиг также может иметь результат, хотя и меньший, когда Lt, Rt панорамируется вперед (L, R).

Общей проблемой во многих матричных декодерах является неспособность применяться в случае, где входные сигналы панорамируются в задне-центральное положение. Это особенно является проблемой, когда воспроизведение применяет виртуализатор наушников или виртуализатор громкоговорителя. Задне-центральное положение кодируется, например, с помощью Lt и Rt, сдвинутых по фазе относительно друг друга. Поэтому, когда сигналы Lt, Rt панорамируются в Ls, Rs, задне-центральные сигналы появляются в сигналах Ls, Rs сдвинутыми по фазе. Задний кажущийся образ не формируется правильно с помощью таких сдвинутых по фазе сигналов.

Аспект настоящего изобретения состоит в том, чтобы сдвинуть сигналы Ls, Rs влево или вправо, посредством этого избегая задне-центрального кажущегося положения, которое вызывает сложность в воспроизведении.

Это может достигаться путем выполнения операции "сдвига" над сигналами Lt, Rt, как показано на Фиг.3 и как описано ниже. Самый большой сдвиг может применяться к задне-центральным сигналам, и меньший сдвиг - для положений, постепенно удаляющихся от задне-центрального. Наименьший сдвиг (или отсутствие сдвига) может применяться к передне-центральным сигналам с постепенно увеличивающимся сдвигом для положений, удаленных от передне-центрального. Другими словами, сдвиг должен больше всего изменить задне-центральное положение и меньше всего передне-центральное. С помощью предотвращения или минимизации сдвига в передне-центральном положении при всех условиях предотвращаются или минимизируются сдвиги расположения образа голосов (диалог), которые обычно находятся в передне-центральном положении. В принципе, устройство или функция сдвига в стиле примера из Фиг.3 может применяться для того, чтобы изменить входной сигнал Lt, Rt в любые два входных матричных декодера или функции декодирования, где функционирование декодера или функции декодирования реагирует на относительные амплитуды и полярности Lt и Rt.

Одна подходящая операция "сдвига" показана на Фиг.3, в которой формируется разностный сигнал Lt-Rt. Затем взвешенная величина этого разностного сигнала смешивается обратно в оба Lt и Rt, чтобы создать Ltbiased и Rtbiased. Управляющий сигнал (LR_bias) может принимать значение +α или -α в зависимости от того, предназначен ли "сдвиг" для сдвига задних каналов влево или вправо. LR_bias может определяться, например, как показано в примере из Фиг.5. Альфа может иметь значение в диапазоне, например, от 0,05 до 0,2. Значение 0,1 признано обеспечивающим пригодные результаты.

Согласно Фиг.3 Rt вычитается из Lt в сумматоре или суммирующем устройстве 32, чтобы получить Lt-Rt, которое затем масштабируется на LR_bias в умножителе или функции 34 умножения. Масштабированная версия Lt-Rt затем складывается с каждым из Lt и Rt в соответствующих сумматорах или суммирующих функциях 36 и 38, чтобы получить Ltbiased и Rtbiased.

Рассмотрим некоторые примеры работы схемы сдвига из Фиг.3 следующим образом.

Например, когда LR_bias=+0,1 (указывающее, что следует сделать сдвиг влево), получаем:

Ltbiased = Lt+[0,1×(Lt-Rt)]

= 1,1×Lt-0,1×Rt

Rtbiased = Rt + [0,1×(Lt-Rt)]

= 0,9×Rt + 0,1×Lt (9)

Продолжая рассматривать этот пример (LR_bias = +0,1), рассмотрим случай, где входной сигнал Lt, Rt состоит из центрально-панорамированного сигнала: Lt = Rt = C. В этом случае имеем:

Lt = Rt = C

Ltbiased = Lt + [0,1×(Lt-Rt)]

= 1,1×Lt-0,1×Rt

= 1,1×C-0,1×C

= C

Rtbiased = Rt + [0,1×(Lt-Rt)]

= 0,9×Rt + 0,1×Lt

= 0,9×C + 0,1×C

= C (10)

В этом случае сигналы Ltbiased и Rtbiased являются такими же, как Lt, Rt. Другими словами, схема сдвига не изменяет сигналы Lt, Rt, когда входной сигнал содержит только передне-центральное панорамированное аудио.

В отличие от этого рассмотрим случай, где входной сигнал Lt, Rt состоит из задне-центрального панорамированного сигнала S: Lt = S, Rt = -S. В этом случае получаем:

Lt = S, Rt = -S

Ltbiased = Lt + [0,1×(Lt-Rt)]

= 1,1×Lt-0,1×Rt

= 1,1×S-0,1×(-S)

= 1,2×S

Rtbiased = Rt + [0,1×(Lt-Rt)]

= 0,9×Rt + 0,1×Lt

= 0,9×(-S) + 0,1×S

= -0,8×S (11)

В этом случае сигналы Ltbiased и Rtbiased изменяются схемой или процессом сдвига, так что Ltbiased повышен по амплитуде, а Rtbiased понижен по амплитуде. Отметим, что если бы LR_bias был установлен в -0,1 вместо +0,1, то сдвиги амплитуд были бы противоположными, причем Rtbiased поднят по уровню, тогда как Ltbiased понижен.

В идеале схема или процесс сдвига работает таким образом, что тыловые каналы сдвигаются влево или вправо и передние каналы сдвигаются аналогичным образом, но в меньшей степени. Пример сдвига влево показан на Фиг.4, на которой окружность из сплошной линии представляет цикл матричного кодирования, в котором показаны традиционные положения L (левого), С (центрального), R (правого), Ls (левого тылового), S (тылового или заднего тылового) и Rs (правого тылового) каналов. Эта окружность имеет единичный радиус, отражая тот факт, что каждый канал обладает единичной мощностью. Окружность из пунктирной линии показывает влияние операции сдвига на единичную окружность. Сдвиг от единичной окружности указывает, что мощность некоторых направлений сигналов усилена или ослаблена. В частности, отметим, что задне-центральное положение S сдвигается на наибольшую величину с постепенно меньшим сдвигом для направлений, все больше и больше удаленных от S, без сдвига, возникающего в передне-центральном положении C.

Пример способа для определения подходящего сигнала LR_bias показан на Фиг.5. Сигнал LR_bias преимущественно основывается на LR, кратковременной усредненной разности амплитуд между сигналами Ltbiased и Rtbiased. Другими словами, LR является оценкой Ltbiased в сравнении с Rtbiased. LR_bias вычисляется в устройстве или функции 40 "Определения сдвига" в ответ на то, меньше или больше пороговой величины каждый из LR, FB (Фиг.2), и в ответ на Lt-Rt. Такое вычисление может быть выражено в программном псевдокоде:

If ( zero_crossing (Lt-Rt) &&

(FB<0,1) ) {

if(LR<-0,1) {

Bias =-0,1;

}

if(LR>0,1) {

Bias = 0,1;

}

}

В качестве альтернативы FB и LR могут перемножаться, и смещение определяется по тому, превышает ли результат пороговую величину. Такое вычисление может быть выражено в программном псевдокоде:

If ( zero_crossing (Lt-Rt) &&

if(LR*FB<-0,01) {

Bias = +0,1;

If ( zero_crossing (Lt-Rt) &&

if(LR*FB>0,01) {

Bias = -0,1;

}

}

Сигнал LR_bias может определяться следующим образом. Сначала измерим относительную амплитуду сигналов Ltbiased и Rtbiased. Промежуточный сигнал, LR, оценка Ltbiased в сравнении с Rtbiased, кратковременная усредненная разность амплитуд между сигналами Ltbiased и Rtbiased могут определяться следующим образом:

(12)

Отметим, что малое положительное смещение ε (эпсилон) добавляется в знаменатель дроби в уравнении 7, чтобы гарантировать, что никакой ошибки не возникнет, когда Lt и Rt оба равны нулю. Чтобы оценить LR, отметим, что правильное значение LR должно привести к ErrorLR, равной нулю:

(13)

Одним способом создания кратковременного сглаженного значения LR является увеличение или уменьшение мгновенного значения разности амплитуд между сигналами Ltbiased и Rtbiased (на небольшое приращение, например 2-10) на основе значения ErrorLR следующим образом:

(14)

Таким образом, следующее значение LR (называемое LR' в уравнении выше) сдвинется к правильному значению ступенчатым образом.

Кратковременное сглаживание или усреднение (отраженное в уравнениях 12 и 13 в виде "avg") является результатом сглаживания, который следует из шагов увеличения, которые пытаются уменьшить ошибку LR. Сглаживание может иметь постоянную времени приблизительно между 5 и 100 миллисекундами. Значения 20 и 40 миллисекунд признаны пригодными. В описанной реализации LR может принимать значения от -1 (указывающее строгое панорамирование влево) до +1 (указывающее строгое панорамирование вправо). LR может иметь нулевое начальное значение, соответственно требуя 1024 приращения для достижения +1 или -1. Очевидно, что необходимы 2048 приращений для LR, чтобы дойти от строгого левого до строгого правого.

При реализации в цифровой системе приращения и убывания могут выполняться на скорости передачи аудиосигнала (например, 48 кГц, когда применяются приращения 2-10). В принципе, настоящее изобретение может быть полностью или частично реализовано в аналоговой области.

Согласно Фиг.5 Ltbiased и Rtbiased принимают абсолютные значения, что показано в устройствах или функциях 42 и 44 взятия абсолютного значения. Сумматор или суммирующая функция 46 складывает абсолютное значение Ltbiased и абсолютное значение Rtbiased с малым значением эпсилон и подает результат в умножитель или функцию-множитель 48, которая также принимает задержанную на одну выборку версию LR, чтобы создать произведение LR и суммы абсолютного значения Ltbiased, абсолютного значения Rtbiased и эпсилона. Сумматор или суммирующая функция 50 вычитает абсолютное значение Rtbiased из абсолютного значения Ltbiased. Сигнал ошибки (уравнение 8) затем получается из выхода сумматора или суммирующей функции 52. Сигнал ошибки применяется к знаковому устройству или функции (signum())54, которая выдает +1, если вход больше нуля, -1, если вход меньше нуля, и 0, если вход равен нулю (хотя некоторые реализации DSP такой функции упрощаются, чтобы знаковая функция могла быть +1 для входа, который больше либо равен нулю, и -1 для отрицательного входа). Результат знакового устройства или функции 54 умножается на масштабный коэффициент 2-10 в умножителе или функции 56 умножения и суммируется с задержанной на одну выборку версией LR (предоставленной устройством или функцией 60 задержки) в сумматоре или суммирующей функции 58. Элементы 42, 44, 46, 48, 50, 52, 54, 56, 58 и 60 могут рассматриваться вместе как "элемент 61" устройства или функции "Определение кратковременной усредненной разности", который показан в общей компоновке на Фиг.6.

Как только определено значение LR, значение сигнала LR_bias обновляется в "Определении сдвига" 40 в соответствии с псевдокодом, показанным первым выше, и следующими логическими правилами:

1. LR_bias всегда будет равен +α или -α, где α находится в диапазоне, например, от 0,05 до 0,2. На практике значение 0,1 признано обеспечивающим пригодные результаты.

2. Сигнал LR_bias переходит только между его двумя допустимыми значениями, когда имеется переход через ноль в сигнале Lt-Rt. Это минимизирует вероятность того, что изменение в LR_bias приведет к слышимому щелчку в выходном сигнале.

3. Когда сигнал LR указывает, что Ltbiased больше по амплитуде, чем Rtbiased (когда LR>0), и когда сигнал FB указывает, что сигналы Lt, Rt должны панорамироваться назад больше, чем на подходящую пороговую величину (например, когда FB<-0,1), тогда устанавливают LR_bias в +0,1 (когда есть переход через ноль в разностном сигнале Lt-Rt). Другими словами, разрешается изменять значение LR_bias, когда сигналы Lt, Rt панорамируются назад больше, чем на пороговую величину. Однако последнее значение LR_bias остается действующим независимо от того, панорамируются ли сигналы Lt, Rt назад или вперед.

4. Когда сигнал LR указывает, что Rtbiased больше по амплитуде, чем Ltbiased (когда LR<0), и когда сигнал FB указывает, что сигналы Lt, Rt должны панорамироваться назад больше, чем на пороговую величину (например, когда FB<-0,1, как упоминалось выше), тогда устанавливают LR_bias в -0,1 (когда есть переход через ноль в разностном сигнале Lt-Rt). Способ, которым обрабатывается LR=0, не важен. Одна возможность состоит в том, чтобы ничего не делать, когда LR=0 (оставить LR_bias без изменений), либо в качестве альтернативы действовать, как если бы LR>0, что описано немного выше в пункте 3.

Отметим, что сигнал LR_bias определяется из амплитуд сигналов Ltbiased и Rtbiased, а сигналы Ltbiased и Rtbiased изменяются сигналом LR_bias, соответственно формируя контур обратной связи в общем алгоритме. Это является положительным контуром обратной связи, который делает общее протекание процесса бистабильным по характеру. В результате схема проявляет гистерезис. Например, когда LR_bias = +0,1, это заставляет схему сдвига чрезмерно увеличивать сигнал Ltbiased, усиливая его пропорционально по сравнению с сигналом Rtbiased, который в свою очередь будет увеличивать сигнал LR (продвигая его вверх в положительном направлении). В результате гораздо больший сигнал Rt (относительно Lt) необходим для перехода LR_bias обратно в -0,1. Такой гистерезис гарантирует, что система менее вероятно покажет быстрое переключение туда и обратно в сигнале LR_bias, которое в противном случае могло бы быть нежелательным, вызывая слышимые искажения, например сдвиг звукового образа.

Сдвиг образа также минимизируется путем разрешения LR_bias изменяться только тогда, когда панорамирование проводится назад. Сдвиги образа более заметны, когда происходят вперед. Также сохранение одинакового сдвига при панорамировании сзади вперед и спереди назад предотвращает сдвигов образа, когда происходят такие панорамирования. Однако изменения в LR_bias обычно будут возникать, когда происходит изменение в звуковом содержании. Таким образом, сдвиг в расположении образа часто необходим при таком изменении и является желательным.

Следует отметить, что как панорамирование вперед-назад, так и панорамирование влево-вправо применяют постоянные времени. Хотя даны рекомендуемые значения для таких постоянных времени, станет понятно, что сглаживающие значения определяются в некоторой степени на усмотрение проектировщика и могут выбраться путем проб и ошибок. К тому же желательные сглаживающие значения могут меняться в зависимости от аудиосодержания.

Фиг.6 показывает способ, в котором совмещаются вышеописанные Фиг.1, 2, 3 и 5.

Реализация

Хотя в принципе изобретение может быть применено на практике либо в аналоговой, либо в цифровой области (или в некотором сочетании из двух областей), в практических вариантах осуществления изобретения аудиосигналы представляются выборками в блоках данных и обработка выполняется в цифровой области.

Изобретение может быть реализовано в аппаратных средствах или программном обеспечении либо в сочетании обоих (например, программируемые логические матрицы). Пока не указано иное, алгоритмы и процессы, включенные как часть изобретения, в своей основе не имеют отношения ни к какому конкретному компьютеру или другому устройству. В частности, различные универсальные машины могут использоваться вместе с программами, написанными в соответствии с идеями в этом документе, либо может быть удобнее создать более специализированное устройство (например, интегральные схемы) для выполнения необходимых этапов способа. Таким образом, изобретение может быть реализовано в одной или нескольких компьютерных программах, выполняющихся на одной или нескольких программируемых компьютерных системах, причем каждая содержит по меньшей мере один процессор, по меньшей мере одну систему хранения данных (включающую энергозависимое и энергонезависимое запоминающее устройство и/или запоминающие элементы), по меньшей мере одно устройство или порт ввода и по меньшей мере одно устройство или порт вывода. Программный код применяется ко входным данным, чтобы выполнить функции, описанные в этом документе, и сформировать выходную информацию. Выходная информация подается в одно или несколько устройств вывода известным образом.

Каждая такая программа может быть реализована на любом нужном языке программирования (включая машинный язык, язык ассемблера или высокоуровневые процедурные, логические или объектно ориентированные языки программирования) для взаимодействия с компьютерной системой. В любом случае язык может быть транслируемым или интерпретируемым языком.

Каждая такая компьютерная программа предпочтительно сохраняется или загружается на носители информации или запоминающее устройство (например, твердотельное запоминающее устройство или носители либо магнитные или оптические носители), считываемые универсальным или специализированным программируемым компьютером, для конфигурирования и функционирования компьютера, когда носители информации или запоминающее устройство считывается компьютерной системой для выполнения процедур, описанных в этом документе. Патентоспособная система также может рассматриваться как реализуемая в виде машиночитаемого носителя информации, сконфигурированного с помощью компьютерной программы, где сконфигурированный таким образом носитель информации заставляет компьютерную систему работать особым и предопределенным образом, чтобы выполнять функции, описанные в этом документе.

Описано некоторое количество вариантов осуществления изобретения. Тем не менее, станет понятно, что могут быть сделаны различные модификации без отклонения от сущности и объема изобретения. Например, некоторые из описанных в этом документе этапов могут не зависеть от порядка и соответственно могут выполняться в порядке, отличном от описанного.

1. Способ матричного декодирования аудиосигнала, в котором принимают стереофоническую пару сигналов Lt, Rt, причем в способе относительные амплитуды и полярности пары определяют воспроизводимое направление декодированных сигналов, причем способ содержит этапы, на которых:
панорамируют Lt и Rt на выходы, ассоциированные с передними направлениями, в зависимости от показателя суммы Lt и Rt, превышающего показатель разности между Lt и Rt, и панорамируют Lt и Rt на выходы, ассоциированные с задними направлениями, в зависимости от показателя суммы Lt и Rt, меньшего, чем показатель разности между Lt и Rt, и
изменяют стереофоническую пару сигналов Lt и Rt для сдвига направления воспроизведенных сигналов путем формирования разностного сигнала из сигналов Lt и Rt, масштабирования упомянутого разностного сигнала на коэффициент усиления смещения, и суммирования упомянутого масштабированного разностного сигнала с обоими сигналами Lt и Rt, чтобы создать измененные сигналы Lt и Rt, так что относительные амплитуды и полярности измененной пары Lt и Rt определяют воспроизведенное направление декодированных сигналов.

2. Способ по п.1, в котором этап изменения Lt и Rt для сдвига направления воспроизведенных сигналов сдвигает сигналы, панорамированные на выходы, ассоциированные с задними направлениями.

3. Способ по п.2, в котором этап изменения Lt и Rt для сдвига направления воспроизведенных сигналов сдвигает сигналы, панорамированные на выходы, ассоциированные с задними направлениями так, чтобы сдвинуть сигналы от задне-центрального направления.

4. Способ по п.3, в котором сигналы, панорамированные на выходы, ассоциированные с задними направлениями, сдвигаются от задне-центрального направления в направлении, в котором такие сигналы обладают наибольшей амплитудой.

5. Способ по п.3, в котором степень сдвига является наибольшей для сигналов в задне-центральном положении, причем сдвиг постепенно уменьшается для сигналов в направлениях, в большей степени удаленных от задне-центрального направления.

6. Способ по п.2, в котором этап изменения Lt и Rt для сдвига направления воспроизведенных сигналов также сдвигает сигналы, панорамированные на выходы, ассоциированные с передними направлениями.

7. Способ по п.6, в котором этап изменения Lt и Rt для сдвига направления воспроизведенных сигналов сдвигает сигналы, панорамированные на выходы, ассоциированные с передними направлениями так, чтобы сдвинуть минимальное количество сигналов в передне-центральном направлении.

8. Способ по п.7, в котором степень сдвига является наименьшей для сигналов в передне-центральном положении, причем сдвиг постепенно увеличивается для сигналов в направлениях, в большей степени удаленных от передне-центрального направления.

9. Способ по п.1, в котором степень сдвига основывается на показателе разности между Lt и Rt.

10. Способ по п.1, в котором степень сдвига изменяется только тогда, когда Lt и Rt панорамируются на выходы, ассоциированные с задними направлениями.

11. Способ матричного декодирования аудиосигнала, в котором принимают стереофоническую пару сигналов Lt, Rt, причем в способе относительные амплитуды и полярности пары определяют воспроизведенное направление декодированных сигналов, и способ содержит этап, на котором
сдвигают влево или вправо направления выходов, ассоциированных с передними и задними направлениями, причем направление выходов, ассоциированных с задними направлениями, сдвигается в большей степени, чем направление выходов, ассоциированных с передними направлениями, причем упомянутый сдвиг включает в себя изменение стереофонической пары сигналов Lt, Rt путем формирования разностного сигнала из сигналов Lt и Rt, масштабирования упомянутого разностного сигнала на коэффициент усиления смещения, и суммирования упомянутого масштабированного разностного сигнала с обоими сигналами Lt и Rt, чтобы создать измененные сигналы Lt и Rt, так что относительные амплитуды и полярности измененной пары Lt и Rt определяют воспроизведенное направление декодированных сигналов.

12. Способ изменения стереофонической пары сигналов Lt, Rt перед тем, как пара сигналов декодируется матричным декодером аудиосигнала или способом декодирования, причем относительные амплитуды и полярности пары определяют воспроизведенное направление декодированных сигналов, содержащий этап, на котором
изменяют стереофоническую пару сигналов Lt, Rt путем формирования разностного сигнала из сигналов Lt и Rt, масштабирования упомянутого разностного сигнала на коэффициент усиления смещения и суммирования упомянутого масштабированного разностного сигнала с обоими сигналами Lt и Rt, чтобы создать измененные сигналы Lt и Rt, так что относительные амплитуды и полярности измененной пары Lt и Rt определяют воспроизведенное направление декодированных сигналов.

13. Способ матричного декодирования аудиосигнала, в котором принимают стереофоническую пару сигналов Lt, Rt, причем в способе относительные амплитуды и полярности пары определяют воспроизведенное направление декодированных сигналов, содержащий этапы, на которых:
панорамируют Lt и Rt на выходы, ассоциированные с передними направлениями, в зависимости от показателя суммы Lt и Rt, превышающего показатель разности между Lt и Rt, и панорамируют Lt и Rt на выходы, ассоциированные с задними направлениями, в зависимости от показателя суммы Lt и Rt, меньшего, чем показатель разности между Lt и Rt; и
изменяют Lt и Rt для сдвига направления воспроизведенных сигналов, причем упомянутое изменение включает сдвиг влево или вправо направления выходов, ассоциированных с передними и задними направлениями, причем направление выходов, ассоциированных с задними направлениями, сдвигается в большей степени, чем направление выходов, ассоциированных с передними направлениями, при этом упомянутый сдвиг включает в себя изменение стереофонической пары сигналов Lt, Rt путем формирования разностного сигнала для сигналов Lt и Rt, масштабирования упомянутого разностного сигнала на коэффициент усиления смещения и суммирования упомянутого масштабированного разностного сигнала с обоими сигналами Lt и Rt, чтобы создать измененные сигналы Lt и Rt, так что относительные амплитуды и полярности измененной пары Lt и Rt определяют воспроизведенное направление декодированных сигналов.

14. Устройство матричного декодирования аудиосигнала, приспособленное для выполнения способа по п.1.

15. Машиночитаемый носитель, содержащий сохраненную на нем компьютерную программу для матричного декодирования аудиосигнала, побуждающую компьютер выполнять способ по п.1.



 

Похожие патенты:

Изобретение относится к способу и устройству для генерирования бинаурального звукового сигнала и, в частности, к генерированию бинаурального звукового сигнала из моносигнала понижающего микширования.

Изобретение относится к синтезированию с применением аудиорендеринга выходного стереосигнала или выходного многоканального аудиосигнала, сформированных в результате понижающего микширования с использованием дополнительных управляющих данных.

Изобретение относится к технике связи и может быть использовано в многоканальных системах воспроизведения звука, воссоздающих точное восприятие таких акустических явлений, как музыкальное исполнение или спортивное соревнование.

Изобретение относится к способу и устройству для декодирования аудиосигнала, принятого на цифровом носителе, например сигнала вещания. .

Изобретение относится к способам и устройствам воспроизведения многоканальных звуковых сигналов. .

Использование: данное изобретение относится к сфере обработки звукового сигнала, главным образом, обработки пространственного звукового сигнала, и преобразования различных форматов пространственных звуковых сигналов. Сущность: улучшенная обработка звукового сигнала может быть достигнута, если звуковые сигналы преобразуются в направленные компоненты. Другими словами, данное изобретение показывает, что улучшенная пространственная обработка может быть достигнута, когда формат пространственного звукового сигнала соответствует направленным компонентам, таким как записанные, например, направленным микрофоном В-формата. Кроме того, данное изобретение показывает, что направленные или всенаправленные компоненты из различных источников могут обрабатываться совместно и, к тому же, с повышенной эффективностью. Другими словами, особенно при обработке пространственных звуковых сигналов из множественных источников звука, обработка может быть выполнена более эффективно, если сигналы множественных источников звука доступны в формате их всенаправленных и направленных компонентов, поскольку они могут обрабатываться совместно. В осуществлениях, поэтому, генераторы звукового эффекта или звуковые процессоры могут использоваться более эффективно, обрабатывая объединенные компоненты множественных источников. Технический результат: улучшение пространственной обработки звукового сигнала. 3 н. и 13 з.п. ф-лы, 11 ил.

Изобретение относится к средствам кодирования и декодирования основывающихся на объектах аудиосигналов. Технический результат заключается в предоставлении средств кодирования и декодирования аудио. Извлекают из аудиосигнала первый аудиосигнал и первый аудиопараметр, в которых музыкальный объект закодирован на канальной основе, и второй аудиосигнал и второй аудиопараметр, в которых вокальный объект закодирован на объектной основе. Формируют третий аудиосигнал посредством использования, по меньшей мере, одного из первого и второго аудиосигналов. Формируют многоканальный аудиосигнал посредством использования, по меньшей мере, одного из первого и второго аудиопараметров и третьего аудиосигнала. 5 н. и 4 з.п. ф-лы, 16 ил.
Наверх