Устройство, способ и компьютерная программа для генерирования выходного стереосигнала для обеспечения дополнительных выходных каналов

Изобретение относится к области генерации стереосигнала. Технический результат - обеспечение более гладкого звучания выходных каналов посредством манипулирования комбинационным сигналом. Устройство для генерирования выходного стереосигнала включает: генератор информации о манипуляции, выполненный с возможностью генерировать информацию о манипуляции в зависимости от первого значения отсчета сигнала первого входного канала и от второго значения отсчета сигнала второго входного канала; манипулятор для манипулирования комбинационным сигналом на основе информации о манипуляции для того, чтобы получать первый манипулированный сигнал в качестве первого выходного канала и второй манипулированный сигнал в качестве второго выходного канала; причем комбинационный сигнал представляет собой сигнал, полученный путем комбинирования первого входного канала и второго входного канала; причем манипулятор выполнен с возможностью манипулировать комбинационным сигналом в зависимости от отношения первого значения отсчета сигнала ко второму значению отсчета сигнала. 6 н. и 12 з.п. ф-лы, 10 ил.

 

Настоящее изобретение относится к аудиообработке и, в частности, к способам генерирования выходного стереосигнала.

Аудиообработка продвинулась во многих направлениях. В частности, системы объемного звучания становятся все более важными. Однако большинство музыкальных записей все еще кодируются и передаются как стереосигнал, а не как многоканальный сигнал. Поскольку системы объемного звучания включают в себя множество громкоговорителей, например, четыре или пять, задачей многих исследований было определить, какие сигналы нужно подавать на каждый из громкоговорителей, когда есть только два доступных входных сигнала. Подача первого входного сигнала неизменным на первую группу громкоговорителей и подача второго входного сигнала неизменным на вторую группу громкоговорителей, конечно, было бы решением. Но слушатель в действительности не получил бы впечатления от реального объемного звучания, а вместо этого услышал бы один и тот же звук из различных динамиков.

Более того, рассмотрим систему объемного звучания, включающую в себя пять громкоговорителей, в том числе центральный динамик. Чтобы обеспечить пользователю реальное восприятие звучания, звуки, которые в действительности исходят из места перед слушателем, должны быть воспроизведены передними динамиками, а не левыми и правыми окружающими громкоговорителями позади слушателя. Следовательно, должны быть доступны такие аудиосигналы, которые не включают в себя такие звуковые части.

Кроме того, слушатели, желающие испытать реальное объемное звучание, также ожидают высококачественного звука из левых и правых окружающих громкоговорителей. Подача на оба окружающих динамика того же самого сигнала не является желательным решением. Звуки, которые исходят слева от положения слушателя, не должны воспроизводиться правым окружающим динамиком и наоборот.

Однако, как уже упоминалось, большинство музыкальных записей все еще кодируются как стереосигналы. Во многих стереозаписях используется амплитудное разнесение. Звуковые источники sk записываются и затем разносятся в пространстве путем применения весовых масок ak таким образом, что в стереосистеме они кажутся исходящими из конкретного положения между левым громкоговорителем, принимающим левый стереоканал xL входного стереосигнала, и правым громкоговорителем, принимающим правый стереоканал xR входного стереосигнала. Кроме того, такие записи включают в себя части n1, n2 сигнала окружения, возникающие, например, вследствие реверберации в помещении. Части сигнала окружения появляются в обоих каналах, но не относятся к конкретному источнику звука. Следовательно, левый xL и правый xR каналы входного стереосигнала могут включать в себя:

x L = k s k + n 1

x R = k a k s k + n 2

где xL: левый стереосигнал;

xR: правый стереосигнал;

ak: коэффициент разнесения источника звука k;

sk: сигнал источника звука k;

n1, n2,: части сигнала окружения.

В системах объемного звучания обычно только некоторые из громкоговорителей располагаются перед слушателем (например, центральный, передний левый и передний правый динамики), в то время как другие динамики обычно расположены слева и справа позади слушателя (например, левый и правый окружающие динамики).

Компоненты сигнала, которые одинаково присутствуют в обоих каналах входного стереосигнала (sk=ak·sk), кажутся исходящими от источника звука, находящегося в центре перед слушателем. Поэтому может быть желательно, чтобы эти сигналы не воспроизводились левым и правым окружающими динамиками позади слушателя.

Кроме того, может быть желательно, чтобы компоненты сигнала, которые главным образом присутствуют в левом стереоканале (sk>>ak·sk), воспроизводились левым окружающим динамиком; и чтобы компоненты сигнала, которые главным образом присутствуют в правом стереоканале (sk<<ak·sk), воспроизводились правым окружающим динамиком.

Более того, может быть желательно, чтобы часть n1 сигнала окружения левого стереоканала воспроизводилась левым окружающим динамиком, в то время как часть n2 сигнала окружения правого стереоканала воспроизводились правым окружающим динамиком.

Следовательно, для того, чтобы обеспечить левый и правый окружающие динамики подходящими сигналами, было бы очень ценным предусмотреть по меньшей мере два выходных канала из двух каналов входного стереосигнала, которые отличаются от двух входных каналов и которые обладают описанными свойствами.

Желание генерировать выходной стереосигнал из входного стереосигнала однако не ограничено системами объемного звучания, но может также быть применено к традиционным стереосистемам. Выходной стереосигнал мог бы также быть полезным для обеспечения различного восприятия звучания, например, более широкого звукового поля для традиционных стереосистем, имеющих два громкоговорителя, например, посредством обеспечения расширения стереобазы. Что касается проигрывания с использованием стерео громкоговорителей или наушников, то может быть обеспечено более широкое и/или окутывающее восприятие звука.

В соответствии с первым способом предшествующего уровня техники, монофонический входной источник обрабатывается так, чтобы сгенерировать стереосигнал для воспроизведения, создавая таким образом два канала из монофонического входного источника. Посредством этого входной сигнал модифицируется дополнительными фильтрами для генерирования выходного стереосигнала. При проигрывании двумя громкоговорителями сгенерированный стереосигнал создает более широкий звук чем неотфильтрованное проигрывание того же самого сигнала. Однако источники звука, включенные в стереосигнал, "смазаны", поскольку никакая информация о направлении не генерируется. Детали представлены в публикации:

Manfred Schroeder “An Artificial Stereophonic Effect Obtained From Using a Single Signal”, представлено на 9й ежегодной конференции AES, 8-12 октября 1957.

Другой предложенный подход представлен в патентной заявке WO 9215180 A1: “Системы воспроизведения звука, имеющие матричный преобразователь”. В соответствии с этим подходом предшествующего уровня техники выходной стереосигнал генерируется из входного стереосигнала путем применения линейной комбинации каналов входного стереосигнала. Посредством применения этого способа могут быть сгенерированы выходные сигналы, которые значительно смягчают находящиеся в центральной области части входного сигнала. Однако этот способ также приводит к большому количеству перекрестных помех (с левого канала на правый канал и наоборот). Перекрестные помехи могут быть уменьшены путем ограничения влияния правого входного сигнала на левый выходной сигнал и, наоборот, путем подстройки соответствующего весового коэффициента линейной комбинации. Это, однако, также привело бы к ухудшению смягчения находящихся в центральной области частей сигнала в окружающих динамиках. Сигналы, исходящие из переднего центрального местоположения, непреднамеренно воспроизводились бы задними окружающими динамиками.

Другая предложенная концепция предшествующего уровня техники должна определить направление и окружение входного стереосигнала в частотной области путем применения сложных методов анализа сигналов. Эта концепция предшествующего уровня техники представлена, например, в патентных документах US7257231 B1, US7412380 B1 и US7315624 B2. В соответствии с этим подходом оба входных сигнала исследуются относительно направления и окружения для каждого столбца частотно-временной диаграммы и повторно панорамируются в системе объемного звучания в зависимости от результата анализа окружения и направления. В соответствии с этим подходом корреляционный анализ используется для того, чтобы определить части сигнала окружения. На основе этого анализа генерируются окружающие каналы, которые включают в себя преобладающие части сигнала окружения и из которых могут быть удалены находящиеся в центральной области части сигнала. Однако, поскольку как анализ направления, так и извлечение окружения основываются на оценках, которые не всегда свободны от ошибок, могут быть сгенерированы нежелательные артефакты. Проблема генерируемых нежелательных артефактов становится более серьезной, если смесь входного сигнала включает в себя несколько сигналов (например, различных инструментов) с накладывающимися спектрами. Эффективная сигнально-зависимая фильтрация обязана удалять находящиеся в центральной области части из стереосигнала, что, однако, делает ошибки оценки, вызванные “музыкальным шумом”, ясно видимыми. Более того, комбинация анализа направления и извлечения окружения кроме того приводит к добавлению артефактов от обоих способов.

Поэтому задачей настоящего изобретения является предложить улучшенные концепции для генерирования выходного стереосигнала. Задача настоящего изобретения решается устройством для генерирования выходного стереосигнала по п. 1 формулы изобретения, повышающим микшером по п. 14 формулы изобретения, устройством для расширения стереобазы по п. 15 формулы изобретения, способом генерирования выходного стереосигнала по п. 16 формулы изобретения, кодером по п. 17 формулы изобретения, и компьютерной программой по п. 18 формулы изобретения.

В соответствии с настоящим изобретением предлагается устройство для генерирования выходного стереосигнала. Устройство генерирует выходной стереосигнал, имеющий первый выходной канал и второй выходной канал, из входного стереосигнала, имеющего первый входной канал и второй входной канал.

Устройство может включать в себя генератор информации о манипуляции, который выполнен с возможностью генерировать информацию о манипуляции в зависимости от первого значения отсчета сигнала первого входного канала и второго значения отсчета сигнала второго входного канала. Кроме того, устройство включает в себя манипулятор для манипулирования комбинационным сигналом на основе информации о манипуляции для того, чтобы получить первый манипулированный сигнал в качестве первого выходного канала и второй манипулированный сигнал в качестве второго выходного канала.

Комбинационный сигнал представляет собой сигнал, полученный путем комбинирования первого входного канала и второго входного канала. Кроме того, манипулятор может быть выполнен с возможностью манипулирования комбинационным сигналом первым методом, когда первое значение отсчета сигнала находится в первом отношении ко второму значению отсчета сигнала, или отличающимся вторым методом, когда первое значение отсчета сигнала находится в отличающемся втором отношении ко второму значению отсчета сигнала.

Выходной стереосигнал, следовательно, генерируется путем манипулирования комбинационным сигналом. Поскольку комбинационный сигнал получен путем комбинирования первого и второго входных каналов и таким образом содержит информацию об обоих входных стереоканалах, комбинационный сигнал представляет собой подходящее основание для генерирования выходного стереосигнала из двух входных каналов.

В одном варианте осуществления генератор информации о манипуляции выполнен с возможностью генерирования информации о манипуляции в зависимости от первого значения энергии в качестве первого значения отсчета сигнала первого входного канала и второго значения энергии в качестве второго значения отсчета сигнала второго входного канала. Кроме того, манипулятор выполнен с возможностью управлять комбинационным сигналом первым методом, когда первое значение энергии находится в первом отношении ко второму значению энергии, или отличающимся вторым методом, когда первое значение энергии находится в отличающемся втором отношении ко второму значению энергии. В таком варианте осуществления значения энергии первого и второго входных каналов используются в качестве информации о манипуляции. Энергии двух входных каналов обеспечивают подходящее указание того, как манипулировать комбинационным сигналом для того, чтобы получить первый и второй выходные каналы, поскольку они содержат значимую информацию о первом и втором входных каналах.

В другом варианте осуществления устройство дополнительно включает в себя блок вычисления отсчета сигнала для того, чтобы вычислить первое и второе значение отсчета сигнала.

В другом варианте осуществления манипулятор выполнен с возможностью манипулирования комбинационным сигналом, причем комбинационный сигнал представляет разность между первым и вторым входными каналами. Этот вариант осуществления основан на открытии того, что использование разностного сигнала обеспечивает существенные преимущества.

В соответствии с дополнительным вариантом осуществления устройство включает в себя блок преобразователя для того, чтобы преобразовывать первый и второй входные каналы из временной области в частотную область. Это позволяет производить частотно-зависимую обработку источников сигнала.

Кроме того, устройство в соответствии с одним вариантом осуществления может быть выполнено с возможностью генерировать первую весовую маску в зависимости от первого значения отсчета сигнала и вторую весовую маску в зависимости от второго значения отсчета сигнала. Устройство может быть выполнено с возможностью манипулирования комбинационным сигналом путем применения первой весовой маски к значению амплитуды комбинационного сигнала для того, чтобы получить первое значение модифицированной амплитуды, и может быть выполнено с возможностью манипулирования комбинационным сигналом путем применения второй весовой маски к значению амплитуды комбинационного сигнала для того, чтобы получить второе значение модифицированной амплитуды. Первая и вторая весовые маски обеспечивают эффективный способ модификации разностного сигнала на основе первого и второго входных сигналов.

В дополнительном варианте осуществления устройство включает в себя блок комбинирования, который выполнен с возможностью комбинировать первое значение амплитуды и значение фазы комбинационного сигнала для получения первого выходного канала, и комбинировать второе значение амплитуды и значение фазы комбинационного сигнала для получения второго выходного канала. В таком варианте осуществления значение фазы комбинационного сигнала остается без изменений.

В соответствии с другим вариантом осуществления первая и/или вторая весовая маска генерируются путем определения отношения между значением отсчета сигнала первого канала и значением отсчета сигнала второго канала. При этом может использоваться настроечный параметр.

В соответствии с дополнительным вариантом осуществления предусматриваются блок преобразователя и генератор комбинационного сигнала. В этом варианте осуществления входные сигналы преобразуются в частотную область перед тем, как будет сгенерирован комбинационный сигнал. Таким образом можно избежать преобразования комбинационного сигнала в частотную область, что позволяет сократить продолжительность обработки.

Кроме того, предлагаются повышающий микшер, устройство для расширения стереобазы, способ генерирования выходного стереосигнала, устройство для кодирования информации о манипуляции и компьютерная программа для генерирования выходного стереосигнала.

Далее предпочтительные варианты осуществления будут объяснены со ссылками на сопровождающие чертежи, в которых:

Фиг. 1 иллюстрирует устройство для генерирования выходного стереосигнала в соответствии с одним вариантом осуществления;

Фиг. 2 изображает устройство для генерирования выходного стереосигнала в соответствии с другим вариантом осуществления;

Фиг. 3 показывает устройство для генерирования выходного стереосигнала в соответствии с дополнительным вариантом осуществления;

Фиг. 4 иллюстрирует другой вариант осуществления устройства для генерирования выходного стереосигнала;

Фиг. 5 иллюстрирует диаграмму, показывающую различные зависимости весовых масок от значений энергии в соответствии с одним вариантом осуществления настоящего изобретения;

Фиг. 6 изображает устройство для генерирования выходного стереосигнала в соответствии с дополнительным вариантом осуществления;

Фиг. 7 иллюстрирует повышающий микшер в соответствии с одним вариантом осуществления;

Фиг. 8 изображает повышающий микшер в соответствии с дополнительным вариантом осуществления;

Фиг. 9 показывает устройство для расширения стереобазы в соответствии с одним вариантом осуществления;

Фиг. 10 изображает кодер в соответствии с одним вариантом осуществления.

Фиг. 1 иллюстрирует устройство для генерирования выходного стереосигнала в соответствии с одним вариантом осуществления. Устройство включает в себя генератор 110 информации о манипуляции и манипулятор 120. Генератор 110 информации о манипуляции выполнен с возможностью генерировать первую информацию о манипуляции GL в зависимости от значения отсчета сигнала VL первого канала входного стереосигнала. Кроме того, генератор 110 информации о манипуляции выполнен с возможностью генерировать вторую информацию о манипуляции GR в зависимости от значения отсчета сигнала VR второго канала входного стереосигнала.

В одном варианте осуществления значение отсчета сигнала VL первого канала является значением энергии первого канала, а значение отсчета сигнала VR второго канала является значением энергии второго канала. В другом варианте осуществления значение отсчета сигнала VL первого канала является значением амплитуды первого канала, а значение отсчета сигнала VR второго канала является значением амплитуды второго канала.

Сгенерированная информация о манипуляции GL, GR передается манипулятору 120. Кроме того, комбинационный сигнал d подается в манипулятор 120. Комбинационный сигнал d получается из первого и второго входных каналов входного стереосигнала.

Манипулятор 120 генерирует первый манипулированный сигнал dL на основе первой информации о манипуляции GL и комбинационного сигнала d. Кроме того, манипулятор 120 также генерирует второй манипулированный сигнал dR на основе второй информации о манипуляции GR и комбинационного сигнала d. Манипулятор 120 выполнен с возможностью управлять комбинационным сигналом d первым методом, когда первое значение отсчета сигнала VL находится в первом отношении ко второму значению отсчета сигнала VR, или отличающимся вторым методом, когда первое значение отсчета сигнала VL находится в отличающемся втором отношении ко второму значению отсчета сигнала VR.

В одном варианте осуществления комбинационный сигнал d представляет собой разностный сигнал. Например, второй канал входного стереосигнала может быть вычтен из первого канала входного стереосигнала. Использование разностного сигнала в качестве комбинационного сигнала основано на открытии того, что разностный сигнал является особенно подходящим для модификации с целью генерирования выходного стереосигнала. Это открытие основано на следующем:

(Монофонический) разностный сигнал, также называемый “S” (боковой) сигнал, генерируется из левого и правого каналов входного стереосигнала, например, во временной области, путем применения следующей формулы:

S = x L x R ,

где S: разностный сигнал;

xL: левый входной сигнал;

xR: правый входной сигнал.

Используя вышеприведенные определения для xL и xR, получаем:

S = x L x R = ( k s k + n 1 ) ( k a k s k + n 2 )

Посредством генерирования разностного сигнала в соответствии с вышеприведенной формулой источники звука sk, которые одинаково присутствуют в обоих входных каналах (ak=1), удаляются при генерировании разностного сигнала. (Предполагается, что источники звука, которые одинаково присутствуют в обоих входных стереоканалах, находятся в центральном местоположении перед слушателем.) Кроме того, источники звука sk, которые панорамированы таким образом, что источник звука почти одинаково присутствует в обоих каналах входного стереосигнала (ak≈1), будут сильно ослаблены в разностном сигнале.

Однако источники звука, которые панорамируются таким образом, что они присутствуют только (или главным образом) в левом канале входного стереосигнала (ak→0), не будут ослаблены вообще (или будут только немного ослаблены). Кроме того, источники звука, которые панорамируются таким образом, что они присутствуют только (или главным образом) в правом канале (ak>>1), также не будут ослаблены вообще (или будут только немного ослаблены).

Вообще, части n1 и n2 сигнала окружения левого и правого каналов входного стереосигнала являются только слегка коррелированными. Следовательно, они будут только немного ослаблены при формировании разностного сигнала.

Разностный сигнал может использоваться в процессе генерирования выходного стереосигнала. Если S-сигнал генерируется во временной области, не образуется никаких артефактов.

Фиг. 2 иллюстрирует устройство для генерирования системы стереовывода в соответствии с другим вариантом осуществления настоящего изобретения. Устройство включает в себя генератор информации о манипуляции 210, манипулятор 220 и, кроме того, блок 230 вычисления отсчета сигнала.

Первый канал xL и второй канал xR входного стереосигнала подаются в блок 230 вычисления отсчета сигнала. Блок 230 вычисления отсчета сигнала вычисляет первое значение отсчета сигнала VL, относящееся к первому входному каналу xL, и второе значение отсчета сигнала VR, относящееся ко второму входному каналу xL. Например, первое значение энергии первого входного канала xL вычисляется как первое значение отсчета сигнала VL, а второе значение энергии второго входного канала xR вычисляется как второе значение отсчета сигнала VR. Альтернативно, первое значение амплитуды первого входного канала xL вычисляется как первое значение отсчета сигнала VL, а второе значение амплитуды второго входного канала xR вычисляется как второе значение отсчета сигнала VR.

В других вариантах осуществления в блок 230 вычисления отсчета сигнала подаются более чем два канала, и вычисляются более чем два значения отсчетов сигнала, в зависимости от количества каналов входа, которые подаются в блок 230 вычисления отсчета сигнала.

Вычисленные значения отсчетов сигнала VL, VR подаются в генератор 210 информации о манипуляции.

Генератор 210 информации о манипуляции выполнен с возможностью генерирования информации о манипуляции GL в зависимости от первого значения отсчета сигнала VL первого канала xL входного стереосигнала и генерирования информации о манипуляции GR в зависимости от второго значения отсчета сигнала VR второго канала xR входного стереосигнала. На основе информации о манипуляции GL, GR, сгенерированной генератором 210 информации о манипуляции, манипулятор 220 генерирует первый и второй манипулированный сигнал dL, dR в качестве первого и второго выходного канала выходного стереосигнала, соответственно. Кроме того, манипулятор 220 выполнен с возможностью управлять комбинационным сигналом d первым методом, когда первое значение отсчета сигнала VL находится в первом отношении ко второму значению отсчета сигнала VR, или отличающимся вторым методом, когда первое значение отсчета сигнала VL находится в отличающемся втором отношении ко второму значению отсчета сигнала VR.

Фиг. 3 иллюстрирует устройство для генерирования выходного стереосигнала. Входной стереосигнал, имеющий два входных канала xL(t), xR(t), которые представлены во временной области, подается в блок 320 преобразователя и в генератор 310 комбинационного сигнала. Первый xL(t) и второй xR(t) входные каналы могут быть левым xL(t) и правым xR(t) входными каналами входного стереосигнала, соответственно. Входные сигналы xL(t), xR(t) могут быть сигналами дискретного времени.

Генератор 310 комбинационного сигнала генерирует комбинационный сигнал d(t) на основе первого xL(t) и второго xR(t) входных каналов входного стереосигнала. Сгенерированный комбинационный сигнал d(t) может быть сигналом d(t) дискретного времени. В одном варианте осуществления комбинационный сигнал d(t) может быть разностным сигналом и может, например, генерироваться посредством вычитания второго (например, правого) входного канала xR(t) из первого (например, левого) входного канала xL(t) или наоборот, например, посредством применения следующей формулы:

d(t)=xL(t)-xR(t).

В другом варианте осуществления используются другие виды комбинационных сигналов. Например, генератор 310 комбинационного сигнала может генерировать комбинационный сигнал d(t) в соответствии с формулой:

d(t)=a·xL(t)-b·xR(t)

Параметры a и b называются управляющими параметрами. Посредством выбора управляющих параметров a и b так, что а отличается от b, даже сигнал источник звука, который не присутствует в равной степени в каналах xL(t), xR(t) входного стереосигнала, может быть удален при генерировании комбинационного сигнала d(t). Таким образом, путем выбора управляющего параметра а, отличного от управляющего параметра b, возможно удалить источники звука, которые были расположены, например, с использованием амплитудного разнесения, слева от центра или справа от центра.

Например, рассмотрим случай, где источник звука r(t) был расположен таким образом, что он кажется исходящим из положения слева от центра, например, посредством установки:

xL(t)=2·r(t) ·f(t); и

xR(t)=0,5·r(t)+g(t).

Тогда установка управляющих параметров a и b в значения а=0,5 и b=2 удаляет источник сигнала r(t) из комбинационного сигнала:

d(t)=a·xL(t)-b·xR(t)

=a·(2·r(t)+f(t))-b·(0,5·r(t)+g(t))

=0,5·(2·r(t)+f(t))-2·(0,5·r(t)+g(t))

=0,5·f(t)-2·g(t);

В вариантах осуществления комбинационный сигнал d(t)=a·xL(t)-b·xR(t) используется для удаления источника звука, исходящего из определенного положения, из комбинационного сигнала посредством установки подходящих значений управляющих параметров a и b. Доминирующий источник звука может, например, быть доминирующим инструментом в музыкальной записи, например, в записи оркестра. Значения управляющих параметров a, b могут быть установлены таким образом, что звуки, исходящие из положения доминирующего источник звука, будут удалены при генерировании комбинационного сигнала.

В одном варианте осуществления управляющие параметры a и b могут быть динамически подстроены в зависимости от входных каналов xL(t), xR(t) входного стереосигнала. Например, генератор 310 комбинационного сигнала может быть настроен, чтобы динамически подстраивать управляющие параметры a и b таким образом, чтобы доминирующий источник звука удалялся из комбинационного сигнала. Положение доминирующего источника звука может меняться. В один момент времени доминирующий источник звука расположен в первом положении, а в другой момент времени доминирующий источник звука расположен в отличающемся втором положении либо потому, что доминирующий источник звука движется, либо потому, что другой источник звука стал доминирующим источником звука в записи. Посредством динамической подстройки управляющих параметров a и b фактический доминирующий источник звука может быть удален из комбинационного сигнала.

В дополнительном варианте осуществления энергетическое отношение первого и второго входных сигналов может быть доступным в генераторе 310 комбинационного сигнала. Энергетическое отношение может, например, указывать отношение значения энергии первого входного канала xL(t) к значению энергии второго входного канала xR(t). В таком варианте осуществления значения управляющих параметров a и b могут быть динамически определены на основе этого энергетического отношения.

В одном варианте осуществления значения управляющих параметров a и b могут, например, быть выбраны таким образом, что а=1; и b=E(xL(t))/E(xR(t)); (E(y)=значение энергии y). В других вариантах осуществления могут использоваться другие правила для определения значений управляющих параметров a и b.

Кроме того, в другом варианте осуществления генератор комбинационного сигнала может самостоятельно определять энергетическое отношение первого и второго входных каналов xL(t), xR(t), например, путем анализа энергетического отношения входных каналов во временной области или в частотной области.

В дополнительном варианте осуществления отношение амплитуд первого и второго входных каналов xL(t), xR(t) доступны в генераторе 310 комбинационного сигнала. Отношение амплитуд может, например, отражать отношение значения амплитуды первого входного канала xL(t) к значению амплитуды второго входного канала xR(t). В таком варианте осуществления значения управляющих параметров a, b могут быть динамически определены на основе отношения амплитуд. Определение управляющих параметров a и b может быть проведено аналогично вариантам осуществления, в которых значения управляющих параметров a и b определяются на основе энергетического отношения. В дополнительном варианте осуществления генератор комбинационного сигнала может самостоятельно определять амплитудное отношение первого и второго входных каналов xL(t), xR(t), например, посредством преобразования входных каналов xL(t), xR(t) из временной области в частотную область, например, посредством применения БПФ (быстрого преобразования Фурье), посредством определения значений амплитуды представлений в частотной области обоих каналов xL(t), xR(t), и посредством установки одного или множества значений амплитуды первого входного канала xL(t) в отношении к одному или множеству значений амплитуды второго входного канала xR(t). Когда множество значений амплитуды первого входного канала xL(t) устанавливается в отношении ко множеству значений амплитуды второго входного канала xR(t), могут быть вычислены среднее значение для первого множества и среднее значение для второго множества значений амплитуды.

Устройство в варианте осуществления, изображенном на Фиг. 3, дополнительно включает в себя первый блок преобразователя 320. Генератор 310 комбинационного сигнала подает комбинационный сигнал d(t) в первый блок преобразователя 320. Кроме того, первый xL(t) и второй xR(t) входные каналы входного стереосигнала также подаются в первый блок преобразователя 320. Первый блок преобразователя 320 преобразует первый входной канал xL(t), второй входной канал xR(t) и разностный сигнал d(t) в частотную область путем использования подходящего способа преобразования.

В варианте осуществления, изображенном на Фиг. 3, первый блок преобразователя 320 использует группу фильтров для того, чтобы преобразовать входные каналы дискретного времени xL(t), xR(t), а также разностный сигнал дискретного времени d(t) в частотную область, например, посредством использования быстрого преобразования Фурье (STFT, Short-Time Fourier Transform). В других вариантах осуществления первый блок преобразователя 320 может быть выполнен с возможностью использовать другие виды способов преобразования, например группу фильтров QMF (квадратурный зеркальный фильтр), для преобразования сигналов из временной области в частотную область.

После преобразования входных каналов xL(t), xR(t) и разностного сигнала d(t) посредством использования быстрого преобразования Фурье, разностный сигнал в частотной области D(m,k) и первый XL(m,k) и второй XR(m,k) входные каналы в частотной области представляют комплексные спектры. Индекс m является индексом времени быстрого преобразования Фурье, а индекс k является частотным индексом.

Первый блок преобразователя 320 подает комплексный сигнал D(m,k) в частотной области разностного сигнала в амплитудно-фазовый вычислительный блок 350. Амплитудно-фазовый вычислительный блок вычисляет амплитудные спектры │D(m,k)│ и фазовые спектры φD(m,k) из комплексных спектров разностного сигнала D(m,k) в частотной области.

Кроме того, первый блок преобразователя 320 подает комплексные первый XL(m,k) и второй XR(m,k) входные каналы в частотной области в блок 330 вычисления отсчета сигнала. Блок 330 вычисления отсчета сигнала вычисляет первые значения отсчета сигнала из первого входного канала в частотной области XL(m,k) и вторые значения отсчета сигнала из второго входного канала в частотной области XR(m,k). Более конкретно, в варианте осуществления, изображенном на Фиг. 3, блок 330 вычисления отсчета сигнала вычисляет первые значения энергии EL(m,k) в качестве первых значений отсчета сигнала из первого входного канала в частотной области XL(m,k) и вторые значения энергии ER(m,k) в качестве вторых значений отсчета сигнала из второго входного канала в частотной области XR(m,k).

Блок 330 вычисления отсчета сигнала рассматривает каждую часть сигнала, например, каждый частотно-временной дискрет (m,k) первого XL(m,k) и второго XR(m,k) входных каналов в частотной области. Относительно каждого частотно-временного дискрета блок 330 вычисления отсчета сигнала в варианте осуществления, изображенном на Фиг. 3, вычисляет первую энергию EL(m,k), относящуюся к первому входному каналу в частотной области XL(m,k) и вторую энергию ER(m,k), относящуюся ко второму входному каналу в частотной области XR(m,k). Например, первая и вторая энергии EL(m,k) и ER(m,k) могут быть вычислены в соответствии с формулами:

E L ( m , k ) = ( Re { X L ( m , k ) } ) 2 + ( Im { X L ( m , k ) } ) 2

E R ( m , k ) = ( Re { X R ( m , k ) } ) 2 + ( Im { X R ( m , k ) } ) 2

В другом варианте осуществления блок 330 вычисления отсчета сигнала вычисляет значения амплитуды первого XL(m,k) входного канала в частотной области в качестве первых значений отсчетов сигнала и значения амплитуды второго XR(m,k) входного канала в частотной области в качестве вторых значений отсчетов сигнала. В таком варианте осуществления блок 330 вычисления отсчета сигнала может определить значение амплитуды для каждого частотно-временного дискрета первого входного сигнала в частотной области XL(m,k) для того, чтобы получить первые значения отсчетов сигнала. Кроме того, блок 330 вычисления отсчета сигнала может определить значение амплитуды для каждого частотно-временного дискрета второго входного сигнала в частотной области XR(m,k) для того, чтобы получить вторые значения отсчетов сигнала.

Блок 330 вычисления отсчета сигнала, изображенный на Фиг. 3, передает значения отсчетов сигнала, например, значения энергии EL(m,k), ER(m,k), первого и второго входных каналов XL(m,k), XR(m,k) генератору 340 информации о манипуляции.

В варианте осуществления, показанном на Фиг. 3, генератор 340 информации о манипуляции генерирует весовую маску, например, весовой коэффициент, для каждого частотно-временного дискрета каждого входного сигнала XL(m,k), XR(m,k). В зависимости от отношения первого и второго значений отсчетов сигнала, например, в зависимости от энергетических отношений левого и правого сигналов в частотной области, генерируются весовая маска GL(m,k), относящаяся к первому входному сигналу XL(m,k), и весовая маска GR(m,k), относящаяся ко второму входному сигналу XR(m,k). Относительно конкретного частотно-временного дискрета, GL(m,k) имеет значение, близкое к 1, если EL(m,k)>>ER(m,k). С другой стороны, GL(m,k) имеет значение, близкое к 0, если ER(m,k)>>EL(m,k). Для правой весовой маски применяются противоположные правила. В тех вариантах осуществления, где генератор информации о манипуляции принимает значения амплитуды в качестве первого и второго значений отсчетов сигнала, аналогично применяется то же самое.

Весовые маски могут быть вычислены, например, в соответствии с формулами:

G L ( m , k ) = E L ( m , k ) E L ( m , k ) + E R ( m , k ) ; и

G R ( m , k ) = E R ( m , k ) E L ( m , k ) + E R ( m , k ) .

Для вычисления весовых масок может использоваться настраиваемый параметр, что становится актуальным, если источник звука не расположен в крайнем левом или в крайнем правом положении, но находится в промежутке между ними. Другие примеры того, как вычислять весовые маски GL(m,k), GR(m,k), будут описаны позже со ссылкой на Фиг. 5.

Блок 330 вычисления значения сигнала подает сгенерированную первую весовую маску GL(m,k) в первый манипулятор 360. Кроме того, амплитудно-фазовый вычислительный блок 350 подает значения амплитуды │D(m,k)│ разностного сигнала D(m,k) в первый манипулятор 360. Первая весовая маска GL(m,k) затем применяется к значению амплитуды разностного сигнала для того, чтобы получить первое значение модифицированной амплитуды │DL(m,k)│ разностного сигнала D(m,k). Первая весовая маска GL(m,k) может быть применена к значению амплитуды │D(m,k)│ разностного сигнала D(m,k), например, посредством умножения значения амплитуды │D(m,k)│ на GL(m,k), где │D(m,k)│ и GL(m,k) относятся к одному и тому же частотно-временному дискрету (m,k). Первый манипулятор 360 генерирует модифицированные значения амплитуды │DL(m,k)│ для всех частотно-временных дискретов, для которых он принимает значение весовой маски GL(m,k) и значение амплитуды разностного сигнала │D(m,k)│.

Кроме того, блок 330 вычисления значения сигнала подает сгенерированную вторую весовую маску GR(m,k) во второй манипулятор 370. Кроме того, амплитудно-фазовый вычислительный блок 350 подает амплитудные спектры │D(m,k)│ разностного сигнала D(m,k) во второй манипулятор 370. Вторая весовая маска GR(m,k) затем применяется к значению амплитуды разностного сигнала для того, чтобы получить второе значение модифицированной амплитуды │DL(m,k)│ разностного сигнала D(m,k). Опять же, вторая весовая маска GR(m,k) может быть применена к значению амплитуды │D(m,k)│ разностного сигнала D(m,k), например, посредством умножения значения амплитуды │D(m,k)│ на GR(m,k), где │D(m,k)│ и GR(m,k) относятся к одному и тому же частотно-временному дискрету (m,k). Второй манипулятор 370 генерирует модифицированные значения амплитуды │DR(m,k)│ для всех частотно-временных дискретов, для которых он принимает значение весовой маски GR(m,k) и значение амплитуды разностного сигнала │D(m,k)│.

Первые значения модифицированной амплитуды │DL(m,k)│, так же как и вторые значения модифицированной амплитуды │DR(m,k)│, подаются в блок 380 комбинирования. Блок 380 комбинирования комбинирует каждое из первых значений модифицированной амплитуды │DL(m,k)│ с соответствующим значением фазы (значением фазы, которое относится к тому же самому частотно-временному дискрету) разностного сигнала φD(m,k), для того, чтобы получить комплексный первый выходной канал в частотной области DL(m,k). Кроме того, блок 380 комбинирования комбинирует каждое из вторых значений модифицированной амплитуды │DR(m,k)│ с соответствующим значением фазы (которое относится к тому же самому частотно-временному дискрету) разностного сигнала φD(m,k), для того, чтобы получить комплексный второй выходной канал в частотной области DR(m,k).

В соответствии с другим вариантом осуществления блок 380 комбинирования комбинирует каждое из первых значений амплитуды │DL(m,k)│ с соответствующим значением фазы (значением фазы, которое относится к тому же самому частотно-временному дискрету) первого, например, левого, входного канала XL(m,k), и кроме того комбинирует каждое из вторых значений амплитуды │DR(m,k)│ с соответствующим значением фазы (значением фазы, которое относится к тому же самому частотно-временному дискрету) второго, например, правого, входного канала XR(m,k).

В других вариантах осуществления первое │DL(m,k)│ и второе │DR(m,k)│ значения амплитуды могут быть скомбинированы с комбинированным значением фазы. Такое комбинированное значение фазы φcomb(m,k) может, например, быть получено путем комбинирования значения фазы первого входного сигнала φx1(m,k) и значения фазы второго входного сигнала φx2(m,k), например, посредством применения следующей формулы:

φcomb(m,k)=(φx1(m,k)+φx2(m,k))/2.

В других вариантах осуществления первая комбинация первого и второго значений амплитуды применяется к значениям фазы первого входного сигнала, а вторая комбинация первого и второго значений амплитуды применяется к значениям фазы второго входного сигнала.

Блок 380 комбинирования, изображенный на Фиг. 3, подает сгенерированные первый и второй комплексные выходные сигналы в частотной области DL(m,k), DR(m,k) во второй блок преобразователя 390. Второй блок преобразователя 390 преобразует первый и второй комплексные выходные сигналы в частотной области DL(m,k), DR(m,k) во временную область, например, посредством выполнения обратного быстрого преобразования Фурье (ISTFT, Inverse Short-Time Fourier Transform) для того, чтобы получить первый выходной сигнал во временной области dL(t) из первого выходного сигнала в частотной области DL(m,k) и второй выходной сигнал во временной области dR(t) из второго выходного сигнала в частотной области DR(m,k), соответственно.

Фиг. 4 иллюстрирует дополнительный вариант осуществления. Вариант осуществления, изображенный на Фиг. 4, отличается от варианта осуществления, изображенного на Фиг. 3, тем, что блок преобразователя 420 только преобразует первый и второй входные каналы xL(t), xR(t) из временной области в спектральную область. Однако блок преобразователя не преобразует комбинационный сигнал. Вместо этого предусмотрен генератор 410 комбинационного сигнала, который генерирует комбинационный сигнал в частотной области из первого и второго входных каналов в частотной области XL(m,k) и XR(m,k). Поскольку комбинационный сигнал сгенерирован в частотной области, стадия преобразования не требуется, так как не требуется преобразование комбинационного сигнала в частотную область. Генератор 410 комбинационного сигнала может, например, генерировать разностный сигнал в частотной области, например, посредством применения следующей формулы для каждого частотно-временного дискрета:

D(m,k)=XL(m,k)-XR(m,k).

В другом варианте осуществления генератор комбинационного сигнала может использовать любой другой вид комбинационного сигнала, например:

D(m,k)=a·XL(m,k)-b·XR(m,k).

Фиг. 5 иллюстрирует отношение между весовыми масками GL, GR и значениями энергии EL, ER, принимая во внимание настроечный параметр α. В то время как последующие объяснения прежде всего относятся к отношению весовых масок и значений энергии, они одинаково применимы к отношению весовых масок и значений амплитуды, например в том случае, когда генератор информации о манипуляции генерирует весовые маски на основе значений амплитуды первого и второго входных каналов. Следовательно, объяснения и формулы одинаково применимы для значений амплитуды.

Концептуально весовые маски генерируются на основе правил для вычисления центра тяжести между двумя точками:

x c = m 1 x 1 + m 2 x 2 m 1 + m 2

где xc: центр тяжести;

x1: точка 1;

x2: точка 2;

m1: масса точки 1;

m2: масса точки 2.

Если эта формула используется для того, чтобы вычислить "центр тяжести" значений энергии EL(m,k) и ER(m,k), это приводит к следующей формуле:

C ( m , k ) = E L ( m , k ) x 1 + E R ( m , k ) x 2 E L ( m , k ) + E R ( m , k )

где C ( m , k ) : центр тяжести значений энергии EL(m,k) и ER(m,k).

Для того, чтобы получить весовую маску для левого канала, значение x1 устанавливается равным x1=1, а значение x2 устанавливается равным x2=0:

G L ( m , k ) = E L ( m , k ) E L ( m , k ) + E R ( m , k ) ,

Такая весовая маска GL(m,k) дает желаемый результат, что GL(m,k)→1 в случае панорамируемых в левой области сигналов (EL(m,k)>>ER(m,k)), и желаемый результат, что GL(m,k)→0 в случае панорамируемых в правой области сигналов (ER(m,k)>>EL(m,k)).

Аналогичным образом весовая маска для правого канала получается путем установки значений x1=0 и x2=1:

G R ( m , k ) = E R ( m , k ) E L ( m , k ) + E R ( m , k ) ,

Такая весовая маска GR(m,k) дает желаемый результат, что GR(m,k)→1 в случае панорамируемых в правой области сигналов (ER(m,k)>>EL(m,k)), и желаемый результат, что GR(m,k)→0 в случае панорамируемых в левой области сигналов (EL(m, k)>>ER(m,k)).

В случае центрально панорамируемых входных сигналов (EL(m,k)=ER(m,k)) весовые маски GL(m,k) и GR(m,k) равны 0,5. Параметр α используется для управления поведением весовых масок по отношению к центрально панорамируемым сигналам и сигналам, которые панорамируются близко к центру, где α представляет собой экспоненту, применяемую к весовым маскам в соответствии с формулами:

G L ( m , k ) = ( E L ( m , k ) E L ( m , k ) + E R ( m , k ) ) α

G R ( m , k ) = ( E R ( m , k ) E L ( m , k ) + E R ( m , k ) ) α

Весовые маски GL(m,k) и GR(m,k) рассчитываются по этим формулам на основе энергий.

Как указано выше, эти формулы одинаково применимы для значений амплитуды |XL(m,k)|, |XR(m,k)| первого и второго входных каналов. В этом случае EL(m,k) принимает значение |XL(m,k)|, а ER(m,k) принимает значение |XR(m,k)|, например, в тех вариантах осуществления, где генератор информации о манипуляции генерирует весовые маски на основе значений амплитуды вместо значений энергии.

Фиг. 5 иллюстрирует эффекты применения настроечного параметра α посредством кривых, относящихся к различным значениям настроечного параметра. Если значение α установлено в α=0,4, дискреты, которые включают в себя равные или подобные энергии в левом и правом входных каналах, немного ослабляются. Только те дискреты, которые имеют значительно более высокую энергию в правом канале, сильно ослабляются левой весовой маской GL(m,k). Аналогично, те дискреты, которые имеют значительно более высокую энергию в левом канале, сильно ослабляются правой весовой маской GR(m,k). Поскольку только небольшое количество частей сигнала сильно ослабляются таким фильтром, такая установка настроечного параметра может упоминаться как “низкая селективность”.

Более высокое значение параметра, например, α=2 приводит к значительно “более высокой селективности”. Как можно видеть на Фиг. 5, дискреты, имеющие равную или подобную энергию в левом и правом каналах, сильно ослабляются. В зависимости от применения желаемая селективность может управляться настроечным параметром α.

Фиг. 6 иллюстрирует устройство для генерирования выходного стереосигнала в соответствии с дополнительным вариантом осуществления. Устройство, изображенное на Фиг. 6, отличается от варианта осуществления, изображенного на Фиг. 3, среди прочего тем, что оно дополнительно включает в себя блок 605 задержки сигнала. Первый xLA(t) и второй xRA(t) входные каналы входного стереосигнала подаются в блок 605 задержки сигнала. Первый и второй входные каналы xLA(t), xRA(t) также подаются в первый блок преобразователя 620.

Блок 605 задержки сигнала выполнен с возможностью задерживать первый входной канал xLA(t) и/или второй входной канал xRA(t). В одном варианте осуществления блок задержки сигнала определяет время задержки, используя корреляционный анализ первого и второго входных каналов xLA(t), xRA(t). Например, xLA(t) и xRA(t) сдвигаются во времени постадийно. Для каждой стадии проводится корреляционный анализ. Затем определяется временной сдвиг с максимальной корреляцией. Предполагая, что для размещения источника сигнала во входном стереосигнале использовалось панорамирование посредством задержки, так что звук кажется исходящим из конкретного положения, временной сдвиг с максимальной корреляцией, как предполагается, соответствует задержке, заданной при панорамировании посредством задержки. В одном варианте осуществления блок задержки сигнала может перестроить панорамированный задержкой источник сигнала таким образом, что он переместится к центральному положению. Например, если корреляционный анализ указывает на то, что входной канал xLA(t) был задержан на Δt, тогда блок 605 задержки сигнала задерживает входной канал xRA(t) на эту же величину Δt.

В конечном счете модифицированные первый xLB(t) и второй xRB(t) каналы затем подаются в генератор 620 комбинационного сигнала, который генерирует комбинационный сигнал. В одном варианте осуществления генератор комбинационного сигнала генерирует разностный сигнал в качестве комбинационного сигнала посредством применения следующей формулы:

d(t)=xLB(t)-xRB(t).

Поскольку панорамированный задержкой источник сигнала был перемещен к центральному положению, источник сигнала тогда одинаково присутствует в модифицированных первом и втором каналах xLB(t), xRB(t), и поэтому будет удален из разностного сигнала d(t). Следовательно, посредством использования устройства в соответствии с вариантом осуществления, показанным на Фиг. 6, возможно сгенерировать комбинационный сигнал без соответствующих панорамированных задержкой источников сигнала.

Фиг. 7 иллюстрирует повышающий микшер 700 для повышающего микширования входного стереосигнала до пяти выходных каналов, например, до пяти каналов системы объемного звучания. Входной стереосигнал имеет первый входной канал L и второй входной канал R, которые подаются в повышающий микшер 700. Пять выходных каналов могут быть центральным каналом, левым передним каналом, правым передним каналом, левым окружающим каналом и правым окружающим каналом. Центральный канал, левый передний канал, правый передний канал, левый окружающий канал и правый окружающий канал выводятся соответственно на центральный громкоговоритель 720, левый передний громкоговоритель 730, правый передний громкоговоритель 740, левый окружающий громкоговоритель 750 и правый окружающий громкоговоритель 760. Громкоговорители могут быть размещены вокруг места 710 слушателя.

Повышающий микшер 700 генерирует центральный канал для центрального громкоговорителя 720 посредством сложения левого входного канала L и правого входного канала R входного стереосигнала. Повышающий микшер 700 может подавать левый входной канал L неизмененным на левый передний громкоговоритель 730, и может дополнительно подавать правый входной канал R неизмененным на правый передний громкоговоритель 740. Кроме того, повышающий микшер включает в себя устройство 770 для генерирования выходного стереосигнала в соответствии с одним из вышеописанных вариантов осуществления. Левый входной канал L и правый входной канал R подаются в устройство 770 в качестве первого и второго входных каналов устройства 770 для генерирования выходного стереосигнала, соответственно. Первый выходной канал устройства 770 выводится на левый окружающий динамик 750 в качестве левого окружающего канала, в то время как второй выходной канал устройства 770 выводится на правый окружающий динамик 760 в качестве правого окружающего канала.

Фиг. 8 иллюстрирует дополнительный вариант осуществления повышающего микшера 800, имеющего пять выходных каналов, например, пять каналов системы объемного звучания. Входной стереосигнал имеет первый входной канал L и второй входной канал R, которые подаются в повышающий микшер 800. Как и в варианте осуществления, показанном на Фиг. 7, пять выходных каналов могут быть центральным каналом, левым передним каналом, правым передним каналом, левым окружающим каналом и правым окружающим каналом. Центральный канал, левый передний канал, правый передний канал, левый окружающий канал и правый окружающий канал выводятся соответственно на центральный громкоговоритель 820, левый передний громкоговоритель 830, правый передний громкоговоритель 840, левый окружающий громкоговоритель 850 и правый окружающий громкоговоритель 860. Опять же, громкоговорители могут быть размещены вокруг места 810 слушателя.

Центральный канал, выводимый на центральный громкоговоритель 820, генерируется посредством сложения левого входного канала L и правого входного канала R. Кроме того, повышающий микшер включает в себя устройство 870 для генерирования выходного стереосигнала в соответствии с одним из вышеописанных вариантов осуществления. Левый входной канал L и правый входной канал R подаются в устройство 870. Устройство 870 генерирует первый и второй выходные каналы выходного стереосигнала. Первый выходной канал выводится на левый передний громкоговоритель 830; второй выходной канал выводится на правый передний громкоговоритель 840. Кроме того, первый и второй выходные каналы, сгенерированные устройством 870, подаются к экстрактору 880 окружения. Экстрактор 880 окружения извлекает первый компонент сигнала окружения из первого выходного канала, сгенерированного устройством 870, и выводит первый компонент сигнала окружения на левый окружающий громкоговоритель 850 в качестве левого окружающего канала. Кроме того, экстрактор 880 окружения извлекает второй компонент сигнала окружения из выходного канала, сгенерированного устройством 870, и выводит второй компонент сигнала окружения на правый окружающий громкоговоритель 860 в качестве правого окружающего канала.

Фиг. 9 иллюстрирует устройство 900 для расширения стереобазы в соответствии с одним вариантом осуществления. На Фиг. 9 первый входной канал L и второй входной канал R входного стереосигнала подаются в устройство 900. Устройство 900 для расширения стереобазы включает в себя устройство 910 для генерирования выходного стереосигнала в соответствии с одним из вышеописанных вариантов осуществления. Первый и второй входные каналы L, R устройства 900 для расширения стереобазы подаются в устройство 910 для генерирования выходного стереосигнала.

Первый выходной канал устройства 910 для генерирования выходного стереосигнала подается в первый блок 920 комбинирования, который комбинирует первый входной канал L и первый выходной канал устройства 910 для генерирования выходного стереосигнала для того, чтобы сгенерировать первый выходной канал устройства 900 для расширения стереобазы.

Соответственно, второй выходной канал устройства 910 для генерирования выходного стереосигнала подается во второй блок 930 комбинирования, который комбинирует второй входной канал R и второй выходной канал устройства 910 для генерирования выходного стереосигнала для того, чтобы сгенерировать второй выходной канал устройства 900 для расширение стереобазы.

Посредством этого генерируется расширенный выходной стереосигнал. Блоки комбинирования могут комбинировать оба принятых канала, например, путем сложения обоих каналов, путем использования линейной комбинации обоих каналов, или другим способом комбинирования двух каналов.

Фиг. 10 иллюстрирует кодер в соответствии с одним вариантом осуществления. Первый XL(m,k) и второй XR(m,k) каналы стереосигнала подаются в кодер. Стереосигнал может быть представлен в частотной области.

Кодер включает в себя блок 1010 вычисления отсчета сигнала для определения первого значения отсчета сигнала VL и второго значения отсчета сигнала VR первого и второго каналов XL(m,k), XR(m,k) стереосигнала, например, первого и второго значений энергии EL(m,k), ER(m,k) первого и второго каналов XL(m,k), XR(m,k). Кодер может быть выполнен с возможностью определения значений энергии EL(m,k), ER(m,k) тем же способом, что и устройство для генерирования выходного стереосигнала в вышеописанных вариантах осуществления. Например, кодер может определять значения энергии путем использования следующих формул:

E L ( m , k ) = ( Re { X L ( m , k ) } ) 2 + ( Im { X L ( m , k ) } ) 2

E R ( m , k ) = ( Re { X R ( m , k ) } ) 2 + ( Im { X R ( m , k ) } ) 2 .

В другом варианте осуществления блок 1010 вычисления отсчета сигнала может определять значения амплитуды первого и второго каналов XL(m,k), XR(m,k). В таком варианте осуществления блок 1010 вычисления отсчета сигнала может определять значения амплитуды первого и второго каналов XL(m,k), XR(m,k) тем же способом, что и устройство для генерирования выходного стереосигнала в вышеописанных вариантах осуществления.

Блок 1010 вычисления значения сигнала подает определенные значения энергии EL(m,k), ER(m,k) и/или определенные значения амплитуды в генератор 1020 информации о манипуляции. Генератор 1020 информации о манипуляции затем генерирует информацию о манипуляции, например, первый GL(m,k) и второй GR(m,k) весовые маски на основе принятых значений энергии EL(m,k), ER(m,k) и/или значений амплитуды посредством применения концепций, подобных используемым в устройстве для генерирования выходного стереосигнала в вышеописанных вариантах осуществления, в частности, как объяснено со ссылкой на Фиг. 5.

В одном варианте осуществления генератор 1020 информации о манипуляции может определять информацию о манипуляции на основе значений амплитуды первого и второго каналов XL(m,k), XR(m,k). В таком варианте осуществления генератор 1020 информации о манипуляции может применять концепции, подобные используемым в устройстве для генерирования выходного стереосигнала в вышеописанных вариантах осуществления.

Генератор 1020 информации о манипуляции затем передает весовые маски GL(m,k) и GR(m,k) модулю 1030 вывода.

Модуль 1030 вывода выводит информацию о манипуляции, например, весовые маски GL(m,k) и GR(m,k), в подходящем формате данных, например, в виде потока битов или как значения сигнала.

Выведенная информация о манипуляции может быть передана к декодеру, который генерирует выходной стереосигнал посредством применения переданной информации о манипуляции, например, посредством комбинирования переданных весовых масок с разностным сигналом или с входным стереосигналом, как описано со ссылкой на вышеописанные варианты осуществления устройства для генерирования выходного стереосигнала.

Хотя некоторые аспекты были описаны в контексте устройства, очевидно, что эти аспекты также представляют собой описание соответствующего способа, где блок или устройство соответствуют этапу способа или признаку этапа способа. Аналогичным образом, аспекты, описанные в контексте стадии способа, также представляют собой описание соответствующего блока или узла или признака соответствующего устройства.

В зависимости от конкретных требований реализации варианты осуществления настоящего изобретения могут быть воплощены в аппаратных средствах или в программном обеспечении. Реализация может быть выполнена с использованием цифрового запоминающего носителя, например дискеты, DVD, CD, ROM, PROM, EPROM, EEPROM или флэш-памяти, которые содержат хранящиеся на них электронно-читаемые управляющие сигналы, которые взаимодействуют (или способны взаимодействовать) с программируемой компьютерной системой таким образом, что выполняется соответствующий способ.

Некоторые варианты осуществления в соответствии с настоящим изобретением включают в себя носитель данных, содержащий электронно-читаемые управляющие сигналы, которые способны взаимодействовать с программируемой компьютерной системой таким образом, что выполняется один из описанных в настоящем документе способов.

Вообще, варианты осуществления настоящего изобретения могут быть реализованы как компьютерный программный продукт с программным кодом, способным выполнять один из способов, когда компьютерный программный продукт выполняется на компьютере. Программный код, например, может быть сохранен на машиночитаемом носителе.

Другие варианты осуществления включают в себя компьютерную программу для выполнения одного из способов, описанных в настоящем документе, сохраненных на машиночитаемом носителе или на постоянном запоминающем носителе.

Другими словами, вариант осуществления способа по настоящему изобретению является, следовательно, компьютерной программой, содержащей программный код для того, чтобы выполнять один из описанных в настоящем документе способов, когда компьютерная программа выполняется на компьютере.

Дополнительный вариант осуществления способов по настоящему изобретению является, следовательно, запоминающим носителем (или цифровым запоминающим носителем, или машиночитаемым носителем), включающим в себя записанную на нем компьютерную программу для того, чтобы выполнять один из описанных в настоящем документе способов.

Дополнительный вариант осуществления способа по настоящему изобретению является, следовательно, потоком данных или последовательностью сигналов, представляющих компьютерную программу для выполнения одного из способов, описанных в настоящем документе. Поток данных или последовательность сигналов могут, например, быть переданными через соединение для передачи данных, например через Интернет.

Дополнительный вариант осуществления включает в себя средство обработки, например компьютер, или программируемое логическое устройство, сконфигурированное или адаптированное для выполнения одного из описанных в настоящем документе способов.

Дополнительный вариант осуществления включает в себя компьютер, содержащий установленную на нем компьютерную программу для выполнения одного из описанных в настоящем документе способов.

В некоторых вариантах осуществления программируемое логическое устройство (например, логическая матрица, программируемая пользователем) может использоваться для того, чтобы выполнять некоторые или все функции описанных в настоящем документе способов. В некоторых вариантах осуществления логическая матрица, программируемая пользователем, может взаимодействовать с микропроцессором для того, чтобы выполнять один из описанных в настоящем документе способов. Вообще, способы предпочтительно выполняются любым аппаратным устройством.

Вышеописанные варианты осуществления предназначены исключительно для иллюстрации принципов настоящего изобретения. Подразумевается, что модификации и вариации компоновок и деталей, описанных в настоящем документе, будут очевидны для специалистов в данной области техники. Таким образом, настоящее изобретение ограничивается только объемом формулы изобретения, а не конкретными деталями, представленными в настоящем документе посредством описания и объяснения вариантов осуществления.

1. Устройство для генерирования выходного стереосигнала, имеющего первый выходной канал и второй выходной канал, из входного стереосигнала, имеющего первый входной канал и второй входной канал, включающее в себя:
генератор (110; 210; 340; 440; 640) информации о манипуляции, выполненный с возможностью генерировать информацию о манипуляции в зависимости от первого значения отсчета сигнала первого входного канала и от второго значения отсчета сигнала второго входного канала; и
манипулятор (120; 220; 360, 370; 460, 470; 660, 670) для манипулирования комбинационным сигналом на основе информации о манипуляции для того, чтобы получать первый манипулированный сигнал в качестве первого выходного канала и второй манипулированный сигнал в качестве второго выходного канала;
причем комбинационный сигнал представляет собой сигнал, полученный путем комбинирования первого входного канала и второго входного канала; и
причем манипулятор (120; 220; 360, 370; 460, 470; 660, 670) выполнен с возможностью манипулировать комбинационным сигналом в зависимости от отношения первого значения отсчета сигнала ко второму значению отсчета сигнала.

2. Устройство по п. 1,
в котором генератор (110; 210; 340; 440; 640) информации о манипуляции выполнен с возможностью генерировать информацию о манипуляции в зависимости от первого значения энергии в качестве первого значения отсчета сигнала первого входного канала и от второго значения энергии в качестве второго значения отсчета сигнала второго входного канала; и
в котором манипулятор (120; 220; 360, 370; 460, 470; 660, 670) выполнен с возможностью манипулирования комбинационным сигналом в зависимости от упомянутого отношения первого значения отсчета сигнала ко второму значению отсчета сигнала, которое является отношением первого значения энергии ко второму значению энергии.

3. Устройство по п. 1,
в котором генератор (110; 210; 340; 440; 640) информации о манипуляции выполнен с возможностью генерировать информацию о манипуляции в зависимости от первого значения отсчета сигнала первого входного канала и от второго значения отсчета сигнала второго входного канала,
в котором первое значение отсчета сигнала первого входного канала зависит от значения амплитуды первого входного канала;
в котором второе значение отсчета сигнала второго входного канала зависит от значения амплитуды второго входного канала; и
в котором манипулятор (120; 220; 360, 370; 460, 470; 660, 670) выполнен с возможностью манипулирования комбинационным сигналом в зависимости от упомянутого отношения первого значения отсчета сигнала ко второму значению отсчета сигнала.

4. Устройство по п. 1,
причем устройство дополнительно включает в себя блок (230; 330; 430; 630) вычисления отсчета сигнала, выполненный с возможностью вычислять первое значение отсчета сигнала на основе первого входного канала и дополнительно выполненный с возможностью вычислять второе значение отсчета сигнала на основе второго входного канала.

5. Устройство по п. 1,
в котором манипулятор (120; 220; 360, 370; 460, 470; 660, 670) выполнен с возможностью манипулирования комбинационным сигналом, причем комбинационный сигнал генерируется в соответствии с формулой
d(t)=a·xL(t)-b·xR(t),
где d(t) представляет собой комбинационный сигнал, где xL(t) представляет собой первый входной канал, где xR(t) представляет собой второй входной канал и где а и b представляют собой управляющие параметры.

6. Устройство по п. 1,
в котором манипулятор (120; 220; 360, 370; 460, 470; 660, 670) выполнен с возможностью манипулирования комбинационным сигналом, причем комбинационный сигнал представляет собой разность между первым и вторым входными каналами.

7. Устройство по п. 1,
причем устройство дополнительно включает в себя блок (320; 420; 620) преобразователя для того, чтобы преобразовывать первый и второй входные каналы входного стереосигнала из временной области в частотную область.

8. Устройство по п. 1,
в котором генератор (110; 210; 340; 440; 640) информации о манипуляции выполнен с возможностью генерировать первую весовую маску в зависимости от первого значения отсчета сигнала и генерировать вторую весовую маску в зависимости от второго значения отсчета сигнала; и
в котором манипулятор (120; 220; 360, 370; 460, 470; 660, 670) выполнен с возможностью манипулирования комбинационным сигналом посредством применения первой весовой маски к значению амплитуды комбинационного сигнала для того, чтобы получить первое значение модифицированной амплитуды, и с возможностью манипулирования комбинационным сигналом посредством применения второй весовой маски к значению амплитуды комбинационного сигнала для того, чтобы получить второе значение модифицированной амплитуды.

9. Устройство по п. 8,
причем устройство дополнительно включает в себя блок (380; 480; 680) комбинирования, выполненный с возможностью комбинировать первое значение модифицированной амплитуды и значение фазы комбинационного сигнала для того, чтобы получить первый манипулированный сигнал в качестве первого выходного канала; и
причем блок (380; 480; 680) комбинирования выполнен с возможностью комбинировать второе значение модифицированной амплитуды и значение фазы комбинационного сигнала для того, чтобы получить второй манипулированный сигнал в качестве второго выходного канала.

10. Устройство по п. 8,
в котором генератор (110; 210; 340; 440; 640) информации о манипуляции выполнен с возможностью генерировать первую весовую маску GL(m, k) в соответствии с формулой

или в котором генератор (110; 210; 340; 440; 640) информации о манипуляции выполнен с возможностью генерировать вторую весовую маску GR(m, k) в соответствии с формулой

где GL(m, k) обозначает первую весовую маску для частотно-временного дискрета (m, k), где GR(m, k) обозначает вторую весовую маску для частотно-временного дискрета (m, k), где EL(m, k) является значением отсчета сигнала первого входного канала для частотно-временного дискрета (m, k), где ER(m, k) является значением отсчета сигнала второго входного канала для частотно-временного дискрета (m, k) и где α представляет собой настроечный параметр.

11. Устройство по п. 10,
в котором генератор (110; 210; 340; 440; 640) информации о манипуляции выполнен с возможностью генерировать первую или вторую весовую маску, причем настроечный параметр α равен α=1.

12. Устройство по п. 1,
причем устройство включает в себя блок (320; 420; 620) преобразователя и генератор (310; 410; 610) комбинационного сигнала;
причем блок (320; 420; 620) преобразователя выполнен с возможностью принимать первый и второй входные каналы и преобразовывать первый и второй входные каналы из временной области в частотную область для того, чтобы получить первый и второй входные каналы в частотной области;
и причем генератор (310; 410; 610) комбинационного сигнала выполнен с возможностью генерировать комбинационный сигнал на основе первого и второго входных каналов в частотной области.

13. Устройство по п. 1,
причем устройство дополнительно включает в себя блок (605) задержки сигнала, выполненный с возможностью задерживать первый входной канал и/или второй входной канал.

14. Повышающий микшер (700; 800) для генерирования по меньшей мере трех выходных каналов из по меньшей мере двух входных каналов, включающий в себя:
устройство (710; 810) для генерирования выходного стереосигнала по п. 1, выполненное с возможностью приема двух из входных каналов повышающего микшера (700; 800) в качестве входных каналов; и
комбинирующий блок (770; 870) для комбинирования по меньшей мере двух из входных сигналов повышающего микшера (700; 800) для того, чтобы обеспечить комбинационный канал;
причем повышающий микшер (700; 800) выполнен с возможностью вывода первого выходного канала устройства (710; 810) для генерирования выходного стереосигнала, или сигнала, полученного из первого выходного канала устройства (710; 810) для генерирования выходного стереосигнала, в качестве первого выходного канала повышающего микшера (700; 800);
причем повышающий микшер (700; 800) выполнен с возможностью вывода второго выходного канала устройства (710; 810) для генерирования выходного стереосигнала или сигнала, полученного из второго выходного канала устройства (710; 810) для генерирования выходного стереосигнала, в качестве второго выходного канала повышающего микшера (700; 800); и
причем повышающий микшер (700; 800) выполнен с возможностью вывода комбинационного канала в качестве третьего выходного канала повышающего микшера (700; 800).

15. Устройство (900) для расширения стереобазы для генерирования двух выходных каналов из двух входных каналов, включающее в себя:
устройство (910) для генерирования выходного стереосигнала по п. 1, выполненное с возможностью приема двух входных каналов устройства (900) для расширения стереобазы в качестве входных каналов; и
комбинирующий блок (920, 930) для комбинирования по меньшей мере одного из выходных каналов устройства (910) для генерирования выходного стереосигнала с по меньшей мере одним из входных каналов устройства (900) для расширения стереобазы для того, чтобы обеспечить комбинационный канал;
причем устройство (900) для расширения стереобазы выполнено с возможностью вывода комбинационного канала или сигнала, полученного из комбинационного канала.

16. Способ генерирования выходного стереосигнала, имеющего первый выходной канал и второй выходной канал, из входного стереосигнала, имеющего первый входной канал и второй входной канал, включающий в себя этапы, на которых:
генерируют информацию о манипуляции в зависимости от первого значения отсчета сигнала первого входного канала и от второго значения отсчета сигнала второго входного канала; и
манипулируют комбинационным сигналом на основе информации о манипуляции для того, чтобы получить первый манипулированный сигнал в качестве первого выходного канала и второй манипулированный сигнал в качестве второго выходного канала;
причем комбинационный сигнал получают посредством комбинирования первого входного канала и второго входного канала; и
причем манипулирование комбинационным сигналом проводят посредством манипулирования комбинационным сигналом в зависимости от отношения первого значения отсчета сигнала ко второму значению отсчета сигнала.

17. Устройство для кодирования информации о манипуляции, включающее в себя:
блок (1010) вычисления отсчета сигнала для определения первого значения отсчета сигнала первого канала входного стереосигнала и для определения второго значения отсчета сигнала второго канала входного стереосигнала;
генератор (1020) информации о манипуляции, выполненный с возможностью генерировать информацию о манипуляции в зависимости от первого значения отсчета сигнала первого входного канала и от второго значения отсчета сигнала второго входного канала; и
модуль (1030) вывода для вывода информации о манипуляции;
причем информация о манипуляции является подходящей для манипулирования комбинационным сигналом на основе информации о манипуляции для того, чтобы сгенерировать первый канал и второй канал выходного стереосигнала;
причем комбинационный сигнал представляет собой сигнал, полученный посредством комбинирования первого входного канала и второго входного канала; и
причем информация о манипуляции указывает отношение первого значения отсчета сигнала ко второму значению отсчета сигнала; и
причем упомянутое отношение первого значения отсчета сигнала ко второму значению отсчета сигнала является подходящим для манипулирования комбинационным сигналом в зависимости от упомянутого отношения.

18. Компьютерно-читаемый носитель, содержащий компьютерную программу для генерирования выходного стереосигнала, имеющего первый и второй выходной канал, из входного стереосигнала, имеющего первый входной канал и второй входной канал, реализующую способ по п. 16.



 

Похожие патенты:

Изобретение относится к аудиосигналам и устройствам или способам для их формирования, передачи, преобразования и воспроизведения. Технический результат заключается в обеспечении уравновешивания или более сильного дифференцирования стереофонических (включая псевдостереофонические) сигналов.

Изобретение относится к средствам обработки звука. Технический результат заключается в улучшении пространственного восприятия звукового сигнала.

Изобретение относится к обработке аудиосигналов и может быть применено в искусственных ревербераторах. Технический результат - улучшение характеристик воспринимаемого звука.

Изобретение относится к аудиосигналам и к устройствам или способам для их получения, передачи, преобразования и воспроизведения. Технический результат заключается в улучшении стереофонического воспроизведения монофонически отображаемого источника звука.

Изобретение относится к способам и системам применения реверберации к многоканальному сведенному звуковому сигналу, указывающему на большее количество отдельных звуковых каналов.

Изобретение относится к области акустических средств и может быть применено при воспроизведении музыки и речи с созданием эффекта объемного звучания, активно воздействующего на психофизическое состояние человека.

Устройство для обеспечения набора пространственных указателей, связанных с аудиосигналом повышающего микширования, имеющим более двух каналов, на основе двухканального сигнала микрофона, содержит анализатор сигнала и генератор дополнительной пространственной информации.

Изобретение относится к устройствам и способам извлечения сигнала окружающей среды и получения весовых коэффициентов для извлечения сигнала окружающей среды. .

Изобретение относится к кодированию многоканального звукового сигнала, в частности к сведению фонограмм стереофонического речевого сигнала к монофоническому сигналу для кодирования с помощью монофонического кодера, такого как кодер линейного предсказания.

Изобретение относится к устройству и способу обработки звукового сигнала, а именно, предназначено для обработки звукового сигнала, принятого с цифрового носителя, и широкополосного сигнала.

Изобретение относится к технике связи и предназначено для обработки звукового сигнала. Технический результат - обеспечение генерирования интерполированных функций HRTF.

Изобретение относится к области видео/аудио воспроизведения. Технический результат - сохранение качества звука, который вызывает высокое ощущение реальности.

Изобретение относится к технике радиосвязи и может быть использовано для цифрового телевещания. Технический результат - снижение разрядности передаваемых кодов видеосигналов и звука в 1,6 раза, введение на передающей стороне цифровых микрофонов, на приемной стороне повышение разрешения экранов в два раза, достигаемое получением трех цветовых тонов R.G.B пикселя из одной излучающей ячейки.

Изобретение относится к средствам для стереофонического кодирования и декодирования с использованием комплексного предсказания в частотной области. Технический результат заключается в повышении скорости кодирования в диапазоне высоких скоростей передачи битов.

Группа изобретений относится к технологии для воспроизведения стереоскопического видео и, в частности, к выделению видеопотока на носителе записи. Техническим результатом является повышение эффективности использования запоминающего устройства для устройства воспроизведения за счет уменьшения емкости буфера, необходимой для стереоскопического воспроизведения.

Изобретение относится к средствам кодирования и декодирования звуковых сигналов. Технический результат заключается в повышении качества кодирования сигнала.

Предметом изобретения является устройство отображения с объектно-ориентированным 3-мерным представлением координат места возникновения звука, в котором звуки передаются через динамик, расположенный в соответствии с координатами объекта в матричной акустической системе, образованной большим множеством динамиков, располагаемых позади устройства отображения, во взаимодействии с поведением объекта, изображение которого выведено на экран устройства отображения.

Изобретение относится к устройству для улучшения стереофонического звукового сигнала FM-стереофонического радиоприемника. .

Изобретение относится к устройствам цветомузыки и может быть использовано для перевода двухканальной стереофонии в цветовые образы. .

Изобретение относится к области стереофонического расширения. .

Настоящее изобретение относится к средствам обработки аудиосигнала. Технический результат заключается в улучшении качества звукового пространства при малом количестве регистраций за счет улучшения согласованности и динамического диапазона звука. Обрабатывают исходный аудиосигнал с N.х каналами, где N больше 1, а х больше или равно 0, включая стадию многоканальной обработки вышеупомянутого входного аудиосигнала посредством многоканальной свертки с заранее заданным образом. Вышеупомянутый образ создается путем захвата эталонного звука с помощью набора акустических экранов, расположенных в базовом пространстве. Дополнительно выбирают по меньшей мере один образ из множества образов, ранее созданных на различных звуковых фонах. 3 з.п. ф-лы, 3 ил.
Наверх