Генерирование многоканальных звуковых сигналов



Генерирование многоканальных звуковых сигналов
Генерирование многоканальных звуковых сигналов
Генерирование многоканальных звуковых сигналов
Генерирование многоканальных звуковых сигналов
Генерирование многоканальных звуковых сигналов
Генерирование многоканальных звуковых сигналов
Генерирование многоканальных звуковых сигналов
Генерирование многоканальных звуковых сигналов
Генерирование многоканальных звуковых сигналов
Генерирование многоканальных звуковых сигналов
Генерирование многоканальных звуковых сигналов
Генерирование многоканальных звуковых сигналов
Генерирование многоканальных звуковых сигналов
Генерирование многоканальных звуковых сигналов
Генерирование многоканальных звуковых сигналов
Генерирование многоканальных звуковых сигналов
Генерирование многоканальных звуковых сигналов
Генерирование многоканальных звуковых сигналов
Генерирование многоканальных звуковых сигналов

 


Владельцы патента RU 2417458:

КОНИНКЛЕЙКЕ ФИЛИПС ЭЛЕКТРОНИКС Н.В. (NL)
КОУДИНГ ТЕКНОЛОДЖИЗ АБ (SE)
ЭЙДЖИР СИСТЕМС (US)

Изобретение относится к генерированию многоканальных звуковых сигналов из матрично-кодированного стереосигнала объемного звука. Технический результат - повышение качества звукового сигнала. Декодер генерирует многоканальный звуковой сигнал, такой как сигнал объемного звука, из принятого первого сигнала. Многоканальный сигнал содержит второй набор звуковых каналов, и первый сигнал содержит первый набор звуковых каналов. Декодер содержит приемник, который принимает первый сигнал. Приемник подсоединен к процессору оценки, который генерирует оцененные параметрические данные для второго набора звуковых каналов в ответ на характеристики первого набора звуковых каналов. Оцененные параметрические данные связывают характеристики второго набора звуковых каналов с характеристиками первого набора звуковых каналов. Декодер дополнительно содержит декодер пространственного звука, который декодирует первый сигнал в ответ на оцененные параметрические данные для генерирования многоканального сигнала, содержащего второй набор каналов. Изобретение позволяет использовать декодирование пространственного звука с сигналами, которые не кодируются кодером пространственного звука. 6 н. и 13 з.п. ф-лы, 6 ил.

 

Изобретение относится к генерированию многоканальных звуковых сигналов посредством декодирования пространственного звука и, в частности, но не исключительно, к генерированию многоканальных звуковых сигналов из матрично-кодированного стереосигнала объемного звука.

Цифровое кодирование сигналов различных источников стало все более важным в последние десятилетия, так как цифровое представление сигналов и цифровая связь все больше и больше заменяют аналоговое представление и связь. Например, мобильные телефонные системы, такие как глобальная система мобильной связи, основаны на цифровом кодировании речи. Также, распределение медиаконтента, такого как видео и музыка, в большей степени основывается на кодировании цифрового контента.

Кроме того, в последнем десятилетии наблюдалась тенденция к многоканальному звуку и, особенно, к пространственному звуку, простирающемуся за пределы обычных стереосигналов. Например, традиционные стереозаписи содержат только два канала, тогда как современные усовершенствованные звуковые системы обычно используют пять или шесть каналов, как в популярных 5.1-канальных системах объемного звука. Это обеспечивает более глубокий опыт прослушивания, где пользователь может быть окружен источниками звука.

Были разработаны различные методы и стандарты для передачи таких многоканальных сигналов. Например, шесть дискретных каналов, представляющих 5.1-канальную объемную систему, могут передаваться в соответствии со стандартами, такими как стандарты перспективного звукового кодирования (ААС, ПЗК) или Dolby Digital.

Однако, чтобы обеспечить обратную совместимость, известно понижающее микширование с большего числа каналов до меньшего числа каналов, и, конкретно, часто используется понижающее микширование 5.1-канального сигнала объемного звука в стереосигнал, позволяя воспроизводить стереосигнал традиционными (стерео) декодерами и 5.1-канальный сигнал - декодерами объемного звука.

Такие существующие способы для обратно совместимой многоканальной передачи без дополнительной многоканальной информации могут обычно характеризоваться как способы матрицированного объема. Примеры матричного кодирования объемного звука включают в себя способы, такие как Dolby Prologic II и Logic-7. Общим принципом этих способов является то, что они выполняют матричное умножение многочисленных каналов входного сигнала на подходящую неквадратную матрицу, таким образом генерируя выходной сигнал с меньшим количеством каналов. Конкретно, матричный кодер обычно применяет фазовые сдвиги к объемным каналам перед их смешиванием с передними и центральными каналами. Генерирование сигнала (Lt, Rt) с понижающим микшированием может, например, определяться как:

Таким образом, левый сигнал (Lt) понижающего микширования состоит из левого-переднего сигнала (Lf), центрального сигнала (с), умноженного на коэффициент q, левого-объемного сигнала (Ls), фаза которого сдвинута на 90 градусов ('j') и который масштабирован с коэффициентом а, и, наконец, правого-объемного (Rs) сигнала, фаза которого также сдвинута на 90 градусов и который масштабирован с коэффициентом b. Правый сигнал (Rt) понижающего микширования генерируется аналогичным образом. Типовыми коэффициентами понижающего микширования являются 0,707 для q и а, и 0,408 - для b.

Логическим обоснованием для противоположных знаков для правого сигнала (Rt) понижающего микширования является то, что объемные каналы смешиваются в противофазе в пару (Lt, Rt) понижающего микширования. Это свойство помогает декодеру выполнять различение между передним и задним каналами из пары сигналов понижающего микширования. Декодер может (частично) восстановить многоканальный сигнал из стереосигнала понижающего микширования применением операции дематрицирования. Насколько точно вновь созданный многоканальный сигнал имеет сходство с исходным многоканальным сигналом будет зависеть от конкретных свойств многоканального звукового контента.

Хотя системы матрицированного объемного звука предусматривают обратную совместимость, они могут обеспечивать только низкое качество звука по сравнению с дискретными объемными системами/кодерами, такими как системы ААС (ПЗК) или Dolby Digital.

Методы кодирования/декодирования, известные как кодирование пространственного звука (SAC, КПЗ), были разработаны для обеспечения улучшенного качества звуковых сигналов с понижающим микшированием. При КПЗ декодер выполняет понижающее микширование каналов до меньшего количества и, кроме того, генерирует параметрические данные, которые описывают характеристики многоканальных сигналов относительно сигналов с понижающим микшированием. Дополнительные параметрические данные затем включаются в битовый поток вместе с сигналом понижающего микширования, которым обычно является звуковой моно- или стереосигнал. Таким образом, традиционные декодеры могут игнорировать дополнительные параметрические данные и повторно генерировать моно- или стереосигнал (или, возможно, матрично-декодированный сигнал объемного звука низкого качества). Кроме того, КПЗ-декодеры могут извлекать параметрические данные и использовать их для генерирования многоканального сигнала более высокого качества.

Однако проблемой с этим подходом является то, что многие системы не оборудованы для КПЗ-кодированных сигналов. Например, многие системы используют только матричное кодирование объемного звука, которое не генерирует параметрические данные КПЗ. Кроме того, многие стандарты на сигнал и декодер не обеспечивают гибкости для включения дополнительных параметрических данных, таким образом требуя полное переключение на новый стандарт до того, как может быть развернуто КПЗ. Это может потребовать, чтобы все существующие кодеры и декодеры в системе были заменены кодерами и декодерами с поддержкой КПЗ. Конкретно, существует много двухканальных стереофонических традиционных систем (таких как радио, цифровое радио и т.д.), где неосуществимо большой объем работ по добавлению дополнительной информации, необходимой для КПЗ, т.е. слишком высоки затраты для расширения таких систем до использования КПЗ. Кроме того, уже существует большое количество доступного матрично-кодированного звукового материала, и он потребовал бы перекодирования КПЗ-кодером перед тем, как могут быть достигнуты преимущества КПЗ-декодирования.

Следовательно, была бы полезной улучшенная система для обработки и/или передачи многоканальных звуковых сигналов, и, в частности, были бы полезными функциональные возможности, позволяющие получить повышенную гибкость, улучшенное качество звука, повышенную применимость принципов КПЗ и/или улучшенные рабочие характеристики.

Следовательно, изобретение пытается, предпочтительно, ослабить, уменьшить или устранить одно или несколько из вышеупомянутых недостатков отдельно или в любой комбинации.

Согласно первому аспекту изобретения, обеспечивается декодер для генерирования многоканального звукового сигнала, причем декодер содержит: средство для приема первого сигнала, содержащего первый набор звуковых каналов; средство оценки для генерирования оцененных параметрических данных для второго набора звуковых каналов в ответ на характеристики первого набора звуковых каналов; причем оцененные параметрические данные связывают характеристики второго набора звуковых каналов с характеристиками первого набора звуковых каналов; и декодер пространственного звука для декодирования первого сигнала в ответ на оцененные параметрические данные для генерирования многоканального звукового сигнала, содержащего второй набор каналов.

Изобретение может предоставить улучшенные рабочие характеристики. Конкретно, изобретение может сделать возможным использование принципов декодирования пространственного звука для сигналов, не содержащих параметры кодирования пространственного звука (КПЗ). Применимость декодера может быть существенно повышена, и он, например, может использоваться с матричными кодерами и кодированными сигналами. Улучшенное качество звука может быть достигнуто посредством декодирования пространственного звука.

Второй набор каналов, в общем, содержит больше каналов, чем первый набор каналов. Второй набор звуковых каналов может содержать один или несколько из первого набора звуковых каналов. Один или несколько из второго набора звуковых каналов могут генерироваться без использования оцененных параметрических данных. Оцененными параметрическими данными могут быть, по существу, данные, соответствующие параметрам пространственного звука и, в частности, параметрам пространственного звука, которые обычно генерируются обычными КПЗ-кодерами.

Оцененные параметрические данные могут непосредственно связывать заданную характеристику первого набора каналов с заданной характеристикой второго набора каналов и/или могут, например, содержать значения данных, связывающие характеристики различных каналов второго набора каналов, таким образом, указывая, как первый сигнал может декодироваться для обеспечения второго набора звуковых каналов. Характеристиками может быть последовательность измерений одного единственного параметра по различным интервалам времени. Альтернативно, характеристики могут принадлежать более чем одному единственному параметру.

Согласно дополнительному признаку изобретения, первый сигнал не содержит параметрических звуковых данных, связанных со вторым набором каналов.

Изобретение позволяет применять принципы декодирования пространственного звука к сигналу, не содержащему параметрических звуковых данных для по меньшей мере некоторых из выходных каналов. Таким образом, изобретение может предоставить улучшенное качество для не-КПЗ-кодированных сигналов. Изобретение может предоставить улучшенную обратную совместимость и может, в частности, предоставить улучшенное качество звука для декодированных сигналов объемного звука из матрично-кодированных сигналов объемного звука.

Согласно дополнительному признаку изобретения, средство оценки содержит средство для определения первых параметрических данных для первого набора звуковых каналов и средство для отображения первых параметрических данных на оцененные параметрические данные для второго набора звуковых каналов.

Это может предоставить эффективную реализацию и оценку параметрических данных, которые могут обеспечить особенно высокое качество декодированного звука. Отображение может, например, быть посредством использования таблицы соответствия или посредством вычисления математической функции. Таким образом, существует прямая зависимость между оцененными параметрическими значениями и заданными параметрическими значениями первых параметрических данных.

Согласно дополнительному признаку изобретения, первые параметрические данные содержат по меньшей мере одно значение межканальной разности уровней для по меньшей мере двух звуковых каналов первого набора звуковых каналов.

Это может предоставить эффективную реализацию и оценку параметрических данных, которые могут обеспечивать особенно высокое качество декодированного звука. В частности, исследования показали, что значение межканальной разности уровней особенно подходит для оценки связанных с ним параметрических данных КПЗ из матрично-кодированного сигнала объемного звука. Изобретатели настоящего изобретения поняли, что существует сильная корреляция между межканальной разностью уровней для, например, стереофонического матрично-кодированного сигнала объемного звука и данными КПЗ для сигнала объемного звука.

Согласно дополнительному признаку изобретения, первые параметрические данные содержат по меньшей мере одно значение коэффициента межканальной корреляции для по меньшей мере двух звуковых каналов первого набора звуковых каналов.

Это может предоставить эффективную реализацию и оценку параметрических данных, которые могут обеспечивать особенно высокое качество декодированного звука. В частности, исследования показали, что значение коэффициента межканальной корреляции особенно подходит для оценки связанных с ним параметрических данных КПЗ из матрично-кодированного сигнала объемного звука. Изобретатели настоящего изобретения поняли, что существует сильная корреляция между коэффициентом межканальной корреляции для, например, стереофонического матрично-кодированного сигнала объемного звука и данными КПЗ для сигнала объемного звука.

Согласно необязательному признаку изобретения, многоканальный звуковой сигнал представляет собой сигнал объемного звука, и оцененные параметрические данные содержат по меньшей мере один параметр, выбранный из группы, состоящей из: межканальной разности уровней между левым-передним и левым-объемным каналом второго набора каналов; межканальной разности уровней между правым-передним и правым-объемным каналом второго набора каналов; коэффициента межканальной корреляции между левым-передним и левым-объемным каналом второго набора каналов; коэффициента межканальной корреляции между правым-передним и правым-объемным каналом второго набора каналов; коэффициента предсказания для центрального канала второго набора звуковых каналов; и межканальной разности уровней между центральным каналом и другим каналом (или комбинацией каналов) второго набора каналов.

Это может предоставить особенно высокие рабочие характеристики. Конкретно, эти параметры особенно подходят для генерирования высококачественного декодированного сигнала декодером пространственного звука и обычно имеют сильную корреляцию между параметрами входного сигнала, такого как в системе матрично-кодированного объемного звука.

По меньшей мере один параметр, выбранный из группы, может генерироваться прямым отображением из значения межканальной разности уровней и/или значения коэффициента межканальной корреляции для по меньшей мере двух звуковых каналов первого набора звуковых сигналов на по меньшей мере один параметр.

Согласно необязательному признаку изобретения, устройство дополнительно содержит средство для генерирования частотно-временных фрагментов; и в котором средство оценки выполнено с возможностью генерирования оцененных параметрических данных для частотно-временных фрагментов.

Это облегчает работу и/или повышает качество. В частности, это может предоставлять облегченное и/или улучшенное отображение между параметрами, извлеченными из первого сигнала, и оцененными параметрическими данными.

Согласно необязательному признаку изобретения, средство оценки содержит средство для прямого отображения набора по меньшей мере одной характеристики сигнала первого набора звуковых каналов для частотно-временного фрагмента на значение параметрических данных для второго набора звуковых каналов.

Это может предоставлять эффективную реализацию и оценку параметрических данных, которые могут обеспечивать особенно высокое качество декодированного звука. Отображение может, например, выполняться посредством использования таблицы соответствия или посредством вычисления математической функции. Таким образом, применяется прямая зависимость между набором характеристик сигнала и соответствующими значениями оцененных параметрических данных. Характеристиками сигнала могут быть межканальная разность уровней и/или коэффициент межканальной корреляции для двух каналов первого набора звуковых каналов, и они могут непосредственно отображаться, например, на коэффициенты предсказания и/или коэффициенты межканальной корреляции и/или межканальной разности уровней для второго набора звуковых каналов.

Согласно необязательному признаку изобретения, декодер пространственного звука выполнен с возможностью выполнения по меньшей мере одной матричной операции, используя параметры, определенные в ответ на оцененные параметрические данные.

Это может предоставлять высокие рабочие характеристики. В частности, это может предоставлять подходящую реализацию с высоким качеством декодирования.

Согласно необязательному признаку изобретения, декодер дополнительно содержит средство для извлечения параметрических данных для второго сигнала, и декодер пространственного звука выполнен с возможностью декодирования второго сигнала в ответ на извлеченные параметрические данные.

Декодер может быть выполнен с возможностью обработки как КПЗ-кодированных сигналов, так и не-КПЗ-кодированных сигналов, используя один и тот же кодер пространственного звука. Для КПЗ-кодированных сигналов могут использоваться извлеченные данные, тогда как для не-КПЗ-кодированных сигналов могут использоваться оцененные параметрические данные. Изобретение может обеспечивать улучшенную применимость и/или обратную совместимость. Устройство может быть выполнено с возможностью декодирования первого сигнала в ответ на извлеченные параметрические данные, таким образом позволяя применять корреляцию между первым и вторым сигналом.

Согласно необязательному признаку изобретения, декодер дополнительно содержит средство для выбора режима декодирования в ответ на характеристику первого сигнала.

Декодер, например, может быть выполнен с возможностью работы в первом режиме, при котором оцениваются параметрические данные КПЗ, и во втором режиме, при котором параметрические данные КПЗ извлекаются из принятого сигнала, и может быть выполнен с возможностью выбора между первым и вторым режимом в ответ на то, содержит ли первый сигнал данные КПЗ или нет. Таким образом, может достигаться в высокой степени гибкий декодер, способный обрабатывать многочисленные различные типы сигналов.

Согласно необязательному признаку изобретения, первый набор звуковых каналов состоит из двух звуковых каналов.

Изобретение может предоставить улучшенное декодирование многоканальных сигналов, преобразованных понижающим микшированием до стереосигнала.

Согласно необязательному признаку изобретения, первый сигнал представляет собой матрично-кодированный сигнал объемного звука.

Изобретение может предоставить особенно улучшенное декодирование многоканальных сигналов, преобразованных с понижающим микшированием до матрично-кодированного сигнала объемного звука. В частности, эксперименты показали, что очень точные данные КПЗ могут быть оценены для матрично-кодированных сигналов объемного звука, основываясь на стереоканалах сигнала.

Согласно необязательному признаку изобретения, декодер дополнительно содержит обратную матрицу матричного объема и средство для определения по меньшей мере одного коэффициента обратной матрицы матричного объема в ответ на оцененные параметрические данные.

Это может предоставить улучшенное качество декодированного звука для матрично-кодированного объемного сигнала.

Согласно другому аспекту изобретения, обеспечивается способ генерирования многоканального звукового сигнала, причем способ содержит: прием первого сигнала, содержащего первый набор звуковых каналов; генерирование оцененных параметрических данных для второго набора звуковых каналов в ответ на характеристики первого набора звуковых каналов; причем оцененные параметрические данные связывают характеристики второго набора звуковых каналов с характеристиками первого набора звуковых каналов; и декодирование декодером пространственного звука первого сигнала в ответ на оцененные параметрические данные для генерирования многоканального звукового сигнала, содержащего второй набор каналов.

Согласно другому аспекту изобретения, обеспечивается продукт компьютерной программы для исполнения способа.

Согласно другому аспекту изобретения, обеспечивается приемник для генерирования многоканального звукового сигнала, причем приемник содержит: средство для приема первого сигнала, содержащего первый набор звуковых каналов; средство оценки для генерирования оцененных параметрических данных для второго набора звуковых каналов в ответ на характеристики первого набора звуковых каналов; причем оцененные параметрические данные связывают характеристики второго набора звуковых каналов с характеристиками первого набора звуковых каналов; и декодер пространственного звука для декодирования первого сигнала в ответ на оцененные параметрические данные для генерирования многоканального звукового сигнала, содержащего второй набор каналов.

Согласно другому аспекту изобретения, обеспечивается система передачи, включающая в себя: кодер для генерирования первого сигнала, содержащего первый набор звуковых каналов, посредством кодирования многоканального сигнала; передатчик для передачи первого сигнала; средство для приема первого сигнала; средство оценки для генерирования оцененных параметрических данных для второго набора звуковых каналов в ответ на характеристики первого набора звуковых каналов; причем оцененные параметрические данные связывают характеристики второго набора звуковых каналов с характеристиками первого набора звуковых каналов; и декодер пространственного звука для декодирования первого сигнала в ответ на оцененные параметрические данные для генерирования декодированного многоканального звукового сигнала, содержащего второй набор каналов.

Согласно другому аспекту изобретения, обеспечивается способ передачи и приема звукового сигнала, причем способ содержит: генерирование первого сигнала, содержащего первый набор звуковых каналов, посредством кодирования многоканального сигнала; передачу первого сигнала; прием первого сигнала; генерирование оцененных параметрических данных для второго набора звуковых каналов в ответ на характеристики первого набора звуковых каналов; причем оцененные параметрические данные связывают характеристики второго набора звуковых каналов с характеристиками первого набора звуковых каналов; и декодирование декодером пространственного звука первого сигнала в ответ на оцененные параметрические данные для генерирования декодированного многоканального звукового сигнала, содержащего второй набор каналов.

Согласно другому аспекту изобретения, обеспечивается устройство проигрывания звука, содержащее декодер, как описано выше.

Эти и другие аспекты, признаки и преимущества изобретения очевидны из варианта(ов) осуществления, описанного ниже в данном документе, и объясняются со ссылкой на него (них).

Описываются варианты осуществления изобретения, только в качестве примера, со ссылкой на чертежи, на которых

фиг.1 иллюстрирует систему передачи для передачи звукового сигнала согласно некоторым вариантам осуществления изобретения;

фиг.2 иллюстрирует блок-схему типового КПЗ-кодера;

фиг.3 иллюстрирует пример типового КПЗ-декодера;

фиг.4 иллюстрирует декодер согласно некоторым вариантам осуществления изобретения;

фиг.5 иллюстрирует элементы декодера согласно некоторым вариантам осуществления изобретения; и

фиг.6 иллюстрирует способ генерирования многоканального звукового сигнала согласно некоторым вариантам осуществления изобретения.

Нижеследующее описание сосредотачивает внимание на вариантах осуществления изобретения, применимых для декодирования матрицированных сигналов объемного звука, преобразованных понижающим микшированием до стереосигналов. Однако понятно, что изобретение не ограничивается этим применением, но может применяться ко многим другим сигналам.

Фиг.1 иллюстрирует систему 100 передачи для передачи звукового сигнала согласно некоторым вариантам осуществления изобретения. Система 100 передачи содержит передатчик 101, который соединен с приемником 103 посредством сети 105, которой, конкретно, может быть Интернет.

В конкретном примере передатчик 101 представляет собой записывающее сигнал устройство, и приемник представляет собой устройство 103 проигрывателя сигнала, но понятно, что в других вариантах осуществления передатчик и приемник могут использоваться в других применениях и для других целей. Например, передатчик 101 и/или приемник 103 могут быть частью функциональной возможности транскодирования и могут, например, обеспечивать сопряжение с другими источниками или получателями сигналов.

В конкретном примере, где поддерживается функция записи сигнала, передатчик 101 содержит цифровой преобразователь 107, который принимает аналоговый сигнал, который преобразуется в цифровой сигнал импульсно-кодовой модуляции (ИКМ) посредством дискретизации и аналого-цифрового преобразования. Аналоговым сигналом, конкретно, является многоканальный сигнал объемного звука по стандарту 5.1.

Передатчик 101 соединен с кодером 109 на фиг.1, который кодирует сигнал ИКМ в соответствии с алгоритмом кодирования. Конкретно, кодером является матричный кодер, который генерирует стереосигнал с понижающим микшированием, используя матричную операцию по уравнению 1. Таким образом, кодированный сигнал представляет собой матрично-кодированный сигнал объемного звука.

Кодер 100 соединен с сетевым передатчиком 111, который принимает кодированный сигнал и выполняет сопряжение с Интернетом 105. Сетевой передатчик может передавать кодированный сигнал на приемник 103 по Интернету 105.

Приемник 103 содержит сетевой приемник 113, который выполняет сопряжение с Интернетом 105 и который предназначен для приема кодированного сигнала от передатчика 101.

Сетевой приемник 111 соединен с декодером 115. Декодер 115 принимает кодированный сигнал и декодирует его в соответствии с алгоритмом декодирования.

В конкретном примере, где поддерживается функция проигрывания сигнала, приемник 103 дополнительно содержит проигрыватель 117 сигнала, который принимает декодированный звуковой сигнал от декодера 115 и представляет его пользователю. Конкретно, проигрыватель 113 сигнала может содержать цифроаналоговый преобразователь, усилители и громкоговорители, необходимые для вывода декодированного звукового сигнала.

В описанном варианте осуществления изобретения алгоритм декодирования, используемый декодером 115, содержит элемент КПЗ-декодирования. Для ясности сначала будет описан принцип действия типового КПЗ-кодера.

Фиг.2 иллюстрирует блок-схему типового КПЗ-кодера 200. Кодер 200 разделяет поступающие сигналы в отдельные частотно-временные фрагменты посредством банка 201 квадратурных зеркальных фильтров (КЗФ). Эти частотно-временные фрагменты, в основном, упоминаются как «диапазоны параметров».

Для каждого диапазона параметров элемент 203 КПЗ-кодирования определяет ряд пространственных параметров, которые описывают свойства пространственного изображения, например, межканальные разности уровней и коэффициенты взаимной корреляции. Кроме извлечения параметров, элемент 203 КПЗ-кодирования также генерирует монофонический или стереофонический сигнал понижающего микширования из многоканального входного сигнала. Посредством банков 205 синтеза КЗФ эти сигналы переносятся во временную область. Результирующий сигнал понижающего микширования подается на процессор 207 битового потока, который генерирует битовый поток, содержащий каналы понижающего микширования и параметрические данные, сгенерированные элементом 203 КПЗ-кодирования. Предпочтительно, что сигнал понижающего микширования также кодируется перед передачей (используя обычный монофонический или стереофонический «базовый» кодер), тогда как битовые потоки базового кодера и пространственные параметры, предпочтительно, объединяются (мультиплексируются) в единственный выходной битовый поток.

В зависимости от режима работы эта скорость передачи данных параметрических данных может охватывать широкий диапазон скоростей передачи битов от нескольких кбит/с для многоканального звука хорошего качества до десятков кбит/с для почти прозрачного качества.

Кроме того, в случае стереофонического сигнала понижающего микширования пользователь имеет выбор из обычного стереосигнала понижающего микширования или сигнала понижающего микширования, который совместим с системами матрицированного объема. В последнем случае кодер 200 может генерировать совместимый с матрицированным объемом сигнал понижающего микширования, используя подход матрицирования по уравнению 1. Альтернативно, он может генерировать совместимый с матрицированным объемом сигнал понижающего микширования, используя блок постобработки понижающего микширования, работающий с обычным стереосигналом понижающего микширования. В такой конфигурации кодер может содержать постпроцессор матрицированного объема, который модифицирует обычный стереосигнал понижающего микширования, делая его совместимым с матрично-объемным звуком, используя пространственные параметры, извлеченные этапом оценки параметров. Преимущество такого подхода заключается в том, что обработка матрицированного объема может быть полностью изменена на обратную декодером, имеющим доступные пространственные параметры.

КПЗ-декодер, в принципе, выполняет процесс, обратный кодеру. Фиг.3 иллюстрирует пример типового КПЗ-декодера. КПЗ-декодер 300 содержит разделитель 301, который принимает битовый поток и разделяет его на сигнал понижающего микширования и параметрические данные. Впоследствии, декодированный сигнал понижающего микширования обрабатывается банком 303 анализа КЗФ, приводя к диапазонам параметров, которые являются такими же, что и диапазоны, примененные в КПЗ-кодере 200. Каскад 305 пространственного синтеза восстанавливает многоканальный сигнал, используя параметрические данные, извлеченные разделителем 301. Наконец, сигналы КЗФ-области пересылаются во временную область посредством банка 307 синтеза КЗФ, приводя к окончательным многоканальным выходным сигналам.

Таким образом, в системах, где как кодеры, так и декодеры содержат функциональную возможность КПЗ, может достигаться высокое качество декодированных многоканальных сигналов для относительно низкой скорости передачи данных. Однако, так как многие уже развернутые системы и большинство звукового материала не используют функциональную возможность КПЗ, преимущества обычно ограничиваются новыми системами и повторно кодированным звуковым материалом.

В примере по фиг.1 декодер 115 содержит функциональную возможность КПЗ-декодирования, которая может использоваться с не-КПЗ-кодерами и не-КПЗ-кодированным материалом. Декодер 115, таким образом, может вносить некоторые преимущества КПЗ, не требуя перекодирования или совместимых с КПЗ кодеров, и может, в частности, обеспечивать существенно улучшенное отношение качества к скорости передачи данных для многоканальных сигналов.

Фиг.4 более подробно иллюстрирует декодер 115 по фиг.1. Декодер 115 содержит приемник 401, который принимает сигнал, содержащий набор звуковых каналов. В частности, приемник принимает битовый поток, содержащий два канала, которые были сгенерированы матричным кодированием сигнала объемного звука кодером 109. Приемник 401 принимает битовый поток и генерирует два канала y1, y2 стереосигнала понижающего микширования. Отмечается, что в конкретном примере кодер 109 представляет собой обычный матричный кодер для объемного сигнала, генерирующий битовый поток, содержащий только два канала понижающего микширования. Таким образом, в примере битовый поток не содержит параметрических данных пространственного звука. В других вариантах осуществления кодер 109 может, например, представлять собой КПЗ-кодер, генерирующий стереосигнал, совместимый с матричным объемом, без параметрических данных КПЗ.

Декодер 115 дополнительно содержит элемент 403 КПЗ-декодирования, подсоединенный к приемнику 401. Элемент 403 КПЗ-декодирования декодирует стереоканалы y1, y2 понижающего микширования, используя методы КПЗ, описанные ранее. Конкретно, принцип действия элемента 403 КПЗ-декодирования соответствует принципу действия, описанному для КПЗ-декодера 300 по фиг.3. Элемент 403 КПЗ-декодирования, таким образом, генерирует выходной сигнал объемного звука, соответствующий окружающему сигналу, который был матрично-кодирован кодером 109.

Как ранее описано, стереоканалы понижающего микширования могли кодироваться матричным кодером, как описано в уравнении 1. Альтернативно, каналы понижающего микширования могли генерироваться КПЗ-кодером 203, включающим в себя блок постобработки для генерирования совместимого с матричным объемом сигнала понижающего микширования. В обоих случаях элемент 403 КПЗ-декодирования может включать в себя блок предварительной обработки, который меняет на обратные операции, примененные кодером для совместимости с матричным объемом.

Декодер 115 дополнительно содержит процессор 405 оценки, который подсоединен к приемнику 401 и элементу 403 КПЗ-декодирования. Процессор 405 оценки выполнен с возможностью генерирования оцененных параметрических данных, которые могут использоваться для генерирования выходных окружающих сигналов. Конкретно, процессор 405 оценки оценивает параметрические данные, которые КПЗ-кодер сгенерировал бы для каналов понижающего микширования, если бы было выполнено КПЗ-кодирование. Таким образом, оцененные параметрические данные связывают характеристики выходных окружающих каналов с характеристиками принятых каналов понижающего микширования, так как они предоставляют информацию о том, как они могут декодироваться для генерирования выходных окружающих каналов.

В примере на фиг.4 процессор 405 оценки генерирует оцененные параметрические данные, так что они соответствуют данным КПЗ, которые элемент 403 КПЗ-декодирования может непосредственно использовать для определения выходных объемных каналов.

Таким образом, декодер 115 использует принципы КПЗ для декодирования матрично-кодированного материала объемного звука. Процессор 405 оценки использует сигнальные контрольные метки принятого входного стереосигнала для определения данных, которые используются элементом 403 КПЗ-декодирования. Конкретно, процессор 405 оценки оценивает межканальные контрольные метки принятого стереосигнала и отображает их на контрольные метки КПЗ, которые могут использоваться непосредственно элементом 403 КПЗ-декодирования. Это может, конкретно, сделать возможным, чтобы элемент 403 КПЗ-декодирования был обычным КПЗ-декодером, таким образом, способствуя обратной совместимости, снижая конструктивные требования и требования к разработке и позволяя, чтобы одна и та же функциональная возможность использовалась для декодирования КПЗ-кодированных сигналов и не-КПЗ-кодированных сигналов. Таким образом, в примере, необходимые параметры КПЗ генерируются на стороне декодера, используя параметры, полученные посредством анализа принятого двухканального сигнала понижающего микширования.

Процессор 405 оценки содержит процессор 407 анализа, который определяет один или несколько параметров для стереосигнала понижающего микширования. Конкретно, процессор 407 анализа генерирует значения межканальной разности уровней (МРУ) и значения коэффициента межканальной корреляции (КМК) для стереоканалов y1, y2 понижающего микширования.

Процессор 407 анализа соединен с процессором 409 отображения, который отображает значения МРУ и КМК в значения КПЗ, относящиеся к выходным каналам.

Процессор 409 отображения, в частности, использует ранее неизвестный и неожиданный факт, что обычно существует сильная корреляция между значениями МРУ и КМК для матрично-кодированного объемного сигнала и параметров пространственного звука для исходных каналов объемного звука.

Процессор 409 отображения может просто использовать таблицу соответствия для определения значений параметров КПЗ для выходных окружающих каналов относительно стереоканалов y1, y2 понижающего микширования. Определенные значения МРУ и КМК или их представители, например, после квантования, могут использоваться в качестве адреса для просмотра таблицы. Эквивалентно, процессор 409 отображения может оценивать предварительно определенную функцию, имеющую значения МРУ и КМК в качестве входных параметров и предоставляющую необходимые параметры КПЗ в качестве выходных параметров.

Таким образом, процессор 409 отображения может генерировать (например) следующие параметры КПЗ для выходных каналов объемного звука:

- межканальная разность уровней между левым-передним и левым-объемным каналом;

- межканальная разность уровней между правым-передним и правым-объемным каналом;

- коэффициент межканальной корреляции между левым-передним и левым-объемным каналом;

- коэффициент межканальной корреляции между правым-передним и правым объемным каналом;

- один или несколько коэффициентов предсказания для канала, такого как центральный канал;

- межканальная разность уровней между центральным каналом и другим каналом (или комбинацией каналов) выходных каналов объемного звука.

В качестве конкретного примера процессор 407 анализа может генерировать значение КМК и значение МРУ для стереоканалов y1, y2 понижающего микширования. Эти два значения затем используются для генерирования уникального адреса для таблицы соответствия. По заданному адресу были сохранены параметрические значения КПЗ, которые обычно имеют место для этих значений КМК и МРУ. Процессор 409 отображения, таким образом, просто извлекает хранимые значения данных, таким образом получая подходящие оцененные параметрические данные. Эти данные затем подаются на элемент 403 КПЗ-декодирования, где они используются так же, как и обычные данные КПЗ, сгенерированные КПЗ-кодером.

Понятно, что соответствующие значения параметров КПЗ для данных значений МРУ и КМК могут быть определены любым подходящим образом. Например, может выполняться моделирование, при котором большое количество сигналов кодируется как матричным кодированием, так и КПЗ-кодированием. Значения КМК и МРУ тогда могут выводиться для матрично-кодированных сигналов и сравниваться с параметрическими данными, сгенерированными КПЗ-кодером. Данные могут обрабатываться статистически для определения параметров КПЗ, которые, наиболее вероятно, имеют место для данных значений МРУ и КМК, и затем могут сохраняться в соответствующем месте таблицы соответствия. Понятно, что такой анализ необходим только один раз и что определенная таблица соответствия может использоваться многими декодерами и для любого принятого сигнала.

Действительно, эксперименты и моделирования продемонстрировали, что существует сильная корреляция между значениями КМК и МРУ матрично-кодированного сигнала объемного звука с понижающим микшированием и значениями КПЗ для КПЗ-кодированного сигнала объемного звука. Следовательно, параметры КПЗ могут быть оценены с относительно высокой точностью, и может быть достигнуто существенно улучшенное качество декодированного звука.

В примере по фиг.4 процессор 405 оценки работает на основе частотно-временных фрагментов.

Конкретно, стереоканалы y1, y2 понижающего микширования сначала обрабатываются банком фильтров комплексно-модулированного КЗФ для генерирования индивидуальных частотно-временных фрагментов. Понятно, что такая обработка может быть разделена между процессором 405 оценки и элементом 403 КПЗ-декодирования и может, например, быть реализована в элементе 403 КПЗ-декодирования. Генерирование частотно-временных фрагментов, охватывающих полосу частот для временного интервала, хорошо известно для специалистов в данной области техники и не описывается подробно (пример можно найти, например, в публикации Breebaart, J., van de Par, S., Kohlrausch, A., and Schuijers, E. (2005). Parametric coding of stereo audio. Eurasip J. Applied Signal Proc., 9: 1305-1322).

Частотно-временные фрагменты составляются посредством группирования некоторых полос частот и временных сегментов. Обычно, эти частотно-временные фрагменты относительно узкие на низких частотах и более широкие на высоких частотах, в соответствии с психоакустическими принципами. Соответствующее временное разрешение обычно от 11 до 50 мс.

Для каждого сгенерированного частотно-временного фрагмента процессор 407 анализа генерирует два параметра МРУ и КМК из стереоканалов y1, y2 понижающего микширования. Конкретно, если Y1[k,b] представляет (комплексозначный) выходной результат банка фильтров для сигнала y1 для выходного сигнала q фильтра и временной выборки k, и Y2[k,b] представляет соответствующее представление в области КЗФ для y2, параметр МРУ для диапазона b параметров определяется по:

где диапазон суммирования для k выполняется по соответствующим временным выборкам области КЗФ текущего частотно-временного фрагмента, суммирование по q выполняется по тем выходным результатам банка фильтров, которые соответствуют диапазону b параметров, и (*) обозначает комплексное сопряжение.

Аналогично, если ℜ обозначает действительную часть, значение КМК для диапазона b параметров определяется как:

Для каждой пары значений КМК и МРУ процессор 409 отображения может тогда выполнить просмотр таблицы и определить:

- МРУ между соответствующими частотно-временными фрагментами левого-переднего и левого-объемного каналов;

- МРУ между соответствующими частотно-временными фрагментами правого-переднего и правого-объемного каналов;

- КМК между соответствующими частотно-временными фрагментами левого-переднего и левого-объемного каналов;

- КМК между соответствующими частотно-временными фрагментами правого-переднего и правого-объемного каналов;

- коэффициенты предсказания для генерирования центрального канала из сигнала понижающего микширования, и/или

- МРУ между центральным каналом и любым другим каналом (пара).

На декодер, таким образом, подаются оцененные параметрические данные, которые соответствуют параметрическим данным КПЗ, которые были бы получены КПЗ-кодером.

Фиг.5 более подробно иллюстрирует элементы элемента 403 КПЗ-декодирования.

Элемент 403 КПЗ-декодирования содержит блок 501 матрицы предварительного смешивания, который управляет сигналами, которые поступают на блок 503 второй матрицы смешивания, а также входными сигналами для группы декорреляторов (D1 - Dm) 505. Вторая матрица смешивания генерирует выходные сигналы, основанные на выходных сигналах декорреляторов и непосредственных выходных сигналах матрицы 501 предварительного смешивания. Принцип действия КПЗ хорошо известен для специалиста в данной области техники и для ясности и краткости не описывается подробно в данном документе. Дополнительные подробности можно найти, например, в публикации: Herre et al.: “The reference model architecture for MPEG spatial audio coding”. Proc. 118th AES convention, Barcelona, Spain, 2005.

Оцененные параметрические данные, принятые от процессора 405 оценки, используются для управления блоком 501 матрицы предварительного смешивания и блоком 503 второй матрицы смешивания, как если бы они были обычными параметрическими данными КПЗ. Конкретно, блок 501 матрицы предварительного смешивания может использовать матрицу М1 предварительного смешивания для генерирования трех промежуточных сигналов l, r и c из входных сигналов y1, y2 как:

при этом

где с1 и с2 представляют два из пространственных параметров (коэффициенты предсказания), сгенерированных процессором 409 отображения. На два декоррелятора D1 и D2 505 подаются сигналы l и r соответственно. Наконец, выходные сигналы lf, rf, c, ls и rs для левого-переднего, правого-переднего, центрального, левого-объемного и правого-объемного каналов генерируются при помощи матрицы М2 последующего смешивания в блоке 503 второй матрицы смешивания:

при этом

при этом hxy,z зависит от параметров МРУ и КМК, сгенерированных процессором 409 отображения.

при этом

В данном случае ILDx и ICCx представляют параметр МРУ и КМК, сгенерированный процессором 409 отображения для канальной пары Х (левый-передний/левый-объемный или правый-передний/правый-объемный).

В случае КПЗ-кодера, работающего в режиме, совместимом с матричным объемом, при помощи постпроцессора кодера соответствующий препроцессор на стороне декодера может быть включен в блок 501 матрицы предварительного смешивания. В этом конкретном случае может использоваться альтернативная матрица предварительного смешивания, которая состоит из комбинации исходной матрицы М1 предварительного смешивания и обратной матрицы Q, совместимой с матричным объемом:

при этом обратная матрица Q матричного объема определяется как:

где qxy,z представляет собой функцию параметров, сгенерированных процессором 409 отображения:

при этом g1=g2=0,577, и wl и wr - функции параметров, представленных процессором 409 отображения:

Альтернативно, элементы в М1 или М1' также могут генерироваться непосредственно процессором 409 отображения, исключая приведенные выше уравнения.

Понятно, что хотя вышеупомянутое описание сосредоточено на варианте осуществления, в котором принятый сигнал не содержит параметрических данных КПЗ, некоторые параметрические данные могут быть включены в принятый сигнал в других вариантах осуществления. Например, принятый сигнал может содержать параметрические данные, относящиеся к некоторым выходным каналам, но не к другим выходным каналам, и оцененные параметры могут использоваться для этих других каналов. В качестве другого примера оцененные параметрические данные могут использоваться для замены параметрических данных, которые были повреждены, например, из-за ошибок передачи. Таким образом, оцененные параметрические данные могут использоваться для улучшения и дополнения других параметрических данных, принятых от кодера.

Кроме того, понятно, что одним из преимуществ описанных примеров является то, что элемент 403 КПЗ-декодирования может использовать стандартный метод КПЗ-декодирования. Таким образом, элемент 403 КПЗ-декодирования может, в равной степени, применяться для декодирования обычных КПЗ-сигналов, принятых от КПЗ-кодера.

Конкретно, система 100 передачи по фиг.1 может содержать ряд не-КПЗ-кодеров и ряд КПЗ-кодеров. Декодер 115 может модифицировать свою работу в соответствии с принимаемым сигналом. Таким образом, если принимается не-КПЗ-сигнал, принцип действия может быть такой, который описан выше. Однако если принимается КПЗ-сигнал, параметрические данные могут просто извлекаться и подаваться на элемент 403 КПЗ-декодирования вместе с каналами понижающего микширования. Следовательно, может быть достигнут в значительной мере гибкий декодер.

Фиг.6 иллюстрирует способ генерирования многоканального звукового сигнала согласно некоторым вариантам осуществления изобретения. Способ применим к декодеру 115 по фиг.4 и описывается со ссылкой на него.

Способ инициируется на этапе 601, на котором приемник 401 принимает первый сигнал, содержащий первый набор звуковых каналов.

За этапом 601 следует этап 603, на котором процессор 405 оценки генерирует оцененные параметрические данные для второго набора звуковых каналов в ответ на характеристики первого набора звуковых каналов. Оцененные параметрические данные связывают характеристики второго набора звуковых каналов с характеристиками первого набора звуковых каналов.

За этапом 603 следует этап 605, на котором элемент 403 КПЗ-декодирования декодирует первый сигнал в ответ на оцененные параметрические данные для генерирования многоканального сигнала, содержащего второй набор каналов.

Понятно, что в вышеприведенном описании для ясности описаны варианты осуществления изобретения со ссылкой на различные функциональные блоки и процессоры. Однако очевидно, что может использоваться любое подходящее распределение функциональных возможностей между различными функциональными блоками или процессорами без отступления от изобретения. Например, изображенные функциональные возможности, подлежащие выполнению отдельными процессорами или контроллерами, могут выполняться одним и тем же процессором или контроллерами. Следовательно, ссылки на конкретные функциональные блоки должны рассматриваться только как ссылки на подходящие средства для предоставления требуемых функциональных возможностей, а не как указание на точную логическую или физическую структуру или организацию.

Изобретение может быть реализовано в любом подходящем виде, включая аппаратные средства, программные средства, программно-аппаратные средства или любую их комбинацию. Изобретение может быть реализовано, необязательно, по меньшей мере частично, как программное обеспечение компьютера, выполняющееся на одном или нескольких процессорах данных и/или процессорах цифровых сигналов. Элементы и компоненты варианта осуществления изобретения физически, функционально и логически могут быть реализованы любым подходящим образом. В самом деле, функциональные возможности могут быть реализованы в одном блоке, во множестве блоков или как часть других функциональных блоков. По существу, изобретение может быть реализовано в одном блоке или физически и функционально может быть распределено между различными блоками и процессорами.

Хотя настоящее изобретение было описано в связи с некоторыми вариантами осуществления, предполагается, что оно не ограничивается конкретной формой, изложенной в нем. Скорее, объем настоящего изобретения ограничивается только прилагаемой формулой изобретения. Кроме того, хотя признак, как может казаться, описывается в связи с конкретными вариантами осуществления, для специалиста в данной области техники будет понятно, что различные признаки описанных вариантов осуществления могут быть объединены согласно изобретению. В формуле изобретения термин «содержащий» не исключает присутствия других элементов или этапов.

Кроме того, хотя перечислены индивидуально, множество средств, элементов или этапов способа могут быть реализованы, например, одним блоком или процессором. Кроме того, хотя индивидуальные признаки могут быть включены в различные пункты формулы изобретения, они, возможно, могут быть выгодно объединены, и включение в различные пункты формулы изобретения не означает, что комбинация признаков не является допустимой и/или полезной. Также, включение признака в одну категорию пунктов формулы изобретения не означает ограничения этой категорией, но скорее указывает, что признак в равной степени применим к другим категориям пунктов формулы изобретения соответствующим образом. Кроме того, порядок признаков в формуле изобретения не означает никакого заданного порядка, в котором признаки должны обрабатываться, и, в частности, порядок индивидуальных этапов в пункте формулы изобретения на способ не означает, что этапы должны выполняться в этом порядке. Скорее, этапы могут выполняться в любом подходящем порядке. Кроме того, ссылки в единственном числе не исключают множество. Таким образом, ссылки в единственном числе, «первый», «второй» и т.д. не устраняют множество. Обозначения ссылок в формуле изобретения предусмотрены в качестве уточняющего примера и никоим образом не должны толковаться как ограничивающие объем формулы изобретения.

1. Декодер для генерирования многоканального звукового сигнала, причем декодер содержит:
средство для приема (401) первого сигнала, содержащего первый набор звуковых каналов;
средство (405) оценки для генерирования оцененных параметрических данных для второго набора звуковых каналов в ответ на характеристики первого набора звуковых каналов; причем оцененные параметрические данные связывают характеристики второго набора звуковых каналов с характеристиками первого набора звуковых каналов; и
декодер (403) пространственного звука для декодирования первого сигнала в ответ на оцененные параметрические данные для генерирования многоканального звукового сигнала, содержащего второй набор каналов.

2. Декодер по п.1, в котором первый сигнал не содержит никаких параметрических звуковых данных, связанных со вторым набором каналов.

3. Декодер по п.1, в котором средство (405) оценки содержит средство (407) для определения первых параметрических данных для первого набора звуковых каналов и средство (409) для отображения первых параметрических данных на оцененные параметрические данные для второго набора звуковых каналов.

4. Декодер по п.3, в котором первые параметрические данные содержат, по меньшей мере, одно значение межканальной разности уровней для, по меньшей мере, двух звуковых каналов первого набора звуковых сигналов.

5. Декодер по п.3, в котором первые параметрические данные содержат, по меньшей мере, одно значение коэффициента межканальной корреляции для, по меньшей мере, двух звуковых каналов первого набора звуковых сигналов.

6. Декодер по п.1, в котором многоканальный звуковой сигнал представляет собой сигнал объемного звука, и оцененные параметрические данные содержат, по меньшей мере, один параметр, выбранный из группы, состоящей из:
межканальной разности уровней между левым передним и левым объемным каналом второго набора каналов;
межканальной разности уровней между правым передним и правым объемным каналом второго набора каналов;
коэффициента межканальной корреляции между левым передним и левым объемным каналом второго набора каналов;
коэффициента межканальной корреляции между правым передним и правым объемным каналом второго набора каналов;
коэффициента предсказания для центрального канала второго набора звуковых каналов; и
межканальной разности уровней между центральным каналом и другим каналом второго набора каналов.

7. Декодер по п.1, дополнительно содержащий средство для генерирования частотно-временных фрагментов; и в котором средство (405) оценки выполнено с возможностью генерирования оцененных параметрических данных для частотно-временных фрагментов.

8. Декодер по п.7, в котором средство оценки содержит средство для прямого отображения набора, по меньшей мере, одной характеристики сигнала первого набора звуковых каналов для частотно-временного фрагмента на соответствующее значение параметрических данных для второго набора звуковых каналов.

9. Декодер по п.1, в котором декодер пространственного звука выполнен с возможностью выполнения, по меньшей мере, одной матричной операции, используя параметры, определенные в ответ на оцененные параметрические данные.

10. Декодер по п.1, дополнительно содержащий средство для извлечения параметрических данных для второго сигнала, и в котором декодер (403) пространственного звука выполнен с возможностью декодирования второго сигнала в ответ на извлеченные параметрические данные.

11. Декодер по п.1, дополнительно содержащий средство для выбора режима декодирования в ответ на характеристику первого сигнала.

12. Декодер по п.1, в котором первый набор звуковых каналов состоит из двух звуковых каналов.

13. Декодер по п.12, в котором первый сигнал представляет собой матрично-кодированный сигнал объемного звука.

14. Декодер по п.13, дополнительно содержащий обратную матрицу матричного объема и средство для определения, по меньшей мере, одного коэффициента обратной матрицы матричного объема в ответ на оцененные параметрические данные.

15. Способ генерирования многоканального звукового сигнала, причем способ содержит:
прием (601) первого сигнала, содержащего первый набор звуковых каналов;
генерирование (603) оцененных параметрических данных для второго набора звуковых каналов в ответ на характеристики первого набора звуковых каналов; причем оцененные параметрические данные связывают характеристики второго набора звуковых каналов с характеристиками первого набора звуковых каналов; и
декодирование (605) декодером пространственного звука первого сигнала в ответ на оцененные параметрические данные для генерирования многоканального звукового сигнала, содержащего второй набор каналов.

16. Приемник (103) для генерирования многоканального звукового сигнала, причем приемник содержит:
средство для приема (113, 401) первого сигнала, содержащего первый набор звуковых каналов;
средство (405) оценки для генерирования оцененных параметрических данных для второго набора звуковых каналов в ответ на характеристики первого набора звуковых каналов; причем оцененные параметрические данные связывают характеристики второго набора звуковых каналов с характеристиками первого набора звуковых каналов; и
декодер (403) пространственного звука для декодирования первого сигнала в ответ на оцененные параметрические данные для генерирования многоканального звукового сигнала, содержащего второй набор каналов.

17. Система передачи для передачи и приема звукового сигнала, включающая в себя:
кодер для генерирования первого сигнала, содержащего первый набор звуковых каналов, посредством кодирования многоканального сигнала;
передатчик для передачи первого сигнала;
средство для приема (401) первого сигнала;
средство (405) оценки для генерирования оцененных параметрических данных для второго набора звуковых каналов в ответ на характеристики первого набора звуковых каналов; причем оцененные параметрические данные связывают характеристики второго набора звуковых каналов с характеристиками первого набора звуковых каналов; и
декодер (403) пространственного звука для декодирования первого сигнала в ответ на оцененные параметрические данные для генерирования декодированного многоканального звукового сигнала, содержащего второй набор каналов.

18. Способ передачи и приема звукового сигнала, причем способ содержит:
генерирование первого сигнала, содержащего первый набор звуковых каналов, посредством кодирования многоканального сигнала;
передачу первого сигнала;
прием (401) первого сигнала;
генерирование оцененных параметрических данных для второго набора звуковых каналов в ответ на характеристики первого набора звуковых каналов; причем оцененные параметрические данные связывают характеристики второго набора звуковых каналов с характеристиками первого набора звуковых каналов; и
декодирование декодером (403) пространственного звука первого сигнала в ответ на оцененные параметрические данные для генерирования декодированного многоканального звукового сигнала, содержащего второй набор каналов.

19. Устройство (103) проигрывания звука, содержащее декодер (115) по п.1.



 

Похожие патенты:

Изобретение относится к телекоммуникационным системам, в частности к способу и устройству конкатенации кадров в системе связи. .

Изобретение относится к области высококачественного кодирования звука. .

Изобретение относится к методам кодирования речи, в частности к кодированию речи с обеспечением устойчивости к ошибкам и передаче речи по сети с пакетной коммутацией для приложений, связанных с передачей речевых данных по протоколу Интернет (VoIP, Voice over IP).

Изобретение относится к трансформации шкалы времени, т.е. .

Изобретение относится к устройствам кодирования и декодирования и к способам кодирования и декодирования, которые могут кодировать или декодировать сигналы с оптимальной скоростью передачи битов согласно характеристикам сигналов.

Изобретение относится к кодированию информационных сигналов, например, аудиокодированию, в частности, к кодированию с копированием спектральных полос (SBR). .

Изобретение относится к устройству и способу для генерации значений субполос звукового сигнала, к устройству и способу для генерации отсчетов временной области. .

Изобретение относится к кодированию и декодированию аудио для многоканальных сигналов. .

Изобретение относится к способам обработки сигналов, в частности к методам улучшения качества многоканальных аудиосигналов. .

Изобретение относится к способу и устройству для декодирования аудиосигнала, предназначено для обеспечения способа декодирования аудиосигнала посредством использования информации об объекте, включающей в себя информацию об уровне объекта и информацию о коэффициенте усиления объекта, для модифицирования сигнала понижающего смешивания аудиосигнала в виде изменения вклада объекта в каждый канал понижающего смешивания

Изобретение относится к способу и устройству для декодирования аудиосигнала, принятого на цифровом носителе, например сигнала вещания

Изобретение относится к обработке аудиоданных с использованием фильтров с перекошенной характеристикой и, в частности, к многоцелевому кодированию аудиоданных

Изобретение относится к технологии обработки речевых сигналов, в частности система и способы относятся к изменению окна с кадром, ассоциированным с аудио сигналом

Изобретение относится к аудиокодекам, в частности к поддиапазонному кодированию, таблицам кодирования и/или избыточному кодированию

Изобретение относится к кодированию и/или декодированию звука с использованием структур иерархического кодирования и/или структур иерархического декодирования

Изобретение относится к обработке речевых сигналов

Изобретение относится к способу и устройству для обработки аудиосигнала, в частности широковещательного сигнала или т.п

Изобретение относится к системе электросвязи и предназначено для кодирования широкополосного речевого сигнала (ШРС) с диапазоном частот от 50 до 7000 Гц
Наверх