Способ и устройство для кодирования и декодирования аудиосигналов

Авторы патента:

ЛИМ Дзае Хиун (KR)

ПАНГ Хее Сук (KR)

ОХ Хиен О (KR)

ДЗУНГ Йанг Вон (KR)

КИМ Донг Соо (KR)

G10L19 - Техника анализа-синтеза речи для уменьшения избыточности, например в вокодерах ; кодирование или декодирование речи

Владельцы патента RU 2383941:

ЭлДжи ЭЛЕКТРОНИКС ИНК. (KR)

Изобретение относится к обработке аудиосигнала и, более конкретно, к способу и устройству для кодирования и декодирования аудиосигналов. Сущность изобретения заключается в том, что включает в себя этап приема аудиосигнала, включающего в себя сведенный сигнал и сигнал пространственной информации, и, если заголовок включен в сигнал пространственной информации, этап извлечения информации конфигурации из заголовка, на котором извлекается пространственная информация, включенная в сигнал пространственной информации, и этап преобразования сведенного сигнала в многоканальный сигнал, используя информацию конфигурации и пространственную информацию. Соответственно, заголовок может быть выборочно включен в сигнал пространственной информации, при этом если заголовок многократно включен в сигнал пространственной информации, становится возможным декодирование пространственной информации, в случае воспроизведения аудиосигнала из случайной позиции. Технический результат - обеспечение декодирования аудиосигналов из случайной точки посредством создания множества заголовков, выборочно включенных в сигнал пространственной информации. 3 н. и 5 з.п. ф-лы, 9 ил.

Область техники, к которой относится изобретение

Настоящее изобретение относится к обработке аудиосигнала и, более конкретно, к способу и устройству для кодирования и декодирования аудиосигнала.

Предшествующий уровень техники

В целом, устройство кодирования аудиосигналов сжимает аудиосигнал в сведенный сигнал моно или стерео типа, вместо сжатия каждого канала многоканального аудиосигнала. Устройство кодирования аудиосигналов передает сжатый сведенный сигнал на устройство декодирования совместно с сигналом пространственной информации (или вспомогательным информационным сигналом) или сохраняет сжатый сведенный сигнал совместно с сигналом пространственной информации на носителе данных.

В этом случае сигнал пространственной информации, извлеченный при сведении многоканального аудиосигнала, используется при восстановлении исходного многоканального аудиосигнала из сжатого сведенного сигнала.

Сигнал пространственной информации включает в себя заголовок и пространственную информацию. Кроме того, в заголовок включена информация конфигурации. Заголовок является информацией для интерпретирования пространственной информации.

Устройство декодирования аудиосигналов декодирует пространственную информацию с использованием включенной в заголовок информации конфигурации. Включенная в заголовок информация конфигурации передается на устройство декодирования или сохраняется на носителе данных совместно с пространственной информацией.

Устройство кодирования аудиосигналов мультиплексирует закодированный сведенный сигнал с сигналом пространственной информации в форму битового потока, а затем передает мультиплексированный сигнал на устройство декодирования. Поскольку, в целом, информация конфигурации является неизменной, заголовок, включающий в себя информацию конфигурации, вставляется в битовый поток однократно. Так как информация конфигурации передается для однократной первоначальной вставки в аудиосигнал, устройство декодирования аудиосигналов имеет проблему при декодировании пространственной информации из-за отсутствия информации конфигурации в случае воспроизведения аудиосигнала из случайной временной точки. А именно, поскольку аудиосигнал воспроизводится из требуемой пользователем определенной временной точки, вместо воспроизведения с начальной части в случае трансляции, VOD (видео по требованию) или подобного, использование передающейся в аудиосигнале информации конфигурации невозможно. Следовательно, может быть невозможным и декодирование пространственной информации.

Раскрытие изобретения

Цель настоящего изобретения заключается в обеспечении способа и устройства для кодирования и декодирования аудиосигналов, декодирующих аудиосигнал посредством создания заголовка, выборочно включаемого в кадр сигнала пространственной информации.

Другая цель настоящего изобретения заключается в обеспечении способа и устройства для кодирования и декодирования аудиосигналов, декодирующих аудиосигнал даже в случае, если аудиосигнал воспроизводится устройством декодирования аудиосигналов из случайной точки, посредством создания множества заголовков, включенных в сигнал пространственной информации.

Для достижения этих и других преимуществ, а также в соответствии с целью настоящего изобретения, как воплощено и описано в широком аспекте, способ декодирования аудиосигналов согласно настоящему изобретению включает в себя этап приема аудиосигнала, включающего в себя сведенный сигнал и сигнал пространственной информации, если заголовок включен в сигнал пространственной информации, этап извлечения информации конфигурации из заголовка, этап извлечения пространственной информации, включенной в сигнал о пространственной информации, и этап преобразования сведенного сигнала в многоканальный сигнал с использованием информации конфигурации и пространственной информации.

Краткое описание чертежей

Фиг.1 изображает конфигурационную диаграмму аудиосигнала согласно одному варианту осуществления настоящего изобретения.

Фиг.2 изображает конфигурационную диаграмму аудиосигнала согласно другому варианту осуществления настоящего изобретения.

Фиг.3 изображает блок-схему устройства для декодирования аудиосигналов согласно одному варианту осуществления настоящего изобретения.

Фиг.4 изображает блок-схему устройства для декодирования аудиосигналов согласно другому варианту осуществления настоящего изобретения.

Фиг.5 изображает графическое представление способа декодирования аудиосигналов согласно одному варианту осуществления настоящего изобретения.

Фиг.6 изображает графическое представление способа декодирования аудиосигналов согласно другому варианту осуществления настоящего изобретения.

Фиг.7 изображает графическое представление способа декодирования аудиосигналов согласно дополнительному варианту осуществления настоящего изобретения.

Фиг.9 изображает графическое представление способа декодирования аудиосигналов согласно другому дополнительному варианту осуществления настоящего изобретения.

Предпочтительные варианты осуществления изобретения

Далее даются ссылки на предпочтительные варианты осуществления настоящего изобретения, примеры которых проиллюстрированы на чертежах.

Для понимания настоящего изобретения устройство и способ кодирования аудиосигналов разъясняются перед описанием устройства и способа декодирования аудиосигналов. Несмотря на это, устройство и способ декодирования согласно настоящему изобретению не ограничиваются следующим устройством и способом кодирования. Более того, настоящее изобретение применимо к схеме кодирования аудиосигналов для формирования многоканального сигнала с использованием пространственной информации, а также MP3 (MPEG 1/2-layer III) и AAC (усовершенствованное кодирование аудиосигнала).

Фиг.1 изображает конфигурационную диаграмму аудиосигнала, передаваемого на устройство декодирования аудиосигналов с устройства кодирования аудиосигналов, согласно одному варианту осуществления настоящего изобретения.

Изображенный на фиг.1 аудиосигнал включает в себя идентификатор 101 аудиосигнала, сведенный сигнал 103 и сигнал 105 пространственной информации.

При использовании схемы кодирования для воспроизведения аудиосигнала для трансляции или подобного, аудиосигнал может включать в себя вспомогательные данные, а также идентификатор 101 аудиосигнала и сведенный сигнал 103. Настоящее изобретение может включать в себя сигнал 105 пространственной информации в качестве вспомогательных данных. Для информирования устройства декодирования аудиосигналов об основной информации аудиокодека без анализа аудиосигнала, аудиосигнал может выборочно включать в себя идентификатор 101 аудиосигнала. Идентификатор 101 аудиосигнала состоит из небольшого объема основной информации, необходимой для декодирования аудиосигнала, такой как скорость передачи передаваемого аудиосигнала, количество каналов, частота выборки сжатых данных, идентификатор, указывающий на используемый в текущий момент аудиокодек, и т.п.

С помощью идентификатора 101 аудиосигнала устройство декодирования аудиосигналов может быть информировано о типе используемого аудиосигналом кодека. В частности, с помощью идентификатора 101 аудиосигнала устройство декодирования аудиосигналов может быть информировано о том, является ли принятый аудиосигнал сигналом, восстанавливающим многоканальный сигнал с использованием сигнала 105 пространственной информации и сведенного сигнала 103. В этом случае многоканальный сигнал может включать в себя сигнал виртуального трехмерного объемного звучания, а также фактический многоканальный сигнал. С помощью технологии виртуального трехмерного объемного звучания аудиосигнал, содержащий сигнал 105 пространственной информации, объединенный со сведенным сигналом 103, сделан прослушиваемым через один или два канала.

Идентификатор 101 аудиосигнала располагается независимо от сведенного сигнала 103 или сигнала 105 пространственной информации, включенных в аудиосигнал. К примеру, идентификатор 101 аудиосигнала располагается в пределах отдельного поля, указывающего аудиосигнал.

В случае если заголовок не предусмотрен в сведенном сигнале 103, то устройство декодирования аудиосигналов может декодировать сведенный сигнал 103 с использованием идентификатора 101 аудиосигнала.

Сведенный сигнал 103 является сигналом, сформированным при сведении многоканального сигнала. Сведенный сигнал 103 может быть либо сформирован в блоке сведения (не показан на чертеже) включенном в устройство кодирования аудиосигналов (не показан на чертеже), либо сформирован искусственно.

Сведенный сигнал 103 может классифицироваться на случай включения сигнала 105 пространственной информации и на случай невключения заголовка.

В случае если сведенный сигнал 103 включает в себя заголовок, то заголовок включается в каждый блок от кадра к кадру. В случае если сведенный сигнал 103 не включает в себя заголовок, как упомянуто в предшествующем описании, то сведенный сигнал 103 может быть декодирован с использованием идентификатора 101 аудиосигнала посредством устройства декодирования аудиосигналов. Сведенный сигнал 103 принимает либо форму с включением заголовка для каждого кадра, либо форму без включения заголовка. Более того, сведенный сигнал 103 включается в аудиосигнал аналогичным способом до конца контента.

Сигнал 105 пространственной информации также может либо включать в себя заголовок и пространственную информацию, либо может включать в себя пространственную информацию без заголовка. Заголовок сигнала 105 пространственной информации отличается от заголовка сведенного сигнала 103 тем, что он необязательно должен вставляться в каждый кадр идентичным образом. В частности, сигнал 105 пространственной информации может использовать кадр, включающий в себя заголовок, и кадр, не включающий в себя заголовок. Большая часть информации, включенной в заголовок сигнала 105 пространственной информации, является информацией конфигурации, которая декодирует пространственную информацию посредством интерпретирования пространственной информации.

Фиг.2 изображает конфигурационную диаграмму аудиосигнала, передаваемого на устройство декодирования аудиосигналов с устройства кодирования аудиосигналов, согласно другому варианту осуществления настоящего изобретения.

Изображенный на фиг.2 аудиосигнал включает в себя сведенный сигнал 103 и сигнал 105 пространственной информации. Более того, аудиосигнал имеет форму ES (элементарного потока) размещения кадров.

Каждый сведенный сигнал 103 и сигнал 105 пространственной информации иногда передается в качестве отдельной формы ES на устройство декодирования аудиосигналов. Как сведенный сигнал 103, так и сигнал 105 пространственной информации, как изображено на фиг.2, могут быть объединены в одну форму ES, которая передается на устройство декодирования аудиосигналов.

В случае если сведенный сигнал 103 и сигнал 105 пространственной информации, объединенные в одну форму ES, передаются на устройство декодирования аудиосигналов, то сигнал 105 пространственной информации может быть включен во вспомогательные данные (вспомогательные данные) или в дополнительные данные (данные расширения) сведенного сигнала 103.

Более того, аудиосигнал может включать в себя идентификационную информацию сигнала, указывающую на то, объединен ли сигнал 105 пространственной информации со сведенным сигналом 103.

Кадр сигнала 105 пространственной информации может включать в себя либо заголовок 201 и пространственную информацию 203, либо может включать в себя только пространственную информацию 203. В частности, сигнал 105 пространственной информации может использовать кадр, включающий в себя заголовок 201, совместно с кадром, не включающим в себя заголовок 201.

В настоящем изобретении заголовок 201 вставляется в сигнал 105 пространственной информации, по меньшей мере, однократно. В частности, устройство кодирования аудиосигналов может вставлять заголовок 201 в каждый кадр сигнала 105 пространственной информации, периодически вставлять заголовок 201 в каждый фиксированный интервал кадров в сигнале 105 пространственной информации или не периодически вставлять заголовок 201 в каждый случайный интервал кадров в сигнале 105 пространственной информации.

Аудиосигнал может включать в себя информацию (в дальнейшем названную «идентификационная информация заголовка») указывающую на то, включен ли заголовок 201 в кадр 201.

В случае если заголовок 201 включен в сигнал 105 пространственной информации, то устройство декодирования аудиосигналов извлекает информацию 205 конфигурации из заголовка 201, а затем декодирует пространственную информацию 203, передающуюся после заголовка 201, согласно информации 205 конфигурации. Поскольку заголовок 201 является информацией для декодирования посредством интерпретирования пространственной информации 203, заголовок 201 передается на раннем этапе передачи аудиосигнала.

В случае если заголовок 201 не включен в сигнал 105 пространственной информации, то устройство декодирования аудиосигналов декодирует пространственную информацию 203 с использованием заголовка 201, передаваемого на раннем этапе.

В случае потери заголовка 201 во время передачи аудиосигнала на устройство декодирования аудиосигналов с устройства кодирования аудиосигналов, либо в случае декодирования передаваемого в потоковом формате аудиосигнала с его средней части, используемой для трансляции или подобного, использование предварительно переданного заголовка 201 невозможно. В этом случае устройство для декодирования аудиосигналов извлекает информацию 205 конфигурации из заголовка 201, отличного от изначально вставленного в аудиосигнал вышеупомянутого заголовка 201, а затем может декодировать аудиосигнал с использованием извлеченной информации 205 конфигурации. В этом случае информация 205 конфигурации, извлеченная из вставленного в аудиосигнал заголовка 201, может быть идентична вышеупомянутой информации 205 конфигурации, извлеченной из заголовка 201, который был передан на раннем этапе.

Если заголовок 201 является изменяемым, то информация 205 конфигурации извлекается из нового заголовка 201, извлеченная информация 205 конфигурации декодируется, а затем декодируется пространственная информация 203, переданная после заголовка 201. Если заголовок 201 является неизменяемым, то решается, идентичен ли новый заголовок 201 предварительно переданному старому заголовку 201. Если эти два заголовка 201 отличаются друг от друга, может быть обнаружено, что на пути передачи аудиосигнала в нем произошла ошибка.

Информация 205 конфигурации, извлеченная из заголовка 201 сигнала 105 пространственной информации, является информацией для интерпретирования пространственной информации 203.

Сигнал 105 пространственной информации может включать в себя информацию (в дальнейшем названную «информацией временного выравнивания) для определения разницы во времени задержки между двумя сигналами при формировании многоканального сигнала с использованием сведенного сигнала 103 и сигнала 105 пространственной информации с помощью устройства декодирования аудиосигналов.

Аудиосигнал, передаваемый на устройство декодирования аудиосигналов с устройства кодирования аудиосигналов, анализируется (синтаксически) блоком демультиплексирования (не показан на чертеже), а затем разделяется на сведенный сигнал 103 и сигнал 105 пространственной информации.

Сведенный сигнал 103, отделенный блоком демультиплексирования, декодируется. Декодированный сведенный сигнал 103 формирует многоканальный сигнал с использованием сигнала 105 пространственной информации. При формировании многоканального сигнала посредством объединения сведенного сигнала 103 и сигнала 105 пространственной информации устройство декодирования аудиосигналов может подстроить синхронизацию между двумя сигналами, позицию начальной точки объединения двух сигналов и т.п. с использованием информации временного выравнивания (не показана на чертеже), включенной в информацию 205 конфигурации, извлеченную из заголовка 201 сигнала 105 пространственной информации.

Позиционная информация 207 временного интервала, к которому будет применен параметр, включается в пространственную информацию 203, включенную в сигнал 105 пространственной информации. Пространственным параметром (пространственным признаком) могут являться CLD (разности уровней каналов), указывающие на разность энергии между аудиосигналами, ICC (межканальные помехи), указывающие на близость или сходство между аудиосигналами, CPC (коэффициенты предсказания канала), указывающие на коэффициент, предсказывающий параметр аудиосигнала с использованием других сигналов. В дальнейшем каждый пространственный признак или группа пространственных признаков будет называться «параметром».

В случае если N параметры присутствуют в кадре, включенном в сигнал 105 пространственной информации, то N параметров применяются к определенным позициям временного интервала кадров, соответственно. Если информация, указывающая параметр, будет применена к одному из временных интервалов, включенных в кадр, как позиционная информация 207 временного интервала, то устройство декодирования аудиосигналов декодирует пространственную информацию 203 с использованием позиционной информации 207 временного интервала, к которому будет применен параметр. В этом случае параметр включается в пространственную информацию 203.

Фиг.3 изображает структурную схему устройства для декодирования аудиосигналов согласно одному варианту осуществления настоящего изобретения.

Изображенное на фиг.3 устройство для декодирования аудиосигналов согласно одному варианту осуществления настоящего изобретения включает в себя блок 301 приема и блок 303 извлечения.

Блок 301 приема устройства декодирования аудиосигналов принимает аудиосигнал, передающийся в форме ES устройством кодирования аудиосигналов через вход IN1.

Аудиосигнал, принимаемый устройством декодирования аудиосигналов, включает в себя идентификатор 101 аудиосигнала и сведенный сигнал 103, а также может дополнительно включать в себя сигнал 105 пространственной информации в качестве вспомогательных данных (вспомогательные данные) или дополнительных данных (данные расширения).

Блок 303 извлечения устройства декодирования аудиосигналов извлекает информацию 205 конфигурации из включенного в принятый аудиосигнал заголовка 201, а затем выводит извлеченную информацию 205 конфигурации через выход OUT1.

Аудиосигнал может включать в себя идентификационную информацию заголовка для определения, включен ли заголовок 201 в кадр.

Устройство декодирования аудиосигналов определяет, включен ли заголовок 201 в кадр, с использованием включенной в аудиосигнал идентификационной информации заголовка. Если заголовок 201 включен в аудиосигнал, то устройство декодирования извлекает информацию 205 конфигурации из заголовка 201. В настоящем изобретении, по меньшей мере, один заголовок 201 включается в сигнал 105 пространственной информации.

Изображенное на фиг.4 устройство для декодирования аудиосигналов согласно другому варианту осуществления настоящего изобретения включает в себя блок 301 приема, блок 401 демультиплексирования, основной блок 403 декодирования, блок 405 формирования многоканальных сигналов, блок 407 декодирования пространственной информации и блок 303 извлечения.

Блок 301 приема устройства декодирования аудиосигналов принимает аудиосигнал, передающийся в форме битового потока с устройства кодирования аудиосигналов, через вход IN2. Более того, блок 301 приема посылает принятый аудиосигнал на блок 401 демультиплексирования.

Блок 401 демультиплексирования разделяет посланный блоком 301 приема аудиосигнал на закодированный сведенный сигнал 103 и закодированный сигнал 105 пространственной информации. Блок 401 демультиплексирования передает отделенный от битового потока закодированный сведенный сигнал 103 на основной блок 403 декодирования, а также передает отделенный от битового потока закодированный сигнал 105 пространственной информации на блок 303 извлечения.

Закодированный сведенный сигнал 103 декодируется основным блоком 403 декодирования, а затем передается на блок 405 формирования многоканальных сигналов. Закодированный сигнал 105 пространственной информации включает в себя заголовок 201 и пространственную информацию 203.

Если заголовок 201 включен в закодированный сигнал 105 пространственной информации, то блок 303 извлечения извлекает информацию 205 конфигурации из заголовка 201. Блок 303 извлечения может определить присутствие заголовка 201, использующего идентификационную информацию заголовка, включенную в аудиосигнал. В частности, идентификационная информация заголовка может отображать, включен ли заголовок 201 в кадр, включенный в сигнал 105 пространственной информации. Идентификационная информация заголовка может указать порядок кадра или битовую последовательность аудиосигнала, в который включена информация 205 конфигурации, извлеченная из заголовка 201, если заголовок 201 включен в кадр.

В случае определения через идентификационную информацию заголовка того, что заголовок 201 включен в кадр, блок 303 извлечения извлекает информацию 205 конфигурации из включенного в кадр заголовка 201. Затем извлеченная информация 205 конфигурации декодируется.

Блок 407 декодирования пространственной информации декодирует включенную в кадр пространственную информацию 203 согласно декодированной информации 205 конфигурации.

Более того, блок 405 формирования многоканальных сигналов формирует многоканальный сигнал с использованием декодированного сведенного сигнала 103 и декодированной пространственной информации 203, а затем выводит сформированный многоканальный сигнал через выход OUT2.

Изображенное на фиг.5 устройство декодирования аудиосигналов принимает сигнал 105 пространственной информации, передающийся в форме битового потока с устройства кодирования аудиосигналов (этап S501).

Как упомянуто в вышеизложенном описании, сигнал 105 пространственной информации может быть передан в качестве ES, отдельно от сведенного сигнала 103, а также может быть передан в связке со сведенным сигналом 103.

Блок 401 демультиплексирования аудиосигналов разделяет принятый аудиосигнал на закодированный сведенный сигнал 103 и закодированный сигнал 105 пространственной информации. Закодированный сигнал 105 пространственной информации включает в себя заголовок 201 и пространственную информацию 203. Если заголовок 201 включен в кадр сигнала 105 пространственной информации, то устройство декодирования аудиосигналов идентифицирует заголовок 201 (этап S503).

Устройство декодирования аудиосигналов извлекает информацию 205 конфигурации из заголовка 201 (этап S505).

Более того, устройство декодирования аудиосигналов декодирует пространственную информацию 203 с использованием извлеченной информации 205 конфигурации (этап S507).

Изображенное на фиг.6 устройство декодирования аудиосигналов принимает сигнал 105 пространственной информации, передаваемый в форме битового потока с устройства кодирования аудиосигналов (этап S501).

Блок демультиплексирования 401 аудиосигнала разделяет принятый аудиосигнал на закодированный сведенный сигнал 103 и закодированный сигнал 105 пространственной информации. Закодированный сигнал 105 пространственной информации включает в себя заголовок 201 и пространственную информацию 203. Устройство декодирования аудиосигналов определяет, включен ли заголовок 201 в кадр (этап S601).

Если заголовок 201 включен в кадр, то устройство декодирования аудиосигналов идентифицирует заголовок 201 (этап S503).

Затем устройство декодирования аудиосигналов извлекает информацию 205 конфигурации из заголовка 201 (этап S505).

Устройство декодирования аудиосигналов определяет, является ли информация 205 конфигурации, извлеченная из заголовка 201, информацией 205 конфигурации, извлеченной из первого заголовка 201, включенного в сигнал 105 пространственной информации (этап S603).

Если информация 205 конфигурации извлечена из ранее извлеченного из аудиосигнала заголовка 201, то устройство декодирования аудиосигналов декодирует информацию 205 конфигурации (этап S611), а также декодирует пространственную информацию 203, передаваемую после информации 205 конфигурации, согласно декодированной информации 205 конфигурации.

Если извлеченный из аудиосигнала заголовок 201 не является заголовком 201, извлеченным первым из сигнала 105 пространственной информации, то устройство декодирования аудиосигналов определяет, идентична ли информация 205 конфигурации, извлеченная из заголовка 201, информации 205 конфигурации, извлеченной из первого заголовка 201 (этап S605).

Если информация 205 конфигурации идентична информации 205 конфигурации, извлеченной из первого заголовка 201, то устройство декодирования аудиосигналов декодирует пространственную информацию 203 с использованием декодированной информации 205 конфигурации, извлеченной из первого заголовка 201.

Если извлеченная информация 205 конфигурации не идентична информации 205 конфигурации, извлеченной из первого заголовка 201, то устройство декодирования аудиосигналов определяет, произошла ли ошибка в аудиосигнале на пути передачи от устройства кодирования аудиосигналов до устройства декодирования аудиосигналов (этап S607).

Если информация 205 конфигурации является изменяемой, то ошибка не происходит, даже в случае, если информация 205 конфигурации не идентична информации 205 конфигурации, извлеченной из первого заголовка 201. Следовательно, устройство декодирования аудиосигналов обновляет заголовок 201 в новый заголовок 201 (этап S609). Затем устройство декодирования аудиосигналов декодирует информацию 205 конфигурации, извлеченную из обновленного заголовка 201 (этап S611).

Устройство декодирования аудиосигналов декодирует пространственную информацию 203, передаваемую после информации 205 конфигурации, согласно декодированной информации 205 конфигурации.

Если неизменяемая информация 205 конфигурации не идентична информации 205 конфигурации, извлеченной из первого заголовка 201, это означает, что на пути передачи аудиосигнала произошла ошибка. Следовательно, устройство декодирования аудиосигналов либо удаляет включенную в кадр пространственную информацию 203, включая ошибочную информацию 205 конфигурации, либо исправляет ошибку пространственной информации 203 (этап S613).

Изображенное на фиг.7 устройство декодирования аудиосигналов принимает сигнал 105 пространственной информации, передаваемой в форме битового потока с устройства кодирования аудиосигналов (S501).

Блок 401 демультиплексирования аудиосигналов разделяет принятый аудиосигнал на закодированный сведенный сигнал 103 и закодированный сигнал 105 пространственной информации. В этом случае позиционная информация 207 временного интервала, к которому будет применен параметр, включается в сигнал 105 пространственной информации.

Устройство декодирования аудиосигналов извлекает позиционную информацию 207 временного интервала из пространственной информации 203 (этап S701).

Устройство декодирования аудиосигналов применяет параметр к соответствующему временному интервалу с помощью установления позиции временного интервала, к которому будет применен параметр, с использованием извлеченной позиционной информации временного интервала (этап S703).

Фиг.8 изображает графическое представление способа получения позиционной информации, представляющей количественный параметр, согласно одному варианту осуществления настоящего изобретения. Позиционная информация, представляющая количественный параметр временного интервала, является количеством битов, выделенных для представления позиционной информации 207 временного интервала.

Позиционная информация, представляющая количественный параметр временного интервала, к которому применяется первый параметр, может быть найдена вычитанием количества параметров из количества временных интервалов, добавлением единицы к результату вычитания, вычислением логарифма по основанию 2 от результата сложения и применением функции ceil к значению логарифма. В частности, позиционная информация, представляющая количественный параметр временного интервала, к которому будет применен первый параметр, может быть найдена посредством ceil(log² (k-i+1)), где «k» и «i» - количество временных интервалов и количество параметров соответственно.

Предположим, что «N» является натуральным числом, позиционная информация, представляющая количественный параметр временного интервала, к которому будет применен (N+1)^ый параметр, представляется как позиционная информация 207 временного интервала, к которому применяется N^ыйпараметр. В этом случае позиционная информация 207 временного интервала, к которому применяется N^ый параметр, может быть найдена посредством добавления количества временных интервалов, присутствующих между временным интервалом, к которому применяется N^ый параметр, и временным интервалом, к которому применяется (N-1)^ый параметр, к позиционной информации временного интервала, к которому применяется (N-1)^ый параметр, и добавления единицы к результату сложения (этап S801). В частности, позиционная информация временного интервала, к которому будет применен (N+1)^ый параметр, может быть найдена посредством j(N)+r(N+1)+1, где r(N+1) указывает количество временных интервалов, присутствующих между временным интервалом, к которому применяется (N+1)^ый параметр, и временным интервалом, к которому применяется N^ый параметр.

Если позиционная информация 207 временного интервала, к которому применяется N^ый параметр, найдена, то может быть получена позиционная информация временного интервала, представляющая количественный параметр, представляющий позицию временного интервала, к которому применяется (N+1)^ый параметр. В частности, позиционная информация временного интервала, представляющая количественный параметр, представляющий позицию временного интервала, к которому применяется (N+1)^ый параметр, может быть найдена посредством вычитания количества применяемых к кадру параметров и позиционной информации временного интервала, к которому применяется N^ыйпараметр, из количества временных интервалов, и добавления (N+1) к результату вычитания (этап S803). В частности, позиционная информация, представляющая количественный параметр временного интервала, к которому применяется (N+1)^ый параметр, может быть найдена посредством ceil(log₂ (k-i+N+1-j(N))), где «k», «i» и «j(N)» являются количеством временных интервалов, количеством параметров и позиционной информацией 205 временного интервала, к которому применяется N^ый параметр, соответственно.

В случае получения позиционной информации, представляющей количественный параметр временного интервала, вышеупомянутым способом, позиционная информация, представляющая количественный параметр временного интервала, к которому применяется (N+1)^ый параметр, имеет количество выделенных битов, обратно пропорциональное «N». А именно, позиционная информация, представляющая количественный параметр временного интервала, к которому применяется параметр, является переменным значением, зависящим от «N».

Фиг.9 изображает графическое представление способа декодирования аудиосигналов согласно другому варианту осуществления настоящего изобретения.

Устройство декодирования аудиосигналов принимает аудиосигнал от устройства кодирования аудиосигнала (этап S901). Аудиосигнал включает в себя идентификатор 101 аудиосигнала, сведенный сигнал 103 и сигнал 105 пространственной информации.

Устройство декодирования аудиосигналов извлекает включенный в аудиосигнал идентификатор 101 аудиосигнала (этап S903). Идентификатор, указывающий аудиокодек, включен в идентификатор 101 аудиосигнала.

Устройство декодирования аудиосигналов определяет, что аудиосигнал включает в себя сведенный сигнал 103 и сигнал 105 пространственной информации, используя идентификатор 101 аудиосигнала. В частности, устройство декодирования аудиосигналов может определить, что переданный аудиосигнал является сигналом для формирования многоканального сигнала, используя сигнал 105 пространственной информации (этап S905).

Более того, устройство декодирования аудиосигналов преобразует сведенный сигнал 103 в многоканальный сигнал, используя сигнал 105 пространственной информации. Как было упомянуто в вышеизложенном описании, заголовок 201 может быть включен в сигнал 105 пространственной информации с каждым предварительно определенным интервалом.

Промышленная применимость

Как упомянуто в вышеизложенном описании, способ и устройство для кодирования и декодирования аудиосигналов, согласно настоящему изобретению, могут сформировать заголовок, выборочно включаемый в сигнал пространственной информации.

Более того, в случае если множество заголовков включено в сигнал пространственной информации, способ и устройство для кодирования и декодирования аудиосигналов, согласно настоящему изобретению, могут декодировать пространственную информацию, даже в случае если аудиосигнал воспроизводится устройством декодирования аудиосигналов из случайной точки.

Несмотря на то что настоящее изобретение было описано и проиллюстрировано в настоящем документе со ссылкой на предпочтительные варианты осуществления, специалистам в данной области техники будет очевидно, что в изобретении могут быть сделаны различные модификации и изменения, не отступая от сущности и объема изобретения. Таким образом, настоящее изобретение охватывает модификации и изменения, которые находятся в рамках приложенной формулы изобретения и ее эквивалентов.

1. Способ декодирования аудиосигнала, содержащий этапы, на которых:
принимают аудиосигнал и информацию идентификации заголовка, указывающую, включен ли заголовок во вспомогательный сигнал, при этом аудиосигнал включает в себя сведенный сигнал и упомянутый вспомогательный сигнал;
извлекают информацию конфигурации из заголовка, если заголовок включен во вспомогательный сигнал согласно информации идентификации заголовка;
декодируют аудиосигнал на основе информации конфигурации, причем информация конфигурации включает в себя, по меньшей мере, одно из информации выравнивания времени и позиционной информации временного интервала,
при этом информация выравнивания времени указывает временную задержку между вспомогательным сигналом и сведенным сигналом, если передается вспомогательный сигнал, встроенный в сведенный сигнал.

2. Способ по п.1, в котором вспомогательный сигнал включает в себя, по меньшей мере, один заголовок в каждом предварительно установленном временном или пространственном интервале.

3. Способ по п.1, в котором вспомогательный сигнал указывает сигнал пространственной информации.

4. Способ по п.3, дополнительно содержащий применение параметра, включенного в сигнал пространственной информации, к соответствующему временному интервалу, используя позиционную информацию соответствующего временного интервала, включенную в сигнал пространственной информации.

5. Способ по п.3, в котором аудиосигнал включает в себя информацию идентификации сигнала, указывающую, скомбинирован ли сигнал пространственной информации со сведенным сигналом.

6. Способ по п.1, дополнительно содержащий идентифицирование начальной позиции кадра вспомогательного сигнала с использованием информации выравнивания времени.

7. Способ декодирования аудиосигнала содержащий этапы, на которых:
принимают аудиосигнал и информацию идентификации заголовка, указывающую, включен ли заголовок во вспомогательный сигнал, при этом аудиосигнал включает в себя сведенный сигнал и упомянутый вспомогательный сигнал;
если первый заголовок не включен во вспомогательный сигнал согласно информации идентификации заголовка, то декодируют аудиосигнал на основе информации конфигурации второго заголовка, причем второй заголовок передается перед первым заголовком,
при этом информация конфигурации включает в себя, по меньшей мере, одно из информации выравнивания времени и позиционной информации временного интервала,
причем информация выравнивания времени указывает временную задержку между вспомогательным сигналом и сведенным сигналом, если передается вспомогательный сигнал, встроенный в сведенный сигнал.

8. Устройство для декодирования аудиосигнала, содержащее
приемный блок, принимающий аудиосигнал и информацию идентификации заголовка, указывающую, включен ли заголовок во вспомогательный сигнал, при этом аудиосигнал включает в себя сведенный сигнал и упомянутый вспомогательный сигнал;
блок извлечения, извлекающий информацию конфигурации из заголовка, если заголовок включен во вспомогательный сигнал согласно информации идентификации заголовка;
блок формирования многоканального сигнала, декодирующий аудиосигнал на основе информации конфигурации,
причем информация конфигурации включает в себя, по меньшей мере, одно из информации выравнивания времени и позиционной информации временного интервала,
при этом информация выравнивания времени указывает временную задержку между вспомогательным сигналом и сведенным сигналом, если передается вспомогательный сигнал, встроенный в сведенный сигнал.
Приоритет по пунктам:

30.06.2005 по пп.1, 7, 8;

02.06.2006 по п.2;

22.06.2006 по пп.3-6.

Компактная дополнительная информация для параметрического кодирования пространственного звука // 2383939

Изобретение относится к кодированию звуковых сигналов и последующему синтезу слуховых пространств из закодированных звуковых данных. .

Способ и устройство для декодирования параметрического закодированного звукового сигнала // 2382485

Изобретение относится к декодированию звукового сигнала и, более конкретно, к декодированию параметрических закодированных звуковых сигналов. .

Многоканальный кодер // 2382419

Изобретение относится к многоканальным кодерам, например к многоканальным звуковым кодерам, использующим параметрическое описание пространственного звука. .

Способ совмещения параметрического многоканального аудиокодирования с матричным многоканальным кодированием объемного звучания // 2382418

Изобретение относится к многоканальному аудиокодированию и передаче и, в частности, к способам кодирования многоканального аудиосигнала, полностью обратно совместимого со стереоустройствами и форматами.

Способ осуществления эквалайзера в декодере аудиосигнала и устройство для его осуществления // 2381617

Изобретение относится к обработке аудиосигнала и, более конкретно, к способу осуществления эквалайзера в устройстве, предназначенном для обработки аудиосигнала. .

Стереофонически совместимое кодирование многоканального звука // 2381570

Изобретение относится к кодированию многоканального звука, и в частности к генерированию и использованию параметрического представления многоканального звукового сигнала, которое обратно совместимо со средствами воспроизведения сигнала параметрического стерео.

Способ и устройство масштабирования сигнала по времени // 2381569

Изобретение относится к способу и устройству масштабирования сигнала по времени. .

Функционирование вокодеров без последовательного соединения между несовместимыми системами связи // 2380860

Способ и устройство для декодирования аудиосигнала // 2380767

Изобретение относится к обработке аудиосигналов, более конкретно к способу и устройству для декодирования аудиосигнала. .

Способ и устройство для декодирования аудиосигнала // 2383942

Изобретение относится к обработке аудиосигналов, а более конкретно к устройству и способу декодирования аудиосигнала

Кодирование звуковых сигналов // 2383943

Масштабируемый аудиокодер без потерь и авторское инструментальное средство // 2387022

Изобретение относится к аудиокодекам без потерь, более конкретно - к масштабируемому аудиокодеку без потерь и авторскому инструментальному средству

Многоканальный аудиокодер без потерь // 2387023

Изобретение относится к аудиокодекам без потерь, более конкретно к многоканальным аудиокодекам без потерь

Кодер, декодер, способ кодирования и способ декодирования // 2387024

Изобретение относится к устройству кодирования, устройству декодирования, способу кодирования и способу декодирования

Способ и устройство для векторного квантования спектрального представления огибающей // 2387025

Изобретение относится к обработке речевых сигналов

Временное и пространственное генерирование многоканальных аудиосигналов // 2388068

Изобретение относится к кодированию многоканальных аудиосигналов

Снижение разреженности в кодированных речевых сигналах // 2388069

Изобретение относится к кодированию речи и более конкретно к проблеме разреженности в кодированных речевых сигналах

Способы и устройства для введения низкочастотных предыскажений в ходе сжатия звука на основе acelp/tcx // 2389085

Изобретение относится к способу введения низкочастотных предыскажений в спектр звукового сигнала, преобразуемого в частотной области и содержащего коэффициенты преобразования, сгруппированные в ряд блоков, в котором вычисляется максимальная интенсивность для одного блока и определяется индекс позиции блока с максимальной интенсивностью, рассчитывается коэффициент для каждого блока, имеющего индекс позиции меньше индекса позиции блока с максимальной интенсивностью, и для каждого блока определяется усиление из коэффициента и применяется к коэффициентам преобразования блока

Звуковой проигрыватель, способ воспроизведения звука // 2390056

Изобретение относится к устройству для воспроизведения звука с повышенным удобством