Способ и устройство для декодирования аудиосигнала

Изобретение относится к способу и устройству для декодирования аудиосигнала, предназначено для обеспечения способа декодирования аудиосигнала посредством использования информации об объекте, включающей в себя информацию об уровне объекта и информацию о коэффициенте усиления объекта, для модифицирования сигнала понижающего смешивания аудиосигнала в виде изменения вклада объекта в каждый канал понижающего смешивания. Изобретение предназначено для обеспечения устройства для декодирования аудиосигнала посредством использования информации об объекте, включающей в себя информацию об уровне объекта и информацию о коэффициенте усиления объекта, чтобы модифицировать сигнал понижающего смешивания аудиосигнала в виде изменения вклада каждого объекта в каждый канал понижающего смешивания. Технический результат - обеспечение быстрого и эффективного декодирования многообъектных аудиосигналов посредством уменьшения времени обработки. 5 н. и 16 з.п ф-лы, 9 ил., 1 табл.

 

Область техники, к которой относится изобретение

Изобретение относится к способу и устройству для декодирования аудиосигнала и, в частности, к способу и устройству для декодирования аудиосигнала, принятого посредством различных цифровых носителей.

Уровень техники

При понижающем смешивании нескольких аудиообъектов в моно- или стереосигнал могут извлекаться несколько видов информации (или параметров) из сигналов индивидуальных объектов. Эти виды информации могут использоваться в декодере аудиосигнала. Выходной аудиосигнал блока управления многими объектами (MCU) может генерироваться с использованием видов информации, соответствующих сигналам индивидуальных объектов.

Блок управления многоточечными конференциями (MCU) представляет устройство, которое может использоваться, чтобы телеконференция связывала представляемые сигналы от удаленного места посредством конференцсвязи. Недавно увеличилось количество экспериментов, которые используют методы конвергенции, в соответствии с привлечением внимания к этим методам.

Обычный объединитель MCU, как правило, выполняет прием объединенного сигнала многоканальными аудиосигналами. Но когда многоканальные аудиосигналы, имеющие только многоканальный параметр, используются в MCU, он может управлять только одним из коэффициента усиления и панорамирования каналов, но не может управлять коэффициентом усиления и панорамированием объекта.

Описание изобретения

Техническая проблема

Декодер принимает сигнал понижающего смешивания и дополнительную информацию и может генерировать выходной сигнал, используя дополнительную информацию. Выходной сигнал может воспроизводиться, основываясь на другой входной информации, такой как орган управления пользователя или конфигурация проигрывания. Чтобы управлять сигналами индивидуальных объектов, декодер может принимать многообъектные сигналы и обрабатывать их для декодирования.

Однако устройство и способ для декодирования всех многообъектных сигналов требует большую полосу частот. Следовательно, необходимо новое устройство и способ для декодирования многообъектных сигналов для уменьшения требований к ресурсам, таким как большая полоса частот. Кроме того, для обратной совместимости с учетом каналоориентированного декодирования необходима дополнительная информация, соответствующая объекту, которая может быть гибко преобразована в многоканальный параметр.

Техническое решение

Следовательно, было сделано настоящее изобретение, учитывая вышеупомянутые проблемы, и оно относится к способу и устройству для декодирования аудиосигнала, который в значительной степени устраняет недостатки относящегося уровня техники и устраняет одну или несколько проблем относящегося уровня техники.

Задачей настоящего изобретения является обеспечение способа для декодирования аудиосигнала посредством использования информации об объекте, включающей в себя информацию об уровне объекта и информацию о коэффициенте усиления объекта, чтобы модифицировать сигнал понижающего смешивания аудиосигнала в виде изменения вклада объекта в каждый канал понижающего смешивания.

Другой задачей настоящего изобретения является обеспечение устройства для декодирования аудиосигнала посредством использования информации об объекте, включающей в себя информацию об уровне объекта и информацию о коэффициенте усиления объекта, чтобы модифицировать сигнал понижающего смешивания аудиосигнала в виде изменения вклада каждого объекта в каждый канал понижающего смешивания.

Другой задачей настоящего изобретения является обеспечение способа и устройства для декодирования аудиосигнала, содержащего сигнал понижающего смешивания и параметр объединенных объектов, выполняемый в объединителе MCU, чтобы управлять коэффициентом усиления объекта и выводить в удаленной конференции и т.п.

Другие преимущества, задачи и признаки изобретения излагаются, частично, в описании, которое следует ниже, и, частично, станут очевидными для специалиста в данной области техники при изучении нижеследующего или могут быть узнаны из практики изобретения. Цели и другие преимущества изобретения могут быть реализованы и получены посредством конструкции, конкретно указанной в письменном описании и его формуле изобретения, а также на прилагаемых чертежах.

Полезные эффекты

Различные варианты осуществления настоящего изобретения обеспечивают способ и устройство для быстрого и эффективного декодирования многообъектных аудиосигналов посредством уменьшения времени обработки, ресурсов компьютера, таким образом уменьшая требования к ресурсам, таким как большая полоса частот. Параметры объектов согласно вариантам осуществления настоящего изобретения могут обеспечивать обратную совместимость с учетом каналоориентированного процесса декодирования.

Краткое описание чертежей

Прилагаемые чертежи, которые включены для обеспечения лучшего понимания изобретения, иллюстрируют предпочтительные варианты осуществления изобретения и вместе с описанием служат для объяснения принципов настоящего изобретения. На чертежах:

фиг.1 представляет собой примерную блок-схему устройства декодирования аудиосигнала согласно одному варианту осуществления настоящего изобретения;

фиг.2 представляет собой блок-схему последовательности операций, иллюстрирующую способ декодирования аудиосигнала согласно варианту осуществления настоящего изобретения;

фиг.3 представляет собой примерную блок-схему устройства декодирования аудиосигнала согласно другому варианту осуществления настоящего изобретения;

фиг.4 представляет собой примерную блок-схему блока генерирования параметров согласно одному варианту осуществления настоящего изобретения;

фиг.5 представляет собой примерную блок-схему блока генерирования информации о коэффициенте усиления объекта согласно одному варианту осуществления настоящего изобретения;

фиг.6 представляет собой примерную блок-схему блока генерирования параметров согласно другому варианту осуществления настоящего изобретения;

фиг.7 представляет собой примерную блок-схему устройства для обработки аудиосигнала согласно другому варианту осуществления настоящего изобретения;

фиг.8 представляет собой примерную блок-схему блока объединения MCU согласно одному варианту осуществления настоящего изобретения;

фиг.9 представляет собой примерную блок-схему блока кодирования параметров объединенных объектов согласно одному варианту осуществления настоящего изобретения.

Лучший вариант осуществления изобретения

Чтобы выполнить эти задачи и другие преимущества согласно цели изобретения, воплощенного и широко описанного в данном документе, настоящее изобретение способа декодирования аудиосигнала содержит прием сигнала понижающего смешивания аудиосигнала, информации об объекте и информации о смешивании, причем информация об объекте включает в себя информацию об уровне объекта, информацию о сопоставлении объектов и информацию о коэффициенте усиления объекта, причем информация об уровне объекта генерируется посредством нормализации уровня объекта, соответствующего объекту, используя одно из уровней объекта в качестве эталонной информации, информация о сопоставлении объектов обеспечивается из объединения двух выбранных объектов, информация о коэффициенте усиления объекта содержит по меньшей мере одну из информации о значении коэффициента усиления объекта и информации об отношении коэффициентов усиления объектов; генерирование информации об обработке сигнала понижающего смешивания, использующей информацию об объекте и информацию о смешивании; и обработку сигнала понижающего смешивания аудиосигнала, используя информацию об обработке сигнала понижающего смешивания.

Необходимо понять, что как вышеприведенное общее описание, так и последующее подробное описание настоящего изобретения являются примерными и объяснительными и предназначены для того, чтобы обеспечить дополнительное объяснение заявленного изобретения.

Вариант изобретения

Ниже делается подробная ссылка на предпочтительный вариант осуществления настоящего изобретения, примеры которого изображены на прилагаемых чертежах. Где это возможно, одинаковые позиции используются на всех чертежах для ссылки на одинаковые или подобные компоненты.

Перед описанием настоящего изобретения необходимо отметить, что большая часть терминов, описанных в настоящем изобретении, соответствует общим терминам, хорошо известным в технике, но некоторые термины были выбраны применением как необходимые и ниже в данном документе описываются в нижеследующем описании настоящего изобретения. Поэтому предпочтительно, чтобы термины, определенные заявителем, были понятны на основе их значений в настоящем изобретении.

Фиг.1 представляет собой примерную блок-схему устройства 1000 для декодирования аудиосигнала согласно одному варианту осуществления настоящего изобретения. Фиг.3 представляет собой примерную блок-схему устройства 2000 декодирования аудиосигнала согласно другому варианту осуществления настоящего изобретения.

Два варианта осуществления устройства 1000 и 2000 имеют различие в том, что устройство 1000 имеет многоканальный декодер 1300, тогда как устройство 2000 не имеет многоканального декодера 1300. Другие элементы, такие как блок 1100 и 2000 генерирования параметров и блок 1200 и 2200 обработки сигнала понижающего смешивания являются одинаковыми на фиг.1 и 3.

Как показано на фиг.1, устройство 1000 для декодирования аудиосигнала (ниже в данном документе просто упоминается как «декодер 1000») включает в себя блок 1100 генерирования параметров, блок 1200 обработки сигнала понижающего смешивания и многоканальный декодер 1300. Блок 1100 генерирования параметров выполнен с возможностью приема информации об объекте и информации о смешивании от органа управления пользователя или из битового потока и генерирования информации об обработке сигнала понижающего смешивания.

Информация об объекте включает в себя информацию об уровне объекта, информацию о сопоставлении объектов и информацию о коэффициенте усиления объекта. Информация об уровне объекта может генерироваться посредством нормализации уровня объекта, соответствующего каждому объекту, используя один из уровней объекта в качестве эталонной информации. Информация о сопоставлении объектов может обеспечиваться из объединения двух выбранных объектов. Информация о коэффициенте усиления объекта включает в себя информацию о значении коэффициента усиления объекта или информацию об отношении коэффициентов усиления объектов. Информация об обработке сигнала понижающего смешивания включает в себя параметр для управления коэффициентом усиления объекта и панорамированием объекта, которая вводится в блок 1200 обработки сигнала понижающего смешивания.

Блок 1200 обработки сигнала понижающего смешивания выполнен с возможностью приема сигнала понижающего смешивания аудиосигнала с информацией об обработке сигнала понижающего смешивания от блока 1100 генерирования параметров. Блок 1200 обработки сигнала понижающего смешивания может обрабатывать сигнал понижающего смешивания, используя информацию об обработке сигнала понижающего смешивания, таким образом генерируя обработанный сигнал понижающего смешивания. Например, блок 1200 обработки сигнала понижающего смешивания может применять информацию об обработке сигнала понижающего смешивания к сигналу понижающего смешивания аудиосигнала, чтобы изменять одно или все из коэффициента усиления объекта и положение объекта сигнала понижающего смешивания аудиосигнала, чтобы генерировать обработанный сигнал понижающего смешивания.

Обработанный сигнал понижающего смешивания может вводиться в многоканальный декодер 1300 для повышающего смешивания и вывода при помощи выводного устройства, такого как громкоговоритель. Выходной сигнал многоканальных параметров от блока генерирования параметров также может вводиться в многоканальный декодер 1300. В некоторых вариантах осуществления настоящего изобретения многоканальный декодер 1300 может использоваться также как декодер системы окружающего звука Экспертной группы по вопросам движущегося изображения (MPEG).

Альтернативно, обработанный сигнал понижающего смешивания может непосредственно передаваться на выводное устройство и выводиться выводным устройством, таким как устройство 2000, показанное на фиг.2. Чтобы непосредственно выводить обработанный сигнал через громкоговорители, блок 2200 обработки сигнала понижающего смешивания может выполнять функцию банка синтезирующих фильтров и выводить данные импульсно-кодовой модуляции (ИКМ). Он также может выбирать или непосредственно выводить в виде ИКМ-сигнала, или вводить в многоканальный декодер посредством выбора пользователя.

Фиг.2 изображает блок-схему последовательности операций настоящего изобретения и ссылается также на фиг.1. Способ представляет собой последовательность операций способа декодирования для аудиосигнала. На этапе S110 принимается сигнал понижающего смешивания аудиосигнала, информация об объекте и информация о смешивании. На этапе 120 генерируется информация об обработке сигнала понижающего смешивания, используя информацию об объекте и информацию о смешивании. На этапе S130 генерируется обработанный сигнал понижающего смешивания для обработки сигнала понижающего смешивания аудиосигнала, используя информацию об обработке сигнала понижающего смешивания.

Конфигурация блока 1100 генерирования параметров ниже подробно объясняется с ссылкой на фиг.4-6.

1. Информация об объекте

1.1 Эталонная информация и информация об уровне объекта

Фиг.4 представляет собой примерную блок-схему устройства для обработки аудиосигнала согласно одному варианту осуществления настоящего изобретения, в частности, примерную блок-схему блока генерирования параметров. Как показано на фиг.4, блок 1100 генерирования параметров может быть выполнен с возможностью приема информации об объекте и генерирования информации об обработке сигнала понижающего смешивания, используя параметр объекта.

Блок 1100 генерирования параметров может включать в себя блок 1110а декодирования информации об уровне объекта, блок 1120а генерирования информации о коэффициенте усиления объекта и блок 1130а генерирования информации о сопоставлении объектов.

Сигнал понижающего смешивания аудиосигнала включает в себя многие из сигналов объекта, и сигналы объекта имеют уровень объекта в каждом сигнале объекта.

Информация об уровне объекта генерируется посредством нормализации уровня объекта, используя эталонную информацию, эталонной информацией может быть один из уровней объекта, более конкретно, эталонной информацией может быть наибольший уровень объекта среди всех уровней объекта.

Например, предполагается, что сигнал понижающего смешивания аудиосигнала включает в себя объект s_i, и уровень объекта каждого объекта s_i равен Ps_i.

Если передается энергия уровня объекта, так как она должна кодировать параметр объекта, параметр объекта включает в себя информацию об объекте следующего вида:

Ps_i может быть получен различными способами. Например, Ps_i может быть равен «s_i(n)2» или «E[s_i(n)2]». Ps_i может передаваться как информация, соответствующая каждому виду информации об уровне объекта. В данном случае «s_i(n)» ссылается на сигнал i-ного объекта, и s_i(n) может представлять собой или сигнал временной области, или сигнал подполосы в данной полосе.

Однако если информация об уровне объекта, соответствующая сигналу каждого объекта, передается как само значение, уровень объекта сигнала объекта может быть трудно квантовать из-за избыточного увеличения изменения динамического диапазона.

Таким образом, информация об уровне объекта может нормализоваться, используя эталонную информацию, наибольшую энергию уровня объекта из всех энергий объекта. Если эталонной информацией может быть r_1, информация об уровне объекта может передаваться так, как в математическом выражении ниже:

(математическое выражение 1)

E[s_i(n)2]/E[r_1(n)2],r_1(n)=эталонная информация

Вся информация об уровне объекта содержится в диапазоне, равном или меньшем 1.

Поэтому динамический диапазон может быть сжат в достаточной степени для кодирования аудиосигнала.

Дополнительно, информация об уровне объекта может включать в себя эталонную информацию, информацию по умолчанию, исходную энергию уровня объекта для использования другого сигнального процесса. Информация об уровне объекта соответствует каждому объекту, и количество видов информации об уровне объекта равно количеству объектов в сигнале понижающего смешивания.

1.2 Информация о коэффициенте усиления объекта

Параметр объекта содержит информацию о коэффициенте усиления объекта, включающую в себя по меньшей мере одну из информации о значении коэффициента усиления объекта и информации об отношении коэффициентов усиления объектов. Фиг.5 представляет собой примерную блок-схему устройства для обработки аудиосигнала согласно одному варианту осуществления настоящего изобретения, в частности, примерную блок-схему блока декодирования информации о коэффициенте усиления объекта блока 1100 генерирования параметров.

Блок 1120а генерирования информации о коэффициенте усиления объекта включает в себя блок 1121 генерирования информации о значении коэффициента усиления объекта и блок 1122 генерирования информации об отношении коэффициентов усиления объектов. Информация о коэффициенте усиления объекта относится к сигналу одного объекта способа понижающего смешивания для генерирования сигнала понижающего смешивания, имеющего более одного канала.

1.2.1 Информация о значении коэффициента усиления объекта

Информация о значении коэффициента усиления объекта содержит значение коэффициента усиления объекта. В некоторых вариантах осуществления настоящего изобретения коэффициент усиления объекта применяется к каждому объекту перед генерированием обработанного сигнала понижающего смешивания.

Например, когда сигнал понижающего смешивания аудиосигнала включает в себя множество объектов, каждая информация о значении коэффициента усиления объекта, соответствующая каждому объекту, умножается на уровень объекта каждого объекта для генерирования каждого усиленного объекта, и все усиленные объекты суммируются для генерирования обработанного сигнала понижающего смешивания.

(математическое выражение 2)

X=sum{a_i*s_i}

где Х представляет собой обработанный сигнал понижающего смешивания, подлежащий передаче на моноканал, s_i представляет собой уровень объекта и a_i представляет собой информацию о значении коэффициента усиления объекта у объекта, составляющего вклад в каждый канал.

1.2.2 Информация об отношении коэффициентов усиления объектов

Информация о коэффициенте усиления объекта содержит дополнительно информацию об отношении коэффициентов усиления объектов, а также информацию о значении коэффициента усиления объекта. Информация об отношении коэффициентов усиления объектов включает в себя значение отношения между коэффициентами усиления каждого объекта, составляющего вклад в каждый канал обработанного сигнала понижающего смешивания.

Информация об отношении коэффициентов усиления объектов может использоваться для обработки сигнала понижающего смешивания блоком 1200 обработки сигнала понижающего смешивания, таким образом получая обработанный сигнал понижающего смешивания, подлежащий передаче по 2-м (т.е. стерео) и более каналам. В случае стереоканала обработанный сигнал понижающего смешивания, подлежащий передаче по каждому стереоканалу, изображается математическим выражением 3. Информация об отношении коэффициентов усиления объектов может быть получена из математического выражения 4.

(математическое выражение 3)

x_1=sum{a_i*s_i},

x_2=sum{b_i*s_i},

где x_1 и x_2 представляют собой обработанный сигнал понижающего смешивания, подлежащий передаче по каждому каналу, соответственно, s_i представляет собой уровень объекта и a_i и b_i представляют собой информацию о значении коэффициента усиления объекта у объекта, составляющего вклад в каждый канал.

(математическое выражение 4)

m_i=a_i/b_i,

где m_i представляет собой информацию об отношении коэффициентов усиления объектов каждого объекта.

Информация о коэффициенте усиления объекта, т.е. информация (a_i и b_i) о значении коэффициента усиления объекта и информация (m_i) об отношении коэффициентов усиления объектов может передаваться на блок 1100 генерирования параметров с различным объединением информации о коэффициенте усиления объекта, содержащейся в битовом потоке. Объединения включают в себя, например, (a_i, b_i), (m_i, a_i) и (m_i, b_i). Блок 1100 генерирования параметров может декодировать объединения для восстановления исходной информации об объекте. Можно понять, что декодирование объединений, выполняемых блоком 1100 генерирования параметров, может быть адаптировано для другого декодера, например, многоканального декодера 1300.

Альтернативно, когда информация о коэффициенте усиления объекта передается на блок 1100 генерирования параметров в объединении с информацией (a_i, b_i) о значении коэффициента усиления объекта, информация о значении коэффициента усиления объекта может масштабироваться. Если есть соглашение, что b_i масштабируется в 1, хотя передается информация об уровне объекта и только a_i в качестве информации о коэффициенте усиления объекта, блок 1100 генерирования параметров может восстановить информацию об исходном объекте согласно соглашению. Посредством масштабирования значения коэффициента усиления объекта может быть уменьшено количество параметров, передаваемых на блок 1100 генерирования параметров.

Альтернативно, информация (m_i) об отношении коэффициентов усиления объектов может быть получена с другим значением как математическое выражение 5.

(математическое выражение 5)

m_i=a_i/b_i,

m_i=(a_i+α/b_i+β),

m_i=(a_i*s_i)/(b_i*s_i)

(α, β представляют собой очень малое число, которое предотвращает равенство нулю числителя и знаменателя.)

В случае, когда информация об отношении коэффициентов усиления объектов содержит s_i, такое же значение m_i может не включать такое же значение s_i. Например, в случае 1) a_i=0,5, b_i=0,5, 2) a_i=2, b_i=2 все в данном случае имеют одинаковое m_i(=1), но случаи имеют различные значения a_i, b_i.

Чтобы получить обработанный сигнал понижающего смешивания, подлежащий передаче по каждому каналу, может использоваться новый способ как математическое выражение 6:

(математическое выражение 6),

x_1=sum{a_i'(n)*s_i'(n)},

x_2=sum{b_i'(n)*s_i'(n)}

где a_i' и b_i' представляют собой значения, удовлетворяемые следующим условиям,

(a_i'+b_i'=C) или (a_i'^2+b_i'^2=C) или (a_i'=C или +b_i'=C), где s_i=g_i*s_i).

Наконец, информация об отношении коэффициентов усиления объектов может передаваться m_i'(=a_i'/b_i'). Может быть уменьшено количество параметров, передаваемых на блок 1100 генерирования параметров. Чтобы предотвратить искажение аудиосигнала в декодере 1000 или 2000, может передаваться m_i.

1.3 Информация о сопоставлении объектов

Как показано на фиг.4, блок 1100 декодирования параметров принимает информацию о сопоставлении объектов. Информация о сопоставлении объектов оценивается между двумя объектами и представляет сопоставление/связь между двумя объектами.

В случае, когда два объекта имеют одно и то же происхождение канала и передаются по различным каналам, может существовать информация о сопоставлении объектов.

Во-первых, если сигнал объекта включает в себя стереообъекты, стереообъекты могут генерировать монообъект, смешивающий с понижением стереообъекты, и генерировать параметр объекта-потомка, указывающий родство между каналами стереообъектов (ниже в данном документе данный способ представляет собой «моноспособ»). В данном случае информация об уровне объекта генерируется с использованием энергии уровня объекта монообъекта.

Во-вторых, стереообъекты распознают сигнал двух индивидуальных монообъектов. В данном случае информация об уровне объекта генерируется с использованием уровня двух индивидуальных монообъектов (ниже в данном документе данный способ представляет собой «стереоспособ»). Количество видов информации, подлежащих передаче с использованием второго способа, является большим, чем количество с использованием первого способа.

Чтобы обработать стереообъект, например сигналом первого канала стереообъектов может быть s_i, сигналом второго канала стереообъектов является s_j в качестве каждого сигнала монообъекта.

Уровень объекта вышеупомянутого сигнала канала может быть Ps_i, Ps_j.

В случае стереообъекта каждая информация об объекте, представляющая L и R каналы данного объекта, подобна друг другу. Поэтому информация о сопоставлении объектов может использоваться для представления подобия между информацией об объектах.

Поэтому, чтобы кодировать Ps_i и Ps_j, считается, что каждый монообъект, использующий стереоспособ, связывает один и тот же составляющий объект.

Информация о сопоставлении объектов включает в себя одно из мощности канала, как представляющую, например, левый канал стереообъекта, и нормализованное значение мощности, использующее представление следующим образом.

(математическое выражение 7)

Ps_j'=Ps_j/Ps_i или

Ps_j'=10log10(Ps_j)-10log10(Ps_i)=10log10(Ps_j/Ps_i)

Чтобы уменьшить количество передаваемых битов информации об объекте, эффективно использовать информацию о сопоставлении объектов.

И информация о сопоставлении объектов может генерироваться с использованием представления следующим образом.

(математическое выражение 8)

Ps_i',Ps_j'=Ps_i,Ps_j/sqrt(Ps_i*Ps_j)

Информация о сопоставлении объектов представляет родство между объектами, являются ли или нет объекты обоими каналами одно и того же стерео или многоканального объекта, т.е. каждый объект представляет собой другой канал одного и того же происхождения.

Кроме того, в отношении связи между двумя объектами может использоваться разностная информация.

Различная информация включает в себя сигнал суммы или разности стереообъекта следующим образом.

(математическое выражение 9)

M=(L+R)/2, S=(L-R)/2,

Ps_M=(Ps_L+Ps_R)/2, Ps_S=(Ps_L-Ps_R)/2.

Информация о сопоставлении объектов, включающая в себя вышеупомянутые М и Ps_M, может повысить эффективность передачи и является легкой для выполнения компенсации ошибок.

Количество видов информации о сопоставлении объектов изменяется адаптивно в соответствии с составляющими этого же объекта, чтобы уменьшить скорость передачи битов параметра объекта. Информация о флаге «флаг_сопоставления», указывающая, является ли объект частью стереообъекта или многоканального объекта, может быть принята из информации об объекте. Флаг_сопоставления может быть включен в информацию об объекте и может приниматься блоком 1100 генерирования информации.

Значение информации о флаге «флаг_сопоставления» показана таблице.

Флаг_сопоставления Значение
1 сопоставление
0 нет сопоставления

В том случае, когда «флаг_сопоставления» равен 0, информация о сопоставлении объектов не передается на блок 1130а декодирования информации о сопоставлении объектов. Когда «флаг_сопоставления» не принимается декодером 1000 или 2000, может использоваться значение по умолчанию для обработки сигнала понижающего смешивания аудиосигнала. В противном случае («флаг_сопоставления» равен 1), информация о сопоставлении объектов передается на блок 1130а декодирования информации о сопоставлении объектов о подобии между выбранными двумя объектами.

Кроме того, информация об объекте дополнительно отдельно включает в себя эталонную информацию. Когда присутствует эталонная информация, эталонной информацией может быть идентификатор для объединителя MCU.

Способ кодирования аудиосигнала согласно настоящему изобретению содержит этап приема многообъектного аудиосигнала и этап генерирования сигнала понижающего смешивания аудиосигнала и информации об объекте, включающей в себя информацию об уровне объекта, информацию о коэффициенте усиления объекта и сопоставление объектов, информация об уровне объекта и информация о сопоставлении объектов из многообъектного аудиосигнала, характеристики информации об уровне объекта, информация о коэффициенте усиления объекта и сопоставление объектов одни и те же, что и в способе декодирования. Поэтому способ кодирования аудиосигнала согласно настоящему изобретению может не ограничиваться, как определено выше.

Кроме того, устройство кодирования аудиосигнала согласно настоящему изобретению содержит блок понижающего смешивания, генерирующий сигнал понижающего смешивания аудиосигнала из многообъектного аудиосигнала, и блок информации об объекте, извлекающий информацию об объекте, включающую в себя информацию об уровне объекта, информацию о коэффициенте усиления объекта и информацию о сопоставлении объектов из многообъектного аудиосигнала. Устройство кодирования аудиосигнала может не ограничиваться, как определено выше.

2. Объединитель MCU

Аудиосигнал, содержащий многообъектные сигналы, может использоваться объединителем MCU для управления коэффициентом усиления объекта и выводом в удаленной конференции и т.д. В случае, когда используется аудиосигнал, содержащий многообъектные сигналы, эффективно управлять коэффициентом усиления объекта и панорамированием в соответствии с характеристикой сигнала каждого объекта.

Например, многоканальный аудиосигнал включает в себя вокальный звук, музыкальный фон (BGM), звук комментария. Как того требует случай, нельзя обнаружить или управлять специальным видом сигналов объекта, когда только используется или прослушивается музыкальный фон без вокального звука и звука комментария или только выполняется сообщение кому-то в телеконференции.

Кроме того, способ декодирования настоящего изобретения, использующий информацию об объекте, может использоваться в улучшенной системе караоке.

Фиг.6 представляет собой примерную блок-схему устройства для обработки аудиосигнала согласно варианту осуществления настоящего изобретения. Как показано на фиг.6, устройство для обработки аудиосигнала согласно варианту осуществления может содержать кодер 1 3100, кодер 2 4100, блок 5000 объединения, включающий в себя блок 5100 объединения MCU и устройство 5200 понижающего смешивания. Кодер 1 3100 и кодер 2 4100 могут быть выполнены с возможностью приема каждым аудиосигнала_1 или аудиосигнала_2 и генерирования сигнала_1 понижающего смешения и информации_1 об объекте в кодере 1 3100 и генерирования сигнала_2 понижающего смешивания и информации_2 об объекте в кодере 2 4100.

Блок 5000 объединения может быть выполнен с возможностью приема сигнала_1 понижающего смешивания и информации_1 об объекте от кодера 1 3100, сигнала_2 понижающего смешивания и информации_2 об объекте от кодера 2 4100 и информации управления от органа управления пользователя и генерирования сигнала понижающего смешивания и информации об объединенных объектах.

Сигнал понижающего смешивания, выходной сигнал блока 5000 объединения, может генерироваться обычным блоком понижающего смешивания. Поэтому подробности элементов устройства 5200 понижающего смешивания опускаются.

2.1 Параметр объединенных объектов

Фиг.7 представляет собой примерную блок-схему устройства для обработки аудиосигнала согласно варианту осуществления настоящего изобретения, в частности, примерную блок-схему блока 8100 объединения MCU. Как показано на фиг.7, блок 5100 объединения MCU может быть выполнен с возможностью генерирования информации об объединенных объектах, используя информацию_1 об объекте, информацию_2 об объекте и информацию управления. Информация об объединенных объектах включает в себя всю информацию, соответствующую сигналу_1 понижающего смешивания от кодера 1 3100 и сигналу_2 понижающего смешивания от кодера 2 4100.

Блок 5100 объединения MCU включает в себя блок 5110 декодирования информации об объекте и блок 5120 кодирования информации об объединенных объектах. Блок 5110 декодирования информации об объекте может быть выполнен с возможностью приема информации_1 об объекте от кодера 1 3100 и информации_2 об объекте от кодера 2 4100 и генерирования эталонного значения_1, информации_1 об уровне объекта и информации_1 о коэффициенте усиления объекта из информации_1 об объекте и эталонного значения_2, информации_2 об уровне объекта и информации_2 о коэффициенте усиления объекта. Эталонные значения, информация об уровне объекта и информация о коэффициенте усиления являются одинаковыми с теми, которые приведены на фиг.1-6. Поэтому подробности способа генерирования этих видов информации опускаются.

И блок 5100 объединения MCU может быть выполнен с возможностью приема по меньшей мере двух видов информации об объекте от каждого из многочисленных кодеров без ограничения входных сигналов, и генерирования информации об объединенных объектах, содержащей несколько видов информации, соответствующих сигналу понижающего смешивания.

2.2 Информация управления

Фиг.8 представляет собой примерную блок-схему устройства для обработки аудиосигнала согласно варианту осуществления настоящего изобретения, в частности, примерную блок-схему блока 5120 кодирования информации об объединенных объектах. Как показано на фиг.8, блок 5120 кодирования информации об объединенных объектах может быть выполнен с возможностью приема этих видов информации и информации управления от органа управления пользователя и генерирования информации об объединенных объектах, подлежащей вводу в декодер (не показан).

Информация управления может обрабатывать информацию_1 об объекте и информацию_2 об объекте и может применяться к объединению вышеупомянутой информации_1 об объекте и информации_2 об объекте в блоке 5120 кодирования информации об объединенных объектах. Информация об объединенных объектах может генерироваться для обработки информацией управления, причем информация управления указывает объединение некоторых объектов, составляющих информацию об объединенных объектах и управление коэффициентом усиления объекта в объединении видов информации об объекте.

Информация управления включает в себя информацию управления объектом, информацию управления коэффициентом усиления и информацию о предназначении. Каждая из информации управления объектом, информации управления коэффициентом усиления и информации о предназначении может объяснять нижеследующее.

2.2.1 Информация управления объектом

Информация управления объектом может определять целевые объекты для генерирования информации об объединенных объектах. Информация управления объектом может определять требуемый поднабор аудиообъектов информации_1 об объекте или информации_2 об объекте.

Информация управления объектом может обрабатываться в информацию об уровне объекта в блоке 5112 кодирования информации об уровне объекта. Информация об объединенных объектах может включать в себя информацию, соответствующую некоторым объектам, определяемым информацией управления объектом, и может использоваться в соответствии с несколькими целями.

Например, информация_1 об объекте содержит музыку, включающую в себя сигналы объектов вокального произведения, фортепиано, гитары и информация_2 об объекте содержит сигналы объекта скрипки, вокального произведения. Чтобы генерировать аудиосигнал, содержащий сигналы объектов фортепиано, гитары, скрипки, можно получить информацию об объединенных объектах, используя информацию управления объектом от органа управления пользователя без сигналов объекта вокального произведения.

2.2.2 Информация управления коэффициентом усиления

Блок 5113 кодирования информации о коэффициенте усиления объекта может быть выполнен с возможностью приема информации_1 о коэффициенте усиления из информации_1 об объекте, информации_2 о коэффициенте усиления из информации_2 об объекте, информации управления коэффициентом усиления и информации о предназначении и генерирования информации о коэффициенте усиления объекта информации об объекте.

Информация управления коэффициентом усиления может использоваться для управления коэффициентом усиления объекта для объединителя MCU. В отличие от информации управления объектом информация управления коэффициентом усиления может обрабатывать информацию об объекте в блоке 5113 кодирования информации о коэффициенте усиления объекта, причем информация об объекте выбирается с использованием информации управления объектом в блоке 5112 кодирования информации об уровне объекта. Информация управления коэффициентом усиления может представлять собой значение в диапазоне 0-1.

2.2.3 Информация о предназначении

Среди диапазона информации управления коэффициентом усиления, если информация управления коэффициентом усиления, соответствующая информации_i об объекте, равна 0, информация об объекте не включена в информацию об объединенных объектах. Когда информация управления коэффициентом усиления равна 0 или 1, информация управления коэффициентом усиления определяет информацию о предназначении. Информация о предназначении может включать в себя специальную информацию управления коэффициентом усиления, имеющую значение 0 или 1, и индикаторы, в какие предназначения должен выводиться сигнал понижающего смешивания.

Информация о предназначении может использоваться для специальной функции, например, функции шептания, тайной встречи и для управления предназначением сигнала объекта.

Как показано на фиг.8, информация о предназначении может вводиться в блок 5123 кодирования информации о коэффициенте усиления объекта и может обрабатывать информацию_1 о коэффициенте усиления и информацию_2 о коэффициенте усиления для управления коэффициентом усиления объекта информации об объединенных объектах. Если объединитель MCU имеет три порта, информация о предназначении может включать в себя каждое значение (0, 1) коэффициента усиления, соответствующее каждому выходному порту.

Информация управления коэффициентом усиления и информация о предназначении могут вводиться одновременно или отдельно в блок 5113 кодирования информации о коэффициенте усиления объекта.

2.3 Процесс генерирования информации об объединенных объектах

Фиг.8 представляет собой примерную блок-схему блока 5120 кодирования информации об объединенных объектах. Как показано на фиг.8, блок 5120 кодирования информации об объединенных объектах может быть выполнен с возможностью приема эталонного значения_1, эталонного значения_2, информации_1 об уровне объекта, информации_2 об уровне объекта, информации_1 о коэффициенте усиления объекта, информации_2 о коэффициенте усиления объекта, информации управления объектом, информации управления коэффициентом усиления и информации о предназначении, и генерирования информации об объединенных объектах, используя информацию управления объектом, информацию управления коэффициентом усиления и информацию о предназначении.

2.3.1 Определение эталонной информации

Снова ссылаясь на фиг.8, блок 5120 кодирования информации об объединенных объектах включает в себя блок 5121 генерирования эталонного значения, блок 5122 кодирования информации об уровне объекта и блок 5123 кодирования информации о коэффициенте усиления объекта.

Чтобы генерировать информацию об объединенных объектах, сначала может оцениваться эталонная информация информации об объединенных объектах. Каждый вид информации_i об объекте может включать в себя эталонную информацию для нормализации каждого уровня объекта и генерирования информации об уровне объекта. Но в случае объединения по меньшей мере двух видов информации об объекте для генерирования информации об объединенных объектах, информация об объединенных объектах может определять нормализацию уровня объекта, составляющего информацию об уровне объекта информации об объединенных объектах.

Эталонная информация информации об объединенных объектах может определяться несколькими способами. Например, эталонной информацией информации об объединенных объектах может быть эталонная информация_1 или наибольшая эталонная информация информации_i об объекте.

Вместо изменения эталонной информации информация об объединенных объектах может использовать информацию об уровне объекта информации_i об объекте в качестве информации об объединенных объектах

2.3.2 Информация об уровне объекта информации об объединенных объектах

Блок 5121 генерирования эталонной информации может оценивать эталонную информацию информации об объединенных объектах как вышеописанный способ. Перед изменением эталонной информации информации об объединенных объектах информация_i об уровне объекта нормализуется при помощи эталонной информации_i.

Изобретатели предполагают, что информация об уровне объекта информации_1 об объекте представляет собой (математическое выражение 10), и информация об уровне объекта информации об объединенных объектах представляет собой (математическое выражение 11).

(математическое выражение 10)

OL_1n=EO_1n/(эталонная информация информации_1 об объекте)

(OL_1n представляет собой информацию об уровне n-го объекта информации_1 об объекте, EO_1n представляет собой энергию уровня n-го объекта информации_1 об объекте)

(математическое выражение 11)

OL_k=OL_1n*(эталонная информация информации_1 об объекте)/(эталонная информация информации об объекте)

(OL_k представляет собой информацию об уровне k-го объекта информации об объединенных объектах)

2.3.2 Информация о коэффициенте усиления объекта

Блок 5123 кодирования информации о коэффициенте усиления объекта может быть выполнен с возможностью приема коэффициента_1 усиления объекта, коэффициента_2 усиления объекта, информации управления коэффициентом усиления и информации о предназначении, и генерирования информации о коэффициенте усиления объекта, используя информацию управления коэффициентом усиления и информацию о предназначении. В случае, когда информация о предназначении от органа управления пользователя указывает включение/выключение информации об объекте, т.е. информация о предназначении равна 0 или 1, информация о коэффициенте усиления объекта информации_i об объекте равна 0 или 1. В случае, когда информация управления коэффициентом усиления может вводиться с органа управления пользователя, информация_1 о коэффициенте усиления объекта и информация_2 о коэффициенте усиления объекта могут меняться, используя информацию управления коэффициентом усиления.

2.3.3 Информация о сопоставлении объектов

Информация о сопоставлении объектов указывает подобие/различие между каналами стереообъекта или многоканального объекта, поэтому на информацию о сопоставлении объектов может оказывать влияние объединение информации об объекте в блоке 5100 объединения MCU.

Информация о сопоставлении объектов информации об объединенных объектах может включать в себя информацию о сопоставлении объектов информации_i об объекте в том виде, как есть.

Для специалиста в данной области техники очевидно, что различные модификации и изменения могут быть сделаны в настоящем изобретении без отступления от сущности или объема изобретений. Таким образом, предполагается, что настоящее изобретение охватывает модификации и изменения данного изобретения при условии, что они подпадают под объем прилагаемой формулы изобретения и ее эквивалентов.

Следовательно, настоящее изобретение применимо для кодирования и декодирования аудиосигнала.

1. Способ декодирования аудиосигнала, содержащий:
прием сигнала понижающего смешивания аудиосигнала, информации об объекте и информации о смешивании, причем информация об объекте включает в себя информацию об уровне объекта, информацию о сопоставлении объектов и информацию о коэффициенте усиления объекта, информация об уровне объекта генерируется посредством нормализации уровня объекта, соответствующего объекту, используя один из уровней объекта в качестве эталонной информации, информация о сопоставлении объектов обеспечивается из объединения двух выбранных объектов, информация о коэффициенте усиления объекта содержит по меньшей мере одну из информации о значении коэффициента усиления объекта и информации об отношении коэффициентов усиления объектов;
генерирование информации об обработке сигнала понижающего смешивания, используя информацию об объекте и информацию о смешивании; и
обработку сигнала понижающего смешивания аудиосигнала, используя информацию об обработке сигнала понижающего смешивания.

2. Способ по п.1, в котором эталонная информация содержит наибольший уровень объекта среди всех уровней объекта.

3. Способ по п.1, в котором количество видов информации об уровне объекта равно количеству объектов в сигнале понижающего смешивания аудиосигнала.

4. Способ по п.1, в котором информация о сопоставлении объектов содержит информацию о родстве, представляющую другой объект с таким же происхождением.

5. Способ по п.1, в котором информация о сопоставлении объектов существует на основе флага_сопоставления.

6. Способ по п.1, в котором информация о сопоставлении объектов содержит значение по умолчанию, основанное на флаге_сопоставления.

7. Способ по п.1, в котором информация о значении коэффициента усиления объекта содержит значение коэффициента усиления, подлежащее применению к объекту для генерирования сигнала понижающего смешивания аудиосигнала.

8. Способ по п.1, в котором информация об отношении коэффициентов усиления объектов содержит отношение коэффициентов усиления для относительного вклада в по меньшей мере два канала сигнала понижающего смешивания аудиосигнала.

9. Способ по п.1, в котором информация об объекте также содержит эталонную информацию.

10. Способ по п.1, в котором информация об объекте также содержит флаг_сопоставления.

11. Способ по п.1, содержащий также:
получение обработанного сигнала понижающего смешивания аудиосигнала в качестве выходного сигнала.

12. Способ по п.1, содержащий также:
повышающее смешивание обработанного сигнала понижающего смешивания, используя многоканальный параметр.

13. Способ по п.1, в котором сигнал понижающего смешивания аудиосигнала принимается в качестве широковещательного сигнала.

14. Способ по п.1, в котором сигнал понижающего смешивания аудиосигнала принимается с цифрового носителя.

15. Считываемый компьютером носитель, имеющий хранимые на нем инструкции, которые, при исполнении их декодером, вызывают выполнение процессором операций, содержащих:
прием сигнала понижающего смешивания аудиосигнала, информации об объекте и информации о смешивании, причем информация об объекте включает в себя информацию об уровне объекта, информацию о сопоставлении объектов и информацию о коэффициенте усиления объекта, информация об уровне объекта генерируется посредством нормализации уровня объекта, соответствующего объекту, используя один из уровней объекта в качестве эталонной информации, информация о сопоставлении объектов обеспечивается из объединения двух выбранных объектов, информация о коэффициенте усиления объекта включает в себя по меньшей мере одну из информации об отношении коэффициентов усиления объектов и информации о значении коэффициента усиления объекта;
генерирование информации об обработке сигнала понижающего смешивания, используя информацию об обработке и информацию о смешивании;
обработку сигнала понижающего смешивания аудиосигнала, используя информацию об обработке сигнала понижающего смешивания.

16. Устройство для декодирования аудиосигнала, содержащее:
блок генерирования информации, принимающий информацию об объекте и информацию о смешивании, причем информация об объекте включает в себя информацию об уровне объекта, информацию о сопоставлении объектов и информацию о коэффициенте усиления объекта, информация об уровне объекта генерируется посредством нормализации уровня объекта, соответствующего объекту, используя один из уровней объекта в качестве эталонной информации, информация о сопоставлении объектов обеспечивается из объединения двух выбранных объектов, информация о коэффициенте усиления объекта содержит по меньшей мере одну из информации о значении коэффициента усиления объекта и информации об отношении коэффициентов усиления объектов, и генерирующий информацию об обработке сигнала понижающего смешивания, используя информацию об объекте и информацию о смешивании; и
блок обработки сигнала понижающего смешивания, принимающий сигнал понижающего смешивания аудиосигнала, и информацию об обработке сигнала понижающего смешивания, и обрабатывающий сигнал понижающего смешивания аудиосигнала, используя информацию об обработке сигнала понижающего смешивания.

17. Способ кодирования аудиосигнала, содержащий:
прием многообъектного аудиосигнала; и
генерирование сигнала понижающего смешивания аудиосигнала и информации об объекте, включающей в себя информацию об уровне объекта, информацию о коэффициенте усиления объекта и сопоставление объектов, причем информация об уровне объекта и информация о сопоставлении объектов из многообъектного аудиосигнала, информация об уровне объекта генерируется посредством нормализации уровня объекта, соответствующего объекту, используя один из уровней объекта в качестве эталонной информации, информация о сопоставлении объектов обеспечивается из объединения двух выбранных объектов, информация о коэффициенте усиления объекта содержит по меньшей мере одну из информации о значении коэффициента усиления объекта и информации об отношении коэффициентов усиления объектов.

18. Способ по п.17, в котором эталонная информация содержит наибольший уровень объекта среди всех уровней объекта.

19. Способ по п.17, в котором количество видов информации об уровне объекта равно количеству объектов в сигнале понижающего смешивания аудиосигнала.

20. Способ по п.17, в котором информация о сопоставлении объектов содержит информацию о родстве, представляющую другой объект с таким же происхождением.

21. Устройство для кодирования аудиосигнала, содержащее:
блок понижающего смешивания, генерирующий сигнал понижающего смешивания аудиосигнала из многообъектного аудиосигнала; и
блок информации об объекте, извлекающий информацию об объекте, включающую в себя информацию об уровне объекта, информацию о коэффициенте усиления объекта и информацию о сопоставлении объектов из многообъектного аудиосигнала, причем информация об уровне объекта и информация о сопоставлении объектов из многообъектного аудиосигнала, информация об уровне объекта генерируется посредством нормализации уровня объекта, соответствующего объекту, используя один из уровней объекта в качестве эталонной информации, информация о сопоставлении объектов обеспечивается из объединения двух выбранных объектов, информация о коэффициенте усиления объекта содержит по меньшей мере одну из информации о значении коэффициента усиления объекта и информации об отношении коэффициентов усиления объектов.



 

Похожие патенты:

Изобретение относится к генерированию многоканальных звуковых сигналов из матрично-кодированного стереосигнала объемного звука. .

Изобретение относится к телекоммуникационным системам, в частности к способу и устройству конкатенации кадров в системе связи. .

Изобретение относится к области высококачественного кодирования звука. .

Изобретение относится к методам кодирования речи, в частности к кодированию речи с обеспечением устойчивости к ошибкам и передаче речи по сети с пакетной коммутацией для приложений, связанных с передачей речевых данных по протоколу Интернет (VoIP, Voice over IP).

Изобретение относится к трансформации шкалы времени, т.е. .

Изобретение относится к устройствам кодирования и декодирования и к способам кодирования и декодирования, которые могут кодировать или декодировать сигналы с оптимальной скоростью передачи битов согласно характеристикам сигналов.

Изобретение относится к кодированию информационных сигналов, например, аудиокодированию, в частности, к кодированию с копированием спектральных полос (SBR). .

Изобретение относится к устройству и способу для генерации значений субполос звукового сигнала, к устройству и способу для генерации отсчетов временной области. .

Изобретение относится к кодированию и декодированию аудио для многоканальных сигналов. .

Изобретение относится к способу и устройству для декодирования аудиосигнала, принятого на цифровом носителе, например сигнала вещания

Изобретение относится к обработке аудиоданных с использованием фильтров с перекошенной характеристикой и, в частности, к многоцелевому кодированию аудиоданных

Изобретение относится к технологии обработки речевых сигналов, в частности система и способы относятся к изменению окна с кадром, ассоциированным с аудио сигналом

Изобретение относится к аудиокодекам, в частности к поддиапазонному кодированию, таблицам кодирования и/или избыточному кодированию

Изобретение относится к кодированию и/или декодированию звука с использованием структур иерархического кодирования и/или структур иерархического декодирования

Изобретение относится к обработке речевых сигналов

Изобретение относится к способу и устройству для обработки аудиосигнала, в частности широковещательного сигнала или т.п

Изобретение относится к системе электросвязи и предназначено для кодирования широкополосного речевого сигнала (ШРС) с диапазоном частот от 50 до 7000 Гц

Изобретение относится к способу переключения скорости передачи битов при декодировании аудиосигнала, кодированного с помощью системы аудиокодирования, причем упомянутое декодирование содержит этап последующей обработки, зависящий от скорости передачи битов
Наверх