Устройство декодирования звукового сигнала и способ регулирования баланса устройства декодирования звукового сигнала

Авторы патента:

ЙОСИДА Кодзи (JP)

ЕХАРА Хироюки (JP)

КАВАСИМА Такуя (JP)

G10L19 - Техника анализа-синтеза речи для уменьшения избыточности, например в вокодерах ; кодирование или декодирование речи

Владельцы патента RU 2491656:

ПАНАСОНИК КОРПОРЭЙШН (JP)

Для поддержки ощущения стерео подавляется колебание в локализации декодированного сигнала. Блок (220) выбора выбирает параметры баланса, если параметры баланса являются входными данными из блока (210) декодирования коэффициента усиления, или выбирает входные данные параметров баланса из блока (223) вычисления коэффициента усиления, если не имеется входных данных параметра баланса из блока (210) декодирования коэффициента усиления, и выводит выбранные параметры баланса на блок (221) умножения. Блок (221) умножения умножает входные данные коэффициента усиления из блока (220) выбора на декодированные входные данные монофонического сигнала из блока (202) монофонического декодирования для выполнения обработки регулирования баланса. Технический результат - возможность гашения колебаний локализации декодированных сигналов и поддержки стереовоспроизведения. 2 н. и 5 з.п. ф-лы, 12 ил.

Область техники, к которой относится изобретение

Настоящее изобретение относится к устройству декодирования акустического сигнала и способу регулирования баланса в устройстве декодирования акустического сигнала.

Предшествующий уровень техники

В качестве схемы низкоскоростного кодирования акустических стереосигналов известна как схема интенсивности стерео. Стереосхема интенсивности использует способ формирования сигнала канала L (сигнала левого канала) и сигнала канала R (сигнала правого канала) посредством умножения монофонического сигнала на коэффициент пересчета. Данный способ также называется "панорамированием амплитуды".

Самым общим способом панорамирования амплитуды является нахождение сигнала канала L и сигнала канала R посредством умножения временного монофонического сигнала на коэффициент усиления панорамирования амплитуды (то есть на коэффициент усиления панорамирования) (например, см. непатентную литературу 1: V. Pulkki и M. Karjalainen, «Localization of amplitude-panned virtual sources I: Stereophonic panning», Journal of the Audio Engineering Society, т. 49, №9, сентябрь, 2001, стр.739-752). Кроме того, имеется и другой способ нахождения сигнала канала L и сигнала канала R посредством умножения монофонического сигнала на коэффициент усиления панорамирования каждого компонента частоты (или каждой группы частот) в частотной области (например, см. непатентную литературу 2: B. Cheng, C. Ritz и I. Burnett, «Principles and analysis of the squeezing approach to low bit rate spatial audio coding», протокол IEEE ICASSP2007, стр.I-13-I-16, апрель, 2007 и патентную литературу 3: Международная публикация №2009/038512.

Если коэффициенты усиления панорамирования применяются в качестве параметров кодирования параметрического стерео, то имеется возможность реализации масштабируемого стереосигнала (масштабируемого кодирования монофонического сигнала в стереосигнал) (например, см. патентную литературу 1: Японский перевод опубликованной заявки PCT №2004-535145 и патентную литературу 2: Японский перевод опубликованной заявки PCT №2005-533271). Коэффициенты усиления панорамирования описываются как параметры баланса в патентной литературе 1: Японский перевод опубликованной заявки PCT №2004-535145 и как ILD (перепад уровней) в патентной литературе 2: Японский перевод опубликованной заявки PCT №2005-533271.

Кроме того, предлагается (например, патентная литература 3 Международная публикация №2009/038512) масштабируемое кодирование монофонического сигнала в стереосигнал, использующее панорамирование для предварительной подготовки монофонического сигнала в стереосигнал, и кодирование разницы между стереосигналом и входным стереосигналом, получаемым посредством панорамирования.

Сущность изобретения

Техническая проблема

Однако, в масштабируемом кодировании монофонического сигнала в стереосигнал возможен случай, в котором кодированные стереоданные теряются в канале передачи и не принимаются на декодирующей стороне устройства. Кроме того, возможен случай, в котором возникает ошибка в кодированных стереоданных в канале передачи, и кодированные стереоданные отбрасываются на декодирующей стороне устройства. В этом случае, в устройстве декодирования не могут применяться параметры баланса (коэффициенты усиления панорамирования), включенные в состав кодированных стереоданных, и, следовательно, происходит переключение между стереосигналом и монофоническим сигналом, что изменяет локализацию декодированных акустических сигналов. В результате, ухудшается качество акустических стереосигналов.

Следовательно, задачей настоящего изобретения является предоставление устройства декодирования акустического сигнала, имеющего возможность гашения колебаний локализации декодированных сигналов и поддержки стереовоспроизведения, и способ регулирования баланса (панорамирования амплитуды) в устройстве декодирования акустического сигнала.

Решение проблемы

В устройстве декодирования акустического сигнала настоящего изобретения используется конфигурация, имеющая: блок декодирования, который декодирует первый параметр баланса кодированных стереоданных, блок вычисления, который вычисляет второй параметр баланса с использованием сигнала первого канала и сигнала второго канала стереосигнала, полученного ранее; и блок регулирования баланса, который выполняет обработку регулирования баланса монофонического сигнала с использованием второго параметра баланса в качестве параметра регулирования баланса, если не может быть использован первый параметр баланса.

Способ регулирования баланса настоящего изобретения включает в себя: этап, на котором декодируют первый параметр баланса кодированных стереоданных, этап, на котором вычисляют второй параметр баланса с использованием сигнала первого канала и сигнала второго канала стереосигнала, полученного ранее, и этап, на котором регулируют баланс для выполнения обработки регулирования баланса монофонического сигнала с использованием второго параметра баланса в качестве параметра регулирования баланса, если не может быть использован первый параметр баланса.

Преимущество изобретения

В соответствии с настоящим изобретением, имеется возможность гашения колебаний локализации декодированных сигналов и поддержки стереовоспроизведения.

Краткое описание чертежей

Фиг.1 изображает блок-схему, показывающую конфигурации устройства кодирования акустического сигнала и устройства декодирования акустического сигнала, в соответствии с первым вариантом осуществления настоящего изобретения;

Фиг.2 изображает блок-схему, показывающую пример конфигурации блока декодирования стерео, в соответствии с первым вариантом осуществления настоящего изобретения;

Фиг.3 изображает блок-схему, показывающую пример конфигурации блока регулирования баланса, в соответствии с первым вариантом осуществления настоящего изобретения;

Фиг.4 изображает блок-схему, показывающую пример конфигурации блока вычисления коэффициента усиления, в соответствии с первым вариантом осуществления настоящего изобретения;

Фиг.5 изображает блок-схему, показывающую пример конфигурации блока декодирования, в соответствии с первым вариантом осуществления настоящего изобретения;

Фиг.6 изображает блок-схему, показывающую пример конфигурации блока регулирования баланса, в соответствии с первым вариантом осуществления настоящего изобретения;

Фиг.7 изображает блок-схему, показывающую пример конфигурации блока вычисления коэффициента усиления, в соответствии с первым вариантом осуществления настоящего изобретения;

Фиг.8 изображает блок-схему, показывающую пример конфигурации блока регулирования баланса, в соответствии со вторым вариантом осуществления настоящего изобретения;

Фиг.9 изображает блок-схему, показывающую пример конфигурации блока вычисления коэффициента усиления, в соответствии со вторым вариантом осуществления настоящего изобретения;

Фиг.10 изображает блок-схему, показывающую пример конфигурации блока регулирования баланса, в соответствии со вторым вариантом осуществления настоящего изобретения;

Фиг.11 изображает блок-схему, показывающую пример конфигурации блока вычисления коэффициента усиления, в соответствии со вторым вариантом осуществления настоящего изобретения; и

Фиг.12 изображает блок-схему, показывающую пример конфигурации блока вычисления коэффициента усиления, в соответствии со вторым вариантом осуществления настоящего изобретения.

Описание варианта осуществления изобретения

Теперь будут описаны варианты осуществления настоящего изобретения, со ссылкой на прилагаемые чертежи. Кроме того, обработка регулирования баланса, в настоящем изобретении, относится к обработке преобразования стереосигнала посредством умножения монофонического сигнала на параметры баланса, и равноценна обработке панорамирования амплитуды. Кроме того, в настоящем изобретении параметры баланса определяются как коэффициенты усиления, посредством которых монофонический сигнал умножается после преобразования монофонического сигнала в стереосигнал, и являются равноценными коэффициентам усиления панорамирования в панорамировании амплитуды.

Первый вариант осуществления

Фиг.1 изображает конфигурации устройства 100 кодирования акустического сигнала и устройства 200 декодирования акустического сигнала, в соответствии с первым вариантом осуществления.

Как показано на фиг.1, устройство 100 кодирования акустического сигнала оснащено блоком 101 аналого-цифрового преобразования, блоком 102 монофонического кодирования, блоком 103 стереокодирования и блоком 104 мультиплексирования.

Блок 101 аналого-цифрового преобразования принимает в качестве входных данных аналоговый стереосигнал (сигнал канала L, т.е. L, сигнал канала R, т.е. R), преобразовывает данный аналоговый стереосигнал в цифровой стереосигнал, и выводит данный сигнал на блок 102 монофонического кодирования и блок 103 стереокодирования.

Блок 102 монофонического кодирования выполняет обработку понижающего микширования цифрового стереосигнала для преобразования его в монофонический сигнал, кодирует данный монофонический сигнал и выводит результат кодирования (кодированные монофонические данные) на блок 104 мультиплексирования. Кроме того, блок 102 монофонического кодирования выводит информацию, полученную посредством обработки кодирования (то есть информацию о монофоническом кодировании), на блок 103 стереокодирования.

Блок 103 стереокодирования параметрически кодирует цифровой стереосигнал с использованием информации о монофоническом кодировании, и выводит результат кодирования, включающий в себя параметры (то есть закодированные стереоданные), на блок 104 мультиплексирования.

Блок 104 мультиплексирования мультиплексирует кодированные монофонические данные и кодированные стереоданные, и выводит результат мультиплексирования (мультиплексированные данные) на блок 201 демультиплексирования устройства 200 декодирования акустического сигнала.

В данном примере имеется канал передачи (не показан), такой как телефонная линия, и сеть с коммутацией пакетов между блоком 104 мультиплексирования и блоком 201 демультиплексирования, и мультиплексированные данные, выведенные блоком 104 мультиплексирования, подвергаются обработке, такой как пакетирование, в случае необходимости, а затем выводятся в канал передачи.

В отличие от предыдущего, устройство 200 декодирования акустического сигнала оснащено блоком 201 демультиплексирования, блоком 202 монофонического декодирования, блоком 203 стереодекодирования и блоком 204 цифро-аналогового преобразования.

Блок 201 демультиплексирования принимает и демультиплексирует уплотненные данные, передаваемые из устройства 100 кодирования акустического сигнала в кодированные монофонические данные и кодированные стереоданные, и выводит кодированные монофонические данные на блок 202 монофонического декодирования, а кодированные стереоданные на блок 203 стереодекодирования.

Блок 202 монофонического декодирования декодирует кодированные монофонические данные в монофонический сигнал и выводит данный декодированный монофонический сигнал на блок 203 стереодекодирования. Кроме того, блок 202 монофонического декодирования выводит информацию (то есть информацию о монофоническом декодировании), полученную посредством данной обработки декодирования на блок 203 стереодекодирования.

В данном примере, блок 202 монофонического декодирования может выводить декодированный монофонический сигнал на блок 203 стереодекодирования как стереосигнал, подвергнутый обработке посредством повышающего микширования. Если в блоке 202 монофонического декодирования обработка посредством повышающего микширования не выполняется, то информация, требуемая для обработки посредством повышающего микширования, может выводиться из блока 202 монофонического декодирования на блок 203 стереодекодирования, и в блоке 203 стереодекодирования может выполняться обработка повышающего микширования декодированного монофонического сигнала.

В данном примере, в целом, для обработки посредством понижающего микширования не требуется особой информации. Однако, если по причине соответствия фазы канала L и канала R выполняется обработка посредством понижающего микширования, то информация о разности фаз рассматривается в качестве информации, требуемой для обработки повышающего микширования. Кроме того, в случае обработки понижающего микширования, по причине соответствия уровней амплитуды канала L и канала R, коэффициенты пересчета рассматриваются в качестве информации, требуемой для обработки повышающего микширования.

Блок 203 стереодекодирования декодирует декодированный монофонический сигнал в стереосигнал, с использованием кодированных стереоданных и информации о монофоническом кодировании, и выводит цифровой стереосигнал на блок 204 цифро-аналогового преобразования.

Блок 204 цифро-аналогового преобразования преобразует цифровой стереосигнал в аналоговый стереосигнал и выводит аналоговый стереосигнал как декодированный стереосигнал (декодированный сигнал канала L, т.е. сигнал L^, декодированный сигнал канала R, т.е. сигнал R^).

Затем, фиг.2 изображает пример конфигурации блока 203 стереодекодирования устройства 200 декодирования акустического сигнала. В качестве примера будет описываться конфигурация, в которой стереосигнал выражается параметрически, посредством обработки регулирования баланса.

Как показано на фиг.2, блок 203 стереодекодирования включает в себя блок 210 декодирования коэффициента усиления и блок 211 регулирования баланса.

Блок 210 декодирования коэффициента усиления декодирует параметры баланса из кодированных стереоданных, принятых в качестве входных данных из блока 201 демультиплексирования, и выводит данные параметры баланса на блок 211 регулирования баланса. Фиг.2 изображает пример, в котором как параметр баланса для канала L, так и параметр баланса для канала R выводятся из блока 210 декодирования коэффициента усиления.

Блок 211 регулирования баланса выполняет обработку регулирования баланса монофонического сигнала с использованием этих параметров баланса. Таким образом, блок 211 регулирования баланса умножает декодированный монофонический сигнал, принятый в качестве входных данных из блока 202 монофонического декодирования, на данные параметры баланса для формирования декодированного сигнала канала L и декодированного сигнала канала R. В данном примере, полагая, что декодированный монофонический сигнал относится к сигналам в частотной области (например, коэффициентам FFT (быстрого преобразования Фурье) и коэффициентам MDCT (модифицированного дискретного косинус преобразования)). Следовательно, каждая частота декодированного монофонического сигнала умножается на данные параметры баланса.

Нормальное устройство декодирования акустического сигнала выполняет обработку декодированного монофонического сигнала на основе участка полосы частот, где, обычно, ширина каждого участка полосы частот устанавливается шире на более высоких частотах. Даже в настоящем варианте осуществления, один параметр баланса декодируется на одном участке полосы частот, и тот же самый параметр баланса используется для компонентов частот на каждом участке полосы частот. Кроме того, также имеется возможность использования декодированного монофонического сигнала в качестве сигнала во временной области.

Затем, фиг.3 изображает пример конфигурации блока 211 регулирования баланса.

Как показано в фиг.3, блок 211 регулирования баланса включает в себя блок 220 выбора, блок 221 умножения, блок 222 частотно-временного преобразования и блок 223 вычисления коэффициента усиления.

Параметры баланса, принимаемые в качестве входных данных из блока 210 декодирования коэффициента усиления, принимаются в качестве входных данных блока 221 умножения через блок 220 выбора.

В случае приема параметров баланса в качестве входных данных из блока 210 декодирования коэффициента усиления (то есть в случае, если могут быть использованы параметры баланса, включенные в состав кодированных стереоданных), блок 220 выбора выбирает данные параметры баланса, или, в случае, если параметры баланса не принимаются в качестве входных данных из блока 210 декодирования коэффициента усиления (то есть в случае, если не могут быть использованы параметры баланса, включенные в состав кодированных стереоданных), блок 220 выбора выбирает параметры баланса, принятые в качестве входных данных из блока 223 вычисления коэффициента усиления, и выводит выбранные параметры баланса на блок 221 умножения. Выбор 220 формируется с помощью двух переключающих переключателей, как показано, например, на фиг.3. Один переключающий переключатель предназначен для канала L, а другой переключающий переключатель предназначен для канала R, и вышеупомянутый выбор выполняется посредством совместного переключения данных переключающих переключателей.

В данном примере, в случае, если параметры баланса не принимаются в качестве входных данных из блока 210 декодирования коэффициента усиления на блок 220 выбора, то возможен случай, в котором кодированные стереоданные теряются в канале передачи и не принимаются устройством 200 декодирования акустического сигнала, или в котором обнаруживается ошибка в кодированных стереоданных, принятых в устройстве 200 декодирования акустического сигнала, и эти данные отбрасываются. Таким образом, случай, в котором параметры баланса не принимаются в качестве входных данных из блока 210 декодирования коэффициента усиления, является равноценным случаю, в котором параметры баланса, включенные в состав кодированных стереоданных, не могут быть использованы. Следовательно, сигнал управления, указывающий на то, могут ли быть использованы параметры баланса, включенные в состав кодированных данных, принимается в качестве входных данных в блоке 220 выбора, и состояние соединения переключающих переключателей в блоке 220 выбора изменяется на основе данного сигнала управления.

Кроме того, например, для сокращения скорости передачи битов, если параметры баланса, включенные в состав кодированных стереоданных, не используются, блок 220 выбора может выбирать параметры баланса, принимаемые в качестве входных данных из блока 223 вычисления коэффициента усиления.

Блок 221 умножения умножает декодированный монофонический сигнал (который является монофоническим сигналом в качестве параметра частотной области), принимаемый в качестве входных данных из блока 202 монофонического декодирования посредством параметра баланса канала L и параметра баланса канала R, принимаемых в качестве входных данных из блока 220 выбора, и выводит результаты умножения для данных каналов L и R (являющихся стереосигналом в качестве параметра частотной области) на блок 222 частотно-временного преобразования и на блок 223 вычисления коэффициента усиления. Таким образом, блок 221 умножения выполняет обработку регулирования баланса монофонического сигнала.

Блок 222 частотно-временного преобразования преобразует результаты умножения для каналов L и R в блоке 221 умножения в сигналы временной области и выводит данные сигналы на блок 204 цифро-аналогового преобразования как цифровые стереосигналы для каналов L и R.

Блок 223 вычисления коэффициента усиления вычисляет соответствующие параметры баланса для каналов L и R из результатов умножения для каналов L и R в блоке 221 умножения, и выводит данные параметры баланса на блок 220 выбора.

Пример определенного способа вычисления параметров баланса в блоке 223 вычисления коэффициента усиления будет описан ниже.

Для i-того компонента частоты предполагается, что: параметр баланса для канала L является GL[i], параметр баланса для канала R является GR[i], декодированный стереосигнал для канала L является L[i], а декодированный стереосигнал для канала R является R[i]. Блок 223 вычисления коэффициента усиления вычисляет коэффициент GL[i] и коэффициент GR[i], в соответствии с уравнениями 1 и 2.

GL[i]=|L[i]|/(|L[i]|+|R[i]|) (Уравнение 1)

GR[i]=|R[i]|/(|R[i]|+|R[i]|) (Уравнение 2)

В данном примере, абсолютные значения не могут вычисляться в уравнениях 1 и 2. Кроме того, при вычислении знаменателя, могут вычисляться абсолютные значения после суммирования L и R. Однако, в случае суммирования L и R, а затем вычисления абсолютных значений, если L у R имеют противоположные знаки, то параметры баланса могут стать значительно больше. Следовательно, в данном случае, необходима контрмера, например, для установления порогового значения величины параметров баланса и ограничения параметров баланса.

Кроме того, в случае декодирования результатов квантования различий между выходными сигналами блока 221 умножения и сигналами каналов L и R, является предпочтительным вычисление коэффициентов усиления, в соответствии с уравнениями 1 и 2, с использованием сигнала канала L и сигнала канала R после суммирования декодированных, квантованных различий. Таким образом, возможно вычисление подходящих параметров баланса, даже если производительность кодирования исключительно посредством обработки регулирования баланса (то есть способность точного представления входных сигналов) не достаточна. Кроме того, для того, чтобы декодировать вышеупомянутые квантованные различия, в блоке 211 регулирования баланса на фиг.3, используется конфигурация добавления (не показана) блока декодирования квантованного различия между блоком 221 умножения и блоком 222 частотно-временного преобразования, в котором блок декодирования квантованного различия декодирует результат квантования различия между декодированным сигналом канала L, подвергаемым обработке регулирования баланса (то есть входным стереосигналом канала L, квантованным с использованием регулирования баланса), и сигналом канала L входного стереосигнала, и декодирует результат квантования различия между декодированным сигналом канала R, подвергаемым обработке регулирования баланса (то есть входным стереосигналом канала R, квантованным с использованием регулирования баланса), и сигналом канала R входного стереосигнала. Блок декодирования квантованного различия принимает декодированные стереосигналы каналов L и R в качестве входных данных из блока 221 умножения, принимает в качестве входных данных из блока 201 демультиплексирования и декодирует кодированные данные квантованного различия, суммирует результирующие декодированные сигналы квантованного различия с декодированными стереосигналами для каналов L и R соответственно, и выводит результаты суммирования на блок 222 частотно-временного преобразования в качестве итоговых декодированных стереосигналов.

Затем, фиг.4 изображает пример конфигурации блока 223 вычисления коэффициента усиления.

Как показано на фиг.4, блок 223 вычисления коэффициента усиления оснащен блоком 230 вычисления абсолютного значения канала L, блоком 231 вычисления абсолютного значения канала R, блоком 232 обработки сглаживания канала L, блоком 233 обработки сглаживания канала R, блоком 234 вычисления коэффициента усиления канала L, блоком 235 вычисления коэффициента усиления канала R, блоком 236 суммирования и блоком 237 масштабирования.

Блок 230 вычисления абсолютного значения канала L вычисляет абсолютное значение каждого компонента частоты параметров частотной области сигнала канала L, принимаемого в качестве входных данных из блока 221 умножения и выводит результаты на блок 232 обработки сглаживания канала L.

Блок 231 вычисления абсолютного значения канала R вычисляет абсолютное значение каждого компонента частоты параметров частотной области сигнала канала R, принимаемого в качестве входных данных из блока 221 умножения и выводит результаты на блок 233 обработки сглаживания канала R.

В блоке 232 обработки сглаживания канала L применяется обработка сглаживания по частотной оси к абсолютному значению каждого компонента частоты параметров частотной области сигнала канала L, и выводятся параметры частотной области сглаживания сигнала канала L по частотной оси на блок 234 вычисления коэффициента усиления канала L и на блок 236 суммирования.

В данном примере, обработка сглаживания по частотной оси является равноценной применению обработки фильтром низких частот по частотным осям к параметрам частотной области.

Более конкретно, как показано в уравнении 3, обработка выполняется для суммирования одного компонента перед, или одного компонента после каждого компонента частоты, а затем вычисления среднего значения, то есть вычисления среднего смещения трех точек. В уравнении 3, LF(f) относится к параметру частотной области сигнала канала L (параметру после вычисления абсолютного значения), LFs(f) относится к параметру частотной области после обработки сглаживания канала L, а f относится к порядковому номеру частоты (который является целым числом).

LFs(f)=(LF(f-1)+LF(f)+LF(f+1))/3 (Уравнение 3)

Кроме того, как показано в уравнении 4, также возможно выполнение обработки сглаживания по частотной оси с использованием авторегрессионной обработки фильтром низких частот. В данном примере, α относится к коэффициенту сглаживания.

LFs(f)=LF(f)+α×LFs(f-1) 0<α<1 (Уравнение 4)

В блоке 233 обработки сглаживания канала R применяется обработка сглаживания по частотной оси к абсолютному значению каждого компонента частоты параметров частотной области сигнала канала R, и выводятся параметры частотной области сглаживания сигнала канала R по частотной оси на блок 235 вычисления коэффициента усиления канала R и на блок 236 суммирования.

Поскольку обработка сглаживания в блоке 233 обработки сглаживания канала R подобна обработке сглаживания в блоке 232 обработки сглаживания канала L, то выполняется обработка для суммирования одного компонента перед или одного компонента после каждого компонента частоты, а затем вычисляется среднее значение, то есть вычисляется среднее смещение трех точек, как показано в уравнении 5. В уравнении 5, RF(f) относится к параметру частотной области сигнала канала R (параметр после вычисления абсолютного значения), а RFs(f) относится к параметру частотной области после обработки сглаживания канала R.

RFs(f)=(RF(f-1)+RF(f)+RF(f+1))/3 (Уравнение 5)

Кроме того, как показано в уравнении 6, также возможно выполнение обработки сглаживания по частотной оси с использованием авторегрессионной обработки фильтром низких частот.

RFs(f)=RF(f)+α×RFs(f-1) 0<α<1 (Уравнение 6)

Кроме того, обработка сглаживания канала L и обработка сглаживания канала R обязательно являются одной и той же обработкой. Например, если характеристики сигнала канала L и характеристики сигнала канала R различны, может иметь место случай, в котором целенаправленно используется различная обработка сглаживания.

Блок 236 суммирования суммирует, на основе компонента частоты, сглаживание параметров частотной области сигнала канала L со сглаживанием параметров частотной области сигнала канала R, и выводит результаты суммирования на блок 234 вычисления коэффициента усиления канала L и на блок 235 вычисления коэффициента усиления канала R.

Блок 234 вычисления коэффициента усиления канала L вычисляет отношение амплитуд между параметром (LFs(f)) частотной области, сглаживающим сигнал канала L и результатом (LFs(f)+RFs(f)) суммирования, принимаемым в качестве входных данных из блока 236 суммирования, и выводит отношение амплитуд на блок 237 масштабирования. То есть, блок 234 вычисления коэффициента усиления канала L вычисляет gL(f), показанный в уравнении 7.

gL(f)=LFs(f)/(LFs(f)+RFs(f)) (Уравнение 7)

Блок 235 вычисления коэффициента усиления канала R, вычисляет отношение амплитуд между параметром (RFs(f)) частотной области, сглаживающим сигнал канала R и результатом (LFs(f)+RFs(f)) суммирования, принимаемым в качестве входных данных из блока 236 суммирования, и выводит отношение амплитуд на блок 237 масштабирования. То есть, блок 235 вычисления коэффициента усиления канала R вычисляет коэффициент gR(f), показанный в уравнении 8.

gR(f)=RFs(f)/(LFs(f)+RFs(f)) (Уравнение 8)

Блок 237 масштабирования выполняет обработку масштабирования gL(f) и gR(f) для вычисления параметра GL(f) баланса для канала L и параметра GR(f) баланса для канала R, дает им задержку в один кадр, а затем выводит данные параметры баланса на блок 220 выбора.

В данном примере, если монофонический сигнал М(f) определяется как, например, М(f)=0.5(L(f)+R(f)), то блок 237 масштабирования выполняет обработку масштабирования gL(f) и gR(f) так, что GL(f)+GR(f)=2.0. Более конкретно, блок 237 масштабирования вычисляет GL(f) и GR(f) посредством умножения gL(f) и gR(f) на 2/(gL(f)+gR(f)).

Кроме того, в случае, если GL(f) и GR(f) вычисляются в блоке 234 вычисления коэффициента усиления канала L и в блоке 235 вычисления коэффициента усиления канала R, так, чтобы, удовлетворять соотношению GL(f)+GR(f)=2.0, то блоку 237 масштабирования не требуется выполнения обработки масштабирования. Например, в случае, если GR(f) вычисляется как GR(f)=2.0-GL(f) после вычисления GL(f) в блоке 234 вычисления коэффициента усиления, то блоку 237 обработки масштабирования не требуется выполнения обработки масштабирования. Следовательно, в данном случае, также возможно введение выходных данных блока 234 вычисления коэффициента усиления канала L и блока 235 вычисления коэффициента усиления канала R на блок 220 выбора. Более подробно данная конфигурация будет описана позже, с использованием фиг.12. Кроме того, несмотря на то, что в данном примере был описан случай, в котором сначала коэффициент усиления канала L вычисляется, также возможно сначала вычисление коэффициента усиления канала R, а затем вычисление коэффициента GL(f) усиления канала L из соотношения GL(f)=2.0-GR(f).

Кроме того, в случае, если не является возможным последовательное использование параметров баланса, включенных в состав кодированных данных, то продолжается режим, в котором выбираются параметры баланса, выводимые из блока 223 вычисления коэффициента усиления. Даже в этом случае, если повторяется вышеупомянутая обработка в блоке 223 вычисления коэффициента усиления, посредством повтора вышеупомянутой обработки сглаживания, вычисляемые в блоке 223 вычисления коэффициента усиления параметры баланса постепенно усредняются по всей полосе частот так, что является возможным регулирование баланса уровней между каналом L и каналом R до подходящего баланса уровней.

Кроме того, если продолжается режим, в котором выбираются выводимые из блока 223 вычисления коэффициента усиления параметры баланса, то имеется возможность выполнения обработки постепенного приближения параметров баланса от вычисленных ранее параметров баланса к 1.0 (то есть ближе к монофоническому). Например, может быть выполнена обработка, показанная в уравнении 9. В этом случае, в кадрах, отличных от кадра, в котором сначала не могут быть использованы параметры баланса, рассмотренная выше обработка сглаживания не является необходимой. Следовательно, при использовании данной обработки, имеется возможность сокращения количества вычислений, относящихся к вычислению коэффициента усиления, по сравнению со случаем, в котором выполняется рассмотренная выше обработка сглаживания. Кроме того, β является коэффициентом сглаживания.

GL(f)=βGL(f)+(1-β) 0<β<1 (Уравнение 9)

Кроме того, после продолжения режима, в котором выбираются выводимые из блока 223 вычисления коэффициента усиления параметры баланса, если данный режим изменяется на режим, в котором выбираются выводимые из блока 210 декодирования коэффициента усиления параметры баланса, то происходит эффект, при котором быстро изменяется звуковой образ или локализация источника звука. Посредством данного быстрого изменения, субъективное качество может понижаться. Следовательно, в данном случае, может быть возможным использование в качестве параметра баланса, принимаемого в качестве входных данных на блок 221 умножения, среднего значения между параметром баланса, выводимым из блока 210 декодирования коэффициента усиления, и параметром баланса, выводимым из блока 223 вычисления коэффициента усиления, непосредственно перед изменением режима выбора. Например, параметр баланса, принимаемый в качестве входных данных на блок 221 умножения, может быть вычислен в соответствии с уравнением 10. В данном примере, параметр баланса, принимаемый в качестве входных данных из блока 210 декодирования коэффициента усиления, является G^, параметр баланса, выводимый в результате из блока 223 вычисления коэффициента усиления, является Gp, а параметр баланса, принимаемый в качестве входных данных на блок 221 умножения, является Gm. Кроме того, γ является внутренним коэффициентом деления, а β является коэффициентом сглаживания для сглаживания γ.

Gm=γGp+(1-γ)G^, γ=βγ, 0<β<1 (Уравнение 10)

Таким образом, продолжается режим, в котором выбираются параметры баланса, выводимые блоком 210 декодирования коэффициента усиления, γ приближается к «0», по мере того, как повторяется обработка в уравнении 10, а если продолжается режим, в котором выбираются параметры баланса, выводимые из блока 210 декодирования коэффициента усиления, то для некоторых кадров Gm=G^. В данном примере, является возможным как предварительное определение количества кадров, требуемого для Gm=G^, так и установление Gm=G^ во время синхронизации режима, в котором выбираются параметры баланса, выводимые из блока 210 декодирования коэффициента усиления, продолжается для этого количества кадров. Следовательно, посредством постепенного приближения параметра баланса, принимаемого в качестве входных данных на блок 221 умножения, к параметру баланса, принимаемому в качестве входных данных из блока 210 декодирования коэффициента усиления, является возможным предотвращение ухудшения субъективного качества, вследствие быстрого изменения звукового образа или локализации источника звука.

Следовательно, в соответствии с настоящим вариантом осуществления, в случае, если не могут быть использованы (или не используются) параметры баланса, включаемые в состав кодированных стереоданных, то обработка регулирования баланса выполняется на монофоническом сигнале, с использованием параметров баланса, вычисляемых из сигнала канала L и сигнала канала R стереосигнала, полученного ранее. Следовательно, в соответствии с настоящим вариантом осуществления, имеется возможность гашения колебания локализации декодированных сигналов и поддержки стереовоспроизведения.

Кроме того, в настоящем варианте осуществления вычисляются параметры баланса с использованием отношения амплитуд сигнала канала L или сигнала канала R в отношении сигнала, суммирующего сигнал канала L с сигналом канала R стереосигнала. Следовательно, в соответствии с настоящим вариантом осуществления, имеется возможность вычисления подходящих параметров баланса, по сравнению со случаем использования отношения амплитуд сигнала канала L или сигнала канала R по отношению к монофоническому сигналу.

Кроме того, в настоящем варианте осуществления применяется обработка сглаживания по частотной оси к сигналу канала L и сигналу канала R для вычисления параметров баланса. Следовательно, в соответствии с настоящим вариантом осуществления, имеется возможность получения стабильной локализации и стереовоспроизведения, даже в случае, если единица измерения частоты (частотное разрешение) для выполнения обработки регулирования баланса является малой величиной.

Следовательно, в соответствии с настоящим вариантом осуществления, даже в случае, если информация о регулировании баланса, такая как параметры баланса, не может быть использована в качестве параметрических параметров стерео, то имеется возможность формирования псевдо стереосигналов высокого качества.

Пример изменения

Фиг.5 изображает пример изменения конфигурации блока 203a стереодекодирования устройства 200 декодирования акустического сигнала. В данном примере изменения используется блок 301 демультиплексирования и блок 302 декодирования остаточного сигнала, в дополнение к конфигурации на фиг.2. На фиг.5 блокам, выполняющим те же операции, что и на фиг.2, назначаются те же ссылочные номера, что и на фиг.2, и описание их действия будет опущено.

Блок 301 демультиплексирования принимает в качестве входных данных кодированных стереоданных, вводимых из блока 201 демультиплексирования, демультиплексирует кодированные стереоданные в кодированные данные параметров баланса и кодированные данные остаточного сигнала, выводит кодированные данные параметров баланса на блок 210 декодирования коэффициента усиления 210, и выводит кодированные данные остаточного сигнала на блок 302 декодирования остаточного сигнала.

Блок 302 декодирования остаточного сигнала принимает в качестве входных данных кодированные данные остаточного сигнала, выводимые из блока 301 демультиплексирования, и выводит декодированный остаточный сигнал каждого канала на блок 211a регулирования баланса.

В данном примере изменения, описывается случай, в котором настоящее изобретение применяется к конфигурации, в которой выполняется масштабируемое кодирование монофонического в стерео для параметрического представления стереосигнала и кодирования в качестве остаточного сигнала, компонентов различия, которые не могут быть представлены параметрически (то есть, например, конфигурация, показанная на фиг.10 патентной литературы 3: Международная публикация №2009/038512).

Затем, фиг.6 изображает конфигурацию блока 211a регулирования баланса, в настоящем примере изменения.

Как показано на фиг.6, блок 211a регулирования баланса в настоящем примере изменения дополнительно имеются блоки 303 и 304 суммирования и блок 305 выбора, в дополнение к конфигурации на фиг.3. На фиг.6, блокам, выполняющим те же операции, что и на фиг.3, назначаются те же ссылочные номера, и описание их действия будет опущено.

Блок 303 суммирования принимает в качестве входных данных сигнал канала L, выводимый из блока 221 умножения, и остаточный сигнал канала L, выводимый из блока 305 выбора, выполняет обработку суммирования данных сигналов, и выводит результат суммирования на блок 222 частотно-временного преобразования и на блок 223 вычисления коэффициента усиления.

Блок 304 суммирования принимает в качестве входных данных сигнал канала R, выводимый из блока 211 умножения, и остаточный сигнал канала R, выводимый из блока 305 выбора, выполняет обработку суммирования данных сигналов, и выводит результат суммирования на блок 222 частотно-временного преобразования и на блок 223 вычисления коэффициента усиления.

В случае получения остаточного сигнала в качестве входных данных из блока 302 декодирования остаточного сигнала (то есть в случае, в котором может быть использован остаточный сигнал, включенный в состав кодированных стереоданных), блок 305 выбора выбирает и выводит остаточный сигнал на блок 303 суммирования и на блок 304 суммирования. Кроме того, в случае неполучения остаточного сигнала в качестве входных данных из блока 302 декодирования остаточного сигнала (то есть в случае, если не может быть использован остаточный сигнал, включенный в состав кодированных стереоданных), блок 305 выбора ничего не выводит или выводит сигнал из одних нулей на блок 303 суммирования и на блок 304 суммирования. Например, как показано на фиг.6, блок выбора сформирован двумя переключающими переключателями. Один переключающий переключатель предназначен для канала L, и его выходная клемма соединена с блоком 303 суммирования, а другой переключаемый переключатель предназначен для канала R, и его выходная клемма соединена с блоком 304 суммирования. В данном примере, посредством совместного переключения данных переключающих переключателей, выполняется рассмотренный выше выбор.

В данном примере, как и случай, в котором остаточный сигнал из блока 302 декодирования остаточного сигнала не вводится в блок 305 выбора, предполагается случай, в котором кодированные стереоданные теряются в канале передачи, и не принимаются в устройстве 200 декодирования акустического сигнала, или в котором обнаруживается ошибка в кодированных стереоданных, принимаемых в устройстве 200 декодирования акустического сигнала, и эти данные отбрасываются. То есть случай, в котором остаточный сигнал не принимается в качестве входных данных из блока 302 декодирования остаточного сигнала, равноценен случаю, в котором остаточный сигнал, включаемый в состав кодированных стереоданных, по некоторым причинам не может быть использован. Фиг.6 изображает конфигурацию ввода сигнала управления, указывающего на то, возможно ли использование остаточного сигнала, включаемого в состав кодированных стереоданных, в блоке 305 выбора, и переключение режима соединения переключаемых переключателей блока 305 выбора на основе данного управляющего сигнала.

Кроме того, например, с целью сокращения скорости передачи битов, если остаточный сигнал, включаемый в состав кодированных стереоданных, не используется, то блок 305 выбора может размыкать переключаемые переключатели и ничего не выводить, или выводить сигналы из одних нулей.

Блок 222 частотно-временного преобразования преобразует результат суммирования, выводимый из блока 303 суммирования, и результат суммирования, выводимый из блока 304 суммирования, в сигналы времени, и выводит их на блок 204 цифро-аналогового преобразования, как соответствующие цифровые стереосигналы для каналов L и R.

Определенный способ вычисления параметров баланса в блоке 223 вычисления коэффициента усиления подобен способу, описанному со ссылкой на фиг.4. В данном случае, имеются различия лишь в том, что входные данные на блок 230 вычисления абсолютного значения канала L являются выходными данными блока 303 суммирования, а входные данные на блок 231 вычисления абсолютного значения канала R являются выходными данными блока 304 суммирования. Данный режим изображен на фиг.7.

Второй вариант осуществления

Описывается устройство декодирования акустического сигнала, в соответствии со вторым вариантом осуществления. Конфигурация устройства декодирования акустического сигнала, в соответствии со вторым вариантом осуществления, отличается от конфигурации устройства 200 декодирования акустического сигнала, в соответствии с первым вариантом осуществления, исключительно блоком регулирования баланса. Следовательно, главным образом, ниже будут описываться конфигурация и действия блока регулирования баланса.

Фиг.8 изображает конфигурацию блока 511 регулирования баланса, в соответствии со вторым вариантом осуществления. Как показано на фиг.8, блок 511 регулирования баланса оснащен блоком 220 выбора, блоком 221 умножения, блоком 222 частотно-временного преобразования и блоком 523 вычисления коэффициента усиления. Блок 220 выбора, блок 221 умножения и блок 222 частотно-временного преобразования выполняют те же самые действия, что и блоки с теми же наименованиями, формирующие блок 211 регулирования баланса, и, следовательно, их описание будет опущено.

Блок 523 вычисления коэффициента усиления вычисляет параметры баланса для компенсации использования декодированного монофонического сигнала, принимаемого в качестве входной информации из блока 202 монофонического декодирования, параметры баланса как для канала L, так и для канала R, принимаемые в качестве входных данных из блока 220 выбора, и результаты умножения в каналах L и R, принимаемые в качестве входных данных из блока 221 умножения (то есть параметры частотной области как для канала L, так и для R). Параметры баланса для компенсации вычисляются для канала L и канала R. Данные параметры баланса для компенсации выводятся на блок 220 выбора.

Затем, фиг.9 изображает конфигурацию блока 523 вычисления коэффициента усиления.

Как показано на фиг.9, блок 523 вычисления коэффициента усиления оснащен блоком 230 вычисления абсолютного значения канала L, блоком 231 вычисления абсолютного значения канала R, блоком 232 обработки сглаживания канала L, блоком 233 обработки сглаживания канала R, блоком 601 хранения коэффициента усиления канала L, блоком 602 хранения коэффициента усиления канала R, блоком 604 обнаружения главного компонента, и переключаемым переключателем 605. Блок 230 вычисления абсолютного значения канала L, блок 231 вычисления абсолютного значения канала R, блок 232 обработки сглаживания канала L, блок 233 выполнения сглаживания канала R выполняют те же самые действия, что и блоки с теми же самыми названиями, формирующие блок 223 вычисления коэффициента усиления, описанный в первом варианте осуществления.

Блок 604 обнаружения главного компонента принимает декодированный монофонический сигнал в качестве входных данных из блока 202 декодирования монофонического сигнала. Данный декодированный монофонический сигнал является параметром частотной области. Блок 604 обнаружения главного компонента обнаруживает компоненты частоты, в которых амплитуда превышает пороговое значение компонентов частоты, включенных в состав входного декодированного монофонического сигнала и выводит данные обнаруженные компоненты частоты в качестве частотной информации главного компонента на блок 603 вычисления коэффициента усиления главного компонента и на переключатель 605. В данном примере, пороговое значение, используемое для обнаружения, может являться фиксированным значением, или некоторым соотношением по отношению к средней амплитуде целого параметра частотной области. Кроме того, количество обнаруженных компонентов частоты, выводимых в качестве частотной информации главного компонента, как правило, не ограничивается, и может являться всеми компонентами частоты, превышающими пороговое значение, или может являться предварительно определенным количеством.

Блок 601 хранения коэффициента усиления канала L принимает параметр баланса канала L в качестве входных данных из блока 220 выбора и сохраняет его. Сохраненный параметр баланса канала L выводится на переключаемый переключатель 605 в следующем кадре или позже. Кроме того, блок 602 хранения коэффициента усиления канала R принимает параметр баланса канала R в качестве входных данных, выводимых из блока 220 выбора, и сохраняет его. Сохраненный параметр баланса канала R выводится на переключаемый переключатель 605 в следующем кадре или позже.

В данном примере, блок 220 выбора выбирает один из параметров баланса, полученных из блока 210 декодирования коэффициента усиления, и параметр баланса, выводимый из блока 523 вычисления коэффициента усиления в качестве параметра баланса для последующего использования в блоке 221 умножения (например, параметр баланса для использования в текущем кадре). Данный выбранный параметр баланса принимается в качестве входных данных на блок 601 хранения коэффициента усиления канала L и блок 602 хранения коэффициента усиления канала R, и сохраняется в качестве параметра баланса, использованного ранее в блоке 221 умножения (например, параметр баланса, использованный в предыдущем кадре). Кроме того, параметр баланса сохраняется для каждой частоты.

Блок 603 вычисления коэффициента усиления главного компонента формируется из блока 234 вычисления коэффициента усиления канала L, блока 235 вычисления коэффициента усиления канала R, блока 236 суммирования и блока 237 масштабирования. Блоки, формирующие главный блок 603 вычисления коэффициента усиления главного компонента, выполняют те же самые действия, что и блоки с теми же самыми наименованиями, формирующие блок 223 вычисления коэффициента усиления.

В данном примере, на основании частотной информации главного компонента, принимаемой в качестве входных данных из блока 604 обнаружения главного компонента и параметров частотной области, подвергаемых обработке сглаживания, принимаемой из блока 232 обработки сглаживания канала L и блока 233 обработки сглаживания канала R, блок 603 вычисления коэффициента усиления главного компонента вычисляет параметры баланса исключительно для компонентов частоты, заданных в качестве главного компонента частотной информации.

То есть, если, например, частотная информация главного компонента, принимаемая в качестве входных данных из блока 604 обнаружения главного компонента, является j, то коэффициенты GL[j] и GR[j] вычисляются в соответствии с рассмотренными выше уравнениями 1 и 2. В данном примере, удовлетворяется условие j $\in$ i. Кроме того, для простоты описания обработка сглаживания не рассматривается.

Следовательно, вычисленные параметры баланса для главной частоты выводятся на переключаемый переключатель 605.

Переключаемый переключатель 605 принимает параметры баланса в качестве входных данных из блока 603 вычисления коэффициента усиления главного компонента, блока 601 хранения коэффициента усиления канала L и блока 602 хранения коэффициента усиления канала R, соответственно. На основе частотной информации главного компонента, принимаемой в качестве входной информации из блока 604 обнаружения главного компонента, переключаемый переключатель 605 выбирает параметры баланса, принимаемые из блока 603 вычисления коэффициента усиления главного компонента, или параметры баланса, получаемые из блока 601 хранения коэффициента усиления канала L и блока 602 хранения коэффициента усиления канала R, каждого компонента частоты, и выводит выбранные параметры баланса на блок 220 выбора.

Для конкретики, если частотная информация главного компонента является j, то переключаемый переключатель 605 выбирает параметры GL[j] и GR[j] баланса, принимаемые в качестве входных данных из блока 603 вычисления коэффициента усиления главного компонента, в компоненте частоты j, и выбирает параметры баланса, принимаемые в качестве входных данных из блока 601 хранения коэффициента усиления канала L и блока 602 хранения коэффициента усиления канала R в других компонентах частоты.

Как описывается выше, в соответствии с настоящим вариантом осуществления, в блоке 523 вычисления коэффициента усиления, блок 603 вычисления коэффициента усиления главного компонента вычисляет параметры баланса исключительно для главных компонентов частоты, а переключаемый переключатель 605 выборочно выводит параметры баланса, получаемые блоком 603 вычисления коэффициента усиления главного компонента в качестве параметров баланса для главных компонентов частоты, в процессе выборочного вывода параметров баланса, хранящихся в блоке 601 хранения коэффициента усиления канала L и блоке 602 хранения коэффициента усиления канала R в качестве параметров баланса для компонентов частоты, отличных от главных компонентов частоты.

Таким образом, параметры баланса вычисляются исключительно в компонентах частоты с высокой амплитудой, а предыдущие параметры баланса используются в других компонентах частоты, так чтобы было возможно формирование псевдо стереосигналов высокого качества с малой степенью обработки.

Пример изменения 1

Фиг.10 изображает конфигурацию блока 511a регулирования баланса, в соответствии с примером изменения второго варианта осуществления. Настоящий пример изменения предоставляет блоки 303 и 304 суммирования и блок 305 выбора, в дополнение к конфигурации на фиг.8. Действия компонентов, добавленных к фиг.8, являются теми же самыми, что и на фиг.6, и, следовательно, компонентам назначаются те же самые ссылочные номера, а описание их действий будет опущено.

Фиг.11 изображает конфигурацию 523 блока вычисления коэффициента усиления в соответствии с настоящим примером изменения. Конфигурация и действия являются такими же, что и на фиг.9, и, следовательно, им будут назначаться те же самые ссылочные номера, а их описание будет опущено. Различия имеются исключительно в том, что входные данные на блок 230 вычисления абсолютного значения канала L являются выходными данными блока 303 суммирования, а входные данные на блок 231 вычисления абсолютного значения канала R являются выходными данными блока 304 суммирования.

Пример изменения 2

В случае, в котором обработка сглаживания, выполняемая в блоке 232 обработки сглаживания канала L и блоке 233 обработки сглаживания канала R, относится к обработке сглаживания, выполняемой с использованием исключительно компонентов частоты около главного компонента частоты, как показано в уравнениях 3 и 5, отдельная обработка, выполняемая в блоке 230 вычисления абсолютного значения канала L, блоке 231 вычисления абсолютного значения канала R, блоке 232 обработки сглаживания канала L и блоке 233 обработки сглаживания канала R, не должна выполняться во всех компонентах частоты, а должна выполняться исключительно для необходимых компонентов частоты. Таким образом, имеется возможность дополнительного сокращения степени обработки в блоке 523 вычисления коэффициента усиления. Для конкретики, если частотная информация главного компонента является j, то блок 230 вычисления абсолютного значения канала L и блок 231 вычисления абсолютного значения канала R, действуют для компонентов частоты j-1, j и j+1. С использованием данного результата, блок 232 обработки сглаживания канала L и блок 233 обработки сглаживания канала R, должны вычислять параметры частотной области, сглаженные исключительно для компонента частоты j.

Фиг.12 изображает конфигурацию 523а блока вычисления коэффициента усиления в соответствии настоящим примером изменения. В данном примере, фиг.12 изображает конфигурацию вычисления коэффициента GR(f) усиления правого канала из GR(f)=2.0-GL(f), описанного в первом варианте осуществления. Тем же самым компонентам и действиям, что и на фиг.11, назначаются те же самые ссылочные номера, и их описание будет опущено. Фиг.12 отличается от фиг.11, главным образом, конфигурацией внутри блока вычисления коэффициента усиления главного компонента.

Блок 606 вычисления коэффициента усиления главного компонента оснащен блоком 230 вычисления абсолютного значения канала L, блоком 231 вычисления абсолютного значения канала R, блоком 232 обработки сглаживания канала L, блоком 233 обработки сглаживания канала R, блоком 234 вычисления коэффициента усиления канала L, блоком 607 вычисления коэффициента усиления канала R и блоком 236 суммирования.

Блок 606 вычисления коэффициента усиления главного компонента вычисляет параметры баланса исключительно для частотной информации j главного компонента, принимаемой в качестве входных данных из блока 604 обнаружения. В данном примере будет описываться примерный случай, в котором обработка сглаживания в блоке 232 обработки сглаживания канала L и блоке обработки сглаживания канала R использует сглаживание трех точек, показанное в вышеупомянутых уравнениях 3 и 5. Следовательно, в настоящем примере изменения, в блоке 606 вычисления коэффициента усиления главного компонента используется конфигурация, включающая в себя блок 230 вычисления абсолютного значения канала L, блок 231 вычисления абсолютного значения канала R, блок 232 обработки сглаживания канала L и блок 233 обработки сглаживания канала R.

Блок 230 вычисления абсолютного значения канала L и 231 блок вычисления абсолютного значения канала R выполняют обработку абсолютного значения исключительно для компонентов j-1, j и j+1 частоты.

Блок 232 обработки сглаживания канала L и блок 233 обработки сглаживания канала R принимают в качестве входных данных абсолютные значения компонентов частоты в каждом канале для j-1, j и j+1, вычисляют значения сглаживания для компонента j частоты и выводят значения сглаживания на блок 236 суммирования. Выходные данные блока 232 обработки сглаживания канала L также принимаются в качестве входных данных в блоке 234 вычисления коэффициента усиления.

Как изображено на фиг.11, блок 234 вычисления коэффициента усиления канала L вычисляет параметр баланса левого канала для компонента частоты j. Вычисленный параметр баланса канала L выводится на переключаемый переключатель 605 и блок 607 вычисления коэффициента усиления канала R.

Блок 607 вычисления коэффициента усиления канала R принимает параметр баланса канала L в качестве входных данных, а затем вычисляет коэффициент GR(f) из соотношения GR(f)=2.0-GL(f). Параметры баланса вычисляются так же, как и выше, удовлетворяя GL(f)+GR(f)=2.0, таким образом, чтобы не было необходимости в обработке масштабирования в блоке 237 масштабирования. Вычисленный параметр баланса канала R выводится на переключаемый переключатель 605.

Посредством использования данной конфигурации, обработка абсолютного значения, обработка сглаживания и вычисления параметра баланса выполняются исключительно для главных компонентов, таким образом, чтобы имелась возможность вычисления параметров баланса с меньшей степенью обработки.

Кроме того, в случае, если конфигурация блока 523a вычисления коэффициента усиления применяется для блока 523 вычисления коэффициента усиления на фиг.8, то входные данные в блок 230 вычисления абсолютного значения канала L и блок 231 вычисления абсолютного значения канала R, являются выходными данными блока 221 умножения.

Кроме того, в конфигурациях блоков 523 вычисления коэффициента усиления на фиг.9 и фиг.11, блок 603 вычисления коэффициента усиления главного компонента выполняет обработку исключительно для главного компонента частоты. Однако, даже в блоках 523 вычисления коэффициента усиления на фиг.9 и фиг.11, схожих с блоком 523a вычисления коэффициента усиления на фиг.12, возможен случай, в котором в блоке вычисления коэффициента усиления главного компонента, используется конфигурация, включающая в себя блок 230 вычисления абсолютного значения канала L, блок 231 вычисления абсолютного значения канала R, блок 232 обработки сглаживания канала L и блок 233 обработки сглаживания канала R, и в котором блок 230 вычисления абсолютного значения канала L, блок 231 вычисления абсолютного значения канала R, блок 232 обработки сглаживания канала L и блок 233 обработки сглаживания канала R выполняются для главного компонента частоты.

Выше описываются варианты осуществления и примеры их изменения.

Кроме того, акустический сигнал, используемый для описания настоящего изобретения, используется в качестве собирательного термина звукового сигнала, речевого сигнала, и так далее. Настоящее изобретение применимо к любому из данных сигналов, или случаю, в котором данные сигналы присутствуют в комбинации.

Кроме того, несмотря на то, что выше описаны случаи с вариантами осуществления и примерами их изменения, в которых сигнал левого канала является L, а сигнал правого канала является R, условия, связанные с расположениями, не определяются посредством описания L и R.

Кроме того, настоящее изобретение применимо, несмотря на то, что конфигурация двух каналов L и R описывается в качестве примера, с вариантами осуществления и примерами их изменения, даже при обработке стирания кадра с маскированием в схеме кодирования с множеством каналов для определения среднего сигнала множества каналов, в качестве монофонического сигнала, и выражения сигнала каждого канала посредством умножения монофонического сигнала на весовой коэффициент для каждого сигнала канала в качестве параметра баланса. В данном случае, в соответствии с уравнениями 1 и 2, например, в случае трех каналов, имеется возможность определения параметров баланса следующим образом. В данном примере, C представляет третий сигнал канала, GC представляет параметр баланса третьего канала.

GL[i]=|L[i]|/(|L[i]|+|R[i]|+|C[i]|) (Уравнение 11)

GR[i]=|R[i]|/(|L[i]|+|R[i]|+|C[i]|) (Уравнение 12)

GC[i]=|C[i]|/(|L[i]|+|R[i]|+|C[i]|) (Уравнение 13)

Кроме того, несмотря на то, что выше описываются примеры случаев, в которых устройство декодирования акустического сигнала, в соответствии вариантами осуществления и примерами их изменения, принимает и обрабатывает мультиплексированные данные (потоки битов), передаваемые из устройства кодирования акустического сигнала, в соответствии настоящими вариантами осуществления, настоящее изобретение ими не ограничивается, и существенным требованием является то, что имеется необходимость передачи потоков битов, принимаемых и обрабатываемых посредством устройства декодирования акустического сигнала, в соответствии вариантами осуществления, из устройства кодирования акустического сигнала, которое может формировать потоки битов, которые могут быть обработаны посредством устройства декодирования акустического сигнала.

Кроме того, устройство декодирования акустического сигнала, в соответствии с настоящим изобретением, не ограничивается вышеупомянутыми вариантами осуществления и примером их изменения, и может реализовываться с различными изменениями.

Кроме того, устройство декодирования акустического сигнала, в соответствии с настоящим изобретением, может устанавливаться в устройстве терминала связи и устройстве базовой станции в системе мобильной связи, так чтобы имелась возможность предоставления устройства терминала связи, устройства базовой станции и системы мобильной связи, имеющих такие же результаты работы, как указано выше.

Несмотря на то, что выше описываются примерные случаи с вариантами осуществления и примером их изменения, в которых настоящее изобретение реализуется в аппаратных средствах, настоящее изобретение может быть реализовано и в программных средствах. Например, посредством описания алгоритма способа декодирования акустического сигнала, в соответствии с настоящим изобретением, на языке программирования, хранение данной программы в запоминающем устройстве и выполнение данной программы посредством блока обработки информации, имеется возможность реализации этой же функции в качестве устройства кодирования акустического сигнала настоящего изобретения.

Кроме того, каждый функциональный блок, используемый в описании каждого из вышеупомянутых вариантов осуществления, может, как правило, быть реализован в качестве LSI, составленной посредством интегральной схемы. Они могут являться как независимыми микросхемами, так и частично или полностью содержащимися на одиночной микросхеме.

В настоящем документе принимается термин "LSI", но также он может называться как "IC", "система LSI," "сверх LSI", или "сверхбольшая LSI", в зависимости от различных степеней интеграции.

Кроме того, способ интеграции схемы не ограничивается LSI, а также возможна реализация с использованием специализированной компоновки схемы или универсальных процессоров. После изготовления LSI, также является возможным использование матрицы FPGA (программируемой пользователем вентильной матрицы) или процессора с изменяемой конфигурацией, в котором соединения и параметры настройки ячеек схемы в LSI могут восстанавливаться.

Кроме того, если будет иметь место технология интегральной схемы для замены схемы LSI, как результат совершенствования технологии полупроводников или производная другой технологии, конечно, также имеется возможность выполнения интеграции функционального блока, с использованием данной технологии. Также возможно применение биотехнологий.

Раскрытия японской заявки на патент №2008-168180, поданной 27 июня 2008 г., и японской заявки на патент №2008-295814, поданной 19 ноября 2008, включающие в себя описания изобретений, чертежи и рефераты, включены в настоящий документ посредством ссылки на них.

Промышленная применимость

В устройстве декодирования акустического сигнала в соответствии с настоящим изобретением используется ограниченный объем запоминающего устройства, и, в особенности, для такого устройства как терминал связи, как мобильный телефон, то есть, осуществляющего радиосвязь принудительно на низкой скорости.

1. Устройство декодирования акустического сигнала, содержащее:
блок декодирования, выполненный с возможностью декодирования первого параметра баланса из кодированных стереоданных;
блок вычисления, выполненный с возможностью вычисления второго параметра баланса с использованием сигнала первого канала и сигнала второго канала стереосигнала, полученного ранее; и
блок регулирования баланса, выполненный с возможностью выполнения обработки регулирования баланса монофонического сигнала с использованием второго параметра баланса в качестве параметра регулирования баланса, если не может быть использован первый параметр баланса.

2. Устройство декодирования акустического сигнала по п.1, в котором блок вычисления выполнен с возможностью вычисления второго параметра баланса с использованием отношения амплитуд сигнала первого канала относительно сигнала, прибавляемого к сигналу первого канала и второго канала, и отношения амплитуд сигнала второго канала относительно прибавленного сигнала.

3. Устройство декодирования акустического сигнала по п.1, дополнительно содержащее:
блок хранения, выполненный с возможностью хранения параметра баланса, используемого ранее в блоке регулирования баланса; и
блок обнаружения, выполненный с возможностью обнаружения компонента частоты, который включен в монофонический сигнал, и у которого имеется значение амплитуды, большее или равное пороговому значению амплитуды, при этом:
блок вычисления, выполненный с возможностью вычисления второго параметра баланса исключительно для обнаруженного компонента частоты; и
блок регулирования баланса, выполненный с возможностью использования в качестве параметра регулирования баланса параметр баланса, сохраненный в блоке хранения, вместо второго параметра баланса для компонентов, отличных от обнаруженного компонента частоты.

4. Устройство декодирования акустического сигнала по п.2, дополнительно содержащее блок обработки сглаживания, выполненный с возможностью выполнения обработки сглаживания сигнала первого канала и сигнала второго канала по частотной оси,
при этом второй параметр баланса вычисляется с использованием сигнала первого канала и сигнала второго канала после обработки сглаживания.

5. Устройство декодирования акустического сигнала по п.3, дополнительно содержащее блок обработки сглаживания, выполненный с возможностью выполнения обработки сглаживания сигнала первого канала и сигнала второго канала по частотной оси,
при этом второй параметр баланса вычисляется с использованием сигнала первого канала и сигнала второго канала после обработки сглаживания.

6. Способ регулирования баланса, содержащий этапы, на которых:
декодируют первый параметр баланса из кодированных стереоданных;
вычисляют второй параметр баланса с использованием сигнала первого канала и сигнала второго канала стереосигнала, полученного ранее; и
выполняют обработку регулирования баланса монофонического сигнала с использованием второго параметра баланса в качестве параметра регулирования баланса, если не может быть использован первый параметр баланса.

7. Способ регулирования баланса по п.6, дополнительно содержащий этапы, на которых:
сохраняют параметр баланса, использованный ранее, в запоминающем устройстве на этапе, на котором регулируют баланс; и
обнаруживают компонент частоты, который включен в монофонический сигнал, и у которого имеется значение амплитуды, большее или равное пороговому значению амплитуды, при этом:
вычисляют второй параметр баланса исключительно для обнаруженного компонента частоты; и
регулируют баланс с использованием в качестве параметра регулирования баланса параметры баланса, сохраненного в запоминающем устройстве на этапе, на котором сохраняют вместо второго параметра баланса для компонентов, отличных от обнаруженного компонента частоты.

Основанное на преобразовании кодирование/декодирование с адаптивными окнами // 2488898

Кодирующее устройство, декодирующее устройство и способ // 2488897

Изобретение относится к вычислительной технике. .

Кодирующее устройство, декодирующее устройство и способ // 2488897

Изобретение относится к вычислительной технике. .

Микширование входящих информационных потоков и генерация выходящего информационного потока // 2488896

Изобретение относится к области телекоммуникационных систем. .

Звуковое кодирующее устройство и звуковое декодирующее устройство // 2487427

Изобретение относится к области звукового кодирования, в частности к кодированию на основе энтропии. .

Устройство и способ преобразования звукового сигнала в параметрическое представление, устройство и способ модификации параметрического представления, устройство и способ синтеза параметрического представления звукового сигнала // 2487426

Изобретение относится к алгоритмам параметрического кодирования звуковых сигналов. .

Способ кодирования сигнала и способ декодирования сигнала // 2486610

Изобретение относится к способу, устройству и системе для кодирования и декодирования сигналов. .

Квантователь, кодер и их способы // 2486609

Изобретение относится к вычислительной технике. .

Квантователь, кодер и их способы // 2486609

Изобретение относится к вычислительной технике. .

Способы и устройства для эффективного использования поэтапно передаваемой информации в кодировании и декодировании звука // 2491657

Устройство и способ кодирования/декодирования звукового сигнала посредством использования схемы переключения совмещения имен // 2492530

Устройство, способ и компьютерная программа для обеспечения набора пространственных указателей на основе сигнала микрофона и устройство для обеспечения двухканального аудиосигнала и набора пространственных указателей // 2493617

Устройство для обеспечения набора пространственных указателей, связанных с аудиосигналом повышающего микширования, имеющим более двух каналов, на основе двухканального сигнала микрофона, содержит анализатор сигнала и генератор дополнительной пространственной информации. Анализатор сигнала конфигурируют для получения информации энергии компонента и информации направления на основе двухканального сигнала микрофона таким образом, что информация энергии компонента описывает оценки энергий компонента прямого звука двухканального сигнала микрофона и компонента рассеянного звука двухканального сигнала микрофона, и таким образом, что информация направления описывает оценку направления, из которого приходит компонент прямого звука двухканального сигнала микрофона. Генератор дополнительной пространственной информации конфигурируют для сопоставления информации энергии компонента и информации направления с информацией пространственных указателей, которая описывает набор пространственных указателей, связанных с аудиосигналом повышающего микширования, имеющим более двух каналов. Технический результат - создание эффективной в вычислительном отношении концепции для получения информации пространственных указателей, сохраняя усилие на преобразование звука достаточно малым. 5 н. и 8 з.п. ф-лы, 21 ил.

Усовершенствованное гармоническое преобразование // 2493618

Настоящее изобретение относится к преобразованию сигналов во времени и/или по частоте и, в частности, к кодированию звуковых сигналов. Конкретнее, настоящее изобретение относится к способам высокочастотной реконструкции (HFR), включающим гармонический преобразователь в частотной области. Техническим результатом является повышение надежности системы преобразования сигнала, а также обеспечение улучшенного гармонического преобразования при малой дополнительной сложности. Описаны способ и система для генерирования преобразованного выходного сигнала из входного сигнала с использованием коэффициента преобразования Т. Система включает окно анализа длиной La, извлекающее кадр входного сигнала, и блок анализирующей трансформации порядка М, трансформирующий дискретные значения в М комплексных коэффициентов. М зависит от коэффициента преобразования Т. Система также включает блок нелинейной обработки, изменяющий фазу комплексных коэффициентов с использованием коэффициента преобразования Т, блок синтезирующей трансформации порядка М, трансформирующий измененные коэффициенты в М измененных дискретных значений, и окно синтеза длиной Ls, генерирующее кадр выходного сигнала νa(n). 6 н. и 31 з.п. ф-лы, 12 ил.

Способ кодирования аудиосигнала, способ декодирования аудиосигнала, устройство кодирования, устройство декодирования, система обработки аудиосигнала, программа кодирования аудиосигнала и программа декодирования аудиосигнала // 2493619

Изобретение относится к способу и устройству кодирования аудиосигнала и к способу и устройству декодирования аудиосигнала. Сущность состоит в том, что когда кадр, непосредственно предшествующий целевому кадру кодирования, подлежащий кодированию с помощью первого модуля кодирования, работающему согласно схеме кодирования с линейным предсказанием, кодируется с помощью второго модуля кодирования, работающего согласно схеме кодирования, отличной от схемы кодирования с линейным предсказанием, целевой кадр кодирования может быть кодирован согласно схеме кодирования с линейным предсказанием с помощью инициализации внутреннего состояния первого модуля кодирования. Вследствие этого может быть реализована обработка кодирования, выполняемая согласно множеству схем кодирования, включающих в себя схему кодирования с линейным предсказанием и схему кодирования, отличную от схемы кодирования с линейным предсказанием. Технический результат - улучшение качества речи. 7 н.п. ф-лы, 5 ил.

Изобретение относится к способам кодирования и декодирования аудиосигнала, к устройствам кодирования и декодирования и системе обработки аудиосигнала. Сущность способа кодирования заключается в том, что когда кадр, непосредственно предшествующий целевому кадру кодирования, подлежащий кодированию с помощью первого модуля кодирования, работающему согласно схеме кодирования с линейным предсказанием, кодируется с помощью второго модуля кодирования, работающего согласно схеме кодирования, отличной от схемы кодирования с линейным предсказанием, целевой кадр кодирования может быть кодирован согласно схеме кодирования с линейным предсказанием с помощью инициализации внутреннего состояния первого модуля кодирования. Вследствие этого может быть реализована обработка кодирования, выполняемая согласно множеству схем кодирования, включающих в себя схему кодирования с линейным предсказанием и схему кодирования, отличную от схемы кодирования с линейным предсказанием. Технический результат - улучшение качества речи. 7 н.п. ф-лы, 5 ил.

Многоканальный аудиокодек без потерь, который использует адаптивную сегментацию с возможностями точек произвольного доступа (rap) и множества наборов параметров предсказания (mpps) // 2495502

Изобретение относится к аудиокодекам без потерь, а более конкретно, к многоканальному аудиокодеку без потерь, который использует адаптивную сегментацию с возможностью точек произвольного доступа (RAP) и возможностью множества наборов параметров предсказания (MPPS). Аудиокодек без потерь кодирует/декодирует битовый поток с переменной скоростью передачи битов (VBR) без потерь с возможностью точек произвольного доступа (RAP) для инициирования декодирования без потерь в заданном сегменте в пределах кадра и/или возможностью множества набора параметров предсказания (MPPS), разделяемого для подавления влияния транзиентов. Это достигается с помощью методики адаптивной сегментации, которая устанавливает начальные точки сегмента, основываясь на ограничениях, предписываемых наличием необходимой RAP и/или обнаруженным транзиентом в кадре, и выбирает оптимальную продолжительность сегмента в каждом кадре для уменьшения кодированной полезной информации кадра, при условии ограничения кодированной полезной информации сегмента, RAP и MPPS в частности можно применять, чтобы повысить общую производительность для более длительной продолжительности кадра. Технический результат - повышение общей эффективности кодирования. 14. н.п. и 34 з.п. ф-лы, 23 ил.

Устройство кодирования звука, устройство декодирования звука, устройство кодирования и декодирования звука и система проведения телеконференций // 2495503

Изобретение относится к устройству, которое реализует кодирование и декодирование с уменьшенной задержкой, используя методику многоканального кодирования и декодирования звука соответственно. Устройство кодирования звука включает в себя: модуль формирования сигнала понижающего микширования (410), который формирует во временной области первый сигнал понижающего микширования, который является одним из 1-канального звукового сигнала и 2-канального звукового сигнала, из входного многоканального звукового сигнала; модуль кодирования сигнала понижающего микширования (404), который кодирует первый сигнал понижающего микширования; первый модуль преобразования t-f (401), который преобразует входной многоканальный звуковой сигнал в многоканальный звуковой сигнал частотной области; и модуль вычисления пространственной информации (409), который формирует пространственную информацию для формирования многоканального звукового сигнала из сигнала понижающего микширования. Технический результат - обеспечивает передачу и прием сигнала с более высоким качеством и меньшей задержкой и меньшей скоростью битового потока. 8 н. и 9 з.п. ф-лы, 9 ил.

Способ снижения скорости передачи низкоскоростных вокодеров с линейным предсказанием // 2495504

Изобретение относится к области цифровой связи и может быть использовано в системах телеинформационных коммуникаций для эффективного кодирования речевых сигналов. Техническим результатом предлагаемого способа является уменьшение скорости передачи данных по каналам связи при эффективном кодировании речевых сигналов с сохранением качественных показателей синтезированного сигнала. Поставленная цель в вокодере с линейным предсказанием достигается посредством отказа от передачи по каналу связи информации о сигнале возбуждения. Сигнал возбуждения идентифицируют непосредственно на приеме по данным о параметрах синтезирующей модели при помощи нейронной сети. По каналу связи передают информацию о коэффициентах формирующей модели, коэффициенте усиления, параметрах, характеризующих кодируемый речевой сигнал, которые рассчитывают на каждом квазистационарном сегменте анализа речевого сигнала. 3 ил.

Маскирование ошибки передачи в цифровом аудиосигнале в иерархической структуре декодирования // 2496156

Изобретение относится к обработке цифровых сигналов, например сигналов речи, музыки, в области телекоммуникаций. Объектом изобретения является способ маскирования ошибки передачи в цифровом сигнале, разбитом на множество последовательных фреймов, связанных с различными временными интервалами, в котором при приеме сигнал может содержать стертые фреймы и нормальные фреймы, при этом нормальные фреймы содержат информацию (inf), связанную с маскированием потери фрейма. Способ применяют во время иерархического декодирования с использованием основного декодирования и декодирования по трансформанте, используя окна с короткой задержкой с введением временной задержки, меньшей одного фрейма по сравнению с основным кодированием. Для замены, по меньшей мере, одного последнего фрейма, стертого перед нормальным фреймом, способ содержит: этап (23) маскирования первого набора недостающих выборок для стертого фрейма, применяемый в первом временном интервале; этап (25) маскирования второго набора недостающих выборок для стертого фрейма, учитывающий данные указанного нормального фрейма и применяемый во втором временном интервале, и этап (29) перехода между первым набором недостающих выборок и вторым набором недостающих выборок для получения, по меньшей мере, части недостающего фрейма. Технический результат - улучшение качества декодированных сигналов при потерях блоков данных путем повышения качества маскирования стертых фреймов в системе иерархического кодирования с короткой задержкой. 3 н. и 7.з.п. ф-лы, 7 ил.