Устройство декодирования параметров, устройство кодирования параметров и способ декодирования параметров

Авторы патента:

ЕХАРА Хироюки (JP)

G10L19/14 - детали, не отнесенные к группам G10L 19/06-G10L 19/12, например кодирование усиления, постфильтрационная схема, структура вокадера

Владельцы патента RU 2431892:

ПАНАСОНИК КОРПОРЭЙШН (JP)

Настоящее изобретение относится к устройству кодирования параметров с использованием устройства предсказания, и к устройству декодирования параметров и способу декодирования параметров, которые декодируют кодированный параметр. Техническим результатом является повышение эффективности маскирования параметра для исключения ухудшения качества. Указанный технический результат достигается тем, что устройство декодирования параметров содержит узел декодирования остатка предсказания, который находит квантованный остаток предсказания, основываясь на кодированной информации, включаемой в текущий кадр, подвергаемый декодированию, и узел декодирования параметра, который декодирует параметр, основываясь на указанном квантованном остатке предсказания, причем указанный узел декодирования остатка предсказания, когда указанный текущий кадр удаляют, находит квантованный остаток предсказания текущего кадра из взвешенной линейной суммы параметра, декодированного в прошлом, и квантованного остатка предсказания будущего кадра. 3 н. и 4 з.п. ф-лы, 27 ил.

ОБЛАСТЬ ТЕХНИКИ ИЗОБРЕТЕНИЯ

Настоящее изобретение относится к устройству кодирования параметров, которое кодирует параметр с использованием устройства предсказания, и к устройству декодирования параметров и способу декодирования параметров, которые декодируют кодированный параметр.

Предшествующий уровень техники

Что касается рекомендации ITU-T G.729, 3GPPAMR или подобного ему речевого кодека, некоторые из параметров, полученных с помощью анализа речевого сигнала, квантуют посредством способа квантования с предсказанием, основанного на модели предсказания скользящего среднего (МА) (патентный документ 1, непатентный документ 1, непатентный документ 2). Средство квантования с предсказанием МА-типа является моделью, которая предсказывает текущий параметр, который подвергается квантованию, с помощью линейной суммы предыдущих квантованных остатков предсказания, и речевой кодек линейного предсказания с кодовым возбуждением (CELP) используется для предсказания параметра частот спектральных линий (ЧСЛ, LSF) и параметра мощности.

Что касается средства квантования с предсказанием МА-типа, так как предсказание выполняют на основе взвешенной линейной суммы квантованных остатков предсказания в конечном количестве предыдущих кадров, даже если существует ошибка в тракте передачи квантованной информации, то ее влияние ограничено конечным количеством кадров. С другой стороны, с помощью средства квантования с предсказанием авторегрессивного (AR) типа, которое использует прошлые декодированные параметры рекурсивно, хотя высокая эффективность предсказания и квантования может в общем случае быть получена, влияние остатка продолжается в течение длительного периода. Следовательно, средство квантования параметра с предсказанием МА-типа может обеспечивать более высокую устойчивость к ошибкам, чем средство квантования параметра с предсказанием AR-типа, и оно используется, в частности, в речевом кодеке для мобильной связи.

Способы маскирования параметра, которые будут использоваться, когда кадр теряют (удаляют) на стороне декодирования, изучались в течение некоторого времени. В общем случае маскирование выполняют, используя параметр кадра, расположенного перед удаленным кадром, вместо параметра удаленного кадра. Однако в случае параметра ЧСЛ, параметры перед удаленным кадром постепенно изменяют с помощью постепенного приближения к среднему значению ЧСЛ, или выполняют постепенное ослабление в случае параметра мощности.

Этот способ обычно также используется в средстве квантования, использующем устройство предсказания МА-типа. В случае параметра ЧСЛ обработку выполняют для обновления состояния устройства предсказания МА-типа с помощью генерирования квантованного остатка предсказания таким образом, чтобы параметр, сгенерированный в маскированном кадре, был декодирован (непатентный документ 1), а в случае параметра мощности обработку выполняют для обновления состояния устройства предсказания МА-типа, используя результат уменьшения среднего значения предыдущих квантованных остатков предсказания в фиксированном процентном отношении (патентный документ 2, непатентный документ 1).

Также существует способ, посредством которого параметр удаленного кадра интерполируют после получения информации восстановленного кадра (обычного кадра), который следует за удаленным кадром. Например, в патентном документе 3 предложен способ, посредством которого выполняют интерполяцию усиления частот основного тона и повторно генерируют содержимое адаптивной кодовой книги.

Патентный документ 1: выложенная японская патентная заявка №HEI 6-175695

Патентный документ 2: выложенная японская патентная заявка №HEI 9-120297

Патентный документ 3: выложенная японская патентная заявка №2002-328700

Непатентный документ 1: рекомендация ITU-T G.729

Непатентный документ 2:3GPP TS 26.091

РАСКРЫТИЕ ИЗОБРЕТЕНИЯ

Проблемы, которые будут решены с помощью изобретения

Способ, посредством которого интерполируют параметр удаленного кадра, используется, когда квантование с предсказанием не выполняют, но когда квантование с предсказанием выполняют, даже если кодированную информацию принимают правильно в кадре, расположенном непосредственно после удаленного кадра, на устройство предсказания влияет ошибка в непосредственно предыдущем кадре, и оно не может получить правильный декодированный результат, и поэтому этот способ в общем случае не используется.

Таким образом, с помощью устройства квантования параметров, которое использует обычное устройство предсказания МА-типа, обработку маскирования параметра удаленного кадра не выполняют посредством способа интерполяции, и поэтому, например, может произойти потеря звука из-за чрезмерного ослабления параметра мощности, вызывая ухудшение субъективного качества.

Когда выполняют квантование с предсказанием, возможный способ состоит в декодировании параметра просто с помощью интерполяции квантованных декодированных остатков предсказания, но тогда как декодированный параметр меняется незначительно от одного кадра к другому кадру из-за определения взвешенного скользящего среднего значения, даже если квантованный декодированный остаток предсказания меняется очень сильно, при этом способе декодированный параметр также меняется в соответствии с изменениями квантованного декодированного остатка предсказания, так что когда изменения квантованного декодированного остатка предсказания большие, субъективное качество ухудшается.

Настоящее изобретение воплощают, учитывая описанные выше проблемы, и задачей настоящего изобретения является обеспечение устройства декодирования параметров, устройства кодирования параметров и способа декодирования параметров, которые дают возможность выполнять обработку маскирования параметра для подавления ухудшения субъективного качества при выполнении квантования с предсказанием.

Средство для решения проблем

Устройство декодирования параметров настоящего изобретения использует конфигурацию, имеющую узел декодирования остатка предсказания, который находит квантованный остаток предсказания, основываясь на кодированной информации, которую включает в себя текущий кадр, подвергаемый декодированию, и узел декодирования параметра, который декодирует параметр, основываясь на квантованном остатке предсказания; причем узел декодирования остатка предсказания, когда текущий кадр удаляют, находит квантованный остаток предсказания текущего кадра из взвешенной линейной суммы параметра, декодированного в прошлом, и квантованного остатка предсказания будущего кадра.

Устройство кодирования параметров настоящего изобретения использует конфигурацию, имеющую: узел анализа, который анализирует вводимый сигнал и находит анализируемый параметр; узел кодирования, который предсказывает анализируемый параметр, используя коэффициент предсказания, и получает квантованный параметр, используя квантованный остаток предсказания, полученный с помощью квантования остатка предсказания, и коэффициент предсказания; узел маскирования предыдущего кадра, который хранит множество наборов весовых коэффициентов, находит взвешенную сумму, используя наборы весовых коэффициентов для квантованного остатка предсказания текущего кадра, квантованного остатка предсказания два кадра назад и квантованного параметра два кадра назад, и находит множество квантованных параметров предыдущего кадра, используя взвешенную сумму; и узел определения, который сравнивает множество квантованных параметров один кадр назад, найденных с помощью узла маскирования предыдущего кадра, и анализируемый параметр, найденный с помощью узла анализа предыдущего кадра, выбирает один из квантованных параметров предыдущего кадра и выбирает и кодирует набор весовых коэффициентов, соответствующий выбранному квантованному параметру предыдущего кадра.

Способ декодирования параметров настоящего изобретения использует способ, имеющий этап декодирования остатка предсказания, состоящий из обнаружения квантованного остатка предсказания, основываясь на кодированной информации, которая включает в себя текущий кадр, подвергаемый декодированию, и этап декодирования параметра, состоящий из декодирования параметра, основываясь на квантованном остатке предсказания; причем на этапе декодирования остатка предсказания, когда текущий кадр удаляют, квантованный остаток предсказания текущего кадра находят из взвешенной линейной суммы параметра, декодированного в прошлом, и квантованного остатка предсказания будущего кадра.

Благоприятное воздействие изобретения

Согласно настоящему изобретению, когда текущий кадр удаляют, когда квантование с предсказанием не выполняют, обработку маскирования параметра можно выполнять для исключения ухудшения субъективного качества с помощью нахождения квантованного остатка предсказания текущего кадра из взвешенной линейной суммы квантованных остатков предсказания прошлого кадра и квантованных остатков предсказания будущего кадра.

КРАТКОЕ ОПИСАНИЕ ЧЕРТЕЖЕЙ

Фиг.1 - структурная схема, на которой показывают основную конфигурацию устройства декодирования речи согласно варианту осуществления 1 настоящего изобретения;

фиг.2 - чертеж, на котором показывают внутреннюю конфигурацию узла декодирования КЛП устройства декодирования речи согласно варианту осуществления 1 настоящего изобретения;

фиг.3 - чертеж, на котором показывают внутреннюю конфигурацию узла декодирования кодового вектора, показанного на фиг.2;

фиг.4 - чертеж, на котором показывают пример результата выполнения обычной обработки, когда нет удаленного кадра;

фиг.5 - чертеж, на котором показывают пример результата выполнения обработки маскирования данного варианта осуществления;

фиг.6 - чертеж, на котором показывают пример результата выполнения обычной обработки маскирования;

фиг.7 - чертеж, на котором показывают пример результата выполнения обычной обработки маскирования;

фиг.8 - структурная схема, на которой показывают основную конфигурацию устройства декодирования речи согласно варианту осуществления 2 настоящего изобретения;

фиг.9 - структурная схема, на которой показывают внутреннюю конфигурацию узла декодирования КЛП, показанного на фиг.8;

фиг.10 - структурная схема, на которой показывают внутреннюю конфигурацию узла декодирования кодового вектора, показанного на фиг.9;

фиг.11 - структурная схема, на которой показывают основную конфигурацию устройства декодирования речи согласно варианту осуществления 3 настоящего изобретения;

фиг.12 - структурная схема, на которой показывают внутреннюю конфигурацию узла декодирования КЛП, показанного на фиг.11;

фиг.13 - структурная схема, на которой показывают внутреннюю конфигурацию узла декодирования кодового вектора, показанного на фиг.12;

фиг.14 - структурная схема, на которой показывают внутреннюю конфигурацию узла декодирования коэффициента усиления, показанного на фиг.1;

фиг.15 - структурная схема, на которой показывают внутреннюю конфигурацию узла декодирования остатка предсказания, показанного на фиг.14;

фиг.16 - структурная схема, на которой показывают внутреннюю конфигурацию узла генерации квантованного остатка предсказания субкадра, показанного на фиг.15;

фиг.17 - структурная схема, на которой показывают основную конфигурацию устройства кодирования речи согласно варианту осуществления 5 настоящего изобретения;

фиг.18 - структурная схема, на которой показывают конфигурацию устройства передачи речевого сигнала и устройства приема речевого сигнала, которые конфигурируют систему передачи речевого сигнала согласно варианту осуществления 6 настоящего изобретения;

фиг.19 - чертеж, на котором показывают внутреннюю конфигурацию узла декодирования КЛП устройства декодирования речи согласно варианту осуществления 7 настоящего изобретения;

фиг.20 - чертеж, на котором показывают внутреннюю конфигурацию узла декодирования кодового вектора, показанного на фиг.19;

фиг.21 - структурная схема, на которой показывают основную конфигурацию устройства декодирования речи согласно варианту осуществления 8 настоящего изобретения;

фиг.22 - чертеж, на котором показывают внутреннюю конфигурацию узла декодирования КЛП устройства декодирования речи согласно варианту осуществления 8 настоящего изобретения;

фиг.23 - чертеж, на котором показывают внутреннюю конфигурацию узла декодирования кодового вектора на фиг.22;

фиг.24 - чертеж, на котором показывают внутреннюю конфигурацию узла декодирования КЛП устройства декодирования речи согласно варианту осуществления 9 настоящего изобретения;

фиг.25 - чертеж, на котором показывают внутреннюю конфигурацию узла декодирования кодового вектора, показанного на фиг.24; и

фиг.26 - структурная схема, на которой показывают основную конфигурацию устройства декодирования речи согласно варианту осуществления 10 настоящего изобретения.

Наилучший вариант осуществления изобретения

Варианты осуществления настоящего изобретения будут теперь описаны подробно в отношении сопроводительных чертежей. В последующих вариантах осуществления для примера описаны случаи, в которых устройство декодирования параметров и устройство кодирования параметров настоящего изобретения применяют к устройству декодирования речи и устройству кодирования речи CELP-типа, соответственно.

(Вариант осуществления 1)

Фиг.1 - структурная схема, на которой показывают основную конфигурацию устройства декодирования речи согласно варианту осуществления 1 настоящего изобретения. В показанном на фиг.1 устройстве 100 декодирования речи кодированную информацию, передаваемую от устройства кодирования (не показано), делят на код F_n+1 постоянной кодовой книги; код A_n+1 адаптивной кодовой книги, код G_n+1 коэффициента усиления и код L_n+1 КЛП (коэффициентов линейного предсказания) с помощью узла 101 демультиплексирования. Отдельно в устройство 100 декодирования речи вводят код B_n+1 удаления кадра. В данном случае нижний индекс n каждого кода указывает номер кадра, подвергаемого декодированию. Т.е. кодированную информацию разделяют в (n+1)-м кадре (в дальнейшем называют «следующим кадром») после n-го кадра, подвергаемого декодированию (в дальнейшем называют «текущим кадром»).

Код F_n+1 постоянной кодовой книги вводят в узел 102 декодирования вектора постоянной кодовой книги (ВПКК), код A_n+1 адаптивной кодовой книги - в узел 103 декодирования вектора адаптивной кодовой книги (ВАКК), код G_n+1 коэффициента усиления - в узел 104 декодирования коэффициента усиления, и код L_n+1 КЛП - в узел 105 декодирования КЛП. Код B_n+1 удаления кадра вводят в узел 102 декодирования ВПКК, в узел 103 декодирования ВАКК, в узел 104 декодирования коэффициента усиления и в узел 105 декодирования КЛП.

Узел 102 декодирования ВПКК генерирует вектор постоянной кодовой книги, используя код F_n постоянной кодовой книги, если код B_n удаления кадра указывает, что «n-й кадр является обычным кадром», и генерирует вектор постоянной кодовой книги посредством обработки маскирования удаления кадра, если код B_n удаления кадра указывает, что «n-й кадр является удаленным кадром». Сгенерированный вектор постоянной кодовой книги вводят в узел 104 декодирования коэффициента усиления и в усилитель 106.

Узел 103 декодирования ВАКК генерирует вектор адаптивной кодовой книги, используя код адаптивной кодовой книги, если код B_n удаления кадра указывает, что «n-й кадр является обычным кадром», и генерирует вектор адаптивной кодовой книги посредством обработки маскирования удаления кадра, если код B_n удаления кадра указывает, что «n-й кадр является удаленным кадром». Сгенерированный вектор адаптивной кодовой книги вводят в усилитель 107.

Узел 104 декодирования коэффициента усиления генерирует коэффициент усиления постоянной кодовой книги и коэффициент усиления адаптивной кодовой книги, используя код G_n коэффициента усиления и вектор постоянной кодовой книги, если код B_n удаления кадра указывает, что «n-й кадр является обычным кадром», и генерирует коэффициент усиления постоянной кодовой книги и коэффициент усиления адаптивной кодовой книги посредством обработки маскирования удаления кадра, если код B_n удаления кадра указывает, что «n-й кадр является удаленным кадром». Сгенерированный коэффициент усиления постоянной кодовой книги вводят в усилитель 106, а сгенерированный коэффициент усиления адаптивной кодовой книги вводят в усилитель 107.

Узел 105 декодирования КЛП декодирует параметр КЛП, используя код L_n КЛП, если код B_n удаления кадра указывает, что «n-й кадр является обычным кадром», и декодирует параметр КЛП посредством обработки маскирования удаления кадра, если код B_n удаления кадра указывает, что «n-й кадр является удаленным кадром». Декодированный параметр КЛП вводят в узел 109 синтеза КЛП. Подробности узла 105 декодирования КЛП будут приведены позже в данной работе.

Усилитель 106 умножает коэффициент усиления постоянной кодовой книги, выводимый из узла 104 декодирования коэффициента усиления, на вектор постоянной кодовой книги, выводимый из узла 102 декодирования ВПКК, и выводит результат умножения на сумматор 108. Усилитель 107 умножает коэффициент усиления адаптивной кодовой книги, выводимый из узла 104 декодирования коэффициента усиления, на вектор адаптивной кодовой книги, выводимый из узла 103 декодирования ВАКК, и выводит результат умножения на сумматор 108. Сумматор 108 складывает вместе вектор постоянной кодовой книги после умножения на коэффициент усиления постоянной кодовой книги, выводимый из усилителя 106, и вектор адаптивной кодовой книги после умножения на коэффициент усиления адаптивной кодовой книги, выводимый из усилителя 107, и выводит результат суммирования (в дальнейшем называемый «вектором суммы») в узел 109 синтеза КЛП.

Узел 109 синтеза КЛП конфигурирует фильтр синтеза с линейным предсказанием, используя декодированный параметр КЛП, выводимый из узла 105 декодирования КЛП, управляет фильтром синтеза с линейным предсказанием с помощью вектора суммы, выводимого из сумматора 108 в качестве сигнала возбуждения, и выводит синтезированный сигнал, полученный в результате данного управления, на выходной фильтр (фильтр окончательной обработки) 110. Выходной фильтр 110 выполняет обработку выделения формант и выделения частот основного тона и т.д. в синтезированном сигнале, выводимом из узла 109 синтеза КЛП, и выводит сигнал как декодированный речевой сигнал.

Далее будет подробно описана обработка маскирования параметра согласно данному варианту осуществления, рассматривая в качестве примера случай, в котором выполняют маскирование параметра КЛП. Фиг.2 - чертеж, на котором показывают внутреннюю конфигурацию узла 105 декодирования КЛП, показанного на фиг.1.

Код L_n+1 КЛП вводят в буфер 201 и узел 203 декодирования кодового вектора, и код B_n+1 удаления кадра вводят в буфер 202, узел 203 декодирования кодового вектора и блок 209 выбора.

Буфер 201 хранит код L_n+1 КЛП следующего кадра в течение продолжительности одного кадра, и затем выводит этот код КЛП в узел 203 декодирования кодового вектора. В результате того, что код хранится в буфере 201 в течение продолжительности одного кадра, код КЛП, выводимый из буфера 201 в узел 203 декодирования кодового вектора, является кодом L_n КЛП текущего кадра.

Буфер 202 хранит код B_n+1 удаления следующего кадра в течение продолжительности одного кадра, и затем выводит этот код удаления кадра в узел 203 декодирования кодового вектора. В результате того, что код хранится в буфере 202 в течение продолжительности одного кадра, код удаления кадра, выводимый из буфера 202 в узел 203 декодирования кодового вектора, является кодом B_n удаления текущего кадра.

Узел 203 декодирования кодового вектора имеет вектора x_n-1-x_n-м квантованных остатков предсказания М предыдущих кадров, декодированный вектор y_n-1 ЧСЛ предыдущего кадра, код L_n+1 КЛП следующего кадра, код B_n+1 удаления следующего кадра, код L_n КЛП текущего кадра и код B_n удаления текущего кадра в качестве вводимой информации, производит вектор x_n квантованного остатка предсказания текущего кадра, основываясь на этих элементах информации, и выводит вектор x_n квантованного остатка предсказания текущего кадра в буфер 204-1 и усилитель 205-1. Подробности узла 203 декодирования кодового вектора будут приведены позже в данной работе.

Буфер 204-1 хранит вектор x_n квантованного остатка предсказания текущего кадра в течение продолжительности одного кадра, и затем выводит этот вектор квантованного остатка предсказания в узел 203 декодирования кодового вектора, буфер 204-2 и усилитель 205-2. В результате того, что вектор хранится в буфере 204-1 в течение продолжительности одного кадра, вектор квантованного остатка предсказания, вводимый в узел 203 декодирования кодового вектора, буфер 204-2 и усилитель 205-2, является вектором x_n-1 квантованного остатка предсказания предыдущего кадра. Точно так же каждый буфер 204-i (где i равно от 2 до М-1) хранит вектор x_n-j+1 квантованного остатка предсказания в течение продолжительности одного кадра, и затем выводит этот вектор квантованного остатка предсказания в узел 203 декодирования кодового вектора, буфер 204-(i+1), и усилитель 205-(i+1). Буфер 204-М хранит вектор x_n-М+1 квантованного остатка предсказания в течение продолжительности одного кадра, и затем выводит этот вектор квантованного остатка предсказания в узел 203 декодирования кодового вектора и усилитель 205-(М+1).

Усилитель 205-1 умножает вектор x_n квантованного остатка предсказания на предопределенный коэффициент α₀ предсказания МА и выводит результат на сумматор 206. Точно так же усилители 205-j (где j равно от 2 до М+1) умножают вектор x_n-j+1 квантованного остатка предсказания на предопределенный коэффициент α_j-1 предсказания МА и выводят результат на сумматор 206. Набор коэффициентов предсказания МА может быть фиксированными значениями одного вида, но в рекомендации ITU-T G.729 обеспечивают два вида наборов, какой набор следует использовать для выполнения декодирования, определяют на стороне кодера, и данный набор кодируют и передают как часть информации кода L_nКЛП. В этом случае используется конфигурация, посредством которой узел 105 декодирования КЛП обеспечивается набором коэффициентов предсказания МА в виде таблицы, и набор, определенный на стороне кодера, используется, как α₀-α_М на фиг.2.

Сумматор 206 вычисляет общую сумму векторов квантованных остатков предсказания после умножения на коэффициенты предсказания МА, выводимые из усилителей 205-1-205-(М+1), и выводит результат вычисления, декодированный вектор y_n ЧСЛ, в буфер 207 и в узел 208 преобразования КЛП.

Буфер 207 хранит декодированный вектор y_n ЧСЛ в течение продолжительности одного кадра, и затем выводит этот декодированный вектор ЧСЛ в узел 203 декодирования кодового вектора. В результате декодированный вектор ЧСЛ, выводимый из буфера 207 в узел 203 декодированного кодового вектора, является декодированным вектором y_n-1 ЧСЛ предыдущего кадра.

Узел 208 преобразования КЛП преобразовывает декодированный вектор y_n ЧСЛ в набор коэффициентов линейного предсказания (декодированный параметр КЛП), и выводит его на блок 209 выбора.

Блок 209 выбора выбирает декодированный параметр КЛП, выводимый из узла 208 преобразования КЛП, или декодированный параметр КЛП предыдущего кадра, выводимый из буфера 210, основываясь на коде B_n удаления текущего кадра и коде B_n+1удаления следующего кадра. В частности, декодированный параметр КЛП, выводимый из узла 208 преобразования КЛП, выбирают, если код B_n удаления текущего кадра указывает, что «n-й кадр является обычным кадром», или код B_n+1 удаления следующего кадра указывает, что «(n+1)-й кадр является обычным кадром», а декодированный параметр КЛП следующего кадра, выводимый из буфера 210, выбирают, если код B_n удаления текущего кадра указывает, что «n-й кадр является удаленным кадром» и код B_n+1 удаления следующего кадра указывает, что «(n+1)-й кадр является удаленным кадром». Затем блок 209 выбора выводит результат выбора в узел 109 синтеза КЛП и в буфер 210, как окончательный декодированный параметр КЛП. Если блок 209 выбора выбирает декодированный параметр КЛП следующего кадра, выводимый из буфера 210, то фактически не требуется выполнять всю обработку от узла 203 декодирования кодового вектора до узла 208 преобразования КЛП, и только обработку для обновления содержимого буферов 204-1-204-М необходимо выполнять.

Буфер 210 хранит декодированный параметр КЛП, выводимый из блока 209 выбора, в течение продолжительности одного кадра, и затем выводит этот декодированный параметр КЛП в блок 209 выбора. В результате декодированный параметр КЛП, выводимый из буфера 210 в блок 209 выбора, является декодированным параметром КЛП предыдущего кадра.

Далее будет подробно описана внутренняя конфигурация узла 203 декодирования кодового вектора, показанного на фиг.2, используя структурную схему на фиг.3.

В кодовой книге 301 генерируют кодовый вектор, идентифицированный кодом L_n КЛП текущего кадра, и выводят его на переключатель 309, и также генерируют кодовый вектор, идентифицированный кодом L_n+1 КЛП следующего кадра, и выводят его на усилитель 307. Как уже указано, в рекомендации ITU-T G.729 информацию, которая определяет набор коэффициентов предсказания МА, включает в себя код L_n КЛП, и в этом случае код L_n КЛП также используется для декодирования коэффициента предсказания МА в дополнение к декодированию кодового вектора, но описание этого опущено в данной работе. Кроме того, кодовая книга может иметь многоступенчатую конфигурацию и может иметь конфигурацию разделения. Например, в рекомендации ITU-T G.729 кодовая книга имеет двухступенчатую конфигурацию с разделением второй ступени на две. Вектор, выводимый из кодовой книги многоступенчатой конфигурации или конфигурации разделения, в общем случае не используется в том виде, в каком он существует, и если интервал между его элементами является чрезвычайно маленьким, или порядок элементов является обратным, то в общем случае выполняют обработку для обеспечения, чтобы минимальный интервал стал определенным значением, или для упорядочивания.

Вектора x_n-1-x_n-М квантованных остатков предсказания М предыдущих кадров вводят на соответствующие усилители 302-1-302-М и соответствующие усилители 305-1-305-М, соответственно.

Усилители 302-1-302-М умножают вводимые вектора x_n-1-x_n-Мквантованных остатков предсказания на коэффициенты α₀-α_М предсказания МА, соответственно, и выводят результаты на сумматор 303. Как указано выше, в случае рекомендации ITU-T G.729, существует два вида наборов коэффициентов предсказания МА, и информацию о том, который из них используется, включает в себя код L_n КЛП. Кроме того, когда удаляют кадр, для которого выполняют это умножение, фактически используют набор коэффициентов предсказания МА, используемый в предыдущем кадре, так как код L_n КЛП удаляют. Т.е. используется информация коэффициента предсказания МА, декодированная из кода L_n-1 КЛП предыдущего кадра. Если предыдущий кадр также является удаленным кадром, то будет использоваться информация кадра, расположенного перед ним.

Сумматор 303 вычисляет общую сумму векторов квантованных остатков предсказания после умножения на коэффициенты предсказания МА, выводимые из усилителей 302-1-302-М, и выводит вектор, который является результатом умножения, на сумматор 304.

Сумматор 304 вычитает вектор, выводимый из сумматора 303, из декодированного вектора y_n-1 ЧСЛ предыдущего кадра, выводимого из буфера 207, и выводит вектор, который является результатом этого вычисления, на переключатель 309.

Вектор, выводимый из сумматора 303, является вектором ЧСЛ, предсказанным с помощью устройства предсказания МА-типа в текущем кадре, и сумматор 304 выполняет обработку для нахождения вектора квантованного остатка предсказания в текущем кадре, необходимого для генерации декодированного вектора ЧСЛ предыдущего кадра. Т.е. посредством усилителей 302-1-302-М, сумматора 303 и сумматора 304, вектор вычисляют так, чтобы декодированный вектор y_n-1 ЧСЛ предыдущего кадра стал декодированным вектором y_n ЧСЛ текущего кадра.

Усилители 305-1-305-М умножают вводимые вектора x_n-1-x_n-Мквантованного остатка предсказания на весовые коэффициенты β₁-β_M, соответственно, и выводит результаты на сумматор 308. Усилитель 306 умножает декодированный вектор y_n-1 ЧСЛ предыдущего кадра, выводимый из буфера 207, на весовой коэффициент β_-1, и выводит результат на сумматор 308. Усилитель 307 умножает кодовый вектор x_n+1, выводимый из кодовой книги 301, на весовой коэффициент β₀, и выводит результат на сумматор 308.

Сумматор 308 вычисляет общую сумму векторов, выводимых из усилителей 305-1-305-М, усилителя 306 и усилителя 307, и выводит кодовый вектор, который является результатом этого вычисления, на переключатель 309. Т.е. сумматор 308 вычисляет вектор, выполняя взвешенное суммирование кодового вектора, идентифицированного кодом L_n+1 КЛП следующего кадра, декодированного вектора ЧСЛ предыдущего кадра и векторов квантованных остатков предсказания М предыдущих кадров.

Если код B_n удаления текущего кадра указывает, что «n-й кадр является обычным кадром», то переключатель 309 выбирает кодовый вектор, выводимый из кодовой книги 301, и выводит его как вектор x_n квантованного остатка предсказания текущего кадра. С другой стороны, если код B_n удаления текущего кадра указывает, что «n-й кадр является удаленным кадром», то переключатель 309 дополнительно выбирает вектор, который будет выведен, в соответствии с тем, какую информацию имеет код B_n+1 удаления следующего кадра.

Т.е. если код B_n+1 удаления следующего кадра указывает, что «(n+1)-й кадр является удаленным кадром», то переключатель 309 выбирает вектор, выводимый из сумматора 304, и выводит его как вектор x_n квантованного остатка предсказания текущего кадра. В этом случае обработка процесса генерации вектора из кодовой книги 301 и усилителей 305-1-305-М на сумматор 308 не должна выполняться.

С другой стороны, если код B_n+1 удаления следующего кадра указывает, что «(n+1)-й кадр является обычным кадром», то переключатель 309 выбирает вектор, выводимый из сумматора 308, и выводит его как вектор x_n квантованного остатка предсказания текущего кадра. В этом случае обработка процесса генерации вектора из усилителей 302-1-302-М на сумматор 304 не должна выполняться.

Таким образом, согласно данному варианту осуществления, когда текущий кадр удаляют, если следующий кадр принимают обычным образом, то обработку маскирования квантованного остатка предсказания, декодированной для параметра ЧСЛ текущего кадра, выполняют посредством обработки взвешенного суммирования (обработки взвешенного линейного суммирования), в частности, для обработки маскирования, используя параметр, декодированный в прошлом, квантованный остаток предсказания кадра, принятого в прошлом, и квантованный остаток предсказания будущего кадра, и декодирование параметра ЧСЛ выполняют с помощью использования маскированной квантованного остатка предсказания. Таким образом можно обеспечивать более высокую эффективность маскирования, чем с помощью повторного использования прошлого декодированного параметра ЧСЛ.

Результаты выполнения обработки маскирования данного варианта осуществления будут теперь описаны, используя фиг.4 - фиг.7, которые представляют фактические примеры по сравнению с обычной технологией. На фиг.4 - фиг.7, ◯ обозначает декодированный квантованный остаток предсказания, • обозначает декодированный квантованный остаток предсказания, полученную с помощью обработки маскирования, ◊ обозначает декодированный параметр и ♦ обозначает декодированный параметр, полученный с помощью обработки маскирования.

Фиг.4 - чертеж, на котором показывают пример результата выполнения обычной обработки, когда нет удаленного кадра, в которой декодированный параметр y_n n-го кадра находят посредством приведенного ниже Уравнения (1) из декодированного квантованного остатка предсказания. В Уравнении (1) c_n является декодированным квантованным остатком предсказания n-го кадра.

Фиг.5 - чертеж, на котором показывают пример результата выполнения обработки маскирования данного варианта осуществления, и фиг.6 и 7 - чертежи, на которых показывают примеры результата выполнения обычной обработки маскирования. На фиг.5-7 предполагают, что n-й кадр удаляют, а другие кадры являются обычными кадрами.

При обработке маскирования показанного на фиг.5 варианта осуществления квантованный остаток C_n предсказания, декодированный для удаленного n-го кадра, находят, используя приведенное ниже Уравнение (3), чтобы сделать сумму D (где D определяют с помощью приведенного ниже Уравнения (2)) расстояния между декодированным параметром y_n-1 (n-1)-го кадра и декодированным параметром y_n n-го кадра, и расстояния между декодированным параметром y_n n-го кадра и декодированным параметром y_n+1 (n+1)-го кадра минимальной, так, чтобы изменения декодированного параметра от одного кадра к другому стали незначительными.

Затем при обработке маскирования данного варианта осуществления находят декодированный параметр y_n удаленного n-го кадра посредством приведенного выше Уравнения (1), используя декодированный квантованный остаток C_n предсказания удаленного n-го кадра, найденную посредством Уравнения (3). В результате, как ясно из сравнения фиг.4 и фиг.5, декодированный параметр y_n, полученный посредством обработки маскирования данного варианта осуществления, имеет почти то же самое значение, как значение, полученное с помощью обычной обработки, когда нет удаленного кадра.

Напротив, при обычной обработке маскирования, показанной на фиг.6, когда n-й кадр удаляют, декодированный параметр y_n-1 (n-1)-го кадра используется непосредственно в качестве декодированного параметра y_n n-го кадра. Кроме того, при обычной обработке маскирования, показанной на фиг.6, декодированный квантованный остаток C_n предсказания n-го кадра находят посредством операции, обратной к приведенному выше Уравнению (1).

В данном случае, так как не учитывают изменения декодированного параметра, сопровождаемые изменениями декодированного квантованного остатка предсказания, как ясно из сравнения фиг.4 и фиг.6, декодированный параметр y_n, полученный посредством обычной обработки маскирования на фиг.6, имеет значение, которое очень сильно отличается от значения, полученного посредством обычной обработки, когда нет удаленного кадра. Кроме того, так как декодированный квантованный остаток C_n предсказания n-го кадра также отличается, декодированный параметр y_n+1 (n+1)-го кадра, полученный посредством обычной обработки маскирования на фиг.6, также имеет значение, отличающееся от значения, полученного посредством обычной обработки, когда нет удаленного кадра.

При обычной обработке маскирования, показанной на фиг.7, декодированный квантованный остаток предсказания находят посредством интерполяции, и когда n-й кадр удаляют, используют среднее значение декодированного квантованного остатка C_n-1 предсказания (n-1)-го кадра и декодированного квантованного остатка C_n+1 предсказания (n+1)-го кадра в качестве декодированного квантованного остатка C_n предсказания n-го кадра.

Затем при обычной обработке маскирования, показанной на фиг.7, находят декодированный параметр y_n удаленного n-го кадра посредством приведенного выше Уравнения (1), используя декодированный квантованный остаток C_n предсказания, найденную посредством интерполяции.

В результате, как ясно из сравнения фиг.4 и фиг.7, декодированный параметр y_n, полученный посредством обычной обработки маскирования на фиг.7, имеет значение, которое очень сильно отличается от значения, полученного посредством обычной обработки, когда нет удаленного кадра. Это происходит потому, что когда декодированный параметр изменяется незначительно от одного кадра к другому через определение взвешенного скользящего среднего значения, при этой обычной обработке маскирования декодированный параметр также изменяется вместе с изменениями декодированного квантованного остатка предсказания. Кроме того, поскольку декодированный квантованный остаток C_n предсказания n-го кадра также отличается, декодированный параметр y_n+1 (n+1)-го кадра, полученный посредством обычной обработки маскирования на фиг.7, также имеет значение, отличающееся от значения, полученного посредством обычной обработки, когда нет удаленного кадра.

(Вариант осуществления 2)

Фиг.8 - структурная схема, на которой показывают основную конфигурацию устройства декодирования речи согласно варианту осуществления 2 настоящего изобретения. Показанное на фиг.8 устройство 100 декодирования речи отличается от устройства на фиг.1 только дополнительным добавлением информации E_n+1 типа маскирования в качестве параметра, вводимого в узел 105 декодирования КЛП.

Фиг.9 - структурная схема, на которой показывают внутреннюю конфигурацию узла 105 декодирования КЛП, показанного на фиг.8. Узел 105 декодирования КЛП, показанный на фиг.9, отличается от узла на фиг.2 только дополнительным добавлением информации E_n+1 типа маскирования в качестве параметра, вводимого в узел 203 декодирования кодового вектора.

Фиг.10 - структурная схема, на которой показывают внутреннюю конфигурацию узла 203 декодирования кодового вектора, показанного на фиг.9. Узел 203 декодирования кодового вектора, показанный на фиг.10, отличается от узла на фиг.3 только дополнительным добавлением узла 401 декодирования коэффициента.

Узел 401 декодирования коэффициента хранит множество видов наборов весовых коэффициентов (β_-1-β_М) (в дальнейшем называемых «наборами коэффициентов»), выбирает один набор весовых коэффициентов из множества наборов коэффициентов согласно вводимому коду E_n+1 типа маскирования, и выводит его на усилители 305-1-305-М, 306 и 307.

Таким образом, согласно данному варианту осуществления, в дополнение к обеспечению особенностей, описанных в варианте осуществления 1, обеспечивают множество наборов весовых коэффициентов взвешенного суммирования для выполнения обработки маскирования, информацию для идентификации оптимального набора передают к стороне декодера после подтверждения, с использованием какого набора весовых коэффициентов на стороне кодера получают высокую эффективность маскирования, и обработку маскирования выполняют, используя указанный набор весовых коэффициентов, основываясь на информации, принятой на стороне декодера, обеспечивая получение еще более высокой эффективности маскирования, чем в варианте осуществления 1.

(Вариант осуществления 3)

Фиг.11 - структурная схема, на которой показывают основную конфигурацию устройства декодирования речи согласно варианту осуществления 3 настоящего изобретения. Устройство 100 декодирования речи, показанное на фиг.11, отличается от устройства на фиг.8 только дополнительным добавлением узла 501 разделения, который делит код L_n+1 КЛП, вводимый в узел 105 декодирования КЛП, на два вида кодов, V_n+1 и K_n+1. Код V-код для генерации кодового вектора, и код К является кодом коэффициента предсказания МА.

Фиг.12 - структурная схема, на которой показывают внутреннюю конфигурацию узла 105 декодирования КЛП, показанного на фиг.11. Коды V_n и V_n+1, которые генерируют кодовый вектор, используются таким же образом, как коды L_n и L_n+1 КЛП, и поэтому их описание опущено в данной работе. Узел 105 декодирования КЛП, показанный на фиг.12, отличается от узла на фиг.9 только дополнительным добавлением буфера 601 и узла 602 декодирования коэффициента, и дополнительным добавлением кода K_n+1 коэффициента предсказания МА в качестве параметра, вводимого в узел 203 декодирования кодового вектора.

Буфер 601 хранит код K_n+1 коэффициента предсказания МА в течение продолжительности одного кадра, и затем выводит этот код коэффициента предсказания МА в узел 602 декодирования коэффициента. В результате код коэффициента предсказания МА, выводимый из буфера 601 в узел 602 декодирования коэффициента, является кодом K_n коэффициента предсказания МА предыдущего кадра.

Узел 602 декодирования коэффициента хранит множество видов наборов коэффициентов, идентифицирует набор коэффициентов посредством кодов B_n и B_n+1 удаления кадра, кода E_n+1 типа маскирования и кода K_n коэффициента предсказания МА и выводит его на усилители 205-1-205-(М+1). В данном случае существуют три способа, с помощью которых идентификацию набора коэффициентов можно выполнять в узле 602 декодирования коэффициента следующим образом.

Если вводимый код B_n удаления кадра указывает, что «n-й кадр является обычным кадром», то узел 602 декодирования коэффициента выбирает набор коэффициентов, определенный кодом K_n коэффициента предсказания МА.

Если вводимый код B_n удаления кадра указывает, что «n-й кадр является удаленным кадром», и код B_n+1 удаления кадра указывает, что «(n+1)-й кадр является обычным кадром», то узел 602 декодирования коэффициента определяет набор коэффициентов, который будет выбран, используя код E_n+1 типа маскирования, принятый в качестве параметра (n+1)-го кадра. Например, если заранее определяют код E_n+1 типа маскирования, который указывает тип коэффициента предсказания МА, который будет использоваться с n-м кадром, который является маскированным кадром, то код E_n+1 типа маскирования может использоваться непосредственно вместо кода K_n коэффициента предсказания МА.

Кроме того, если вводимый код B_n удаления кадра указывает, что «n-й кадр является удаленным кадром», и код B_n+1 удаления кадра указывает, что «(n+1)-й кадр является удаленным кадром», то единственной информацией, которая может использоваться, является информация набора коэффициентов, используемого предыдущим кадром, и поэтому узел 602 декодирования коэффициента неоднократно использует набор коэффициентов, используемый предыдущим кадром. Альтернативно, можно заранее обеспечивать набор коэффициентов определенного типа, чтобы он использовался постоянно.

Фиг.13 - структурная схема, на которой показывают внутреннюю конфигурацию узла 203 декодирования кодового вектора, показанного на фиг.12. Показанный на фиг.13 узел 203 декодирования кодового вектора отличается от узла на фиг.10 только тем, что узел 401 декодирования коэффициента выбирает набор коэффициентов, используя и код E_n+1 типа маскирования, и код K_n+1 коэффициента предсказания МА.

На фиг.13 узел 401 декодирования коэффициента обеспечивают множеством наборов весовых коэффициентов, и набор весовых коэффициентов подготавливают согласно коэффициенту предсказания МА, используемому следующим кадром. Например, в случае, когда существует два вида наборов коэффициентов предсказания МА, один обозначен тип 0, а другой - тип 1, наборы коэффициентов предсказания МА содержат группу наборов весовых коэффициентов, определенных для использования, когда набор коэффициентов предсказания МА следующего кадра - тип 0, и группу наборов весовых коэффициентов, определенных для использования, когда набор коэффициентов предсказания МА следующего кадра - тип 1.

В этом случае узел 401 декодирования коэффициента определяет одну или другую группу наборов весовых коэффициентов из указанных выше групп, выбирает один набор весовых коэффициентов из множества наборов коэффициентов согласно вводимому коду E_n+1 типа маскирования, и выводит его в усилители 305-1-305-М, 306 и 307.

Примерный способ определения весовых коэффициентов β_-1-β_М показан ниже. Как уже указано, если n-й кадр удаляют, а (n+1)-й кадр принимают, то окончательные декодированные параметры неизвестны в обоих кадрах, даже если декодированный квантованный остаток предсказания в (n+1)-м кадре можно декодировать правильно. Следовательно, декодированные параметры обоих кадров не определяют однозначно, если предположение (условие ограничения) некоторого вида не установлено. Таким образом, квантованный остаток y_n предсказания находят посредством приведенного ниже Уравнения (4) для минимизации D^(j), суммы расстояния между декодированным параметром в n-м кадре и декодированным параметром в (n-1)-м кадре, и расстояния между декодированным параметром в (n+1)-м кадре и декодированным параметром в n-м кадре, так, чтобы декодированные параметры n-го кадра и (n+1)-го кадра в максимально возможной степени не отличались от уже декодированного параметра (n-1)-го кадра.

Когда параметр является параметром ЧСЛ, x_n ^(j), y_n ^(j), α_i ^(j), α′_i ^(j) в Уравнении (4) являются следующими:

x_n ^(j): квантованный остаток предсказания j-го компонента параметра ЧСЛ в n-м кадре;

y_n ^(j): j-й компонент параметра ЧСЛ в n-м кадре;

α_i ^(j): j-й компонент компонента i-го порядка в пределах набора коэффициента предсказания МА в n-м кадре;

α′_i ^(j): j-й компонент компонента i-го порядка в пределах набора коэффициента предсказания МА в (n+1)-м кадре.

М: порядок предсказания МА.

В данном случае, решая уравнение, полученное с помощью частичного дифференцирования D^(j) с помощью x_n ^(j) для получения 0, x_n ^(j) выражают в форме приведенного ниже Уравнения (5).

В Уравнении (5), β_i ^(j) является весовым коэффициентом, выраженным с помощью α_i ^(j) и α′_i ^(j). Т.е., если существует только один вид набора коэффициента предсказания МА, также существует только один вид набора весовых коэффициентов β_i ^(j), но если существует множество видов наборов коэффициентов предсказания МА, то множество видов наборов весовых коэффициентов получают с помощью комбинаций α_i ^(j) и α′_i ^(j).

Например, в случае рекомендации ITU-T G.729, существует два вида наборов коэффициентов предсказания МА, и поэтому, если они обозначены тип 0 и тип 1, то можно получать четыре вида наборов - когда n-й кадр и (n+1)-й кадр имеют тип 0, когда n-й кадр - тип 0, а (n+1)-й кадр - тип 1, когда n-й кадр - тип 1, а (n+1)-й кадр - тип 0, и когда n-й кадр и (n+1)-й кадр оба имеют тип 1. Можно придумать множество способов определения, какой набор весовых коэффициентов должен использоваться из этих четырех видов наборов.

Первый способ состоит в генерации декодированных ЧСЛ n-го кадра и декодированных ЧСЛ (n+1)-го кадра на стороне кодера, используя все четыре вида наборов, вычислении Евклидова расстояния между сгенерированными декодированными ЧСЛ n-го кадра и неквантованными ЧСЛ, полученными с помощью анализа входного сигнала, вычислении Евклидова расстояние между сгенерированными декодированными ЧСЛ (n+1)-го кадра и неквантованными ЧСЛ, полученными с помощью анализа входного сигнала, выбора одного из наборов весовых коэффициентов β, который минимизирует сумму этих Евклидовых расстояний, кодирования выбранного набора в двух битах и передачи их в декодер. В этом случае два бита в кадре необходимы для кодирования весового коэффициента β в добавление к кодирующей информации рекомендации ITU-T G.729. Лучшее качество звука можно обеспечивать при использовании взвешенных Евклидовых расстояний, как используется при квантовании ЧСЛ рекомендации ITU-T G.72 9, вместо Евклидовых расстояний.

Второй способ состоит в том, чтобы сделать количество дополнительных битов в кадре равным единице при использовании информации типа коэффициента предсказания МА (n+1)-го кадра. Поскольку информация типа коэффициента предсказания МА (n+1)-го кадра - на стороне декодера, комбинации α_i ^(j) и α′_i ^(j) ограничены двумя. Т.е. если тип предсказания МА (n+1)-го кадра - тип 0, то комбинация типа предсказания МА n-го кадра и (n+1)-го кадра равна или (0-0), или (1-0), что предоставляет возможность ограничивать набор весовых коэффициентов β двумя видами. На стороне кодера необходимо только выполнять кодирование, используя тот из этих двух видов наборов весовых коэффициентов β, который имеет меньший остаток относительно неквантованных ЧСЛ, таким же образом, как в первом приведенном выше способе, и передавать его в декодер.

Третий способ - способ, в котором вообще не посылают никакой информации выбора, используя один набор весовых коэффициентов, для которого существует только два вида комбинаций типа предсказания МА-(0-0) или (1-0), причем первый выбирают, когда тип коэффициента предсказания МА (n+1)-го кадра - 0, и последний выбирают, когда тип коэффициента предсказания МА (n+1)-го кадра-1. Альтернативно, может использоваться способ, посредством которого тип удаления кадра устанавливают в определенный тип, такой как (0-0) или (0-1).

Другие возможные способы - способ, посредством которого для кадра, для которого определяют, что входной сигнал является постоянным, обеспечивают, чтобы декодированные параметры для (n-1)-го кадра и n-го кадра стали одинаковыми, как при обычном способе, и способ, который использует набор весовых коэффициентов β, найденный при условии, что декодированные параметры (n+1)-го кадра и n-го кадра станут одинаковыми.

В данном случае информация периода основного тона, информация типа коэффициента предсказания МА или подобная информация (n-1)-го кадра и (n+1)-го кадра может использоваться для определения постоянства. Т.е. возможные способы состоят в определении, что сигнал постоянен, когда декодированное различие между периодами основного тона между (n-1)-м кадром и (n+1)-м кадром является небольшим, или в определении, что сигнал постоянен, когда выбран тип, подходящий для кодирования кадра, для которого информация типа коэффициента предсказания МА, декодированная в (n+1)-м кадре, постоянна (т.е. тип, в котором старший коэффициент предсказания МА также имеет определенный вес).

Таким образом, в данном варианте осуществления, в дополнение к тому, что обеспечивается в варианте осуществления 2, существует два типа коэффициентов предсказания МА, предоставляя возможность использовать различные наборы коэффициентов предсказания МА для постоянной части и части, которая не является постоянной, и предоставляя возможность улучшать эффективность средства квантования ЧСЛ.

Кроме того, при использовании Уравнения (5) набор весовых коэффициентов, который минимизирует Уравнение (4), декодированные параметры ЧСЛ удаленного кадра и обычного кадра, который является следующим кадром после удаленного кадра, как гарантируют, не станут значениями, которые очень сильно отличаются от параметра ЧСЛ кадра, предшествующего удаленному кадру. Следовательно, даже если декодированный параметр ЧСЛ следующего кадра неизвестен, то принимаемую информацию (квантованный остаток предсказания) следующего кадра можно продолжать использоваться эффективно, и риск маскирования, выполняемого в неправильном направлении - т.е. риск очень сильного отличия от правильного декодированного параметра ЧСЛ, может быть сохранен минимальным.

Кроме того, если приведенный выше второй способ используется в качестве способа выбора типа маскирования, то информация типа коэффициента предсказания МА может использоваться как часть информации, которая идентифицирует набор весовых коэффициентов для использования обработки маскирования, что предоставляет возможность уменьшать количество дополнительно передаваемой информации набора весовых коэффициентов для использования обработки маскирования.

(Вариант осуществления 4)

Фиг.14 - структурная схема, на которой показывают внутреннюю конфигурацию узла 104 декодирования коэффициента усиления, показанного на фиг.1 (то же самое применяют к узлу 104 декодирования коэффициента усиления на фиг.8 и фиг.11). В данном варианте осуществления, как в случае рекомендации ITU-T G.729, декодирование коэффициента усиления выполняют один раз для субкадра, и один кадр состоит из двух субкадров, и фиг.14 показывает последовательное декодирование кодов (G_m и G_m+1) коэффициента усиления двух субкадров n-го кадра, где n обозначает номер кадра, и m обозначает номер субкадра (номера первого субкадра и второго субкадра n-го кадра обозначены m и m+1, соответственно).

На фиг.14 код G_n+1 коэффициента усиления (n+1)-го кадра вводят в узел 104 декодирования коэффициента усиления из узла 101 демультиплексирования, код G_n+1 коэффициента усиления вводят в узел 700 разделения и делят на код G_m+2 коэффициента усиления первого субкадра и код G_m+3 коэффициента усиления второго субкадра (n+1)-го кадра. Разделение на коды G_m+2 и G_m+3коэффициента усиления можно также выполнять с помощью узла 101 демультиплексирования.

В узле 104 декодирования коэффициента усиления получают декодированный коэффициент усиления субкадра m и декодированный коэффициент усиления субкадра m+1 по порядку, используя G_m, G_m+1, G_m+2 и G_m+3, сгенерированные из вводимых G_n и G_n+1.

Работа каждого узла из узла 104 декодирования коэффициента усиления при декодировании кода G_m коэффициента усиления будет теперь описана в отношении фиг.14.

Код G_m+2 коэффициента усиления вводят в буфер 701 и узел 704 декодирования остатка предсказания, и код B_n+1 удаления кадра вводят в буфер 703, узел 704 декодирования остатка предсказания и блок 713 выбора.

Буфер 701 хранит вводимый код коэффициента усиления в течение продолжительности одного кадра и затем выводит этот код коэффициента усиления в узел 704 декодирования остатка предсказания, так, чтобы код коэффициента усиления, вводимый в узел 704 декодирования остатка предсказания, был кодом коэффициента усиления предыдущего кадра. Т.е. если код коэффициента усиления, вводимый в буфер 701, является G_m+2, то выводимый код коэффициента усиления - G_m. Буфер 702 также выполняет такую же обработку, как буфер 701. Т.е. вводимый код коэффициента усиления хранят в течение продолжительности одного кадра и затем выводят в узел 704 декодирования остатка предсказания. Единственное различие - то, что ввод-вывод буфера 701 - код коэффициента усиления первого субкадра, и ввод-вывод буфера 702 - код коэффициента усиления второго субкадра.

Буфер 703 хранит код B_n+1 удаления следующего кадра в течение продолжительности одного кадра, и затем выводит этот код удаления кадра в узел 704 декодирования остатка предсказания, блок 713 выбора и узел 708 вычисления мощности вектора ПКК. Код удаления кадра, выводимый из буфера 703 в узел 704 декодирования остатка предсказания, блок 713 выбора и узел 708 вычисления мощности вектора ПКК, является кодом удаления предыдущего кадра перед вводимым кадром, и является таким образом кодом B_n удаления текущего кадра.

Узел 704 декодирования остатка предсказания, который имеет логарифмические квантованные остатка x_m-1-x_m-M предсказания (которые являются результатом вычисления логарифмов квантованных остатков предсказания MA) M предыдущих субкадров, декодированную мощность e_m-1 (логарифм декодированного коэффициента усиления) предыдущего субкадра, коэффициент e_B усиления погрешности остатка предсказания, коды G_m+2 и G_m+3 коэффициента усиления следующего кадра, код B_n+1 удаления следующего кадра, коды G_m и G_m+1 коэффициента усиления текущего кадра и код B_n удаления текущего кадра в качестве вводимой информации, генерирует квантованный остаток предсказания текущего кадра, основываясь на этих элементах информации, и выводит ее в узел 705 вычисления логарифма и в узел 712 умножения. Подробности узла 704 декодирования остатка предсказания будут приведены позже в данной работе.

Узел 705 вычисления логарифма вычисляет логарифм x_mквантованного остатка предсказания, выводимого из узла 704 декодирования остатка предсказания (в рекомендации ITU-T G.729, 20×log₁₀(х), где х является входной информацией), и выводит его в буфер 706-1.

Буфер 706-1, который имеет логарифмический квантованный остаток x_mпредсказания, выводимый из узла 705 вычисления логарифма, в качестве вводимой информации, хранит ее в течение продолжительности одного субкадра, и затем выводит этот логарифмический квантованный остаток предсказания в узел 704 декодирования остатка предсказания, буфер 706-2 и буфер 707-1. Т.е. логарифмический квантованный остаток предсказания, вводимая в узел 704 декодирования остатка предсказания, буфер 706-2 и усилитель 707-1, является логарифмическим квантованным остатком x_m-1 предсказания предыдущего субкадра. Точно так же каждый из буферов 706-i (где i равно от 2 до М-1) хранит вводимую логарифмический квантованный остаток x_m-i предсказания в течение продолжительности одного субкадра и затем выводит этот логарифмический квантованный остаток предсказания в узел 704 декодирования остатка предсказания, буфер 706-(i+1) и усилитель 707-i. Буфер 706-М хранит вводимый логарифмический квантованный остаток x_m-M-1 предсказания в течение продолжительности одного субкадра и затем выводит этот логарифмический квантованный остаток предсказания в узел 704 декодирования остатка предсказания и в усилитель 707-М.

Усилитель 707-1 умножает логарифмический квантованный остаток x_m-i предсказания на предопределенный коэффициент α₁ предсказания МА и выводит результат на сумматор 710. Точно так же каждый из усилителей 707-j (где j равно от 2 до М) умножает логарифмический квантованный остаток x_m-j предсказания на предопределенный коэффициент α_j предсказания МА и выводил результат на сумматор 710. Набор коэффициентов предсказания МА содержит фиксированные значения одного вида в рекомендации ITU-T G.729, но можно также использовать конфигурацию, в которой обеспечивают множество видов наборов, и выбирают один подходящий.

Если код B_n удаления текущего кадра указывает, что «n-й кадр является обычным кадром», то узел 708 вычисления мощности вектора ПКК вычисляет мощность вектора ПКК (постоянной кодовой книги), декодированного отдельно, и выводит результат вычисления в узел 709 определения превышения средней мощности. Если код B_n удаления текущего кадра указывает, что «n-й кадр является удаленным кадром», то узел 708 вычисления мощности вектора ПКК выводит мощность вектора ПКК предыдущего субкадра в узел 709 определения превышения средней мощности.

Узел 709 определения превышения средней мощности вычитает мощность вектора ПКК, выводимую из узла 708 вычисления мощности вектора ПКК, из средней мощности, и выводит результат вычитания - коэффициент е_в усиления погрешности остатка предсказания - в узел 704 декодирования остатка предсказания и сумматор 710. В данном случае предполагают, что средняя мощность является предварительно установленной константой. Кроме того, суммирование/вычитание мощности выполняют в логарифмической области.

Сумматор 710 вычисляет общую сумму логарифмических квантованных остатков предсказания после умножения на коэффициенты предсказания МА, выводимые из усилителей 707-1-707-М, и коэффициента усиления е_в погрешности остатка предсказания, выводимого из узла 709 определения превышения средней мощности, и выводит логарифмический предсказанный коэффициент усиления, который является результатом этого вычисления, в узел 711 вычисления показательной функции.

Узел 711 вычисления показательной функции вычисляет показательную функцию (10^x, где х - входная информация) логарифмического предсказанного коэффициента усиления, выводимого из сумматора 710, и выводит предсказанный коэффициент усиления, который является результатом этого вычисления, в блок 712 умножения.

Блок 712 умножения умножает предсказанный коэффициент усиления, выводимый из узла 711 вычисления показательной функции, на квантованный остаток предсказания, выводимый из узла 704 декодирования остатка предсказания, и выводит декодированный коэффициент усиления, который является результатом этого вычисления, в блок 713 выбора.

Блок 713 выбора выбирает или декодированный коэффициент усиления, выводимый из блока 712 умножения, или декодированный коэффициент усиления предыдущего кадра после ослабления, выводимый из усилителя 715, основываясь на коде B_n удаления текущего кадра и на коде B_n+1 удаления следующего кадра. В частности, декодированный коэффициент усиления, выводимый из блока 712 умножения, выбирают, если код B_n удаления текущего кадра указывает, что «n-й кадр является обычным кадром», или код B_n+1 удаления следующего кадра указывает, что «(n+1)-й кадр является обычным кадром», а декодированный коэффициент усиления предыдущего кадра после ослабления, выводимый из усилителя 715, выбирают, если код B_n удаления текущего кадра указывает, что «n-й кадр является удаленным кадром» и код B_n+1 удаления следующего кадра указывает, что «(n-1)-й кадр является удаленным кадром». Затем блок 713 выбора выводит результат выбора в качестве окончательного предсказанного коэффициента усиления в усилители 106 и 107, буфер 714 и узел 716 вычисления логарифма. Если блок 713 выбора выбирает декодированный коэффициент усиления предыдущего кадра после ослабления, выводимый из усилителя 715, то фактически не требуется выполнять всю обработку от узла 704 декодирования остатка предсказания до блока 712 умножения, и только обработку для обновления содержимого буферов 706-1-706-М необходимо выполнять.

Буфер 714 хранит декодированный коэффициент усиления, выводимый из блока 713 выбора, в течение продолжительности одного субкадра, и затем выводит этот декодированный коэффициент усиления на усилитель 715. В результате декодированный коэффициент усиления, выводимый из буфера 714 на усилитель 715, является декодированным коэффициентом усиления предыдущего субкадра. Усилитель 715 умножает декодированный коэффициент усиления предыдущего субкадра, выводимый из буфера 714, на предопределенный коэффициент ослабления, и выводит результат в блок 713 выбора. Значение этого предопределенного коэффициента ослабления равно 0,98 в рекомендации ITU-T G.729, например, но оптимальное значение для кодека можно устанавливать соответствующим образом, и это значение можно также изменять согласно характеристикам сигнала удаленного кадра, например, является ли удаленный кадр вокализированным кадром или невокализированным кадром.

Узел 716 вычисления логарифма вычисляет логарифм e_mдекодированного коэффициента усиления, выводимого из блока 713 выбора (в рекомендации ITU-T G.729, 20×log₁₀(х), где х - вводимая информация), и выводит его в буфер 717. Буфер 717, который имеет логарифм e_mдекодированного коэффициента усиления в качестве информации, вводимой из узла 716 вычисления логарифма, хранит его в течение продолжительности одного субкадра, и затем выводит этот логарифм декодированного коэффициента усиления в узел 704 декодирования остатка предсказания. Т.е. логарифм предсказанного коэффициента усиления, вводимый в узел 704 декодирования остатка предсказания, является логарифмом e_m-1 декодированного коэффициента усиления предыдущего субкадра.

Фиг.15 - структурная схема, на которой показывают внутреннюю конфигурацию узла 704 декодирования остатка предсказания, показанного на фиг.14. На фиг.15 коды G_m, G_m+1, G_m+2 и G_m+3 коэффициента усиления вводят в кодовую книгу 801, коды B_n и B_n+1 удаления кадра вводят в переключатель 812, логарифмические квантованные остатки x_m-1-x_m-M предсказания М предыдущих субкадров вводят в сумматор 802, и логарифмический декодированный коэффициент e_m-1 усиления предыдущего субкадра и коэффициент e_B усиления погрешности остатка предсказания вводят в узел 807 генерации квантованного остатка предсказания субкадра и в узел 808 генерации квантованного остатка предсказания субкадра.

В кодовой книге 801 декодируют соответствующие квантованные остатки предсказания из вводимых кодов G_m, G_m+1, G_m+2 и G_m+3коэффициента усиления, выводят квантованные остатки предсказания, соответствующие вводимым кодам G_m и G_m+1 коэффициента усиления, на переключатель 812 через переключатель 813, и выводят квантованные остатки предсказания, соответствующие вводимым кодам G_m+2 и G_m+3 коэффициента усиления, в узел 806 вычисления логарифма.

Переключатель 813 выбирает любой из квантованных остатков предсказания, декодированных из кодов G_m и G_m+1 коэффициента усиления, и выводит ее на переключатель 812. В частности, квантованный остаток предсказания, декодированный из кода G_mкоэффициента усиления, выбирают, когда выполняют обработку декодирования коэффициента усиления первого субкадра, а квантованный остаток предсказания, декодированный из кода G_m+1 усиления, выбирают, когда выполняют обработку декодирования коэффициента усиления второго субкадра.

Сумматор 802 вычисляет общую сумму логарифмических квантованных остатков x_m-1-x_m-M предсказания М предыдущих субкадров и выводит результат этого вычисления на усилитель 803. Усилитель 803 вычисляет среднее значение, умножая выходное значение сумматора 802 на 1/М, и выводит результат этого вычисления на узел 804 ослабления на 4 дБ (децибелл).

Узел 804 ослабления на 4 дБ уменьшает значение выходного сигнала усилителя 803 на 4 дБ и выводит результат в узел 805 вычисления показательной функции. Это ослабление на 4 дБ должно предотвращать устройство предсказания от вывода чрезмерно большого предсказанного значения в кадре (субкадре), восстановленном из удаленного кадра, и блок ослабления не обязательно является неотъемлемой частью примерной конфигурации, в которой не возникает такая потребность. По отношению к величине ослабления на 4 дБ, также можно свободно разрабатывать оптимальное значение.

Узел 805 вычисления показательной функции вычисляет показательную функцию из выходного значения узла 804 ослабления на 4 дБ, и выводит маскированный остаток предсказания, который является результатом этого вычисления, на переключатель 812.

Узел 806 вычисления логарифма вычисляет логарифмы двух квантованных остатков предсказания, выводимых из кодовой книги 801 (следующих из декодированных кодов G_m+2 и G_m+3 коэффициента усиления), и выводит логарифмические квантованные остатки x_m+2 и x_m+3 предсказания, которые являются результатами этих вычислений, в узел 807 генерации квантованных остатков предсказания субкадра и в узел 808 генерации квантованных остатков предсказания субкадра.

Узел 807 генерации квантованного остатка предсказания субкадра, который имеет логарифмические квантованные остатки x_m+2и x_m+3 предсказания, логарифмические квантованные остатки x_m-1-x_m-mпредсказания М предыдущих субкадров, декодированную мощность e_m-1 предыдущего субкадра и коэффициент e_B усиления погрешности остатки предсказания в качестве вводимой информации, вычисляет логарифмический квантованный остаток предсказания первого субкадра, основываясь на этих элементах информации, и выводит ее на переключатель 810. Точно так же узел 808 генерации квантованных остатков предсказания субкадра, который имеет логарифмические квантованные остатки x_m+2 и x_m+3 предсказания, логарифмические квантованные остатки x_m-1-x_m-m предсказания М предыдущих субкадров, декодированную мощность e_m-1 предыдущего субкадра и коэффициент e_B усиления погрешности остатка предсказания в качестве вводимой информации, вычисляет логарифмический квантованный остаток предсказания второго субкадра, основываясь на этих элементах информации, и выводит ее в буфер 809. Подробности узлов 807 и 808 генерации квантованных остатков предсказания субкадра будет приведены позже в данной работе.

Буфер 809 хранит логарифмический квантованный остаток предсказания второго субкадра, выводимый из узла 808 генерации квантованного остатка предсказания субкадра, в течение продолжительности одного субкадра, и выводит этот логарифмический квантованный остаток предсказания второго субкадра на переключатель 810, когда выполняют обработку второго субкадра. Во время обработки второго субкадра, x_m-1-x_m-M, e_m-1 и e_B обновляют вне узла 704 декодирования остатка предсказания, но обработка не выполняется ни узлом 807 генерации квантованного остатка предсказания субкадра, ни узлом 808 генерации квантованного остатка предсказания субкадра, и вся обработка выполняется во время обработки первого субкадра.

Во время обработки первого субкадра переключатель 810 подключают к узлу 807 генерации квантованного остатка предсказания субкадра, и он выводит сгенерированный логарифмический квантованный остаток предсказания первого субкадра в узел 811 вычисления показательной функции, тогда как во время обработки второго субкадра переключатель 810 подключают к буферу 809, и он выводит логарифмический квантованный остаток предсказания второго субкадра, сгенерированную узлом 808 генерации квантованного остатка предсказания субкадра, в узел 811 вычисления показательной функции. Узел 811 вычисления показательной функции вычисляет показательную функцию от логарифмического квантованного остатка, выводимой из переключателя 810, и выводит маскированный остаток предсказания, который является результатом этого вычисления, на переключатель 812.

Если код B_n удаления текущего кадра указывает, что «n-й кадр является обычным кадром», то переключатель 812 выбирает квантованный остаток предсказания, выводимый из кодовой книги 801, через переключатель 813. С другой стороны, если код B_n удаления текущего кадра указывает, что «n-й кадр является удаленным кадром», то переключатель 812 дополнительно выбирает квантованный остаток предсказания, который будут выводить, в соответствии с информацией, которую имеет код B_n+1 удаления следующего кадра.

Т.е. переключатель 812 выбирает маскированный остаток предсказания, выводимый из узла 805 вычисления показательной функции, если код B_n+1 удаления следующего кадра указывает, что «(n+1)-й кадр является удаленным кадром», и выбирает маскированный остаток предсказания, выводимую из узла 811 вычисления показательной функции, если код B_n+1 удаления следующего кадра указывает, что «(n+1)-й кадр является обычным кадром». Ввод данных на другой вход, кроме выбранного входа, не является необходимым, и поэтому при фактической обработке обычно сначала необходимо определять, какой вход должен быть выбран в переключателе 812, и выполнять обработку для генерации сигнала, который будут выводить на определенный вход.

Фиг.16 - структурная схема, на которой показывают внутреннюю конфигурацию узла 807 генерации квантованного остатка предсказания субкадра, показанного на фиг.15. Внутренняя конфигурация узла 808 генерации квантованного остатка предсказания субкадра также идентична конфигурации на фиг.16, и только значения весовых коэффициентов отличаются от значений в узле 807 генерации квантованного остатка предсказания субкадра.

Усилители 901-1-901-М умножают вводимые логарифмические квантованные остатки x_m-1-x_m-M предсказания на весовые коэффициенты β₁-β_М, соответственно, и выводят результаты на сумматор 906. Усилитель 902 умножает логарифмический коэффициент e_m-1 усиления предыдущего субкадра на весовой коэффициент β_-1, и выводит результат на сумматор 906. Усилитель 903 умножает логарифмический коэффициент e_B усиления погрешности на весовой коэффициент β_B, и выводит результат на сумматор 906. Усилитель 904 умножает логарифмический квантованный остаток x_m+2предсказания на весовой коэффициент β₀₀, и выводит результат на сумматор 906. Усилитель 905 умножает логарифмический квантованный остаток x_m+3 предсказания на весовой коэффициент β₀₁ и выводит результат на сумматор 906.

Сумматор 906 вычисляет общую сумму логарифмических квантованных остатков предсказания, выводимых из усилителей 901-1-901-М, усилителя 902, усилителя 903, усилителя 904 и усилителя 905, и выводит результат этого вычисления на переключатель 810.

Ниже показан примерный способ определения весового коэффициента β в данном варианте осуществления. Как уже указано, в случае рекомендации ITU-T G.729, квантование коэффициента усиления - обработка субкадра, а один кадр состоит из двух субкадров, и поэтому удаление одного кадра - удаление пачки из двух последовательных субкадров. Поэтому, набор весовых коэффициентов β нельзя определять посредством способа, описанного в варианте осуществления 3. Таким образом, в данном варианте осуществления находят x_mи x_m+1, которые минимизируют D в приведенном ниже Уравнении (6).

В данном случае для примера описан случай, в котором один кадр состоит из двух субкадров, как в рекомендации ITU-T G.729, и коэффициент предсказания МА - только одного вида. В Уравнении

(б) y_m-1, y_m, y_m+1, y_m+2, y_m+3, x_m, x_m+1, x_m+2, x_m+3, x_B и α_i являются следующими.

y_m-1: декодированный логарифмический коэффициент усиления второго субкадра предыдущего кадра.

y_m: декодированный логарифмический коэффициент усиления первого субкадра текущего кадра.

y_m+1: декодированный логарифмический коэффициент усиления второго субкадра текущего кадра.

y_m+2: декодированный логарифмический коэффициент усиления первого субкадра следующего кадра.

y_m+3: декодированный логарифмический коэффициент усиления второго субкадра следующего кадра.

x_m: логарифмический квантованный остаток предсказания первого субкадра текущего кадра.

x_m+1: логарифмический квантованный остаток предсказания второго субкадра текущего кадра.

x_m+2: логарифмический квантованный остаток предсказания первого субкадра следующего кадра.

x_m+3: логарифмический квантованный остаток предсказания второго субкадра следующего кадра.

x_B: логарифмический коэффициент усиления погрешности.

α_i: коэффициент предсказания MA i-го порядка.

Определяя x_mи x_m+1 с помощью уравнения, полученного с помощью частичного дифференцирования Уравнения (6), чтобы x_mбыло равно 0, и уравнения, полученного с помощью частичного дифференцирования Уравнения (6), чтобы x_m+1 было равно 0, как систему уравнений, получают Уравнение (7) и Уравнение (8). Поскольку β₀₀, β₀₁, β₁-β_M, β_-1, β_B, β′₀₀, β′₀₁, β′₁-β′_M, β′_-1 и β′_B находят из α₀-α_M, то их определяют однозначно.

Таким образом, когда следующий кадр принимают обычным образом, обработку маскирования логарифмического квантованного остатка предсказания текущего кадра выполняют посредством обработки взвешенного суммирования, в частности, для обработки маскирования, используя логарифмический квантованный остаток предсказания, принятый в прошлом, и логарифмический квантованный остаток предсказания следующего кадра, и декодирование параметра коэффициента усиления выполняют, используя маскированный логарифмический квантованный остаток предсказания, давая возможность обеспечивать более высокую эффективность маскирования, чем при использовании декодированного предыдущего параметра коэффициента усиления после монотонного затухания.

Кроме того, при использовании набора весовых коэффициентов Уравнения (7) и Уравнения (8), который минимизирует Уравнение (6), параметры декодированного логарифмического коэффициента усиления удаленного кадра (два субкадра) и обычного кадра (два субкадра), который является следующим кадром (два субкадра) после удаленного кадра, как гарантируют, не будут очень сильно отличаться от параметра логарифмического коэффициента усиления кадра, предшествующего удаленному кадру. Следовательно, даже если параметр декодированного логарифмического коэффициента усиления следующего кадра (два субкадра) не известен, принимаемую информацию (логарифмический квантованный остаток предсказания) следующего кадра (два субкадра) можно продолжать использовать эффективно, и риск маскирования, выполняемого в неправильном направлении (риск сильного отличия от правильного параметра декодированного коэффициента усиления), можно сохранять минимальным.

(Вариант осуществления 5)

Фиг.17 - структурная схема, на которой показывают основную конфигурацию устройства кодирования речи согласно варианту осуществления 5 настоящего изобретения. Фиг.17 показывает пример кодирования информации E_n+1 типа маскирования для определения набора весовых коэффициентов посредством второго способа, описанного в варианте осуществления 3 - т.е. способа, посредством которого информацию типа маскирования (n-1)-го кадра представляют с помощью одного бита, используя информацию типа коэффициента предсказания МА n-го кадра.

В данном случае узел 1003 маскирования КЛП предыдущего кадра находит ЧСЛ маскирования (n-1)-го кадра, как описано с использованием фиг.13, посредством взвешенной суммы декодированного квантованного остатка предсказания текущего кадра и декодированных квантованных остатков предсказания на два кадра раньше - на М+1 кадров раньше. Принимая во внимание, что на фиг.13 ЧСЛ маскирования n-го кадра находят, используя информацию кодирования (n+1)-го кадра, в данном случае ЧСЛ маскирования (n-1)-го кадра находят, используя информацию кодирования n-го кадра, и поэтому соответствующая зависимость является зависимостью смещения на один кадр. Т.е. комбинации α_i ^{j)и α′_i ^(j) ограничены двумя из четырех с помощью кода коэффициента предсказания МА n-го кадра (=текущего кадра) (т.е., когда тип предсказания МА n-го кадра - тип 0, комбинация типов предсказания МА (n-1)-го кадра и n-го кадра - или (0-0), или (0-1), и поэтому наборы весовых коэффициентов β ограничены двумя видами), и узел 1003 маскирования КЛП предыдущего кадра производит два вида ЧСЛ маскирования - ω0_n(j) и ω1_n(j) - используя эти два вида наборов весовых коэффициентов β.

Блок 1004 определения типа маскирования выполняет определение типа, основываясь на том, что из ω0_n ^(j) и ω1_n ^(j)находится ближе к вводимому параметру ЧСЛ ω_n ^(j). Относительное расстояние ω0_n ^(j) и ω1_n ^(j) от ω_n ^(j) можно определять, основываясь на простом евклидовом расстоянии, или основываясь на взвешенном евклидовом расстоянии, например, как используется при квантовании ЧСЛ рекомендации ITU-T G.729.

Далее будет описана работа каждого узла устройства кодирования речи, показанного на фиг.17.

Входной сигнал s_n вводят в узел 1001 анализа КЛП, узел 1006 вычисления целевого вектора и узел 1013 обновления состояния фильтра.

Узел 1001 анализа КЛП выполняет уже известный анализ линейного предсказания входного сигнала s_n и выводит коэффициенты a_j линейного предсказания (j=0-M, где М является порядком анализа линейного предсказания; а₀=1, 0) в узел 1005 вычисления импульсной характеристики, в узел 1006 вычисления целевого вектора и в узел 1002 кодирования КЛП. Кроме того, узел 1001 анализа КЛП преобразовывает коэффициенты a_j линейного предсказания в параметры ω_n ^(j) ЧСЛ и выводит их в блок 1004 определения типа маскирования.

Узел 1002 кодирования КЛП выполняет квантование и кодирование вводимых КЛП (коэффициентов линейного предсказания), и выводит квантованные коэффициенты a′_j линейного предсказания в узел 1005 вычисления импульсной характеристики, узел 1006 вычисления целевого вектора и узел 1011 фильтра синтеза. В этом примере квантование КЛП и кодирование выполняют в области параметра ЧСЛ. Кроме того, узел 1002 кодирования КЛП выводит результат L_n кодирования КЛП в узел 1014 мультиплексирования, и выводит квантованный остаток x_n предсказания, декодированный квантованный параметр ω′_n ^(j) ЧСЛ и тип K_n квантования с предсказанием МА в узел 1003 маскирования КЛП предыдущего кадра.

Узел 1003 маскирования КЛП предыдущего кадра хранит декодированный квантованный параметр ω′_n ^(j) ЧСЛ n-го кадра, выводимый из узла 1002 кодирования КЛП, в буфере в течение продолжительности двух кадров. Декодированный квантованный параметр ЧСЛ на два кадра раньше -ω′_n-2 ^(j). Кроме того, узел 1003 маскирования КЛП предыдущего кадра хранит декодированный квантованный остаток x_n предсказания n-го кадра в течение продолжительности М+1 кадров. Кроме того, узел 1003 маскирования КЛП предыдущего кадра производит декодированные квантованные параметры ω0_n(j) и ω1_n(j) ЧСЛ (n-1)-го кадра посредством взвешенного суммирования квантованного остатка x_n предсказания, декодированного квантованного параметра ω′_n-2 ^(j) ЧСЛ на два кадра раньше, и декодированных квантованных остатков x_n-2-x_n-M-1 предсказания на два кадра раньше - на М+1 кадров раньше, и выводит результат в блок 1004 определения типа маскирования. В данном случае узел 1003 маскирования КЛП предыдущего кадра обеспечивают четырьмя видами наборов весовых коэффициентов, когда находят взвешенную сумму, но два из этих четырех видов выбирают согласно тому, равна ли информация K_n типа квантования с предсказанием МА, вводимая из узла 1002 кодирования КЛП, 0 или 1, и используют для генерации ω0_n ^(j) и ω1_n ^(j).

Блок 1004 определения типа маскирования определяет, какой из двух параметров ω0_n ^(j) и ω1_n ^(j) маскирования ЧСЛ, выводимых из узла 1003 маскирования КЛП предыдущего кадра, ближе к неквантованному параметру ω_n ^(j) ЧСЛ, выводимому из узла 1001 анализа КЛП, и выводит код E_n, соответствующий набору весовых коэффициентов, с помощью которого создают более близкий маскированный параметр ЧСЛ, в узел 1014 мультиплексирования.

Узел 1005 вычисления импульсной характеристики создает перцепционно взвешенную импульсную характеристику h фильтра синтеза, используя неквантованные коэффициенты a_j линейного предсказания, выводимые из узла 1001 анализа КЛП, и квантованные коэффициенты a′_j линейного предсказания, выводимые из узла 1002 кодирования КЛП, и выводит их в узел 1007 кодирования ВАКК и в узел 1008 кодирование ВПКК.

Узел 1006 вычисления целевого вектора вычисляет целевой вектор О (сигнал, в котором характеристику при отсутствии входного сигнала перцепционно взвешенного фильтра синтеза вычитают из сигнала, следующего из применения перцепционно взвешенного фильтра к входному сигналу) из входного сигнала s_n, неквантованных коэффициентов a_j линейного предсказания, выводимых из узла 1001 анализа КЛП, и квантованных коэффициентов a′_j линейного предсказания, выводимых из узла 1002 кодирования КЛП, и выводит их в узел 1007 кодирования ВАКК, в узел 1009 кодирования коэффициента усиления и в узел 1012 обновления состояния фильтра.

Узел 1007 кодирования ВАКК, который имеет целевой вектор ○ из узла 1006 вычисления целевого вектора, импульсную характеристику h перцепционно взвешенного фильтра синтеза из узла 1005 вычисления импульсной характеристики и сигнал ех возбуждения из узла 1010 генерации возбуждения в качестве вводимой информации, выполняет поиск в адаптивной кодовой книге и выводит результирующий код A_n адаптивной кодовой книги в узел 1014 мультиплексирования, квантованный период Т основного тона - в узел 1008 кодирования ВПКК, вектор v AKK - в узел 1010 генерации возбуждения, составную часть р фильтрованного вектора АКК, для вычисления которой свертку импульсной характеристики h перцепционно взвешенного фильтра синтеза выполняют для вектора v АКК - в узел 1012 обновления состояния фильтра и в узел 1009 кодирования коэффициента усиления, и целевой вектор ○′, обновленный для поиска в постоянной кодовой книге, используется для узла 1008 кодирования ВПКК. Более конкретно способ поиска подобен способу, описанному в рекомендации ITU-T G.729 и т.д. Хотя опущено на фиг.17, обычно количество вычислений, необходимых для поиска в адаптивной кодовой книги, не увеличивается при определении диапазона, в котором поиск частоты основного тона с обратной связью выполняют посредством поиска частоты основного тона без обратной связи или подобного поиска.

Узел 1008 кодирования ВПКК, который имеет целевой вектор ○′ постоянной кодовой книги и квантованный период Т основного тона в качестве вводимой информации из узла 1007 кодирования ВАКК, и импульсную характеристику h перцепционно взвешенного фильтра синтеза в качестве вводимой информации из узла 1005 вычисления импульсной характеристики, выполняет поиск в постоянной кодовой книге посредством способа, который описан, например, в рекомендации ITU-T G.729, и выводит код F_n постоянной кодовой книги в узел 1014 мультиплексирования, вектор u ПКК - в узел 1010 генерации возбуждения, и составную часть q фильтрованного вектора ПКК, полученную с помощью свертки импульсной характеристики перцепционно взвешенного фильтра синтеза для вектора u ПКК, - в узел 1012 обновления состояния фильтра и узел 1009 кодирования коэффициента усиления.

Узел 1009 кодирования коэффициента усиления, который имеет целевой вектор ο в качестве вводимой информации из узла 1006 вычисления целевого вектора, составную часть р фильтрованного вектора АКК в качестве вводимой информации из узла 1007 кодирования ВАКК и составную часть q фильтрованного вектора ПКК в качестве вводимой информации из узла 1008 кодирования ВПКК, выводит пару ga и gf, для которой значение |○-(ga×p+gf×q|² становится минимальным, в узел 1010 генерации возбуждения, как квантованный коэффициент усиления адаптивной кодовой книги и квантованный коэффициент усиления постоянной кодовой книги.

Узел 1010 генерации возбуждения, который имеет вектор v адаптивной кодовой книги в качестве вводимой информации из узла 1007 кодирования ВАКК, вектор u постоянной кодовой книги в качестве вводимой информации из узла 1008 кодирования ВПКК, вектор ga усиления адаптивной кодовой книги и вектор gf усиления постоянной кодовой книги в качестве вводимой информации из узла 1009 кодирования усиления, вычисляет вектор ех возбуждения как ga×v+gf×u, и выводит его в узел 1007 кодирования ВАКК и узел 1011 фильтра синтеза. Вектор е_х возбуждения, выводимый в узел 1007 кодирования ВАКК, используется для обновления АСВ (буфера генерированного в прошлом вектора возбуждения) в узле кодирования ВАКК.

Узел 1011 фильтра синтеза управляет фильтром линейного предсказания, сконфигурированным посредством квантованных коэффициентов a′_j линейного предсказания, выводимых из узла 1002 кодирования КЛП посредством вектора ех возбуждения, выводимого из узла 1010 генерации возбуждения, производит локально декодированный речевой сигнал s′_n, и выводит его в узел 1013 обновления состояния фильтра.

Узел 1012 обновления состояния фильтра, который имеет синтезированный вектор р адаптивной кодовой книги в качестве вводимой информации из узла 1007 кодирования ВАКК, синтезированный вектор q постоянной кодовой книги в качестве вводимой информации из узла 1008 кодирования ВПКК и целевой вектор ○ в качестве вводимой информации из узла 1006 вычисления целевого вектора, генерирует состояние перцепционно взвешенного фильтра в узле 1006 вычисления целевого вектора и выводит его в узел 1006 вычисления целевого вектора.

Узел 1013 обновления состояния фильтра вычисляет остаток между локально декодированным речевым сигналом s′_n, вводимым из узла 1011 фильтра синтеза, и входным сигналом s_n, и выводит его в узел 1006 вычисления целевого вектора, как состояние фильтра синтеза в узле 1006 вычисления целевого вектора.

Узел 1014 мультиплексирования выводит кодированную информацию, в которой мультиплексируют коды F_n, G_n, L_n и В.

В данном варианте осуществления показан пример, в котором остаток, относящийся к неквантованному параметру ЧСЛ, вычисляют только для декодированного квантованного параметра ЧСЛ (n-1)-го кадра, но можно также обеспечивать, чтобы тип маскирования определяли, рассматривая остаток между декодированным квантованным параметром ЧСЛ n-го кадра и неквантованным параметром ЧСЛ n-го кадра.

Таким образом, согласно устройству кодирования речи данного варианта осуществления, оптимальный набор весовых коэффициентов обработки маскирования идентифицируют для обработки маскирования для устройства декодирования речи варианта осуществления 3, и эту информацию передают на сторону декодера, предоставляя возможность обеспечивать более высокую эффективность маскирования и улучшение качества декодирования речевого сигнала на стороне декодера.

(Вариант осуществления 6)

Фиг.18 - структурная схема, на которой показывают конфигурацию устройства передачи речевого сигнала и устройство приема речевого сигнала, которые формируют систему передачи речевого сигнала согласно варианту осуществления 6 настоящего изобретения. Единственное отличие от обычной системы - то, что устройство кодирования речи варианта осуществления 5 применяют к устройству передачи речевого сигнала, и устройство декодирования речи любого из вариантов осуществления 1-3 применяют к устройству приема речевого сигнала.

Устройство 1100 передачи речевого сигнала имеет устройство 1101 ввода информации, устройство 1102 А/Ц преобразования, устройство 1103 кодирования речи, устройство 1104 обработки сигналов, устройство 1105 РЧ модуляции, передающее устройство 1106 и антенну 1107.

Вход устройства 1102 А/Ц преобразования подключают к устройству 1101 ввода информации. Вход устройства 1103 кодирования речи подключают к выходу устройства 1102 А/Ц преобразования. Вход устройства 1104 обработки сигналов подключают к выходу устройства 1103 кодирования речи. Вход устройства 1105 РЧ модуляции подключают к выходу устройства 1104 обработки сигналов. Вход передающего устройства 1106 подключают к выходу устройства 1105 РЧ модуляции. Антенну 1107 подключают к выходу передающего устройства 1106.

Устройство 1101 ввода информации принимает речевой сигнал, преобразовывает его в аналоговый речевой сигнал, который является электрическим сигналом, и обеспечивает этот сигнал на устройство 1102 А/Ц преобразования. Устройство 1102 А/Ц преобразования преобразовывает аналоговый речевой сигнал из устройства 1101 ввода информации в речевой сигнал в цифровой форме, и обеспечивает этот сигнал к устройству 1103 кодирования речи. Устройство 1103 кодирования речи кодирует речевой сигнал в цифровой форме от устройства 1102 А/Ц преобразования и производит речевой кодированный поток двоичных сигналов, и обеспечивает этот поток двоичных сигналов на устройство 1104 обработки сигналов. Устройство 1104 обработки сигналов выполняет обработку канального кодирования, обработку пакетирования, обработку буферизации передачи и т.д. речевого кодированного потока двоичных сигналов от устройства 1103 кодирования речи, и затем обеспечивает этот речевой кодированный поток двоичных сигналов на устройство 1105 РЧ модуляции. Устройство 1105 РЧ модуляции модулирует речевой кодированный сигнал потока двоичных сигналов от устройства 1104 обработки сигналов, в котором выполняют обработку канального кодирования и т.д., и обеспечивает сигнал к передающему устройству 1106. Передающее устройство 1106 передает модулированный речевой кодированный поток двоичных сигналов от устройства 1105 РЧ модуляции как радиоволну (РЧ сигнал) через антенну 1107.

В устройстве 1100 передачи речевого сигнала выполняют обработку речевого сигнала в цифровой форме, полученного через устройство 1102 А/Ц преобразования, в блоках кадра продолжительностью несколько десятков миллисекунд (мс). Если сеть, которая формирует систему, является сетью с коммутацией пакетов, то один кадр или несколько кадров кодированных данных помещают в один пакет, и этот пакет передают к пакетной сети. Если сеть является сетью с коммутацией каналов, то обработка пакетирования и обработка буферизации передачи не требуются.

Устройство 1150 приема речевого сигнала имеет антенну 1151, приемное устройство 1152, устройство 1153 РЧ демодуляции, устройство 1154 обработки сигналов, устройство 1155 декодирования речи, устройство 1156 Ц/А преобразования и устройство 1157 вывода информации.

Вход приемного устройства 1152 подключают к антенне 1151. Вход устройства 1153 РЧ демодуляции подключают к выходу приемного устройства 1152. Два входа устройства 1154 обработки сигналов подключают к двум выходам устройства 1153 РЧ демодуляции. Два входа устройства 1155 декодирования речи подключают к двум выходам устройства 1154 обработки сигналов. Вход устройства 1156 Ц/А преобразования подключают к выходу устройства 1155 декодирования речи. Вход устройства 1157 вывода информации подключают к выходу устройства 1156 Ц/А преобразования.

Приемное устройство 1152 принимает радиоволну (РЧ сигнал), которая включает в себя речевую кодированную информацию, через антенну 1151 и производит кодированный сигнал принятой речи, который является аналоговым электрическим сигналом, и обеспечивает этот сигнал на устройство 1153 РЧ демодуляции. Если нет ослабления сигнала или наложения шума по маршруту передачи, то радиоволна (РЧ сигнал), принятая через антенну, является точно такой же, как радиоволна (РЧ сигнал), передаваемая устройством передачи речевого сигнала.

Устройство 1153 РЧ демодуляции демодулирует принятый из приемного устройства 1152 кодированный речевой сигнал и обеспечивает этот сигнал на устройство 1154 обработки сигналов. Устройство 1153 РЧ демодуляции также отдельно обеспечивает устройство 1154 обработки сигналов информацией о том, можно или нет демодулировать принятый кодированный речевой сигнал обычным образом. Устройство 1154 обработки сигналов выполняет обработку буферизации для ослабления дрожания фазы, обработку сборки пакетов, обработку канального декодирования и т.д., принятого от устройства 1153 РЧ демодуляции кодированного речевого сигнала, и обеспечивает принятый речевой кодированный поток двоичных сигналов к устройству 1155 декодирования речи. Кроме того, информацию о том, можно или нет демодулировать принятый кодированный речевой сигнал обычным образом, вводят из устройства 1153 РЧ демодуляции, и если вводимая от устройства 1153 РЧ демодуляции информация указывает, что «демодуляцию нельзя выполнять обычным образом», или если обработку сборки пакетов или подобную обработку в устройстве обработки сигналов нельзя выполнять обычным образом и кодированный поток двоичных сигналов принятой речи нельзя декодировать обычным образом, то появление удаленного кадра передают к устройству 1155 декодирования речи как информацию удаления кадра. Устройство 1155 декодирования речи выполняет обработку декодирования принятого из устройства 1154 обработки сигналов речевого кодированного потока двоичных сигналов и производит декодированный речевой сигнал, и обеспечивает этот сигнал на устройство 1156 Ц/А преобразования. Устройство 1155 декодирования речи определяет, следует ли выполнять обработку декодирования обычным образом или выполнять обработку декодирования посредством обработки маскирования удаления кадра в соответствии с информацией удаления кадра, вводимой параллельно с принятой речевой кодированной строкой битов. Устройство 1156 Ц/А преобразования преобразовывает цифровой декодированный речевой сигнал из устройства 1155 декодирования речи в аналоговый декодированный речевой сигнал, и обеспечивает этот сигнал к устройству 1157 вывода информации. Устройство 1157 вывода информации преобразовывает аналоговый декодированный речевой сигнал из устройства 1156 Ц/А преобразования в колебания воздуха, и выводит их как звуковую волну, слышимую человеческому уху.

Таким образом, обеспечивая устройство кодирования речи и устройство декодирования речи, показанное в вариантах осуществления 1-5, может быть получен декодированный речевой сигнал лучшего качества, чем раньше, даже если происходит ошибка в тракте передачи (в частности, ошибка удаления кадра, которая является типичным представителем потери пакета).

(Вариант осуществления 7)

В приведенных выше вариантах осуществления 1-6 описаны случаи, в которых используется модель предсказания МА-типа, но настоящее изобретение ей не ограничено, и может также использоваться модель предсказания AR-типа. В варианте осуществления 7 описан случай, в котором используется модель предсказания AR-типа. За исключением внутренней конфигурации узла декодирования КЛП, конфигурация устройства декодирования речи согласно варианту осуществления 7 идентична конфигурации, показанной на фиг.1.

Фиг.19 - чертеж, на котором показывают внутреннюю конфигурацию узла 105 декодирования КЛП из устройства декодирования речи согласно данному варианту осуществления. Части конфигурации на фиг.19, которые являются общими с фиг.2, имеют те же самые позиционные обозначения, как на фиг.2, и их подробное описание опущено в данной работе.

Узел 105 декодирования КЛП, показанный на фиг.19, использует конфигурацию, в которой, по сравнению с фиг.2, части, относящиеся к предсказанию (буфер 204, усилители 205 и сумматор 206), и части, относящиеся к маскированию удаления кадра (узел 203 декодирования кодового вектора и буфер 207), были удалены, а части конфигурации, их заменяющие (узел 1901 декодирования кодового вектора, усилитель 1902, сумматор 1903 и буфер 1904) были добавлены.

Код L_n+1 КЛП вводят в буфер 201 и узел 1901 декодирования кодового вектора, и код B_n+1 удаления кадра вводят в буфер 202, узел 1901 декодирования кодового вектора и блок 209 выбора.

Буфер 201 хранит код L_n+1 КЛП следующего кадра в течение продолжительности одного кадра и затем выводит этот код КЛП в узел 1901 декодирования кодового вектора. В результате того, что код хранится в буфере 201 в течение продолжительности одного кадра, код КЛП, выводимый из буфера 201 в узел 1901 декодирования кодового вектора, является кодом L_n КЛП текущего кадра.

Буфер 202 хранит код B_n+1 удаления следующего кадра в течение продолжительности одного кадра, и затем выводит этот код удаления кадра в узел 1901 декодирования кодового вектора. В результате того, что код хранится в буфере 202 в течение продолжительности одного кадра, код удаления кадра, выводимый из буфера 202 в узел 1901 декодирования кодового вектора, является кодом B_n удаления текущего кадра.

Узел 1901 декодирования кодового вектора, который имеет декодированный вектор y_n-1 ЧСЛ предыдущего кадра, код L_n+1 КЛП следующего кадра, код B_n+1 удаления следующего кадра, код L_n КЛП текущего кадра и код B_n удаления текущего кадра в качестве вводимой информации, производит вектор x_n квантованного остатка предсказания текущего кадра, основываясь на этих элементах информации, и выводит вектор x_n квантованного остатка предсказания текущего кадра на сумматор 1903. Подробности узла 1901 декодирования кодового вектора будут приведены позже в данной работе.

Усилитель 1902 умножает декодированный вектор y_n-1 ЧСЛ следующего кадра на предопределенный коэффициент α₁ предсказания МА, и выводит результат на сумматор 1903.

Сумматор 1903 вычисляет сумму предсказанных векторов ЧСЛ, выводимых из усилителя 1902 (т.е. результат умножения декодированных векторов ЧСЛ предыдущего кадра на коэффициент предсказания AR-типа) и вектора x_n квантованного остатка предсказания текущего кадра, и выводит результат умножения декодированного вектора y_n ЧСЛ в буфер 1904 и узел 208 преобразования КЛП.

Буфер 1904 хранит декодированный вектор y_n ЧСЛ в течение продолжительности одного кадра, и затем выводит этот декодированный вектор ЧСЛ в узел 1901 декодирования кодового вектора и в усилитель 1902. В результате того, что вектор хранится в буфере 1904 в течение продолжительности одного кадра, декодированный вектор ЧСЛ, вводимый в узел 1901 декодирования кодового вектора и усилитель 1902, является декодированным вектором y_n-1 ЧСЛ предыдущего кадра.

Если блок 209 выбора выбирает декодированный параметр КЛП в предыдущем кадре, выводимый из буфера 210, то фактически не требуется выполнять всю обработку от узла 1901 декодирования кодового вектора до узла 208 преобразования КЛП.

Далее будет подробно описана внутренняя конфигурация узла 1901 декодирования кодового вектора, показанного на фиг.19, используя структурную схему на фиг.20.

В кодовой книге 2001 генерируют кодовый вектор, идентифицированный кодом L_n КЛП текущего кадра, и выводят его к переключателю 309, и также генерируют кодовый вектор, идентифицированный кодом L_n+1 КЛП следующего кадра, и выводят его на усилитель 2002. Кроме того, кодовая книга может иметь многоступенчатую конфигурацию и может иметь конфигурацию разбиения.

Усилитель 2002 умножает кодовый вектор x_n+1, выводимый из кодовой книги 2001, на весовой коэффициент b₀, и выводит результат на сумматор 2005.

Усилитель 2003 выполняет обработку для поиска вектора квантованного остатка предсказания в текущем кадре, необходимого для генерации декодированного вектора ЧСЛ предыдущего кадра. Т.е. усилитель 2003 вычисляет вектор x_n текущего кадра так, чтобы декодированный вектор y_n-1 ЧСЛ предыдущего кадра стал декодированным вектором y_n ЧСЛ текущего кадра. В частности, усилитель 2003 умножает вводимый декодированный вектор y_n-1 ЧСЛ предыдущего кадра на коэффициент (1-a₁). Затем усилитель 2003 выводит результат этого вычисления на переключатель 309.

Усилитель 2004 умножает вводимый декодированный вектор y_n-1 ЧСЛ предыдущего кадра на весовой коэффициент b_-1, и выводит результат на сумматор 2005.

Сумматор 2005 вычисляет сумму векторов, выводимых из усилителя 2002 и усилителя 2004, и выводит кодовый вектор, который является результатом этого вычисления, на переключатель 309. Т.е. сумматор 2005 вычисляет вектор x_n текущего кадра, выполняя взвешенное суммирование кодового вектора, идентифицированного кодом L_n+1 КЛП следующего кадра, и декодированного вектора ЧСЛ предыдущего кадра.

Если код B_n удаления текущего кадра указывает, что «n-й кадр является обычным кадром», то переключатель 309 выбирает кодовый вектор, выводимый из кодовой книги 2001, и выводит его как вектор x_n квантованного остатка предсказания текущего кадра. С другой стороны, если код B_n удаления текущего кадра указывает, что «n-й кадр является удаленным кадром», то переключатель 309 дополнительно выбирает вектор, который будут выводить, согласно тому, какую информацию имеет код B_n+1 удаления следующего кадра.

Т.е. если код B_n+1 удаления следующего кадра указывает, что «(n+1)-й кадр является удаленным кадром», то переключатель 309 выбирает вектор, выводимый из устройства 2003 кодирования, и выводит его как вектор x_n квантованного остатка предсказания текущего кадра. В этом случае не требуется выполнять обработку процесса генерации вектора из кодовой книги 2001 и усилителей 2002 и 2004 через сумматор 2005. Кроме того, в этом случае, так как y_n-1 можно использовать в качестве y_n, x_n не обязательно нужно генерировать с помощью обработки в усилителе 2003.

С другой стороны, если код B_n+1 удаления следующего кадра указывает, что «(n+1)-й кадр является обычным кадром», то переключатель 309 выбирает вектор, выводимый из сумматора 2005, и выводит его как вектор x_n квантованного остатка предсказания текущего кадра. В этом случае не требуется выполнять обработку с помощью усилителя 2003.

При обработке маскирования данного варианта осуществления весовые коэффициенты b_-1 и b₀ определяют так, чтобы сумма D (где D находят, как показано в приведенном ниже Уравнении (9)) расстояния между декодированным параметром y_n-1 (n-1)-го кадра и декодированным параметром y_n n-го кадра, и расстояния между декодированным параметром y_n n-го кадра и декодированным параметром y_n+1 (n+1)-го кадра была небольшой, так, чтобы изменения между декодированными параметрами кадров стали незначительными.

Пример способа определения весовых коэффициентов b_-1 и b₀ показан ниже. Для минимизации D в Уравнении (9), приведенное ниже Уравнение (10) решают для декодированного вектора x_n квантованного остатка предсказания удаленного n-го кадра. В результате x_n может быть найден посредством приведенного ниже Уравнения (11). Если коэффициенты предсказания отличаются в каждой группе, то Уравнение (9) заменяют Уравнением (12). В данном случае а₁ представляет коэффициент предсказания AR-типа, и а₁ ^(j) представляет j-й элемент набора коэффициентов предсказания AR-типа (т.е. коэффициента, умноженного на y_n-1 ^(j), j-й элемент декодированного параметра y_n-1 ЧСЛ) предыдущего кадра.

Элементы х, y и а в приведенных выше уравнениях являются следующими.

x_n ^(j): квантованный остаток предсказания j-го компонента параметра ЧСЛ в n-м кадре.

y_n ^(j): j-й компонент декодированного параметра ЧСЛ в n-м кадре.

a₁ ^(j): j-й компонент набора коэффициентов предсказания AR-типа.

Таким образом, согласно данному варианту осуществления, в котором используется модель предсказания AR-типа, когда текущий кадр удаляют, если следующий кадр принимают обычным образом, то обработку маскирования декодированного квантованного остатка предсказания параметра ЧСЛ текущего кадра выполняют посредством взвешенной обработки суммирования (обработки взвешенного линейного суммирования), в частности, для обработки маскирования, используя параметр, декодированный в прошлом, и квантованный остаток предсказания следующего кадра, и декодирование параметра ЧСЛ выполняют, используя маскированный квантованный остаток предсказания. Таким образом, можно обеспечивать более высокую эффективность маскирования, чем с помощью повторного использования декодированных в прошлом параметров ЧСЛ.

Также можно применять описание вариантов осуществления 2-4 к варианту осуществления, который использует предсказание AR-типа, в этом случае также можно получать тот же самый результат, как описано выше.

(Вариант осуществления 8)

В указанном выше варианте осуществления 7 описан случай, в котором существует только один вид набора коэффициента предсказания, но настоящее изобретение не ограничено этим, и его можно также применять к случаю, в котором существует множество видов наборов коэффициентов предсказания, таким же образом, как в вариантах осуществления 2 и 3. В варианте осуществления 8 будет описан примерный случай, в котором используется предсказание AR-типа, для которого существует множество видов наборов коэффициентов предсказания.

Фиг.21 - структурная схема устройства декодирования речи согласно данному варианту осуществления. За исключением отличия во внутренней конфигурации узла декодирования КЛП и отсутствия линии ввода информации E_n+1 типа маскирования из узла 101 демультиплексирования в узел 105 декодирования КЛП, конфигурация устройства 100 декодирования речи, показанного на фиг.21, идентична конфигурации на фиг.11.

Фиг.22 - чертеж, на котором показывают внутреннюю конфигурацию узла 105 декодирования КЛП из устройства декодирования речи согласно данному варианту осуществления. Части конфигурации на фиг.22, которые являются общими с фиг.19, имеют те же самые позиционные обозначения, как на фиг.19, и их подробное описание опущено в данной работе.

Узел 105 декодирования КЛП, показанный на фиг.22, использует конфигурацию, в которой, по сравнению с фиг.19, добавлен буфер 2202 и узел 2203 декодирования коэффициента. Кроме того, работа и внутренняя конфигурация узла 2201 декодирования кодового вектора на фиг.22 отличаются от работы и конфигурации узла 1901 декодирования кодового вектора на фиг.19.

Код V_n+1 КЛП вводят в буфер 201 и узел 2201 декодирования кодового вектора, и код B_n+1 удаления кадра вводят в буфер 202, узел 2201 декодирования кодового вектора и блок 209 выбора.

Буфер 201 хранит код V_n+1 КЛП следующего кадра в течение продолжительности одного кадра, и затем выводит этот код КЛП в узел 2201 декодирования кодового вектора. В результате того, что код хранится в буфере 201 в течение продолжительности одного кадра, код КЛП, выводимый из буфера 201 в узел 2201 декодирования кодового вектора, является кодом V_n КЛП текущего кадра. Кроме того, буфер 202 хранит код B_n+1 удаления следующего кадра в течение продолжительности одного кадра, и затем выводит этот код удаления кадра в узел 2201 декодирования кодового вектора.

Узел 2201 декодирования кодового вектора, который имеет декодированный вектор y_n-1 ЧСЛ предыдущего кадра, код V_n+1 КЛП следующего кадра, код B_n+1 удаления следующего кадра, код V_n КЛП текущего кадра, код K_n+1 коэффициента предсказания следующего кадра и код B_n удаления текущего кадра в качестве вводимой информации, производит вектор x_n квантованного остатка предсказания текущего кадра, основываясь на этих элементах информации, и выводит вектор x_n квантованного остатка предсказания текущего кадра на сумматор 1903. Подробности узла 2201 декодирования кодового вектора будут приведены позже в данной работе.

Буфер 2202 хранит код K_n+1 коэффициента предсказания AR-типа в течение продолжительности одного кадра, и затем выводит этот код коэффициента предсказания AR-типа в узел 2203 декодирования коэффициента. В результате код коэффициента предсказания AR-типа, выводимый из буфера 2202 в узел 2203 декодирования коэффициента, является кодом K_n коэффициента предсказания AR-типа предыдущего кадра.

Узел 2203 декодирования коэффициента хранит множество видов наборов коэффициентов, и идентифицирует набор коэффициентов посредством кодов B_n и B_n+1 удаления кадра и кодов K_n и K_n+1 коэффициента предсказания AR-типа. В данном случае существуют три способа, которыми идентификацию наборов коэффициентов можно выполнять в узле 2203 декодирования коэффициента следующим образом.

Если вводимый код B_n удаления кадра указывает, что «n-й кадр является обычным кадром», то узел 2203 декодирования коэффициента выбирает набор коэффициентов, определенный кодом K_n коэффициента предсказания AR-типа.

Если вводимый код B_n удаления кадра указывает, что «n-й кадр является удаленным кадром», и код B_n+1 удаления кадра указывает, что «(n+1)-й кадр является обычным кадром», то узел 2203 декодирования коэффициента определяет набор коэффициентов, который будет выбран, используя код K_n+1 коэффициента предсказания AR-типа, принятый как параметр (n+1)-го кадра. Т.е. K_n+1 используется непосредственно вместо кода K_n коэффициента предсказания AR-типа. Альтернативно, можно обеспечивать набор коэффициентов, который будет использоваться в этом случае, который определяют заранее, и этот ранее определенный набор коэффициентов будет использоваться, не принимая во внимание K_n+1.

Если вводимый код B_n удаления кадра указывает, что «n-й кадр является удаленным кадром», и код B_n+1 удаления кадра указывает, что «(n+1)-й кадр является удаленным кадром», то единственная информация, которая может использоваться, является информацией набора коэффициентов, используемого предыдущим кадром, и поэтому узел 2203 декодирования коэффициента неоднократно использует набор коэффициентов, используемый предыдущим кадром. Альтернативно, можно обеспечивать заранее определенный набор коэффициентов, чтобы он использовался постоянным образом.

Затем узел 2203 декодирования коэффициента выводит коэффициент a₁ предсказания AR-типа на усилитель 1902, и выводит коэффициент a₁ предсказания AR-типа в узел декодирования кодового вектора 2201.

Усилитель 1902 умножает декодированный вектор y_n-1 ЧСЛ предыдущего кадра на коэффициент a₁ предсказания AR-типа, вводимый из узла 2203 декодирования коэффициента, и выводит результат на сумматор 1903.

Далее будет подробно описана внутренняя конфигурация узла 2201 декодирования кодового вектора, показанного на фиг.22, используя структурную схему на фиг.23. Части конфигурации на фиг.23, которые являются общими с фиг.20, имеют те же самые позиционные обозначения, как на фиг.20, и их подробное описание опущено в данной работе. Узел 2201 декодирования кодового вектора на фиг.23 использует конфигурацию, в которой узел 2301 декодирования коэффициента добавлен к узлу 1901 декодирования кодового вектора на фиг.20.

Узел 2301 декодирования коэффициента хранит множество видов наборов коэффициентов, идентифицирует набор коэффициентов посредством кода K_n+1 коэффициента предсказания AR-типа, и выводит его на усилители 2002 и 2004. Также можно вычислять используемый набор коэффициентов, используя коэффициент a₁ предсказания AR-типа, выводимый из узла 2203 декодирования коэффициента, когда не требуется хранить наборы коэффициентов, и вычисление можно выполнять после ввода коэффициента а₁ предсказания AR-типа. Подробности способа вычисления будут приведены в данной работе позже.

В кодовой книге 2001 генерируют кодовый вектор, идентифицированный кодом V_n КЛП текущего кадра, и выводят его на переключатель 309, а также генерируют кодовый вектор, идентифицированный кодом V_n+1 КЛП следующего кадра, и выводят его на усилитель 2002. Кроме того, кодовая книга может иметь многоступенчатую конфигурацию и может иметь конфигурацию разбиения.

Усилитель 2002 умножает кодовый вектор x_n+1, выводимый из кодовой книги 2001, на весовой коэффициент b₀ и выводит результат на сумматор 2005.

Усилитель 2003 умножает коэффициент (1-а₁) предсказания AR-типа, выводимый из узла 2203 декодирования коэффициента, на декодированный вектор y_n-1 ЧСЛ предыдущего кадра и выводит результат на переключатель 309. В терминах реализации, если этот вид маршрута не создан и переключающая конфигурация обеспечена таким образом, что выход буфера 1904 заменяют на выход 1903 сумматора и вводят в узел 208 преобразования КЛП вместо выполнения обработки в усилителе 2003, усилителе 1902 и сумматоре 1903, то маршрут через усилитель 2003 не нужен.

Усилитель 2004 умножает вводимый декодированный вектор y_n-1 ЧСЛ предыдущего кадра на весовой коэффициент b_-1, выводимый из узла 2301 декодирования коэффициента, и выводит результат на сумматор 2005.

При обработке маскирования данного варианта осуществления весовые коэффициенты b_-1 и b₀ определяют так, чтобы сумма D (где D находят, как показано в приведенном ниже Уравнении (13)) расстояния между декодированным параметром y_n-1 (n-1)-го кадра и декодированным параметром y_n n-го кадра, и расстояния между декодированным параметром y_n n-го кадра и декодированным параметром y_n+1 (n+1)-го кадра была небольшой, так, чтобы изменения между декодированными параметрами кадров были незначительными.

Пример способа определения весовых коэффициентов b_-1 и b₀ показан ниже. Для минимизации D в Уравнении (13), приведенное ниже Уравнение (14) решают для декодированного вектора x_n квантованного остатка предсказания удаленного n-го кадра. В результате x_n можно находить посредством приведенного ниже Уравнения (15). Если коэффициенты предсказания отличаются в каждой группе, то Уравнение (13) заменяют Уравнением (16). В данном случае а′₁ представляет коэффициент предсказания AR-типа в (n+1)-м кадре, a₁ представляет коэффициент предсказания AR-типа в n-м кадре, и a₁ ^(j) представляет j-й элемент набора коэффициентов предсказания AR-типа (т.е. коэффициент, умноженный y_n-1 ^(j), j-й элемент декодированного параметра y_n-1 ЧСЛ предыдущего кадра)

Элементы х, y и а в приведенных выше уравнениях являются следующими:

x_n ^(j): квантованный остаток предсказания j-го компонента параметра ЧСЛ в n-м кадре.

y_n ^(j): j-й компонент декодированного параметра ЧСЛ в n-м кадре.

а₁ ^(j): j-й компонент набора коэффициентов предсказания AR-типа n-го кадра.

а′₁ ^(j): j-й компонент набора коэффициентов предсказания AR-типа (n+1)-го кадра.

В данном случае, если n-й кадр является удаленным кадром, то набор коэффициентов предсказания n-го кадра неизвестен. Существует множество возможных способов определения а₁. Во-первых, существует способ, посредством которого a₁ посылают, как дополнительную информацию в (n+1)-м кадре. Однако необходим дополнительный бит, и также необходима модификация на стороне кодера. Затем существует способ, посредством которого используется коэффициент предсказания, используемый (n-1)-м кадром, и также существует способ, посредством которого используется набор коэффициентов предсказания, принятый в (n+1)-м кадре. В этом случае a₁=a′₁. Кроме того, существует способ, посредством которого всегда используется определенный набор коэффициентов предсказания. Однако, как описано позже в данной работе, даже если используют другой а₁, декодированные y_n′ будут равны при выполнении предсказания AR-типа, используя тот же самый а₁. В случае квантования с предсказанием, используя предсказание AR-типа, квантованный остаток x_n предсказания не соотносится с предсказанием, и только декодированный квантованный параметр y_n соотносится с предсказанием, и поэтому в этом случае a₁ может иметь произвольное значение.

Если a₁ определили, то b₀ и b₁ можно определять из Уравнения (15) или Уравнения (16), и можно генерировать кодовый вектор x_n удаленного кадра.

Если кодовый вектор x_n удаления кадра, полученный посредством приведенного выше Уравнения (16), заменяют в уравнении, представляющем y_n (y_n=a₁y_n-1+x_n), то результат находят, как показано в приведенном ниже Уравнении (17). Поэтому, декодированный параметр в удаленном кадре, сгенерированный с помощью обработки маскирования, может быть найден непосредственно из x_n+1, y_n-1 и a′₁. В этом случае становится возможной обработка маскирования, которая не использует коэффициент a₁ предсказания в удаленном кадре.

Таким образом, согласно данному варианту осуществления, в дополнение к обеспечению особенностей, описанных в варианте осуществления 7, обеспечивают множество наборов коэффициентов предсказания для выполнения обработки маскирования, и обработку маскирования выполняют, обеспечивая получение еще более высокой эффективности маскирования, чем в варианте осуществления 7.

(Вариант осуществления 9)

В указанных выше вариантах осуществления 1-8 описаны случаи, в которых выполняют декодирование n-го кадра после принятого (n+1)-го кадра, но настоящее изобретение не ограничено этим, и также можно выполнять генерацию n-го кадра, используя декодированный параметр (n-1)-го кадра, выполнять декодирование параметра n-го кадра, используя способ настоящего изобретения во время декодирования (n+1)-го кадра, и выполнять декодирование (n+1)-го кадра после обновления внутреннего состояния устройства предсказания с помощью этого результата.

В варианте осуществления 9 будет описан этот случай. Конфигурация устройства декодирования речи согласно варианту осуществления 9 идентична конфигурации на фиг.1. Кроме того, конфигурация узла 105 декодирования КЛП может быть идентична конфигурации на фиг.19, но ее повторно изображают, как показано на фиг.24, чтобы пояснить, что декодирование (n+1)-го кадра выполняют для вводимой кодированной информации (n+1)-го кадра.

Фиг.24 - структурная схема, на которой показывают внутреннюю конфигурацию узла 105 декодирования КЛП из устройства декодирования речи согласно данному варианту осуществления. Части конфигурации на фиг.24, которые являются общими с фиг.19, имеют те же самые позиционные обозначения, как на фиг.19, и их подробное описание опущено в данной работе.

Узел 105 декодирования КЛП, показанный на фиг.24, использует конфигурацию, в которой, по сравнению с фиг.19, убран буфер 201, выход узла декодирования кодового вектора - x_n+1, декодированный параметр - параметр (n+1)-го кадра (y_n), и добавлен переключатель 2402. Кроме того, работа и внутренняя конфигурация узла 2401 декодирования кодового вектора на фиг.24 отличаются от работы и конфигурации узла 1901 декодирования кодового вектора на фиг.19.

Код L_n+1 КЛП вводят в узел 2401 декодирования кодового вектора, и код B_n+1 удаления кадра вводят в буфер 202, узел 2401 декодирования кодового вектора и блок 209 выбора.

Буфер 202 хранит код B_n+1 удаления текущего кадра в течение продолжительности одного кадра, и затем выводит этот код удаления кадра в узел 2401 декодирования кодового вектора. В результате того, что код хранится в буфере 202 в течение продолжительности одного кадра, код удаления кадра, выводимый из буфера 202 в узел 2401 декодирования кодового вектора, является кодом B_n удаления предыдущего кадра.

Узел 2401 декодирования кодового вектора, который имеет декодированный вектор y_n-1 ЧСЛ на два кадра раньше, код L_n+1 КЛП текущего кадра и код B_n+1 удаления текущего кадра в качестве вводимой информации, производит вектор x_n+1 квантованного остатка предсказания текущего кадра и декодированный вектор y′_n ЧСЛ предыдущего кадра, основываясь на этих элементах информации, и выводит их на сумматор 1903 и переключатель 2402. Подробности узла 2401 декодирования кодового вектора будут приведены позже в данной работе.

Усилитель 1902 умножает декодированный вектор y_n-1 или y′_nЧСЛ предыдущего кадра на предварительно определенный коэффициент a₁ предсказания AR-типа, и выводит результат на сумматор 1903.

Сумматор 1903 вычисляет предсказанный вектор ЧСЛ, выводимый из усилителя 1902 (т.е. результат умножения декодированного вектора ЧСЛ предыдущего кадра на коэффициент предсказания AR-типа), и выводит результат этого вычисления, декодированный вектор y_n+1 ЧСЛ, в буфер 1904 и узел 208 преобразования КЛП.

Буфер 1904 хранит декодированный вектор y_n+1 ЧСЛ текущего кадра в течение продолжительности одного кадра, и затем выводит этот декодированный вектор ЧСЛ в узел 2401 декодирования кодового вектора и переключатель 2402. В результате того, что вектор хранится в буфере 1904 в течение продолжительности одного кадра, декодированный вектор ЧСЛ, вводимый в узел 2401 декодирования кодового вектора и переключатель 2402 ЧСЛ, является вектором y_n предыдущего кадра.

Переключатель 2402 выбирает или декодированный вектор y_n ЧСЛ предыдущего кадра, или декодированный вектор y′_n ЧСЛ предыдущего кадра, сгенерированный узлом 2401 декодирования кодового вектора текущего кадра с использованием кода L_n+1 КЛП, согласно коду B_n удаления предыдущего кадра. Если B_n указывает удаленный кадр, то переключатель 2402 выбирает y′_n.

Если блок 209 выбора выбирает декодированный параметр КЛП предыдущего кадра, выводимый из буфера 210, то фактически не требуется выполнять всю обработку от узла 2401 декодирования кодового вектора до узла 208 преобразования КЛП.

Далее будет подробно описана внутренняя конфигурация узла 2401 декодирования кодового вектора, показанного на фиг.24, используя структурную схему на фиг.25. Части конфигурации на фиг.25, которые являются общими с фиг.20, имеют те же самые позиционные обозначения, как на фиг.20, и их подробное описание опущено в данной работе. Узел 2401 декодирования кодового вектора на фиг.25 использует конфигурацию, в которой буфер 2502, усилитель 2503 и сумматор 2504 добавляют к узлу 1901 декодирования кодового вектора на фиг.20. Кроме того, работа и внутренняя конфигурация переключателя 2501 на фиг.25 отличаются от работы и конфигурации переключателя 309 на фиг.20.

В кодовой книге 2001 генерируют кодовый вектор, идентифицированный кодом L_n+1 КЛП текущего кадра, и выводят его на переключатель 2501, а также на усилитель 2002.

Усилитель 2003 выполняет обработку для поиска вектора квантованного остатка предсказания в текущем кадре, необходимого для генерации декодированного вектора ЧСЛ предыдущего кадра. Т.е. усилитель 2003 вычисляет вектор x_n+1 текущего кадра так, чтобы декодированный вектор y_n ЧСЛ предыдущего кадра стал декодированным вектором y_n+1 ЧСЛ текущего кадра. В частности, усилитель 2003 умножает вводимый декодированный вектор y_n ЧСЛ предыдущего кадра на коэффициент (1-a₁). Затем усилитель 2003 выводит результат этого вычисления на переключатель 2501.

Если код B_n+1 удаления текущего кадра указывает, что «(n+1)-й кадр является обычным кадром», то переключатель 2501 выбирает вектор, выводимый из кодовой книги 2001, и выводит его в качестве вектора x_n+1 квантованного остатка предсказания текущего кадра. С другой стороны, если код B_n+1 удаления текущего кадра указывает, что «(n+1)-й кадр является удаленным кадром», то переключатель 2501 выбирает вектор, выводимый из усилителя 2003, и выводит его как вектор x_n+1 квантованного остатка предсказания текущего кадра. В этом случае обработка процесса генерации вектора из кодовой книги 2001 и из усилителей 2002 и 2004 через сумматор 2005 не должна выполняться.

Буфер 2502 хранит декодированный вектор y_n ЧСЛ предыдущего кадра в течение продолжительности одного кадра и затем выводит этот декодированный вектор ЧСЛ на усилитель 2004 и усилитель 2503 как декодированный вектор y_n-1 ЧСЛ на два кадра раньше.

Усилитель 2004 умножает вводимый декодированный вектор y_n-1 ЧСЛ на два кадра раньше на весовой коэффициент b_-1 и выводит результат на сумматор 2005.

Сумматор 2005 вычисляет сумму векторов, выводимых из усилителя 2002 и усилителя 2004, и выводит кодовый вектор, который является результатом этого вычисления, на сумматор 2504. Т.е. сумматор 2005 вычисляет вектор x_n предыдущего кадра с помощью выполнения взвешенного суммирования кодового вектора, идентифицированного кодом L_n+1 КЛП текущего кадра, и декодированного вектора ЧСЛ на два кадра раньше и выводит его на сумматор 2504.

Усилитель 2503 умножает декодированный вектор y_n-1 ЧСЛ на два кадра раньше на коэффициент a₁ предсказания и выводит результат на сумматор 2504.

Сумматор 2504 складывает вместе выход 2005 сумматора (декодированный вектор x_n предыдущего кадра, повторно вычисленный с использованием кода L_n+1 КЛП текущего кадра) и выход усилителя 2503 (вектор, являющийся результатом умножения декодированного вектора y_n-1 ЧСЛ на два кадра раньше на коэффициент a₁ предсказания), и повторно вычисляет декодированный вектор y′_n ЧСЛ предыдущего кадра.

Способ повторного вычисления декодированного вектора y′_n ЧСЛ данного варианта осуществления является тем же самым, как обработка маскирования в варианте осуществления 7.

Таким образом, согласно данному варианту осуществления, использование конфигурации, посредством которой декодированный вектор x_n, полученный посредством обработки маскирования варианта осуществления 7, используется только для внутреннего состояния устройства предсказания при декодировании (n+1)-го кадра, дает возможность уменьшать на один кадр задержку обработки, необходимую в варианте осуществления 7.

(Вариант осуществления 10)

В указанных выше вариантах осуществления 1-9 обеспечивают только особенности, относящиеся к внутренней конфигурации и к обработке узла декодирования КЛП, но у конфигурации устройства декодирования речи согласно данному варианту осуществления существует особенность, относящаяся к конфигурации вне узла декодирования КЛП. Хотя настоящее изобретение можно применять к любой из фиг.1, фиг.8, фиг.11 или фиг.21, в данном варианте осуществления для примера описан случай, в котором настоящее изобретение применяют к фиг.1.

Фиг.26 - структурная схема, на которой показывают устройство декодирования речи согласно данному варианту осуществления. Части конфигурации на фиг.26, которые являются общими с фиг.21, имеют те же самые позиционные обозначения, как на фиг.21, и их подробное описание опущено в данной работе. Устройство 100 декодирования речи, показанное на фиг.26, использует конфигурацию, в которой, по сравнению с фиг.21, добавлены узел 2601 вычисления коэффициента усиления фильтра, узел 2602 управления мощностью возбуждения и усилитель 2603.

Узел 105 декодирования КЛП выводит декодированный КЛП в узел 109 синтеза КЛП и узел 2601 вычисления коэффициента усиления фильтра. Кроме того, узел 105 декодирования КЛП выводит код B_n удаления кадра, соответствующий декодируемому n-му кадру, в узел 2602 управления мощностью возбуждения.

Узел 2601 вычисления коэффициента усиления фильтра вычисляет коэффициент усиления фильтра для фильтра синтеза, конфигурированного посредством ввода КЛП из узла 105 декодирования КЛП. Как пример способа вычисления коэффициента усиления фильтра, существует способ, посредством которого квадратный корень из мощности импульсной характеристики находят и используют в качестве коэффициента усиления фильтра. Это основано на том факте, что если входной сигнал рассматривают в качестве импульса с мощностью 1, то мощность импульсной характеристики фильтра синтеза, конфигурированного посредством вводимого КЛП, является в действительности информацией коэффициента усиления фильтра. Другой пример способа вычисления коэффициента усиления фильтра - способ, в котором так как среднеквадратический остаток линейного предсказания можно найти из КЛП с использованием алгоритма Левинсона-Дарбина, его инверсия используется в качестве информации коэффициента усиления фильтра, и квадратный корень из инверсии среднеквадратичного остатка линейного предсказания используют в качестве коэффициента усиления фильтра. Найденный коэффициент усиления фильтра выводят в узел 2602 управления мощностью возбуждения. Среднеквадратичную мощность импульсной характеристики или остатка линейного предсказания можно также выводить в узел 2602 управления мощностью возбуждения, не находя квадратный корень.

Узел 2602 управления мощностью возбуждения, который имеет коэффициент усиления фильтра из узла 2601 вычисления коэффициента усиления фильтра в качестве вводимой информации, вычисляет коэффициент масштабирования для управления амплитудой сигнала возбуждения. Узел 2602 управления мощностью возбуждения обеспечен внутренней памятью и хранит в этой памяти коэффициент усиления фильтра предыдущего кадра. После того, как коэффициент масштабирования вычислен, содержимое памяти перезаписывают вводимым коэффициентом усиления фильтра текущего кадра. Вычисление коэффициента SG_n масштабирования выполняют посредством уравнения SG_n=DG_max×FG_n-1/FG_n, где FG_n - коэффициент усиления фильтра текущего кадра, FG_n-1 - коэффициент усиления фильтра предыдущего кадра, и DG_max - верхнее предельное значение скорости увеличения коэффициента усиления. В данном случае скорость увеличения коэффициента усиления описывают как FG_n/FG_n-1, и она указывает, во сколько раз коэффициент усиления фильтра текущего кадра больше коэффициента усиления фильтра предыдущего кадра. Верхнее предельное значение скорости увеличения коэффициента усиления определяют заранее как DG_max. Если коэффициент усиления фильтра резко повышается относительно коэффициента усиления фильтра предыдущего кадра в фильтре синтеза, созданном посредством обработки маскирования удаления кадра, то мощность выходного сигнала фильтра синтеза также резко повышается, и декодированный сигнал (синтезированный сигнал) имеет в определенном месте большую амплитуду, производя взрывной звук. Чтобы избежать этого, если коэффициент усиления фильтра синтеза, конфигурированного посредством декодированного КЛП, сгенерированного с помощью обработки маскирования удаления кадра, превышает предопределенную скорость увеличения коэффициента усиления относительно коэффициента усиления фильтра предыдущего кадра, то мощность декодированного сигнала возбуждения, который является сигналом управления фильтром синтеза, уменьшают. Для этой цели используется коэффициент масштабирования, и предопределенной скоростью увеличения коэффициента усиления является верхнее предельное значение DG_maxскорости увеличения коэффициента усиления. Обычно возникновение взрывного звука можно предотвращать с помощью установки DG_max в значение 1 или в значение меньше 1, например, 0,98. Если FG_n/FG_n-1 меньше или равно DG_max, то SG_n берут равным 1, 0, и масштабирование не требуется выполнять в усилителе 2603.

Другой способ вычисления коэффициента SG_n масштабирования состоит в том, чтобы использовать, например, уравнение SG_n=Max(SG_max, FG_n-1/FG_n). В данном случае SG_max представляет максимальное значение коэффициента масштабирования и имеет значение, несколько больше 1, например, 1,5, и Мах(А, В) является функцией, которая выводит А или В, в зависимости от того, что имеет наибольшее значение. Если SG_n=FG_n-1/FG_n, то мощность сигнала возбуждения уменьшается пропорционально увеличению коэффициента усиления фильтра, и мощность декодированного синтезированного сигнала текущего кадра становится такой же, как мощность декодированного синтезированного сигнала предыдущего кадра. Таким образом можно избежать описанного выше резкого увеличения мощности синтезированного сигнала, а также можно избежать резкого ослабления мощности синтезированного сигнала. В таком случае, если SG_n=FG_n-1/FG_n, то SG_n имеет значение 1 или выше, и играет роль в предотвращении локального ослабления мощности синтезированного сигнала. Однако, так как сигнал возбуждения, сгенерированный с помощью обработки маскирования удаления кадра, не обязательно подходит в качестве сигнала возбуждения, использование слишком большого коэффициента масштабирования может привести к заметному искажению и ухудшению качества. Следовательно, если обеспечивают верхнее предельное значение коэффициента масштабирования, и FG_n-1/FG_n превышает это верхнее предельное значение, то FG_n-1/FG_n обрезают до верхнего предельного значения.

Коэффициент усиления фильтра предыдущего кадра или параметр, представляющий коэффициент усиления фильтра (такой, как мощность импульсной характеристики фильтра синтеза), можно вводить из внешнего узла 2602 управления мощностью возбуждения, вместо хранения в памяти в узле 2602 управления мощностью возбуждения. В частности, если информация, относящаяся к коэффициенту усиления фильтра предыдущего кадра, используется другой частью, чем речевой декодер, обеспечивают, чтобы описанный выше параметр вводили извне, а не перезаписывали в узле 2602 управления мощностью возбуждения.

Затем узел 2602 управления мощностью возбуждения, который имеет код B_n удаления кадра в качестве вводимой информации из узла 105 декодирования КЛП, выводит вычисленный коэффициент масштабирования на усилитель 2603, если B_n указывает, что текущий кадр является удаленным кадром. С другой стороны, если B_n указывает, что текущий кадр не является удаленным кадром, то узел 2602 управления мощностью возбуждения выводит «1» на усилитель 2603 в качестве коэффициента масштабирования.

Усилитель 2603 умножает коэффициент масштабирования, вводимый из узла 2602 управления мощностью возбуждения, на декодированный сигнал возбуждения, вводимый из сумматора 108, и выводит результат в узел 109 синтеза КЛП.

Таким образом, согласно данному варианту осуществления, если коэффициент усиления фильтра синтеза, конфигурированного посредством декодированного КЛП, сгенерированного с помощью обработки маскирования удаления кадра, изменяется по отношению к коэффициенту усиления фильтра предыдущего кадра, появление взрывчатого звука или потери звука можно предотвращать с помощью коррекции мощности декодированного речевого сигнала, который является управляющим сигналом фильтра синтеза.

Даже если B_n указывает, что текущий кадр является удаленным кадром, то узел 2602 управления мощностью возбуждения может выводить вычисленный коэффициент масштабирования на усилитель 2603, если непосредственно предыдущий кадр является удаленным кадром (т.е., если B_n-1 указывает, что предыдущий кадр является удаленным кадром). Это происходит потому, что когда используется кодирование с предсказанием, может существовать остаточное влияние остатка на кадр, восстановленный из удаленного кадра. В этом случае, также может быть получен тот же самый результат, как описано выше.

Это завершает описание вариантов осуществления настоящего изобретения.

В указанных выше вариантах осуществления предполагают, что параметр кодирования является параметром ЧСЛ, но настоящее изобретение не ограничено этим, и его можно применять к параметру любого вида, пока он является параметром с незначительным изменением между кадрами. Например, могут использоваться частоты спектра иммитанса (ISF).

В приведенных выше вариантах осуществления предполагают, что параметром кодирования является сам параметр ЧСЛ, но может также использоваться параметр ЧСЛ «после устранения среднего значения», который является результатом выделения разности от среднего значения ЧСЛ.

В дополнение к применению в устройстве декодирования речи и в устройстве кодирования речи, также возможно устанавливать устройство декодирования параметров и устройство кодирования параметров согласно настоящему изобретению в устройстве терминала связи и устройстве базовой станции в системе мобильной связи, посредством чего можно обеспечивать устройство терминала связи, устройство базовой станции и систему мобильной связи, которые имеют ту же самую эффективность обработки, как описано выше.

Для примера описан случай, в котором настоящее изобретение конфигурируют как аппаратные средства, но также можно воплощать настоящее изобретение с помощью программного обеспечения. Например, тот же самый вид функций, как функции устройства кодирования параметров согласно настоящему изобретению, можно реализовывать с помощью записи алгоритма способа декодирования параметра согласно настоящему изобретению на языке программирования, сохранения этой программы в памяти и выполнения ее с помощью средства обработки информации.

Функциональные блоки, используемые в описаниях указанных выше вариантов осуществления, обычно воплощают как БИС (большие интегральные схемы), которые являются интегральными схемами. Их можно воплощать отдельно, как одиночные микросхемы, или одна микросхема может внедрять некоторых или все из них.

В данном документе используется термин БИС, но термины интегральная схема (ИС), системная БИС, сверхбольшая интегральная схема (СБИС), ультрабольшая интегральная схема (УБИС) и т.д. могут также использоваться согласно различиям в степени интеграции.

Способ воплощения интегральных схем не ограничен БИС, и может также использоваться реализация посредством специализированных схем или универсального процессора. Могут также использоваться ППВМ (программируемая пользователем вентильная матрица), для которой программирование возможно после изготовления БИС, или реконфигурируемый процессор, позволяющий реконфигурацию соединений между элементами схемы и параметров настройки в пределах БИС.

В случае введения технологии реализации интегральной схемы, посредством которой БИС заменят другой технологией, которая является развитием или производным от полупроводниковой технологии, интеграцию функциональных блоков можно, конечно, выполнять, используя эту технологию. Применение биотехнологии или подобной технологии также возможно.

Раскрытия японской патентной заявки №2006-305861, поданной 10 ноября 2006, японской патентной заявки №2007-132195, поданной 17 мая 2007, и японской патентной заявки номер 2007-240198, поданной 14 сентября 2007, которые включают в себя описание, чертежи и реферат, представлены во всей своей полноте для справки.

Промышленная применимость

Устройство декодирования параметров, устройство кодирования параметров и способ декодирования параметров согласно настоящему изобретению пригодны для использования в устройстве декодирования речи и устройстве кодирования речи, и кроме того, в устройстве терминала связи, устройстве базовой станции и т.п. в системе мобильной связи.

1. Устройство декодирования параметров, содержащее:
узел декодирования остатка предсказания, который находит квантованный остаток предсказания, основываясь на кодированной информации, включаемой в текущий кадр, подвергаемый декодированию; и
узел декодирования параметра, который декодирует параметр, основываясь на указанном квантованном остатке предсказания,
причем указанный узел декодирования остатка предсказания, когда указанный текущий кадр удаляют, находит квантованный остаток предсказания текущего кадра из взвешенной линейной суммы параметра, декодированного в прошлом, и квантованного остатка предсказания будущего кадра.

2. Устройство декодирования параметров по п.1, в котором указанный узел декодирования остатка предсказания, когда указанный текущий кадр удаляют, находит квантованный остаток предсказания текущего кадра так, чтобы общая сумма расстояния между декодированным параметром прошлого кадра и декодированным параметром текущего кадра и расстояния между декодированным параметром текущего кадра и декодированным параметром будущего кадра была минимальной.

3. Устройство декодирования параметров по п.1, в котором указанный узел декодирования остатка предсказания хранит множество наборов весовых коэффициентов, и когда указанный текущий кадр удаляют, выбирает набор весовых коэффициентов, основываясь на команде от взаимодействующей стороны, и умножает указанный набор весовых коэффициентов на указанный параметр, декодированный в прошлом, и указанный квантованный остаток предсказания будущего кадра.

4. Устройство декодирования параметров по п.1, в котором указанный узел декодирования остатка предсказания, когда указанный текущий кадр удаляют, находит квантованный остаток предсказания текущего кадра из взвешенной линейной суммы параметра, декодированного в прошлом, квантованного остатка предсказания прошлого кадра и квантованного остатка предсказания будущего кадра.

5. Устройство кодирования параметров, содержащее:
узел анализа, который анализирует вводимый сигнал и находит анализируемый параметр;
узел кодирования, который предсказывает указанный анализируемый параметр, используя коэффициент предсказания, и получает квантованный параметр, используя квантованный остаток предсказания, полученный с помощью квантованного остатка предсказания и указанного коэффициента предсказания;
узел маскирования предыдущего кадра, который хранит множество наборов весовых коэффициентов, находит взвешенную сумму, используя указанные наборы весовых коэффициентов для указанного квантованного остатка предсказания текущего кадра, указанный квантованный остаток предсказания два кадра назад и указанный квантованный параметр два кадра назад, и находит множество указанных квантованных параметров предыдущего кадра, используя указанную взвешенную сумму; и
узел определения, который сравнивает множество указанных квантованных параметров предыдущего кадра, найденных с помощью указанного узла маскирования предыдущего кадра, и указанный анализируемый параметр, найденный с помощью указанного узла анализа предыдущего кадра, выбирает один из указанных квантованных параметров предыдущего кадра, и выбирает и кодирует набор весовых коэффициентов, соответствующий выбранному указанному квантованному параметру предыдущего кадра.

6. Способ декодирования параметров, содержащий:
этап декодирования остатка предсказания, состоящий из обнаружения квантованного остатка предсказания на основе кодированной информации, включенной в текущий кадр, подвергаемый декодированию; и
этап декодирования параметра, состоящий из декодирования параметра, на основе указанного квантованного остатка предсказания,
причем на указанном этапе декодирования остатка предсказания, когда указанный текущий кадр удаляют, квантованный остаток предсказания текущего кадра находят из взвешенной линейной суммы параметра, декодированного в прошлом, и квантованного остатка предсказания будущего кадра.

7. Способ декодирования параметров по п.6, в котором на указанном этапе декодирования остатка предсказания, когда указанный текущий кадр удаляют, квантованный остаток предсказания текущего кадра находят таким образом, чтобы общая сумма расстояния между декодированным параметром прошлого кадра и декодированным параметром текущего кадра и расстояния между декодированным параметром текущего кадра и декодированным параметром будущего кадра была минимальной.

Похожие патенты:

Кодирование аудиосигнала // 2428748

Изобретение относится к кодированию аудиосигнала, более конкретно к способу, устройствам, системе и машиночитаемому носителю, поддерживающим такое кодирование. .

Системы, способы и устройство для широкополосного кодирования и декодирования неактивных кадров // 2428747

Изобретение относится к обработке речевых сигналов. .

Способ и устройство для кодирования и декодирования аудиосигналов // 2426179

Изобретение относится к связи, а более конкретно, к методикам для кодирования и декодирования. .

Устройство и способ окончательной обработки спектральных значений и кодирующее устройство и декодер для аудиосигналов // 2423740

Изобретение относится к звуковому кодированию/декодированию, в частности к концепциям масштабируемого кодирования/декодирования, имеющим базовый слой и слой расширения.

Способ переключения скорости передачи битов при аудиодекодировании с масштабированием скорости передачи битов и масштабированием полосы пропускания // 2419171

Изобретение относится к способу переключения скорости передачи битов при декодировании аудиосигнала, кодированного с помощью системы аудиокодирования, причем упомянутое декодирование содержит этап последующей обработки, зависящий от скорости передачи битов.

Система и способ управления избыточностью // 2415482

Изобретение относится к методам кодирования речи, в частности к кодированию речи с обеспечением устойчивости к ошибкам и передаче речи по сети с пакетной коммутацией для приложений, связанных с передачей речевых данных по протоколу Интернет (VoIP, Voice over IP).

Трансформация шкалы времени кадров в широкополосном вокодере // 2414010

Изобретение относится к трансформации шкалы времени, т.е. .

Декодирование кодированных с предсказанием данных с использованием адаптации буфера // 2408089

Изобретение относится к декодированию сжатой цифровой информации, в частности к декодированию битовых потоков, отражающих контент, который сжат с применением методов кодирования с долговременным предсказанием.

Способ и устройство для обработки звукового сигнала // 2404507

Изобретение относится к способу и устройству для обработки звукового сигнала. .

Комбинированное аудиокодирование, минимизирующее воспринимаемое искажение // 2393552

Изобретение относится к области кодирования аудиосигнала низкой скорости передачи битов высокого качества. .

Аппаратура и метод многоканального параметрического преобразования // 2431940

Изобретение относится к многоканальному преобразованию параметров, в частности к генерированию параметров когерентности и параметров выходного уровня, которые указывают на пространственные свойства между двумя звуковыми сигналами, основанными на объектно-параметровом базовом представлении звукового воспроизведения в пространстве

Способ кодирования/декодирования индексов кодовой книги для квантованного спектра мдкп в масштабируемых речевых и аудиокодеках // 2437172

Изобретение относится к средствам кодирования/декодирования спектра модифицированного дискретного косинусного преобразования

Аудиокодер для кодирования аудиосигнала, имеющего импульсоподобную и стационарную составляющие, способы кодирования, декодер, способ декодирования и кодированный аудиосигнал // 2439721

Изобретение относится к кодированию источников, в частности к кодированию источников звука, при котором аудиосигнал обрабатывается, по меньшей мере, двумя различными аудиокодерами, использующими два различных алгоритма кодирования

Эффективная реализация наборов фильтров анализа и синтеза для кодеров/декодеров mpeg aac и mpeg aac eld // 2442232

Изобретение относится к кодерам и декодерам, в частности, к реализации набора фильтров для перспективного аудиокодирования (ААС) и усовершенствованного с низкой задержкой (ELD) ААС

Способ и устройство многоступенчатого квантования // 2453932

Изобретение относится к области методов сжатия данных, в частности к способу и устройству для многоступенчатого квантования

Кодирующее устройство, декодирующее устройство и способ // 2459283

Изобретение относится к кодирующему и декодирующему устройствам и их способам, используемым в системе связи с масштабируемой схемой кодирования

Способ и устройство для кодирования и декодирования // 2461898

Изобретение относится к области техники связи, в частности к способу и устройству для кодирования и декодирования

Аудиодекодер // 2466469

Изобретение относится к аудиодекодеру, в частности к МРЕG Surround декодеру или объектно-ориентированному декодеру

Защита от ограничения сигнала с использованием заранее существующих метаданных коэффициента усиления аудиосигнала // 2468451

Изобретение относится к способу и устройству для предотвращения ограничения аудиосигнала, когда защита от ограничения сигнала на основе принятых аудиометаданных не гарантируется

Способ и устройство для формирования уровня улучшения в системе кодирования звука // 2469422

Изобретение относится к кодированию речевых и звуковых сигналов в системах связи