Оптимизированное по задержке преобразование наложения, взвешивающие окна кодирования/декодирования

Изобретение относится к кодированию/декодированию цифрового сигнала, состоящему из последовательных блоков выборок. Технический результат заключается в повышении качества кодированного звука. Кодирование содержит применение взвешивающего окна для двух блоков из М последовательных выборок. В частности, такое взвешивающее окно является асимметричным и содержит четыре отдельных участка, продолжающихся последовательно по двум упомянутым выше блокам, при этом первый участок возрастает в течение первого временного интервала, второй участок имеет постоянное взвешивающее значение в течение второго временного интервала, третий участок уменьшается с течением третьего временного интервала и четвертый участок имеет постоянное взвешивающее значение в течение четвертого временного интервала. 6 н. и 11 з.п. ф-лы, 10 ил.

 

Изобретение относится к области кодирования/декодирования цифровых аудиосигналов, более конкретно к так называемой области ″преобразования кодирования/декодирования аудиоданных с наложением″.

″Кодирование с преобразованием″ состоит в кодировании сигналов, находящихся в области времени, в области преобразования (частоты). Такое преобразование, в частности, позволяет использовать характеристики частоты аудиосигналов (музыки, речи, другого) для оптимизации и улучшения эффективности кодирования. При этом, например, используется тот факт, что гармонический звук представлен в области частоты конечным и уменьшенным количеством спектральных лучей, которые могут быть, таким образом, компактно кодированы. Также, например, предпочтительно используются эффекты маскирования частоты для форматирования шумов кодирования таким образом, чтобы они были, насколько это возможно, неслышимыми.

Стандартная технология кодирования с преобразованием в сумме состоит в следующем.

Цифровой аудиопоток (с заданной частотой Fs выборки), предназначенный для кодирования, разрезают на фреймы (или, в более общем смысле, на ″блоки″) с конечным количеством выборок 2М. Каждый фрейм обычно накладывается с предыдущим фреймом до 50%. Взвешивающее окно ha (называемое ″окном анализа″) применяют для каждого фрейма.

Затем применяют преобразование к сигналу. В случае преобразования, называемого ″MDCT″ (″модифицированное дискретное косинусное преобразование″), и в конкретном варианте осуществления, взвешивающий фрейм ″складывают″ в соответствии с 2М выборками до преобразованной формы из М выборок. Преобразование DCT IV типа затем применяют для сложенного фрейма для получения фрейма с размером М в преобразованной области.

Фрейм в преобразованной области затем квантуют, используя соответствующий квантователь. Квантование позволяет уменьшить размер данных, но вводит шумы (слышимые или неслышимые) в оригинальный фрейм. Чем выше частота битов кодера, тем в большей степени эти шумы уменьшаются и тем более оптимизированный фрейм приближается к оригинальному фрейму.

После декодирования затем применяют обратное преобразование MDCT к квантованному фрейму. Квантованный фрейм размером М преобразуют во фрейм размером М в области времени, используя DCT обратного IV типа. Во-вторых, далее применяют преобразование ″разворачивания″ из М в 2М к временному фрейму с размером М.

Так называемые взвешивающие окна hs ″синтеза″ затем применяют к фрейму с размером 2М.

Декодированный аудиопоток затем синтезируют путем объединения частей наложения.

Для окна синтеза и заданной степени наложения определяют окно анализа, которое позволяет получать идеальную реконструкцию сигнала, предназначенного для кодирования (в отсутствие квантования).

Окно, обычно используемое при кодировании преобразования, представляет собой окно синусоидального типа, которое идентично, как для анализа, так и для синтеза. В этой конфигурации минимальная алгоритмическая задержка, вводимая системой кодирования, представляет собой 2M/Fs секунд.

Для уменьшения этой задержки возможно накладывать нули в начале окна синтеза и в конце аналитического окна. Поскольку результат умножения сигнала на ″0″ известен заранее, возможно выполнять смещение частоты фреймов относительно положения окон. Такие симметричные окна, например, состоят из:

- определенного количества нулей Mz, которые продолжаются по интервалу, соответствующему половине алгоритмической задержки, которая должна быть сохранена;

- синусоидального отрезка повышения длиной M-2Mz;

- отрезка значений 2Mz возле 1;

- второй половины окна, которая, в конечном итоге, является симметричным отражением первой, как представлено на фиг.1.

Эти окна имеют алгоритмическую задержку (2M-2Mz)/Fs секунд и, таким образом, позволяют уменьшить задержку на 2Mz/Fs секунд.

Однако такая технология, хотя и позволяет уменьшить задержку, проявляет тенденцию, когда уменьшение задержки увеличивается, иметь сходство с прямоугольным окном. Такая форма окна не является очень часто выбираемой и, в конечном итоге, существенно уменьшает качество звука кодированного сигнала. Кроме того, она в значительной степени ограничивает окно, поскольку выборки 4Mz накладываются при его конструировании. При этом незначительное количество степеней свободы доступно для предложения эффективных окон для кодирования, а именно для предложения значительной избирательности по частоте.

В документе WO-2009/081003 предложено использовать асимметричные окна для уменьшения этой проблемы. Такие окна, исходя из анализа, состоят из 0с только в конце окна анализа. Для ограничения требуемого пространства для хранения окно синтеза выбирают так, чтобы оно было реверсивным по времени для окна анализа. Такая технология заметно позволяет уменьшить задержку кодирования, а также задержку декодирования. Для общего количества нулей Mz, в два раза меньшего, чем у симметрических окон, описанных ранее, прирост задержки является одинаковым. Учитывая уменьшенное количество нулей, избирательность по частоте таких асимметричных окон больше, чем у симметричных окон. Качество звука декодированного сигнала, таким образом, улучшается.

Более конкретно, в документе WO-2009/081003 представлено окно ha(n) анализа, состоящее из двух частей ha1 и ha2 из исходного окна h (n), заданного следующим образом:

для 0≤n<2М-Mz

и h(n)=0 в противном случае (то есть для 2М-Mz≤n<2М)

и коэффициента Δ (n) коррекции, позволяющего получить идеальное условие для реконструкции, заданной следующим образом:

Окно ha анализа определяется следующим образом:

ha1(n+М)=h(n+М)/≤(n) и ha2(n)=h(n)/≤(n)

для 0≤n<М

Окно hs(n) синтеза является обратным по времени окну анализа:

hs(2M-1-n)=ha(n), для 0≤n<2М

Такие окна имеют, для одного и того же прироста задержки, лучшее качество, чем симметричные окна, из-за их лучшей частотной избирательности.

Однако даже если предшествующий уровень техники является предпочтительным и предлагает улучшение качества, по сравнению с предыдущими технологиями, когда ищут решение с более существенным приростом задержки, например, с количеством нулей Mz, большим чем М/4 (где М представляет собой длительность фрейма), наблюдается деградация звука в результате применения таких окон, которая может, в частности, объясняться тем фактом, что участок окна принимает большие значения, намного больше 1, как представлено на фиг. 2. Теперь, в общем, предпочтительно при обработке цифровых сигналов использовать взвешивание со значениями меньше 1 по абсолютному значению из-за воплощения с фиксированной точкой.

Настоящее изобретение улучшает эту ситуацию.

С этой целью предложен способ для кодирования цифрового сигнала, состоящего из последовательных блоков выборок, кодирование состоит в преобразовании с наложением, и содержащее, после анализа, применение взвешивающего окна для двух последующих блоков М выборок. В частности, упомянутое выше взвешивающее окно является асимметричным и содержит четыре отдельных участка, продолжающихся последовательно по двум блокам, с:

- первым участком, увеличивающимся по первому интервалу выборок;

- вторым участком с постоянным значением 1 во втором интервале;

- третьим участком, уменьшающимся по третьему интервалу;

- четвертым участком, постоянным со значением 0 по четвертому интервалу.

Как будет видно ниже, в соответствии с одним из преимуществ, получаемых благодаря изобретению, постоянство окна при 1 в течение второго интервала позволяет уменьшить сложность использования окон предшествующего уровня техники, как описано в документе WO-2009/081003, сохраняя его преимущества малой задержки и также улучшая качество представления звука, как будет видно ниже со ссылкой на фиг. 3.

Кроме того, предпочтительно, чтобы первый, второй и третий интервалы были рассчитаны, по меньшей мере, как функция длительности четвертого интервала (количество 0 в конце окна), который устанавливает упомянутую выше задержку, которая может быть предпочтительно округлена до алгоритмической задержки, как будет видно в представленных ниже примерных вариантах осуществления. Аналогично, фронты повышения и падения соответствующих участков увеличения и падения могут быть оптимизированы как функция, в частности, длительности четвертого интервала. Четвертый интервал (ниже обозначается Mz) самостоятельно выражается как функция количества выборок М на блок и, конечно, как функция требуемой максимальной задержки.

Последовательность окон анализа проявляет характеристики, аналогичные тем, которые описаны в упомянутом выше документе WO-2009/081003. В частности, два блока выборок с одним размером 2М, которые взвешивают, соответственно, используя первое и второе окна анализа, фронт повышения второго окна может отличаться от фронта падения реверсированного по времени первого окна. Эти кромки, поэтому, не являются симметричными априори.

Кроме того, в варианте осуществления изобретения после кодирования количество идентичных окон анализа, имеющих упомянутые выше характеристики (повышение, постоянство при 1, падение и постоянство при 0), могут успешно применяться для множества последовательных блоков 2М выборок с наложением по М выборкам, как представлено на фиг. 10. В общих условиях, способ в соответствии с изобретением затем включает в себя применение множества последовательных окон, несимметричных и содержащих упомянутые выше четыре участка для последовательности пар блоков. Таким образом, как и в документе WO-2009/081003, здесь снова не предусмотрено конкретное окно перехода, когда применяется асимметричное окно.

В конкретном варианте осуществления окно изменяется по первому интервалу, обозначенному R1, как функция w1 следующего типа:

, при и:

, n∈[0; M-1] при константах C1 и R1, больших чем 0.

В результате оптимизации, например, определили, что член C1 может находиться между 3 и 5 для диапазона задержек порядка 15-30 мс. В конкретном примерном варианте осуществления C1=4,8425.

Первый интервал, обозначенный R1, в этом примерном варианте осуществления, представляет собой длительность, определенную следующим образом:

, в котором М соответствует длительности блока,

обозначение x , обозначающее целое число, меньше или равное x и ближайшее к x.

Что касается второго участка окна, последний может изменяться, в примерном варианте осуществления, в третьем интервале, обозначенном R2, как функция w3 следующего типа:

, при , и:

, n∈[0; M-1] при константах C2 и R2, больших чем 0.

В соответствии с выполненными тестами оптимизации, член C2 предпочтительно находится между 0,85 и 1,05 и, в конкретном примерном варианте осуществления, член С2=0,9659.

Третий интервал, обозначенный R2, представляет собой, в этом примерном варианте осуществления, интервал предпочтительной длительности, определенный, как:

, где М соответствует длительности блока,

обозначение x , представляет целое число, меньшее чем или равное x и ближайшее к x.

В данном примерном варианте осуществления, четвертый интервал, обозначенный Mz, выбирают первоначально так, чтобы он имел длительность, заданную, как

в котором обозначение x обозначает целое число, большее чем или равное x и ближайшее к x, М, соответствующий длительности блока.

Конечно, другие задержки могут быть воплощены и, таким образом, другая длительность четвертого интервала Mz может быть предусмотрена. В Таблице 1, представленной в примерных вариантах осуществления, подробно представленных ниже в конкретных вариантах осуществления, показаны значения параметров C1, C2 и интервалов R1, R2 для разных значений задержки и, поэтому, для разных значений длительности Mz четвертого интервала.

Таким образом, способ предпочтительно может включать в себя предварительный этап оптимизации формы окна, и такая оптимизация основана, по меньшей мере, на одной оценке функции стоимости для получения оптимальных параметров C1, C2, и/или даже R1, R2, описанных выше.

В целом, предпочтительно общее количество ″1″ в окне приблизительно в два раза больше, чем количество 0, в соответствии с выполненными оптимизациями, в частности, для хорошего качества получаемого звука.

Таким образом, в другом конкретном примерном варианте осуществления, первый интервал, обозначенный R1, представляет собой, например, длительность, заданную следующим образом:

, в котором М соответствует длительности блока, и Mz соответствует длительности четвертого интервала.

В этом примере третий интервал R2 может представлять собой длительность, заданную следующим образом:

, где М соответствует длительности блока, и Mz соответствует длительности четвертого интервала.

В таблице 2, представленной в примерных вариантах осуществления, подробно описанных ниже, показаны значения параметров C1 и C2, когда интервалы R1 и R2 были, таким образом, установлены для разных значений задержки и, поэтому, для разных длительностей Mz четвертого интервала.

Таким образом, в изобретении предложено на принципе асимметричного окна с идеальной реконструкцией, с выбранным количеством нулей такого типа, как представлено в документе WO-2009/081003, использовать оптимизированные окна анализа и синтеза, которые позволяют получить хорошее представление звука, обеспечивая эффективное воплощение. На фиг. 3 показано сравнение характеристик в том, что касается качества звука между окном, в соответствии с изобретением (обозначено, как INV), окно в соответствии с документом WO-2009/081003 (обозначено, как АА) и обычным синусоидальным окном (SIN) для задержки 26 мс. Другие точки, которые не обозначены, относятся к другим технологиям предшествующего уровня техники. Очевидно, что изобретение позволяет сохранить качество звука, эквивалентное достигаемому с обычными окнами (SIN), и предложить при этом уменьшение задержки, сопоставимое с достигнутым в вариантах осуществления, описанных в документе WO-2009/081003. Воспринимаемое качество затем сохраняется в представленном ниже описании как критерий оценки, при этом ошибка реконструкции остаточного преобразования остается пренебрежимо малой, в смысле восприятия, в отношении заданного порогового значения восприятия.

Настоящее изобретение направлено на способ для декодирования цифрового сигнала, кодированного в результате воплощения описанного выше способа, декодирование состоит в преобразовании типа с наложением и содержащее, после синтеза, применение взвешивающего окна для двух последовательных блоков кодированных выборок. В частности, взвешивающее окно после синтеза идентично окну анализа, используемому при кодировании, реверсированному по времени, например, для обеспечения свойства идеальной реконструкции, как будет видно ниже.

Настоящее изобретение также направлено на компьютерную программу, предназначенную для ее сохранения в запоминающем устройстве в устройстве кодирования или декодирования, и содержащую, в частности, инструкции для воплощения описанного выше способа кодирования или упомянутого выше способа декодирования, когда инструкции исполняются с помощью процессора устройства. В частности, она может представлять собой компьютерную программу, содержащую первую часть, специфичную для кодирования, и вторую часть, специфичную для декодирования. На фиг. 7, описанной ниже, представлен пример блок-схемы последовательности операций общего алгоритма такой программы, и на фиг. 8 иллюстрируются предварительные этапы, которые, в конкретном варианте осуществления алгоритма этой программы, в частности, могут включать в себя, особенно, если эта программа содержит инструкции для предварительного построения окон анализа и синтеза, способы кодирования/декодирования в соответствии с использованием изобретения.

Как схематично представлено на фиг. 9, настоящее изобретение также направлено на устройство COD кодирования сигнала, содержащее средство для сохранения MEM и/или расчета данных µР взвешивающего окна для анализа, для воплощения способа кодирования в соответствии с изобретением. Аналогично, настоящее изобретение также направлено на устройство DECOD декодирования сигнала, содержащее средство для сохранения MEM′ и/или расчета данных µР взвешивающего окна для синтеза, для воплощения способа декодирования в соответствии с изобретением. При этом возможно, в частности, как для кодирования, так и для декодирования, начать с предварительно инициализированных значений окна для анализа и/или синтеза (сохраненных в запоминающих устройствах MEM и/или MEM′), и возможно оптимизировать эти значения на ходу (в результате воплощения средства расчета µР).

Другие преимущества и особенности изобретения будут понятны при чтении подробного описания изобретения, представленного ниже в качестве примеров не ограничительных вариантов осуществления, и приложенных чертежей, на которых:

на фиг. 1 иллюстрируется внешний вид обычного симметрического окна с малой задержкой, содержащего нули, в начале и в конце окна;

на фиг. 2 иллюстрируется внешний вид асимметричного окна, как описано в документе WO-2009/081003, с улучшением задержки 15 мс на фрейм 2М длительностью 40 мс;

на фиг. 3 иллюстрируется сравнение качества звука между окном, в соответствии с изобретением INV, синусоидальным окном SIN, в соответствии с фиг. 1, и окном АА, в соответствии с фиг. 2, для задержки 26 мс;

на фиг. 4 иллюстрируется первое примерное окно hi инициализации для построения окна анализа в соответствии с изобретением;

на фиг. 5 иллюстрируется второе примерное окно hi инициализации для построения окна анализа в соответствии с изобретением;

на фиг. 6 иллюстрируется пример окна анализа в соответствии с изобретением, полученного из окна инициализации такого типа, как представлено на фиг. 5;

на фиг. 7 схематично представлены этапы примерного способа преобразования кодирования/декодирования для иллюстрации контекста настоящего изобретения;

на фиг. 8 схематично представлены этапы примерного построения окон анализа и синтеза для воплощения способа в соответствии с изобретением;

на фиг. 9 схематично представлены устройства кодирования и декодирования для воплощения изобретения;

на фиг. 10 иллюстрируется последовательность окон анализа в соответствии с изобретением, применяемых с наложением.

Вначале будет сделана ссылка на фиг. 7 для описания, как общего основания для воплощения изобретения, способа для кодирования/декодирования цифрового сигнала (представленного на этапе 70) в результате преобразования с наложением. Способ содержит этап 71 разделения цифрового аудиосигнала на фреймы длиной М. Затем каждый фрейм группируют с предыдущим фреймом, что соответствует наложению 50%. На следующем этапе 72 применяют окно ha анализа для этого набора из двух фреймов. На фиг. 6 иллюстрируется примерное окно ha анализа в соответствии с изобретением (амплитуда от 0 до 1, как функция количества выборок ″Nb Ech″). Следует отметить, что окно ha анализа заканчивается значениями Mz в 0 и имеет общую длину 2М.

Следующий этап 73 состоит в применении преобразования, например, типа MDCT, для блока из двух фреймов, взвешенных таким образом окном ha, затем в ходе квантования (этап 74) значений в области преобразования.

После декодирования обратное преобразование позволяет на этапе 75 выполнить повторное преобразование значений в области времени. Если преобразование при кодировании представляет собой, например, преобразование типа MDCT, обратное преобразование iMDCT можно применять после декодирования.

На этапе 76 для обеспечения условия идеальной реконструкции окно hs синтеза применяют для двух декодированных фреймов. Как описано в документе WO-2009/081003, это условие накладывает коэффициент коррекции 1/Δn (подробно описан ниже), применяемый для окна hi, инициализации, для получения окна ha анализа. Окно hs синтеза выглядит, как обратное по времени для окна ha анализа, при этом:

hs(n)=ha(2M-n-1)

На этапе 77 блоки, которые накладываются друг на друга, объединяют для конечной подачи декодированного сигнала, обеспечивая идеальную его реконструкцию.

Далее будет снова сделана ссылка на фиг. 6 для более подробного описания внешнего вида окна ha анализа, используемого в таком способе, в частности, при кодировании. Окно анализа состоит из четырех отдельных сегментов w1, w2, w3, w4. To же относится к окну hs синтеза, которое выглядит как обратное по времени окно анализа.

В первом интервале, ниже обозначенном R1, окно анализа изменяется, как функция w1 следующего типа:

, при , и:

,

n∈[0; M-1]

Затем окно анализа становится постоянным и имеет значение w2=1 во втором интервале.

В третьем интервале, ниже обозначенном R2, окно изменяется, как функция w3 следующего типа:

, при , и:

при:

n∈[0; M-1]

В конечном итоге, в четвертом интервале Mz окно анализа является постоянным и имеет значение w4=0.

Ниже представлено, что, по сравнению с предшествующим уровнем техники WO-2009/081003, форма таких окон позволяет обеспечить оптимальное качество звука для существенного уменьшения задержки (возможно, в диапазоне, например, вплоть до 40%). Использование таких окон (общих вариаций: увеличение константы при уровне 1, уменьшение константы при уровне 0) не ограничено одним типом преобразования MDCT. Их можно также использовать, например, в случае, когда кодирование относится исключительно и только к части сигнала, предназначенного для кодирования (например, только к части звукового диапазона, например, к обработке ошибки кодирования, по сравнению с другой технологией кодирования или другими подходами).

Далее представлено описание со ссылкой на фиг. 8 того, как получают окно ha, используемое в способе, описанном выше со ссылкой на фиг. 7.

После этапа 80 инициализации параметры R1, R2, C1 и C2 инициализации определяют на этапе 81. На следующем этапе 82 рассчитывают окно hi инициализации из этих параметров инициализации. Как представлено на фиг. 4 и 5, такое окно hi инициализации состоит из четырех сегментов W1, W2, W3, W4.

Первый сегмент W1 длиной R1 определен следующим уравнением:

, n1∈ 0; R1-1]

в котором C1 представляет собой константу >0.

Второй сегмент W2 длиной L=2M-R1-R2-Mz состоит из значений при 1.

Третий сегмент W3 длиной R2 определен следующим уравнением:

, n2∈[0; R2-1]

в котором C2 представляет собой константу >0.

Четвертый сегмент W4 длиной Mz состоит из значений, все около 0.

Окно hi(n) инициализации, поэтому, определено следующим образом:

На этапе 83 коэффициент 1/Δn применяют для окна hi инициализации, что позволяет обеспечить условие идеальной реконструкции и так далее при условии, что окно синтеза является обратным по времени для окна анализа и что преобразование после декодирования будет двойным (например, преобразование iMDCT, если при кодировании применяли преобразование MDCT).

Член Δn определяется следующим образом:

n∈[0; M-1]

окно ha анализа с идеальной реконструкцией затем определяется следующим образом:

, n∈[0; 2M-1]

Следует отметить, что значения, точно равные ″1″, не требуют какого-либо взвешивающего умножения. Таким образом, ожидаемое улучшение сложности является существенным по сравнению с предшествующим уровнем техники, поскольку в представленной ниже таблице показано, соответственно, другое преимущество, получаемое при использовании изобретения.

Окно (512 точек) Количество умножений Улучшение
Окно SIN на фиг. 1 512 0%
Окно АА на фиг. 2 416 19%
Окно INV на фиг. 6 224 56%

Таким образом, для заданного улучшения задержки (заданное количество Mz, равных нулю) существует оптимальная комбинация четырех параметров R1, R2, C1, C2, определяющих точную форму окон анализа и синтеза, которая позволяет получить наилучшее качество звука. Эти параметры могут быть получены путем оптимизации с последовательными итерациями, как описано ниже снова со ссылкой на фиг. 8.

Например, улучшение задержки 35% (соответствующее 14 мс для фреймов размером 40 мс в описанном здесь примере) соответствует просто алгоритмической задержке кодера. Такая задержка 26 мс в описанном примере накладывает количество нулей Mz, определенное следующим образом:

,

в котором x обозначает целое число, больше чем или равное x, которое расположено ближе всего к x. Затем определяют, что Mz=14 мс, для М=40 мс.

При таком выборе значения параметров окон анализа и синтеза могут, например, быть заданы следующим образом:

C1=4.8425

C2=0.9659

в котором x обозначает целое число, меньше чем или равное x, ближайшее к x.

Такой вариант осуществления соответствует окну инициализации, представленному на фиг. 4.

Другой примерный подход позволяет уменьшить количество параметров искомого окна инициализации. Такой подход состоит в учете того, что количество ″1″ в окне hi должно быть в два раза большим количества ″0″ и что ось симметрии окна hi соответствует середине сегмента W2, как показано на фиг. 5. В этих условиях значения интервалов R2 и R1 зависят только от протяженности интервала Mz (то есть от выбранного количества ″0″ в конце окна инициализации).

В этих условиях:

,

где Gdelay представляет собой желательное улучшение задержки, в мс, FL представляет собой длину фрейма 2М, в мс (частота выборки задана, как Fs=2M/FL×1000, рассчитывая в миллисекундах или ″мс″).

Затем, на этапе 84, на фиг. 8, делается попытка определить константы C1 и C2 (и, возможно, R1 и R2), например, путем воплощения итеративной оптимизации (такой как, например, так называемая технология ″градиентов″).

Начиная, например, на этапе 81 с выбора исходных параметров для значений R1; R2; C1 и C2 соответственно 2Mz; Mz; 1 и 1 рассчитывают функцию стоимости на этапе 84, которую применяют для:

- окна анализа, переходящего из окна инициализации, имеющего форму такого типа, как описана выше, и

- его двойного синтеза, обеспечивающего идеальную реконструкцию.

Функция стоимости может быть составлена из набора критериев, которые должны быть проверены при тестировании 85. Примеры, которые могут быть приведены, без ограничения, включают в себя:

- анализ первой производной окна:

,

где

- анализа второй производной окна:

,

где

- поиск улучшения кодирования, как определено, например, в документе WO-2009/081003,

- максимизация отношения сигнал-шум ″SNR″, выраженного как логарифм между некодированным сигналом и ошибкой, вводимой кодированием, для заданной аудиовыборки, путем применения как окна анализа, так и окна синтеза в соответствии с изобретением.

При тестировании 85 становится возможным проверить, достигнуты ли критерии оптимизации (значение функции стоимости, вариация значения параметров или другие). Если соответствует (стрелка ОК), оптимизированные значения параметра находят на конечном этапе 87. Если это не так, в противном случае (стрелка КО), значения R1, R2, C1 и C2 модифицируют таким образом, чтобы уменьшить функцию стоимости.

Таким образом, начиная с выбора исходных параметров R1; R2; C1 и C2 соответственно при 2Mz; Mz; 1 и 1, определили, что после оптимизации:

C1=4.8425

C2=0.9659,

если будет принят вариант выбора, для оптимизации всех этих четырех параметров, или, в качестве альтернативы:

- C1 со значением, близким к 5, и

- C2 со значением, близким к 1,

если будет выбран вариант не использовать оптимизацию только этих двух параметров C1 и C2.

Поэтому возможно, при таком втором варианте выбора ограничить поиск оптимальных значений C1 и C2 в случае, когда предполагают, что количество 1 в два раза превышает количество 0 и что ось симметрии окна соответствует середине сегмента W2, как показано на фиг. 5.

Следует отметить, что в упомянутом выше первом варианте выбора (оптимизация всех четырех параметров) для задержки 28 мс (вместо 26 мс, как было ранее) определили, что C1=4,1582 и C2=0,9181 при использовании такой технологии оптимизации.

В более общем виде, в представленной ниже таблице 1 показан набор оптимизированных параметров R1, R2, C1 и C2 в соответствии с различными вариантами выбора задержки и поэтому количество ″0″ выборок (Mz). Количество выборок на фрейм М определено для частоты выборки 48000 Гц и фреймов длиной 20 мс:

Данные этой таблицы выражены, в частности, как функция количества ″0″ выборок в четвертом интервале Mz следующим образом:

В таблице 2, показанной ниже, представлен набор оптимизированных параметров C1 и C2 в соответствии с упомянутым выше вторым вариантом выбора путем установки интервалов R1 и R2, как функции количества нулей Mz. Количество выборок на фрейм М задано для частоты выборки 48000 Гц и фреймов длиной 20 мс:

Конечно, настоящее изобретение не ограничено описанным выше вариантом осуществления, в качестве примера оно может быть расширено на другие варианты.

Например, способ оптимизации посредством итерации может, как описано выше, представлять собой способ так называемого типа ″градиентов″, но другие варианты, конечно, также возможны. Также возможно, например, в пределах процесса оптимизации установить максимум окна ha в 1 для обработки звуковых выборок с относительно постоянным весом.

В более общем виде, значения окон анализа и синтеза могут быть определены заранее (путем оптимизации, как описано выше), с последующим сохранением в запоминающем устройстве для устройства кодирования или декодирования, для использования способа кодирования или декодирования. В качестве варианта возможно определить окна инициализации, сохранить их в запоминающем устройстве упомянутых выше устройств и затем оптимизировать их, например, в соответствии с условиями передачи данных.

1. Способ кодирования цифрового сигнала, состоящего из последовательных блоков выборок, при этом кодирование состоит в преобразовании с наложением и содержит, в результате анализа, применение взвешивающего окна для двух последовательных блоков из М выборок,
отличающийся тем, что упомянутое взвешивающее окно выполнено асимметричным и содержит четыре отдельных участка, продолжающихся последовательно по упомянутым двум блокам, притом:
- первый участок (w1) возрастает в течение первого временного интервала выборок,
- второй участок (w2) имеет постоянное взвешивающее значение 1 в течение второго временного интервала,
- третий участок (w3) уменьшается в течение третьего временного интервала, и
- четвертый участок (w4) имеет постоянное взвешивающее значение 0 в течение четвертого интервала.

2. Способ по п. 1, отличающийся тем, что первый, второй и третий интервалы имеют соотвествующие длительности, которые рассчитывают, по меньшей мере, как функцию длительности четвертого интервала (Mz).

3. Способ по п. 1, отличающийся тем, что окно изменяется в первом интервале, при этом длительность первого интервала обозначается R1, как функция w1 следующего типа:
, при и:
, n∈[0; M-1] при C1 и R1, постоянными, больше 0 и hi(n), являющимся окном инициализации.

4. Способ по п. 3, отличающийся тем, что член С1 находится между 3 и 5.

5. Способ по п. 1, отличающийся тем, что окно изменяется в течение третьего интервала, при этом длительность третьего интервала обозначается, как R2, как функция w3 следующего типа:
, с , и:
, n∈[0; M-1] при С2 и R2, постоянными, больше 0 и hi(n), являющимся окном инициализации.

6. Способ по п. 5, отличающийся тем, что член С2 находится между 0,85 и 1,05.

7. Способ по п. 1, отличающийся тем, что длительность четвертого интервала, обозначенного Mz, выбирают следующим образом:

в котором обозначение x обозначает целое число, больше чем или равное x и ближайшее к x, М соответствует длительности блока.

8. Способ по п. 3, отличающийся тем, что первый интервал, обозначенный R1, имеет длительность, заданную следующим образом:
, в котором М соответствует длительности блока,
обозначение x обозначает целое число, меньшее чем или равное x и ближайшее к x.

9. Способ по п. 5, отличающийся тем, что третий интервал, обозначенный R2, имеет длительность, заданную следующим образом:
, в которой М соответствует длительности блока,
обозначение x обозначает целое число, меньшее чем или равное x и ближайшее к x.

10. Способ по п. 1, отличающийся тем, что первый интервал, обозначенный R1, имеет длительность, заданную следующим образом:
R1=M-Mz+1+0.5, в которой М соответствует длительности блока, и Mz соответствует длительности четвертого интервала.

11. Способ по п. 10, отличающийся тем, что третий интервал, обозначенный R2, имеет длительность, заданную следующим образом:
R2=M-2Mz+1+0.5, в которой М соответствует длительности блока, и Mz соответствует длительности четвертого интервала.

12. Способ по п. 1, отличающийся тем, что он содержит применение множества последовательных окон, асимметричных и содержащих упомянутые четыре участка, для последовательности из пары блоков.

13. Способ декодирования цифрового сигнала, кодированного в результате воплощения способа по п. 1, при этом декодирование состоит в преобразовании с наложением и содержит, в результате синтеза, применение взвешивающего окна для двух последовательных блоков кодированных выборок,
отличающийся тем, что упомянутое взвешивающее окно, после синтеза, идентично окну анализа, используемому при кодировании, обратному по времени.

14. Считываемый компьютером носитель информации, содержащий инструкции компьютерной программы, предназначенной для сохранения в запоминающем устройстве устройства кодирования, отличающийся тем, что программа содержит инструкции для воплощения способа кодирования по одному из пп. 1-12, когда инструкции исполняются процессором устройства.

15. Считываемый компьютером носитель информации, содержащий инструкции компьютерной программы, предназначенной для сохранения в запоминающем устройстве устройства декодирования, отличающийся тем, что программа содержит инструкции для воплощения способа декодирования по п. 13, когда инструкции исполняются процессором устройства.

16. Устройство кодирования сигнала, отличающееся тем, что оно содержит средство для сохранения (MEM) и/или расчета (µP) данных взвешивающего окна анализа для воплощения способа кодирования по одному из пп. 1-12.

17. Декодер сигнала, отличающийся тем, что содержит средство для сохранения (MEM′) и/или расчета (µP) данных взвешивающего окна синтеза для воплощения способа декодирования по п. 13.



 

Похожие патенты:

Изобретение относится к области телекоммуникаций и предназначено для защиты передаваемой секретной информации. Технический результат - высокий уровень защищенности зашифрованной информации.

Изобретение относится к технике связи и предназначено для кодирования и декодирования сигналов. Технический результат - повышение точности кодирования и декодирования сигналов.

Изобретение относится к беспроводной связи. Технический результат - повышение помехоустойчивости, надежности и эффективности связи, тогда как потребление энергии может быть снижено.

Изобретение относится к технике связи и предназначено для измерения спектра информационных акустических сигналов. Технический результат - повышение точности измерения спектра информационных акустических сигналов, расширение функциональных возможностей устройства за счет привязки мгновенных значений спектра к регулируемым по длительности отрезкам временного акустического сигнала.

Изобретение относится к области обработки цифровых сигналов, в частности к сжатию данных и улучшению энтропийного кодирования видеопоследовательностей. Техническим результатом является повышение эффективности и снижение вычислительной сложности энтропийного кодирования.

Изобретение относится к дешифраторам. Технический результат заключается в повышении быстродействия устройств преобразования информации с использованием заявляемого дешифратора.

Изобретение относится к средствам кодирования с использованием сокращенной кодовой книги с адаптивной установкой в исходное положение. Технический результат заключается в снижении объема информации, передаваемой от приемной стороны передающей стороне.

Изобретение относится к вычислительной технике, а именно к кодированию видеоинформации. Технический результат заключается в повышение эффективности кодирования и декодирования битового потока видеоинформации за счет разделения данных на энтропийные слои.

Изобретение относится к способу кодирования последовательности целых чисел, к устройству хранения и к сигналу, переносящему такую кодированную последовательность, а также к способу декодирования этой кодированной последовательности.

Изобретение относится к устройству обработки сигналов. Техническим результатом является возможность получать звук с более высоким качеством при декодировании аудиосигнала.

Изобретение относится к области техники кодирования, декодирования и обработки аудиосигнала, в частности, он относится к средствам восстановления высокочастотного контента аудиосигнала из низкочастотного контента того же аудиосигнала.

Изобретение относится к декодеру речи и кодеру речи. Достигаемый технический результат - уменьшение искажения формы воспроизводимого сигнала.

Изобретение относится к вычислительной технике. Технический результат заключается в повышении эффективности кодирования последовательных фрагментов аудиоконтента.

Изобретение относится к аудиосистемам. Технический результат заключается в обеспечении возможности улучшения пространственного восприятия воспроизводимого аудиосистемой аудиосигнала, расширении арсенала доступных аудиоэффектов.

Изобретение относится к средствам кодирования и декодирования звука. Технический результат заключается в повышении четкости аудиосигнала, получаемого в результате декодирования.

Изобретение относится к средствам кодирования и декодирования аудиосигнала. Технический результат заключается в повышении эффективности кодирования аудио, включающего речевые и неречевые части, за счет повышения эффективности кодирования переходов между данными частями.

Изобретение относится к средствам для обработки аудио сигнала. Технический результат заключается в уменьшении влияния переходных процессов на качество звука.

Изобретение относится к средствам для обработки аудио сигнала. Технический результат заключается в уменьшении влияния переходных процессов на качество звука.

Группа изобретений относится к устройствам и способам кодирования и декодирования аудиосигнала с удалением алиасинга (наложения спектров). Техническим результатом является нейтрализация артефактов алиасинга при прохождении через декодер аудиосигнала.

Изобретение относится к обработке звукового сигнала и\или видеосигнала в виде последовательности выборок и предназначено для кодирования и декодирования цифрового звукового сигнала. Технический результат – экономия ресурсов памяти и вычислительных ресурсов при кодировании и декодировании цифрового звукового сигнала посредством преобразования с использованием взвешивающих окон анализа и синтеза. Для этого кодирование или декодирование осуществляется путем преобразования цифрового звукового сигнала с использованием взвешивающих окон анализа (ha) или синтеза (hs), применяемых для фреймов выборок, при этом способ включает в себя неравномерную дискретизацию (E10) первоначального окна, предусмотренного для трансформанты заданного первоначального размера N, для применения вторичного преобразования размером M, отличным от N. Устройство содержит модуль дискретизации, выполненный с возможностью выполнения неравномерной дискретизации первоначального окна, предусмотренного для трансформанты данного первоначального размера N, для применения вторичного преобразования размером M, отличным от N. 3 н. и 12 з.п.ф-лы, 7 ил., 3 табл.
Наверх