Устройство и способ для обработки звукового сигнала с использованием гармонического постфильтра

Изобретение относится к устройству, системе, способам и машиночитаемым носителям для обработки аудиосигнала. Технический результат заключается в обеспечении фильтрации аудиосигнала. Устройство содержит преобразователь области для преобразования представления аудиосигнала в первой области в представление аудиосигнала во второй области и гармонический постфильтр для фильтрации представления аудиосигнала во второй области, при этом постфильтр основан на передаточной функции, содержащей числитель и знаменатель, при этом числитель содержит значение усиления, указываемое посредством информации усиления, и при этом знаменатель содержит целочисленную часть запаздывания основного тона, указываемую посредством информации запаздывания основного тона, и многоотводный фильтр, зависящий от дробной части запаздывания основного тона. 6 н. и 11 з.п. ф-лы, 11 ил.

 

Подробное описание изобретения

Настоящее изобретение относится к аудиообработке, и в частности, к аудиообработке с использованием гармонического постфильтра.

Аудиокодеки на основе преобразования, в общем, вводят межгармонический шум при обработке гармонических аудиосигналов, в частности, на низких скоростях передачи битов.

Этот эффект дополнительно ухудшается, когда аудиокодек на основе преобразования работает при низкой задержке вследствие худшего частотного разрешения и/или избирательности, введенной посредством меньшего размера преобразования, и/или худшей частотной характеристики функции окна.

Этот межгармонический шум, в общем, воспринимается в качестве очень раздражающего артефакта, значительно уменьшая производительность аудиокодека на основе преобразования при субъективной оценке на высокотональном аудиоматериале.

Существуют несколько решений для того, чтобы повышать субъективное качество аудиокодеков на основе преобразования для гармонических аудиосигналов. Все они основаны на технологиях на основе прогнозирования, в области преобразования или во временной области.

Примеры подходов области преобразования следующие:

[1] H. Fuchs, "Improving MPEG Audio Coding by Backward Adaptive Linear Stereo Prediction", 99th AES Convention, New York, 1995 год, Preprint 4086.

[2] L. Yin, M. Suonio, M. Väänänen, "A New Backward Predictor for MPEG Audio Coding", 103rd AES Convention, New York, 1997 год, Preprint 4521.

[3] Juha Ojanperä, Mauri Väänänen, Lin Yin, "Long Term Predictor for Transform Domain Perceptual Audio Coding", 107th AES Convention, New York, 1999 год, Preprint 5036.

Примеры подходов на основе временной области следующие:

[4] Philip J. Wilson, Harprit Chhatwal, "Adaptive transform coder having long term predictor", патент (США) 5012517, 30 апреля 1991 года.

[5] Jeongook Song, Chang-Heon Lee, Hyen-O Oh, Hong-Goo Kang, "Harmonic Enhancement in Low Bitrate Audio Coding Using and Efficient Long-Term Predictor", EURASIP Journal on Advances in Signal Processing, 2010 год.

[6] Juin-Hwey Chen, "Pitch-based pre-filtering and post-filtering for compression of audio signals", патент (США) 8738385, 27 мая 2014 года.

Цель настоящего изобретения заключается в том, чтобы предоставить усовершенствованный принцип для обработки аудиосигнала.

Это цель достигается посредством устройства для обработки аудиосигнала по п. 1, способа для обработки аудиосигнала по п. 12, системы по п. 13, способа для работы системы по п. 17 или компьютерной программы по п. 18.

Настоящее изобретение основано на таких выявленных сведениях, что субъективное качество аудиосигнала может существенно повышаться посредством использования гармонического постфильтра, имеющего передаточную функцию, содержащую числитель и знаменатель. Числитель передаточной функции содержит значение усиления, указываемое посредством передаваемой информации усиления, и знаменатель содержит целочисленную часть запаздывания основного тона, указываемую посредством информации запаздывания основного тона, и многоотводный фильтр, зависящий от дробной части запаздывания основного тона.

Следовательно, можно удалять межгармонический шум, введенный посредством обычного аудиодекодера с изменением области в качестве артефакта. Этот гармонический постфильтр, в частности, является полезным тем, что он основывается на передаваемой информации, т.е. усилении основного тона и запаздывании основного тона, которые доступны в любом случае в декодере, поскольку эта информация принимается из соответствующего кодера через входной сигнал декодера. Кроме того, постфильтрация имеет конкретную точность вследствие того, что учитывается не только целочисленная часть запаздывания основного тона, но и, помимо этого, учитывается дробная часть запаздывания основного тона. Дробная часть запаздывания основного тона может быть, в частности, введена в постфильтр через многоотводный фильтр, который имеет коэффициенты фильтрации, фактически зависящие от дробной части запаздывания основного тона. Этот фильтр может реализовываться как FIR-фильтр или также может реализовываться как любой другой фильтр, к примеру, как IIR-фильтр или другая реализация фильтра. Любое изменение области, такое как изменение "время-частота" или изменение "LPC-время", или изменение "время-LPC", или изменение "частота-время", может преимущественно улучшаться посредством принципа постфильтра изобретения. Тем не менее, предпочтительно, изменение области представляет собой изменение из частотной во временную область.

Следовательно, варианты осуществления настоящего изобретения уменьшают межгармонический шум, введенный посредством аудиокодека с преобразованием, на основе долговременного предиктора, работающего во временной области. В отличие от [04]-[6], в которых используются как предварительный фильтр до кодирования с преобразованием, так и постфильтр после декодирования с преобразованием, настоящее изобретение предпочтительно применяет только постфильтр.

Кроме того, следует отметить, что предварительный фильтр, используемый в [04]-[6], имеет тенденцию вводить нестабильности во входном сигнале, предоставленном в кодер с преобразованием. Эти нестабильности обусловлены изменениями усиления и/или запаздывания основного тона между кадрами. Кодер с преобразованием испытывает затруднения в кодировании таких нестабильностей, в частности, на низких скоростях передачи битов, и он иногда вводит еще больше шума в декодированном сигнале по сравнению с ситуацией без предварительного или постфильтра.

Предпочтительно, настоящее изобретение вообще не использует предварительный фильтр и за счет этого полностью исключает проблемы, обусловленные предварительным фильтром.

Кроме того, настоящее изобретение основывается на постфильтре, который применяется к декодированному сигналу после кодирования с преобразованием. Этот постфильтр основан на долговременном прогнозном фильтре с учетом целочисленной части и дробной части запаздывания основного тона, что уменьшает межгармонический шум, введенный посредством аудиокодека с преобразованием.

Для лучшей устойчивости, параметры постфильтрации "запаздывание основного тона" и "усиление основного тона" оцениваются на стороне кодера и передаются в потоке битов. Тем не менее, в других реализациях, запаздывание основного тона и усиление основного тона также могут оцениваться на стороне декодера на основе декодированного аудиосигнала, полученного посредством аудиодекодера, содержащего частотно-временной преобразователь для преобразования частотного представления аудиосигнала в представление аудиосигнала во временной области.

В предпочтительном варианте осуществления, числитель дополнительно содержит многоотводный фильтр для нулевой дробной части запаздывания основного тона, чтобы компенсировать спектральный наклон, введенный посредством многоотводного фильтра в знаменателе, который зависит от дробной части запаздывания основного тона.

Предпочтительно, постфильтр сконфигурирован с возможностью подавлять величину энергии между гармониками в кадре, при этом подавляемая величина энергии меньше 20% полной энергии представления во временной области в кадре.

В дополнительном варианте осуществления, знаменатель содержит произведение между многоотводным фильтром и значением усиления.

В дополнительном варианте осуществления, числитель фильтра дополнительно содержит произведение первого скалярного значения и второго скалярного значения, при этом знаменатель содержит только второе скалярное значение, а не первое скалярное значение. Эти скалярные значения задаются равными предварительно определенным значениям и имеют значения, большие 0 и меньшие 1; и, дополнительно, второе скалярное значение ниже первого скалярного значения. Следовательно, можно очень эффективным способом задавать характеристики удаления энергии, которые типично нежелательны, и дополнительно задавать интенсивность фильтрации, т.е. то, как сильный фильтр ослабляет межгармонические артефакты в выходном сигнале декодера в области преобразования.

Устройство дополнительно содержит, в предпочтительном варианте осуществления, контроллер фильтра для задания, по меньшей мере, второго скалярного значения в зависимости от скорости передачи битов таким образом, что большее значение задается для более низкой скорости передачи битов, и наоборот.

Кроме того, контроллер фильтра сконфигурирован с возможностью выбора, в зависимости от дробной части запаздывания основного тона, соответствующего многоотводного фильтра зависимым от сигнала способом, чтобы задавать гармонический постфильтр сигнально-адаптивно, т.е. в зависимости от фактически предоставленного значения дробной части запаздывания основного тона.

Далее поясняются предпочтительные варианты осуществления настоящего изобретения в контексте прилагаемых чертежей, на которых:

Фиг. 1 иллюстрирует вариант осуществления изобретаемого устройства для обработки аудиосигнала;

Фиг 2 иллюстрирует предпочтительную реализацию гармонического постфильтра, представленного в качестве передаточных функций в z-области;

Фиг. 3 иллюстрирует дополнительный предпочтительный вариант осуществления для гармонического постфильтра, представленного посредством передаточной функции в z-области;

Фиг. 4 иллюстрирует предпочтительную реализацию кодера для формирования кодированного сигнала, который должен декодироваться посредством аудиодекодера в области преобразования, проиллюстрированного на фиг. 1;

Фиг. 5 иллюстрирует предпочтительную реализацию многоотводного фильтра в качестве FIR-фильтра, управляемого посредством контроллера фильтра;

Фиг. 6 иллюстрирует взаимодействие между контроллером фильтра и запоминающим устройством, имеющим предварительно сохраненные весовые коэффициенты отводов, зависящие от дробной части;

Фиг. 7a иллюстрирует частотную характеристику фильтра, имеющего нулевое значение α.

Фиг. 7b иллюстрирует частотную характеристику предпочтительного гармонического постфильтра, имеющего значение α, равное 1;

Фиг. 7c иллюстрирует частотную характеристику предпочтительного гармонического постфильтра, имеющего значение α в 0,8;

Фиг. 8a иллюстрирует предпочтительный вариант осуществления гармонического постфильтра, имеющего значение β, равное 0,4; и

Фиг. 8b иллюстрирует частотную характеристику гармонического постфильтра, имеющего значение β в 0,2.

Фиг. 1 иллюстрирует устройство для обработки аудиосигнала, имеющего ассоциированную информацию запаздывания основного тона и информацию усиления. Эта информация усиления может передаваться в декодер 100 через ввод 102 декодера, принимающий кодированный сигнал, или, альтернативно, эта информация может вычисляться в самом декодере, когда эта информация не доступна. Тем не менее, для более надежной работы, предпочтительно вычислять информацию запаздывания основного тона и информацию усиления основного тона на стороне кодера.

Декодер 100 содержит, например, частотно-временной преобразователь для преобразования частотно-временного представления аудиосигнала в представление аудиосигнала во временной области. Таким образом, декодер не представляет собой речевой кодек только временной области, но содержит декодер только в области преобразования или декодер в смешанной области преобразования либо любой другой кодер, работающий в области, отличающейся от временной области. Кроме того, предпочтительно, если вторая область представляет собой временную область.

Кроме того, устройство содержит гармонический постфильтр 104 для фильтрации представления аудиосигнала во временной области, и этот гармонический постфильтр основан на передаточной функции, содержащей числитель и знаменатель. В частности, числитель содержит значение усиления, указываемое посредством информации усиления, и знаменатель содержит целочисленную часть запаздывания основного тона, указываемую посредством информации запаздывания основного тона, и, что важно, дополнительно содержит многоотводный фильтр, зависящий от дробной части запаздывания основного тона.

Предпочтительная реализация этого гармонического постфильтра с передаточной функцией H(z) проиллюстрирована на фиг. 2. Этот фильтр принимает выходной сигнал 106 декодера и подвергает этот декодированный выходной сигнал операции постфильтрации, чтобы получать постфильтрованный выходной сигнал 108. Этот постфильтрованный выходной сигнал может выводиться в качестве обработанного сигнала или дополнительно может обрабатываться посредством любой процедуры для удаления любых неоднородностей, введенных посредством операции постфильтрации, которая, конечно, является зависимой от сигнала, т.е. может варьироваться между кадрами. Эта операция удаления неоднородности может быть любой известной операцией удаления неоднородности, такой как плавный переход, что означает то, что более ранний кадр постепенно затухает, и, одновременно, новый кадр постепенно нарастает, и предпочтительно, характеристика постепенного изменения является такой, что коэффициенты постепенного изменения составляют в целом единицу в течение операции плавного перехода. Тем не менее, также может применяться другое удаление неоднородности, такое как фильтрация нижних частот или LPC-фильтрация.

Кроме того, устройство для обработки аудиосигнала, проиллюстрированное на фиг. 1, содержит устройство 112 хранения информации многоотводного фильтра и контроллер 114 фильтра. В частности, контроллер 114 фильтра принимает вспомогательную информацию 116 из декодера 100, и эта вспомогательная информация, например, может быть информацией g усиления основного тона и информацией запаздывания основного тона, т.е. информацией относительно целочисленной части Tint запаздывания основного тона и дробной части Tfr запаздывания основного тона. Эта информация является полезной для задания гармонического постфильтра между кадрами и, дополнительно, для выбора информации B(z, Tfr) многоотводного фильтра. Кроме того, дополнительная информация, такая как скорость передачи битов, применяемая посредством декодера, либо частота дискретизации, лежащая в основе декодированного сигнала, также может использоваться посредством контроллера 114 фильтра, чтобы, в частности, устанавливать скалярные значения α, β для определенной настройки кодера и/или декодера относительно скорости передачи битов и частоты дискретизации.

Фиг. 2 иллюстрирует представление нулей и полюсов передаточной функции H(z) фильтра в z-области, как известно в данной области техники. Естественно, предусмотрено множество других представлений гармонического постфильтра, которые все являются представлениями фильтра, которые могут преобразовываться в вид представления нулей и полюсов в z-области. Следовательно, настоящее изобретение является применимым для каждого фильтра, который может описываться тем или иным способом посредством такой передаточной функции, как проиллюстрировано в описании изобретения.

Фиг. 3 иллюстрирует предпочтительный вариант осуществления гармонического постфильтра, также описанный в качестве передаточной функции в обозначении нулей и полюсов в z-области.

Фильтр может описываться следующим образом:

,

где является декодированным усилением, и является целочисленной и дробной частью декодированного запаздывания основного тона, α и β являются двумя скалярными величинами, которые взвешивают усиление, и является FIR-фильтром нижних частот, коэффициенты которого зависят от дробной части декодированного запаздывания основного тона.

Следует отметить, что в числителе используется для того, чтобы компенсировать наклон, введенный посредством .

β используется для того, чтобы управлять интенсивностью постфильтра. Β, равное 1, формирует полные эффекты, подавляя максимальную возможную величину энергии между гармониками. β, равное 0, отключает постфильтр. Обычно, довольно низкое значение используется для того, чтобы не подавлять слишком большую величину энергии между гармониками. Значение также может зависеть от скорости передачи битов с большим значением при более низкой скорости передачи битов, например, 0,4 при низкой скорости передачи битов и 0,2 при высокой скорости передачи битов.

α используется для того, чтобы добавлять небольшой наклон в частотную характеристику H(z), чтобы компенсировать небольшие потери в энергии на низких частотах. Значение α, в общем, выбирается близким к 1, например, 0,8.

Пример приведен на фиг. 6. Порядок и коэффициенты также могут зависеть от скорости передачи битов и выходной частоты дискретизации. Различная частотная характеристика может быть рассчитана и настроена для каждой комбинации скорости передачи битов и выходной частоты дискретизации.

В частности, выяснено, что даже значения для α между 0,6 и меньше 1,0 являются полезными, и что, дополнительно, значения для β между 0,1, и 0,5, как оказалось, также являются полезными.

Кроме того, многоотводный фильтр может иметь переменное число отводов. Обнаружено, что для определенных реализаций, четырех отводов достаточно, где один отвод является z+1. Тем не менее, меньшие фильтры только с двумя отводами или даже большие фильтры более чем с четырьмя отводами являются полезными для определенных реализаций.

Фиг. 6 иллюстрирует предпочтительную реализацию фильтров B(z) для различных дробных значений запаздывания основного тона и, в частности, для разрешения запаздывания основного тона в 1/4. Для этой реализации, проиллюстрированы четыре различных описания фильтра для многоотводного фильтра в знаменателе передаточной функции гармонического постфильтра. Тем не менее, обнаружено, что коэффициенты фильтрации не обязательно должны указывать точно проиллюстрированные значения на фиг. 6, но определенные варьирования+/-0,05 также могут быть полезными в других реализациях.

В частности, как проиллюстрировано на фиг. 1, весовые коэффициенты отводов, проиллюстрированные на фиг. 6, сохраняются в запоминающем устройстве 112 для получения информации многоотводного фильтра. Контроллер 114 фильтра принимает дробную часть Tfr из линии 116 по фиг. 1 и, в ответ на это значение, обращается к запоминающему устройству 112 для того, чтобы извлекать через линию 200 извлечения конкретную информацию фильтра для конкретной дробной части запаздывания основного тона. Эта информация затем перенаправляется через линию 202 вывода в гармонический постфильтр 104, так что гармонический постфильтр корректно задается. Определенная реализация многоотводного FIR-фильтра проиллюстрирована на фиг. 5. Указание w1-w4 весовых коэффициентов соответствует обозначению на фиг. 6, и контроллер 114 фильтра применяет, в ответ на фактическую дробную часть запаздывания основного тона, соответствующие весовые коэффициенты для определенного аудиокадра. Другие части, к примеру, части 501, 502, 503 задержки и модуль 505 комбинирования, могут реализовываться так, как проиллюстрировано. В этом контексте, следует подчеркнуть, что значение 501 задержки в обозначении z является отрицательным значением задержки, поскольку выяснено, что представление FIR-фильтра, имеющее отрицательное значение задержки в дополнение к положительному значению задержки, к примеру, 503 и 504, в частности, является полезным.

Затем, предпочтительная реализация кодера, имеющая определенные функциональные блоки и работающая без предварительного фильтра, проиллюстрирована на фиг. 4. Часть фильтра, проиллюстрированная на фиг. 4, содержит модуль 402 оценки основного тона, модуль 404 уточнения основного тона, модуль 406 оценки дробной части, детектор 408 переходных частей, модуль 410 оценки усиления и квантователь 412 усиления. Информация, предоставляемая посредством квантователя 412 усиления, модуля 406 оценки дробной части, модуля 404 уточнения основного тона, и решающий бит, сформированный посредством детектора 408 переходных частей, вводятся в формирователь 414 кодированных сигналов. Формирователь кодированных сигналов предоставляет кодированный сигнал 102, который затем вводится в декодер 100, проиллюстрированный на фиг. 1. Кодированный сигнал 102 должен содержать дополнительную сигнальную информацию, не проиллюстрированную на фиг. 4.

Далее описывается функциональность модуля 402 оценки основного тона.

Одно запаздывание основного тона (целочисленная часть + дробная часть) в расчете на кадр оценивается (размер кадра, например, 20 мс). Это выполняется на 3 этапах, чтобы уменьшать сложность и повышать точность оценки.

Алгоритм анализа основного тона, который формирует гладкий контур изменения основного тона, используется (например, анализ основного тона с разомкнутым контуром, описанный в Rec. ITU-T G.718, раздел 6.6). Этот анализ, в общем, выполняется на основе субкадров (размер субкадра, например, 10 мс) и формирует одну оценку запаздывания основного тона в расчете на субкадр. Следует отметить, что эти оценки запаздывания основного тона не имеют дробной части и, в общем, оцениваются для сигнала после понижающей дискретизации (с частотой дискретизации, например, 6400 Гц). Используемый сигнал может представлять собой любой аудиосигнал, например, взвешенный LPC-аудиосигнал, как описано в Rec. ITU-T G.718, раздел 6.5.

Модуль уточнения основного тона работает следующим образом:

Конечная целочисленная часть запаздывания основного тона оценивается для аудиосигнала x[n], работающего на частоте дискретизации базового кодера, которая, в общем, выше частоты дискретизации сигнала после понижающей дискретизации, используемого в a. (например, 12,8 кГц, 16 кГц, 32 кГц,...,). Сигнал x[n] может представлять собой любой аудиосигнал, например, взвешенный LPC-аудиосигнал.

Целочисленная часть Tint запаздывания основного тона в таком случае является запаздыванием , которое максимизирует автокорреляционную функцию:

,

при этом d около запаздывания основного тона оценивается на этапе 1.a.

Модуль 406 оценки дробной части работает следующим образом:

Дробная часть находится посредством интерполяции автокорреляционной функции , вычисленной на этапе 2.b, и выбора дробного запаздывания основного тона, которое максимизирует интерполированную автокорреляционную функцию. Интерполяция может выполняться с использованием FIR-фильтра нижних частот, как описано в, например, Rec. ITU-T G.718, раздел 6.6.7.

Детектор 408 переходных частей, проиллюстрированный на фиг. 4, сконфигурирован с возможностью формирования решающего бита.

Если входной аудиосигнал не имеет содержания гармоник, то параметры не кодируются в потоке битов. Только 1 бит отправляется таким образом, что декодер знает то, должен он декодировать параметры постфильтрации или нет. Решение принимается на основе нескольких параметров:

a. Нормализованная корреляция при целочисленном запаздывании основного тона, оцененном на этапе 1.b:

Нормализованная корреляция равна 1, если входной сигнал является идеально прогнозируемым посредством целочисленного запаздывания основного тона, и равна 0, если он вообще не является прогнозируемым. Высокое значение (близко к 1) в таком случае указывает гармонический сигнал. Для более надежного решения, нормализованная корреляция предыдущего кадра также может использоваться в решении, например:

Если (norm.corr(curr.)*norm.corr.(prev.))>0,25, то текущий кадр имеет некоторое содержание гармоник (бит=1)

b. Признаки, вычисленные посредством детектора переходных частей (например, показатель временной равномерности, максимальное изменение энергии), чтобы исключать активацию постфильтра для сигнала, содержащего переходную часть, например:

Если (tempFlatness>3,5 или maxEnergychange>3,5), то задание бита=0 и отказ от отправки параметров

Кроме того, модуль 410 оценки усиления вычисляет усиление, которое должно вводиться в квантователь 412 усиления.

Усиление, в общем, оценивается для входного аудиосигнала на частоте дискретизации базового кодера, но он также может представлять собой любой аудиосигнал, к примеру, взвешенный LPC-аудиосигнал. Этот сигнал помечен y[n] и может быть идентичным или отличающимся от x[n].

Прогнозирование yP[n] y[n] сначала находится посредством фильтрации y[n] со следующим фильтром:

,

где является целочисленной частью запаздывания основного тона (оцененной на 1.b)), и является FIR-фильтром нижних частот, коэффициенты которого зависят от дробной части запаздывания основного тона (оцененной на 1.c)).

Один пример B(z), когда разрешение запаздывания основного тона составляет 1/4:

Усиление g затем вычисляется следующим образом:

,

и ограничено между 0 и 1.

В завершение, усиление квантуется, например, для 2 битов, с использованием, например, равномерного квантования.

Если усиление квантуется до 0, то параметры не кодируются в потоке битов, а только один решающий бит (бит=0).

Как указано выше, постфильтр применяется к выходному аудиосигналу после декодера с преобразованием. Он обрабатывает сигнал на покадровой основе с размером кадра, идентичным размеру кадра, используемого на стороне кодера, к примеру, 20 мс. Как проиллюстрировано, он основан на долговременном прогнозном фильтре H(z), параметры которого определяются из параметров, оцененных на стороне кодера и декодированных из потока битов. Эта информация содержит решающий бит, запаздывание и усиление основного тона. Если решающий бит равен 0, то запаздывание и усиление основного тона не декодируются и предположительно равны 0, вообще не записываются в поток битов.

Как пояснено, если параметры фильтрации отличаются между кадрами, неоднородность может вводиться на границе между двумя кадрами. Чтобы исключать неоднородность, применяется модуль удаления неоднородности, к примеру, регулятор плавного перехода или любая другая реализация для этой цели.

Кроме того, несколько различных способов задавать гармонический постфильтр проиллюстрированы на фиг. 7a-8b. Графики иллюстрируют передаточную функцию в частотной области. Горизонтальная ось связана с нормализованной частотой 1, и вертикальная ось является абсолютной величиной характеристики фильтра в дБ. Следует подчеркнуть, что на всех иллюстрациях, кроме фиг. 7b, фильтр вводит усиление для низких частот, т.е. определенное положительное значение абсолютной величины в дБ.

В частности, фиг. 7a иллюстрирует передаточную функцию, реализующую фильтр на фиг. 3, с определенными значениями параметров, как указано выше. Кроме того, значение α, т.е. первое скалярное значение задается равным 0. Фиг. 7b иллюстрирует аналогичную ситуацию, но теперь со значением α, равным 1. Другие параметры являются идентичными фиг. 7a.

Фиг. 7c иллюстрирует дополнительную реализацию, где α равен 0,8, который имеет небольшой наклон и повышение нижних частот. С другой стороны, фиг. 7 имеет идентичные другие параметры, как указано на фиг. 7a. Становится очевидным, что α, равный 1, удаляет наклон, и все частоты гармоник имеют усиление 1. Недостаток этой настройки заключается в потерях энергии на частотах между гармониками. Следовательно, предпочитается значение α, равное 0,8, как показано на фиг. 7c. Это значение добавляет небольшой наклон по сравнению с ситуацией α, равного 1, на фиг. 7b. Чтобы компенсировать потери энергий на частотах между гармониками, этот небольшой наклон предпочтительно используется.

Кроме того, фиг. 8a и 8b иллюстрируют настройки фильтра для значения α, равного 0,8, и различных значений β, т.е. значения β в 0,4 на фиг. 8a и значения β в 0,2 на фиг. 8b. Становится очевидным, что значение β 0,4 имеет более сильный эффект постфильтрации по сравнению со значением β 0,2, и в силу этого значение β 0,4 используется на более низких скоростях передачи битов, чтобы удалять межгармонический шум, введенный посредством такой низкой скорости передачи битов.

С другой стороны, β, равное 0,2, имеет менее сильный эффект для подавления энергии между гармониками, и в силу этого данное значение β предпочитается для высоких скоростей передачи битов вследствие того факта, что на таких более высоких скоростях передачи битов, существует не такой большой межгармонический шум.

Хотя некоторые аспекты описаны в контексте устройства, очевидно, что эти аспекты также представляют описание соответствующего способа, при этом блок или устройство соответствует этапу способа либо признаку этапа способа. Аналогично, аспекты, описанные в контексте этапа способа, также представляют описание соответствующего блока или элемента, или признака соответствующего устройства. Некоторые или все этапы способа могут быть выполнены посредством (или с использованием) устройства, такого как, например, микропроцессор, программируемый компьютер либо электронная схема. В некоторых вариантах осуществления, некоторые из одного или более самых важных этапов способа могут выполняться посредством этого устройства.

Изобретаемый передаваемый кодированный сигнал может быть сохранен на цифровом носителе хранения данных или может быть передан по среде передачи, такой как беспроводная среда передачи или проводная среда передачи, к примеру, Интернет.

В зависимости от определенных требований к реализации, варианты осуществления изобретения могут быть реализованы в аппаратных средствах или в программном обеспечении. Реализация может выполняться с использованием цифрового носителя хранения данных, например, гибкого диска, DVD, Blu-Ray, CD, ROM, PROM и EPROM, EEPROM или флэш-памяти, имеющего сохраненные электронночитаемые управляющие сигналы, которые взаимодействуют (или допускают взаимодействие) с программируемой компьютерной системой, так что осуществляется соответствующий способ. Следовательно, цифровой носитель хранения данных может быть машиночитаемым.

Некоторые варианты осуществления согласно изобретению содержат носитель данных, имеющий электронночитаемые управляющие сигналы, которые допускают взаимодействие с программируемой компьютерной системой таким образом, что осуществляется один из способов, описанных в данном документе.

В общем, варианты осуществления настоящего изобретения могут быть реализованы как компьютерный программный продукт с программным кодом, при этом программный код сконфигурирован с возможностью осуществления одного из способов, когда компьютерный программный продукт работает на компьютере. Программный код, например, может быть сохранен на машиночитаемом носителе.

Другие варианты осуществления содержат компьютерную программу для осуществления одного из способов, описанных в данном документе, сохраненную на машиночитаемом носителе.

Другими словами, следовательно, вариант осуществления изобретаемого способа представляет собой компьютерную программу, имеющую программный код для осуществления одного из способов, описанных в данном документе, когда компьютерная программа работает на компьютере.

Следовательно, дополнительный вариант осуществления изобретаемого способа представляет собой носитель хранения данных (или энергонезависимый носитель хранения данных, такой как цифровой носитель хранения данных или машиночитаемый носитель), содержащий записанную компьютерную программу для осуществления одного из способов, описанных в данном документе. Носитель данных, цифровой носитель хранения данных или носитель с записанными данными типично является материальным и/или энергонезависимым.

Следовательно, дополнительный вариант осуществления изобретаемого способа представляет собой поток данных или последовательность сигналов, представляющих компьютерную программу для осуществления одного из способов, описанных в данном документе. Поток данных или последовательность сигналов, например, может быть сконфигурирована с возможностью передачи через соединение для передачи данных, например, через Интернет.

Дополнительный вариант осуществления содержит средство обработки, например, компьютер или программируемое логическое устройство, сконфигурированное с возможностью осуществлять один из способов, описанных в данном документе.

Дополнительный вариант осуществления содержит компьютер, имеющий установленную компьютерную программу для осуществления одного из способов, описанных в данном документе.

Дополнительный вариант осуществления согласно изобретению содержит устройство или систему, сконфигурированную с возможностью передавать (например, электронно или оптически) компьютерную программу для осуществления одного из способов, описанных в данном документе, в приемное устройство. Приемное устройство, например, может представлять собой компьютер, мобильное устройство, запоминающее устройство и т.п. Устройство или система, например, может содержать файловый сервер для передачи компьютерной программы в приемное устройство.

В некоторых вариантах осуществления, программируемое логическое устройство (например, программируемая пользователем вентильная матрица) может быть использовано для того, чтобы выполнять часть или все из функциональностей способов, описанных в данном документе. В некоторых вариантах осуществления, программируемая пользователем вентильная матрица может взаимодействовать с микропроцессором, чтобы осуществлять один из способов, описанных в данном документе. В общем, способы предпочтительно осуществляются посредством любого устройства.

Вышеописанные варианты осуществления являются просто иллюстративными в отношении принципов настоящего изобретения. Следует понимать, что модификации и изменения компоновок и подробностей, описанных в данном документе, должны быть очевидными для специалистов в данной области техники. Следовательно, они подразумеваются как ограниченные только посредством объема нижеприведенной формулы изобретения, а не посредством конкретных подробностей, представленных посредством описания и пояснения вариантов осуществления в данном документе.

1. Устройство для обработки аудиосигнала, имеющего ассоциированную информацию запаздывания основного тона и информацию усиления, содержащее:

- преобразователь (100) области для преобразования представления аудиосигнала в первой области в представление аудиосигнала во второй области; и

- гармонический постфильтр (104) для фильтрации представления аудиосигнала во второй области, при этом постфильтр основан на передаточной функции, содержащей числитель и знаменатель, при этом числитель содержит значение усиления, указываемое посредством информации усиления, и при этом знаменатель содержит целочисленную часть запаздывания основного тона, указываемую посредством информации запаздывания основного тона, и многоотводный фильтр, зависящий от дробной части запаздывания основного тона.

2. Устройство по п. 1, в котором передаточная функция постфильтра содержит, в числителе, дополнительный многоотводный FIR-фильтр для нулевой дробной части запаздывания основного тона.

3. Устройство по п. 1, в котором знаменатель содержит произведение между многоотводным фильтром и значением усиления.

4. Устройство по п. 1, в котором числитель, кроме того, содержит произведение первого скалярного значения и второго скалярного значения, при этом знаменатель содержит второе скалярное значение, а не первое скалярное значение, при этом первое и второе скалярные значения предварительно определены и имеют значения, большие 0 и меньшие, и при этом второе скалярное значение ниже первого скалярного значения.

5. Устройство по п. 4, дополнительно содержащее:

- контроллер (114) фильтра, сконфигурированный с возможностью задания второго скалярного значения в зависимости от скорости передачи битов, на которой работает частотно-временной преобразователь (100), при этом второе скалярное значение задается равным первому значению, когда скорость передачи битов имеет первое значение, при этом второе скалярное значение задается равным второму значению, когда скорость передачи битов имеет второе значение, при этом второе значение скорости передачи битов ниже первого значения скорости передачи битов, и при этом второе значение второго скалярного значения превышает первое значение второго скалярного значения.

6. Устройство по п. 4, в котором первое скалярное значение задается между 0,6 и 1,0, и при этом второе скалярное значение задается между 0,1 и 0,5.

7. Устройство по п. 1,

- в котором постфильтр имеет передаточную функцию H(z) в представлении нулей и полюсов на основе следующего уравнения:

- при этом α является первым скалярным значением, при этом β является вторым скалярным значением, при этом B(z, 0) является многоотводным фильтром для нулевой дробной части запаздывания основного тона, при этом B(z, Tfr) является многоотводным фильтром, зависящим от дробной части запаздывания основного тона, при этом Tint является целочисленной частью запаздывания основного тона, при этом Tfr является дробной частью запаздывания основного тона, и при этом g является значением усиления, указываемым посредством информации усиления, z является переменной в плоскости Z.

8. Устройство по п. 1, в котором многоотводный фильтр представляет собой фильтр с конечной импульсной характеристикой (FIR) и имеет, по меньшей мере, три отвода.

9. Устройство по п. 1,

- в котором многоотводный фильтр в знаменателе содержит четыре отвода, при этом, для нулевой дробной части, первый отвод задается между 0,0 и 0,1, второй отвод задается между 0,2 и 0,3, третий отвод задается между 0,5 и 0,6, и четвертый отвод задается между 0,2 и 0,3,

- при этом многоотводный фильтр содержит, для первой дробной части, четыре отвода фильтра, при этом первый отвод задается между 0,0 и 0,1, второй отвод задается между 0,3 и 0,4, третий отвод задается между 0,45 и 0,55, и четвертый отвод задается между 0,1 и 0,2,

- при этом многоотводный фильтр содержит, для второй дробной части, четыре отвода фильтра, при этом первый отвод задается между 0,0 и 0,1, второй отвод задается между 0,35 и 0,45, третий отвод задается между 0,35 и 0,45, и четвертый отвод задается между 0,0 и 0,1,

- при этом многоотводный фильтр содержит, для третьей дробной части, четыре отвода фильтра, при этом первый отвод задается между 0,1 и 0,2, второй отвод задается между 0,45 и 0,55, третий отвод задается между 0,3 и 0,4, и четвертый отвод задается между 0,0 и 0,1,

- при этом третья дробная часть превышает вторую дробную часть, и при этом вторая дробная часть превышает первую дробную часть.

10. Устройство по п. 1,

- в котором постфильтр сконфигурирован с возможностью иметь отрицательный спектральный наклон для компенсации потерь в энергии посредством гармонического постфильтра, или

- при этом постфильтр сконфигурирован с возможностью подавлять величину энергии между гармониками в кадре, при этом подавляемая величина энергии меньше 20% полной энергии представления во временной области в кадре.

11. Устройство по п. 1,

- в котором преобразователь области представляет собой частотно-временной преобразователь, при этом первая область представляет собой частотную область, и вторая область представляет собой временную область, или

- при этом преобразователь области представляет собой преобразователь "LPC-остатки/время", при этом первая область представляет собой область LPC-остатков, и вторая область представляет собой временную область.

12. Способ обработки аудиосигнала, имеющего ассоциированную информацию запаздывания основного тона и информацию усиления, содержащий этапы, на которых:

- преобразуют (100) частотное представление аудиосигнала в представление аудиосигнала во временной области; и

- фильтруют представление аудиосигнала во временной области посредством гармонического постфильтра (104), при этом постфильтр основан на передаточной функции, содержащей числитель и знаменатель, при этом числитель содержит значение усиления, указываемое посредством информации усиления, и при этом знаменатель содержит целочисленную часть запаздывания основного тона, указываемую посредством информации запаздывания основного тона, и многоотводный фильтр, зависящий от дробной части запаздывания основного тона.

13. Система для обработки аудиосигнала, содержащая кодер для кодирования аудиосигнала и декодер, содержащий процессор, причем процессор содержит:

- преобразователь (100) области для преобразования частотного представления аудиосигнала в представление аудиосигнала во временной области; и

- гармонический постфильтр (104) для фильтрации представления аудиосигнала во временной области,

- при этом постфильтр основан на передаточной функции, содержащей числитель и знаменатель, при этом числитель содержит значение усиления, указываемое посредством информации усиления, и при этом знаменатель содержит целочисленную часть запаздывания основного тона, указываемую посредством информации запаздывания основного тона, и многоотводный фильтр, зависящий от дробной части запаздывания основного тона.

14. Система по п. 13, в которой кодер содержит модуль (402, 404, 406) вычисления запаздывания основного тона для вычисления целочисленной части и дробной части запаздывания основного тона и модуль (410, 412) вычисления усиления основного тона для вычисления значения усиления, и формирователь (414) кодированных сигналов для формирования кодированного сигнала (102), содержащего информацию запаздывания основного тона и информацию усиления.

15. Способ обработки аудиосигнала, содержащий способ кодирования аудиосигнала и способ декодирования, содержащий этапы, на которых:

- преобразуют (100) частотное представление аудиосигнала в представление аудиосигнала во временной области; и

- фильтруют представление аудиосигнала во временной области с использованием гармонического постфильтра (104), при этом постфильтр основан на передаточной функции, содержащей числитель и знаменатель, при этом числитель содержит значение усиления, указываемое посредством информации усиления, и при этом знаменатель содержит целочисленную часть запаздывания основного тона, указываемую посредством информации запаздывания основного тона, и многоотводный фильтр, зависящий от дробной части запаздывания основного тона.

16. Машиночитаемый носитель, имеющий сохраненную на нем компьютерную программу для осуществления способа по п. 12, когда компьютерная программа выполняется на компьютере или процессоре.

17. Машиночитаемый носитель, имеющий сохраненную на нем компьютерную программу для осуществления способа по п. 15, когда компьютерная программа выполняется на компьютере или процессоре.



 

Похожие патенты:

Изобретение относится к области обработки аудиосигналов. Технический результат заключается в повышении эффективности обработки аудиосигналов.

Изобретение относится к области обработки сигналов. Технический результат заключается в повышении качества генерируемого комфортного шума кадров тишины.

Изобретение относится к средствам стереофонического кодирования и декодирования аудиосигналов. Технический результат заключается в повышении эффективности использования полосы частот.

Изобретение относится к средствам для контекстного энтропийного кодирования выборочных значений спектральной огибающей. Технический результат заключается в повышении эффективности кодирования.

Изобретение относится к средствам для кодирования и декодирования аудио. Технический результат заключается в повышении эффективности кодирования и декодирования.

Изобретение относится к средствам для воспроизведения акустической сцены. Технический результат заключается в повышении эффективности обработки аудиосигнала.

Изобретение относится к средствам для кодирования и декодирования аудиосигналов. Технический результат заключается в повышении качества кодированного аудиосигнала.

Изобретение относится к области кодирования и декодирования аудиосигналов. Технический результат – повышение качества звучания масштабированной по времени версии входного аудиосигнала.

Изобретение относится к структуре данных о волновой форме и предназначено для хранения данных о волновой форме и извлечения данных о волновой форме. Технический результат – обеспечение возможности задавать разлиные размеры кадров в зависимости от музыкальных звуков.

Изобретение относится к средствам для кодирования и декодирования. Технический результат заключается в повышении эффективности кодирования.

Изобретение относится к кодированию и декодированию звуковых сигналов. Технический результат – повышение точности восстановления звуковых сигналов. Устройство содержит интерфейс приема для приема множества кадров, буфер задержки для хранения выборок звукового сигнала, блок выбора выборок для выбора множества выбранных выборок звукового сигнала и процессор выборок для обработки выбранных выборок звукового сигнала для получения восстановленных выборок звукового сигнала из восстановленного звукового сигнала. Блок выбора выборок конфигурируется для выбора, если текущий кадр принимается с помощью интерфейса приема и если текущий кадр не поврежден, множества выбранных выборок звукового сигнала из выборок звукового сигнала, сохраненных в буфере задержки, в зависимости от информации отставания основного тона, содержащейся в текущем кадре. Кроме того, блок выбора выборок конфигурируется для выбора, если текущий кадр не принимается с помощью интерфейса приема или если текущий кадр поврежден, множества выбранных выборок звукового сигнала из выборок звукового сигнала, сохраненных в буфере задержки, в зависимости от информации отставания основного тона, содержащейся в другом кадре, принятом ранее с помощью интерфейса приема. 3 н. и 10 з.п. ф-лы, 17 ил., 2 табл.

Изобретение относится к обработке аудиосигналов. Технический результат – обеспечение выравнивания визуальных и акустических изображений. Система содержит модуль разложения, процессор сигналов и выходной интерфейс. Модуль разложения выполнен с возможностью приема двух или более входных аудиосигналов, а также с возможностью генерации прямого компонентного сигнала, с возможностью генерации диффузного компонентного сигнала, с возможностью приема прямого компонентного сигнала, диффузного компонентного сигнала и информации направления, с возможностью генерации одного или более обработанных диффузных сигналов в зависимости от диффузного компонентного сигнала. Для каждого выходного аудиосигнала из одного или более выходных аудиосигналов процессор сигналов выполнен с возможностью определения, в зависимости от направления прихода, прямого коэффициента усиления, причем процессор сигналов выполнен с возможностью применения упомянутого прямого коэффициента усиления к прямому компонентному сигналу для получения обработанного прямого сигнала, и процессор сигналов выполнен с возможностью объединения упомянутого обработанного прямого сигнала и одного из одного или более обработанных диффузных сигналов для генерации упомянутого выходного аудиосигнала. Выходной интерфейс выполнен с возможностью вывода одного или более выходных аудиосигналов. 5 н. и 11 з.п. ф-лы, 21 ил.

Изобретение относится к средствам для временного согласования данных обработки на основе квадратурного зеркального фильтра. Технический результат заключается в уменьшении задержки при кодировании и декодировании звука. Определяют восстановленный кадр звукового сигнала по блоку доступа принимаемого потока данных. Причем блок доступа содержит данные о форме сигнала и метаданные. Причем данные о форме сигнала и метаданные связаны с одним и тем же восстановленным кадром звукового сигнала. Генерируют множество форм субполосных сигналов по данным о форме сигнала. Генерируют декодированные метаданные по метаданным. Согласовывают по времени множества форм субполосных сигналов и декодированных метаданных. Генерируют восстановленный кадр звукового сигнала по согласованному по времени множеству форм субполосных сигналов и декодированных метаданных. 5 н. и 32 з.п. ф-лы, 6 ил., 1 табл.

Изобретение относится к обработке аудиосигнала, включающего аудиокадры. Технический результат – удаление разрывов между отфильтрованными аудиокадрами без потенциальных искажений в отфильтрованном аудиосигнале. Данный способ позволяет обрабатывать аудиосигнал, удалять разрыв между отфильтрованным прошедшим кадром и отфильтрованным текущим кадром аудиосигнала, с использованием фильтрации с линейным предсказанием. 5 н. и 9 з.п. ф-лы, 8 ил.

Изобретение относится к средствам для кодирования звуковых сигналов. Технический результат заключается в уменьшении сложности кодирования путем оценки искажения квантования в транспонированном векторном пространстве. Формируют по меньшей мере один вектор параметров, определяющих по меньшей мере один звуковой сигнал. Сортируют компоненты упомянутого по меньшей мере одного вектора параметров согласно порядку убывания на основе абсолютных значений компонентов упомянутого по меньшей мере одного вектора параметров для формирования по меньшей мере одного ассоциированного упорядоченного вектора параметров. Выбирают из списка ведущих классов по меньшей мере один потенциальный кодовый вектор. Определяют расстояние между по меньшей мере одним потенциальным кодовым вектором и по меньшей мере одним упорядоченным вектором параметров. Определяют по меньшей мере один ведущий класс, связанный с потенциальным кодовым вектором, который формирует наименьшее ассоциированное расстояние. Сортируют по меньшей мере один ведущий класс путем обратного упорядочения по убыванию на основе абсолютных значений компонентов упомянутого по меньшей мере одного вектора параметров. 5 н. и 12 з.п. ф-лы, 6 ил.

Изобретение относится к средствам для маскирования ошибок при кодировании/декодировании аудио. Технический результат заключается в восстановлении качества звучания без увеличения алгоритмической задержки, когда происходит потеря пакета при кодировании аудио. Устройство передачи аудиосигнала для кодирования аудиосигнала включает в себя блок кодирования аудио, который кодирует аудиосигнал, и блок кодирования побочной информации, который вычисляет и кодирует побочную информацию из прогнозного сигнала. Устройство приема аудиосигнала для декодирования аудиокода и вывода аудиосигнала включает в себя буфер аудиокода, который обнаруживает потерю пакета на основе состояния приема аудиопакета, блок декодирования аудиопараметров, который декодирует аудиокод, когда аудиопакет принят корректно, блок декодирования побочной информации, который декодирует код побочной информации, когда аудиопакет принят корректно, блок сбора побочной информации, который собирает побочную информацию, получаемую посредством декодирования кода побочной информации, блок обработки отсутствующих аудиопараметров и блок синтеза аудио. 2 н. и 1 з.п. ф-лы, 43 ил.

Изобретение относится к средствам для декодирования битового аудиопотока с метаданными расширенного копирования спектральной полосы. Технический результат заключается в повышении эффективности декодирования. Принимают по меньшей мере один блок кодированного битового аудиопотока. Демультиплексируют часть по меньшей мере одного блока кодированного битового аудиопотока. Декодируют часть по меньшей мере одного блока кодированного битового аудиопотока. Причем по меньшей мере один блок кодированного битового аудиопотока включает в себя: заполняющий элемент с идентификатором, указывающим начало заполняющего элемента, и заполняющие данные после идентификатора. Причем заполняющие данные включают в себя: по меньшей мере один флаг, идентифицирующий, должна ли быть выполнена обработка расширенного копирования спектральной полосы для аудиосодержимого по меньшей мере одного блока кодированного битового аудиопотока; и метаданные расширенного копирования спектральной полосы. 2 н. и 22 з.п. ф-лы, 7 ил., 3 табл.

Изобретение относится к декодированию аудио и более конкретно к выбору процедуры маскирования потери пакета при декодировании аудио. Технический результат – обеспечение высокого качества восстановленного звукового сигнала после потери пакета. В соответствии с примерным вариантом осуществления данного изобретения раскрывается способ и устройство для такового, чтобы выбирать процедуру маскирования потери пакета для потерянного аудиокадра принятого звукового сигнала. Способ для выбора процедуры маскирования потери пакета содержит обнаружение типа аудио принятого аудиокадра и определение процедуры маскирования потери пакета на основании типа аудио. В способе обнаружение типа аудио содержит определение устойчивости огибающей спектра сигналов принятых аудиокадров. 3 н. и 15 з.п. ф-лы, 8 ил.

Изобретение относится к векторному квантованию (VQ), выполняемому кодером. Технический результат изобретения заключается в возможности кодера удерживать сложность поиска на разумном уровне, обеспечивая возможность кодеру применять цикл увеличенной точности только, когда это может быть необходимо, посредством анализа того, потребуется ли в наступающем внутреннем цикле внутренний цикл с более высокой точностью, нежели точность, используемая в текущее время. Способ для поиска формы пирамидального векторного квантователя, PVQ, при этом PVQ берет целевой вектор x в качестве ввода и выводит вектор y посредством итеративного добавления единичных импульсов во внутреннем цикле поиска по размерности. Определение текущего вектора y, до входа в следующий внутренний цикл поиска по размерности для добавления единичного импульса, на основе максимальной амплитуды импульса, , необходима ли большая, чем текущая битовая длина слова, чтобы представлять , способом без потерь в наступающем внутреннем цикле по размерности. Переменная относится к накопленной энергии вектора y. 3 н. и 15 з.п. ф-лы, 12 ил., 3 табл.

Изобретение относится к средствам для формирования расширенного сигнала с использованием заполнения независимым шумом. Технический результат заключается в повышении качества кодированного аудиосигнала. Отображают исходный участок спектра входного сигнала на целевой участок в участке спектра расширения. Формируют первые значения шума для участка заполнения шумом в исходном участке спектра входного сигнала и для формирования вторых значений шума для шумового участка в целевом участке. Причем вторые значения шума являются декоррелированными от первых значений шума. Формируют вторые значения шума для шумового участка в целевом участке, при этом вторые значения шума являются декоррелированными от первых значений шума в исходном участке спектра, причем первые значения шума в исходном участке спектра не являются результатом операции заполнения шумом. 6 н. и 8 з.п. ф-лы, 20 ил.
Наверх