Устройство и способ обработки речевого/аудио сигнала

Авторы патента:


Устройство и способ обработки речевого/аудио сигнала
Устройство и способ обработки речевого/аудио сигнала
Устройство и способ обработки речевого/аудио сигнала
Устройство и способ обработки речевого/аудио сигнала
Устройство и способ обработки речевого/аудио сигнала
Устройство и способ обработки речевого/аудио сигнала
Устройство и способ обработки речевого/аудио сигнала
Устройство и способ обработки речевого/аудио сигнала
Устройство и способ обработки речевого/аудио сигнала

 


Владельцы патента RU 2585987:

ХУАВЕЙ ТЕКНОЛОДЖИЗ КО., ЛТД. (CN)

Изобретение относится к средствам обработки речевого/аудио сигнала. Технический результат заключается в обеспечении комфортного воспроизведения звука во время переключения полосы пропускания речевых/аудио сигналов. Способ обработки речевого/аудио сигнала включает в себя этапы, на которых при переключении полосы пропускания речевого/аудио сигнала получают исходный высокочастотный сигнал, соответствующий текущему кадру речевого/аудио сигнала; получают глобальный параметр усиления исходного высокочастотного сигнала во временной области; выполняют обработку взвешивания для отношения энергий и глобального параметра усиления во временной области и используют полученное взвешенное значение в качестве предсказанного глобального параметра усиления, причем отношение энергий представляет собой отношение между энергией архивного кадра высокочастотного сигнала во временной области и энергией текущего кадра исходного высокочастотного сигнала; корректируют исходный высокочастотный сигнал с помощью предсказанного глобального параметра усиления для получения скорректированного высокочастотного сигнала во временной области; и синтезируют текущий кадр узкополосного сигнала во временной области и скорректированный высокочастотный сигнал во временной области и выводят синтезированный сигнал. 4 н. и 19 з.п. ф-лы, 10 ил.

 

Область техники, к которой относится изобретение

Настоящее изобретение относится к области технологий обработки цифрового сигнала и, более конкретно, к устройству и способу обработки речевого/аудио сигнала.

Уровень техники

В области цифровой связи, передачи голосового сигнала, изображения, аудио и видео контента широко используются, например, вызов абонента по мобильному телефону, осуществление аудио/видео конференции, при трансляции телевизионной программы и мультимедийного развлекательного контента. Аудио сигнал оцифровывается и передается от одного терминала к другому терминалу с использованием сети звуковой связи. Терминал в данном документе может представлять собой мобильный телефон, цифровой телефонный терминал или звуковой терминал любого другого типа, где цифровой телефонной терминал является, например, VoIP-телефоном, ISDN телефоном, компьютером или телефонным аппаратом кабельной связи. С целью уменьшения величины использования ресурсов, которые используются для передачи или хранения речевого/аудио сигнала, речевой/аудио сигнал сжимается на конце передачи, и затем передается на приемный конец, и на приемном конце речевой/аудио сигнал восстанавливается посредством выполнения процесса разуплотнения, и воспроизводится.

При осуществлении многоскоростного кодирования речевого/аудио сигнала, вследствие наличия различных сетевых статусов, сеть отсекает битовые потоки на разных скоростях передачи, где потоки битов передаются от кодера в сеть, и в декодере усеченные битовые потоки декодируются в речевые/аудио сигналы с различной шириной полосы пропускания. В результате, выходные речевые/аудио сигналы переключаются между различными значениями полосы пропускания.

Внезапное переключение между сигналами различных полос пропускания вызывает очевидный слуховой дискомфорт в ушах пользователя. Кроме того, вследствие выполнения обновления состояний фильтров во время частотно-временного преобразования или временного-частотного преобразования, как правило, требуется использование параметра между последовательными кадрами, когда некоторый надлежащий процесс обработки не выполняется во время переключения полосы пропускания, что может вызвать сбой во время обновления этих состояний, что вызывает определенные резкие изменения энергии и ухудшение качества воспроизведения звука.

Сущность изобретения

Целью вариантов осуществления настоящего изобретения является предоставление устройства и способа обработки речевого/аудио сигнала для обеспечения комфортного воспроизведения звука во время переключения полосы пропускания речевых/аудио сигналов.

В соответствии с первым аспектом настоящего изобретения способ обработки речевого/аудио сигнала включает в себя:

при переключении речевого/аудио сигнала из широкополосного частотного сигнала в узкополосный частотный сигнал, получение исходного высокочастотного сигнала, соответствующего текущему кадру речевого/аудио сигнала;

получение значения глобального параметра усиления высокочастотного сигнала во временной области в соответствии с параметром наклона спектра текущего кадра речевого/аудио сигнала и корреляции между текущим кадром узкополосного частотного сигнала и хронологическим кадром узкополосного частотного сигнала;

коррекцию исходного высокочастотного сигнала использованием глобального параметра усиления во временной области для получения скорректированного высокочастотного сигнала во временной области; и

синтезирование текущего кадра узкополосного сигнала во временной области и скорректированного высокочастотного сигнала во временной области и выработку синтезированного сигнала.

В первом возможном способе реализации первого аспекта, в котором получение глобального параметра усиления высокочастотного сигнала во временной области в соответствии с параметром наклона спектра текущего кадра речевого/аудио сигнала и корреляции между текущим кадром узкополосного сигнала и хронологическим кадром узкополосного сигнала содержит:

классификацию текущего кадра речевого/аудио сигнала как первый тип сигнала или второй тип сигнала в соответствии с параметром наклона спектра текущего кадра речевого/аудио сигнала и корреляции между текущим кадром узкополосного сигнала и хронологическим кадром узкополосного частотного сигнала;

когда текущий кадр речевого/аудио сигнала является первым типом сигнала, ограничение параметра наклона спектра до величины менее чем или равной первому заранее заданному значению для получения предельного значения параметра наклона спектра;

когда текущий кадр речевого/аудио сигнала является вторым типом сигнала, ограничение параметра наклона спектра значением в первом диапазоне для получения предельного значения параметра наклона спектра; и

использование предельного значения параметра наклона спектра в качестве глобального параметра усиления высокочастотного сигнала во временной области.

Со ссылкой на первый возможный способ реализации первого аспекта, второй возможный способ реализации, в котором, первый тип сигнала является щелевым сигналом и второй тип сигнала является нещелевым сигналом; когда параметр tilt>5 наклона спектра и параметр cor корреляции меньше заданного значения, то узкополосный сигнал классифицируется как щелевой сигнал, остальные как нещелевые сигналы; первое заданное значение равно 8; и первый заданный диапазон равен [0.5, 1].

Со ссылкой на содержание первого аспекта, первого возможного способа реализации первого аспекта и второго возможного способа реализации первого аспекта, в третьем возможном способе реализации, в котором, коррекция исходного высокочастотного сигнала с помощью глобального параметра усиления во временной области для получения скорректированного высокочастотного сигнала во временной области содержит:

выполнение весовой обработки соотношения энергии и глобального параметра усиления во временной области и использование полученного взвешенного значения в качестве предсказанного глобального параметра усиления, в котором соотношение энергии является соотношением между энергией хронологического кадра высокочастотного сигнала во временной области и энергией текущего кадра исходного высокочастотного сигнала; и

коррекцию исходного высокочастотного сигнала с помощью предсказанного глобального параметра усиления.

Со ссылкой на описание первого аспекта, первого возможного способа реализации первого аспекта и второго возможного способа реализации первого аспекта, четвертый возможный способ реализации дополнительно содержит:

получение параметра огибающей во временной области, соответствующего исходному высокочастотному сигналу, в котором

коррекцию исходного высокочастотного сигнала с помощью глобального параметра усиления во временной области содержит:

коррекцию исходного высокочастотного сигнала с помощью параметра огибающей во временной области и глобального параметра усиления во временной области.

В соответствии со вторым аспектом настоящего изобретения предложен способ обработки речевого/аудио сигнала, который включает в себя:

когда речевой/аудио сигнал переключает полосу пропускания, получение исходного высокочастотного сигнала, соответствующего текущему кадру речевого/аудио сигнала;

получение значения глобального коэффициента усиления временной области исходного высокочастотного сигнала;

выполнение процедуры взвешивания соотношения энергии и глобального параметра усиления во временной области и использование полученного взвешенного значения в качестве предсказанного глобального параметра усиления, где соотношение энергии является соотношением между энергией хронологического кадра высокочастотного сигнала во временной области и энергией текущего кадра исходного высокочастотного сигнала;

коррекцию исходного высокочастотного сигнала посредством использования предсказанного глобального параметра усиления для получения скорректированного высокочастотного сигнала во временной области; и

синтезирование текущего кадра узкополосного сигнала во временной области и скорректированного высокочастотного сигнала во временной области и выработка синтезированного сигнала.

В первом возможном способе реализации второго аспекта, в котором переключение полосы пропускания является переключением из широкополосного частотного сигнала на узкополосный сигнал и получение глобального параметра усиления во временной области исходного высокочастотного сигнала содержит:

получение глобального параметра усиления высокочастотного сигнала во временной области в соответствии с параметром наклона спектра текущего кадра речевого/аудио сигнала и корреляции между текущим кадром узкополосного частотного сигнала и хронологическим кадром узкополосного частотного сигнала.

Со ссылкой на первый возможный способ реализации первого аспекта во втором возможном способе реализации, в котором, получение глобального параметра усиления высокочастотного сигнала во временной области в соответствии с параметром наклона спектра текущего кадра речевого/аудио сигнала и корреляции между текущим кадром узкополосного частотного сигнала и хронологическим кадром узкополосного частотного сигнала содержит:

классификацию текущего кадра речевого/аудио сигнала в качестве первого типа сигнала или второго типа сигнала в соответствии с параметром наклона спектра текущего кадра речевого/аудио сигнала и соотношения между текущим кадром узкополосного частотного сигнала и хронологическим кадром узкополосного частотного сигнала;

когда текущий кадр речевого/аудио сигнала является первым типом сигнала, ограничивается параметр наклона спектра до величины менее чем или равной первому заранее заданному значению для получения предельного значения параметра наклона спектра;

когда текущий кадр речевого/аудио сигнала является вторым типом сигнала, ограничивается параметр наклона спектра значением в первом диапазоне для получения предельного значения параметра наклона спектра; и

использование предельного значения параметра наклона спектра в качестве глобального параметра усиления высокочастотного сигнала во временной области.

Со ссылкой на второй возможный способ реализации первого аспекта, в третьем возможном способе реализации, в котором, первый тип сигнала является щелевым сигналом и второй тип сигнала является нещелевым сигналом; когда параметр tilt>5 наклона спектра и параметр cor корреляции меньше заданного значения, то узкополосный сигнал классифицируется как щелевой, остальные как нещелевые; первое заданное значение равно 8; и первый заданный диапазон равен [0.5, 1].

В четвертом возможном способе реализации второго аспекта, в котором переключение полосы пропускания представляет собой переключение из широкополосного частотного сигнала на узкополосный сигнал и получение исходного высокочастотного сигнала, соответствующего текущему кадру речевого/аудио сигнала содержит:

предсказание высокочастотного сигнала возбуждения в соответствии с текущим кадром речевого/аудио сигнала;

предсказание коэффициента LPC высокочастотного сигнала; и

синтезирование высокочастотного сигнала возбуждения и коэффициента LPC высокочастотного сигнала для получения предсказанного высокочастотного сигнала.

В пятом возможном способе реализации согласно второму аспекту, в котором, переключение полосы пропускания представляет собой переключение из узкополосного частотного сигнала на широкополосный частотный сигнал и способ дополнительно содержит:

когда узкополосные сигналы текущего кадра речевого/аудио сигнала и предшествующий кадр речевого/аудио сигнала имеет заданную корреляцию, использование значения, полученного путем ослабления, в соответствии с размером шага, весового коэффициента alfa соотношения энергии, соответствующего предшествующему кадру речевого/аудио сигнала в качестве весового коэффициента соотношения энергии, соответствующего текущему аудио кадру, в котором затухание выполняется покадрово, пока величина alfa не будет равно 0.

В соответствии с третьим аспектом настоящего изобретения, устройство обработки речевого/аудио сигнал включает в себя:

блок предсказания, выполненный с возможностью: когда речевой/аудио сигнал переключает с широкополосного частотного сигнала в узкополосной частотный сигнал, получать исходный высокочастотный сигнал, соответствующий текущему кадру речевого/аудио сигнала;

блок получения параметра, выполненный с возможностью получать глобальный параметр усиления высокочастотного сигнала во временной области в соответствии с параметром наклона спектра текущего кадра речевого/аудио сигнала и корреляцией между текущим кадром узкополосного частотного сигнала и хронологическим кадром узкополосного частотного сигнала;

корректирующий блок, выполненный с возможностью корректировать исходный высокочастотный сигнал с помощью предсказанного глобального параметра усиления для получения скорректированного высокочастотного сигнала во временной области; и

синтезирующий блок, выполненный с возможностью синтезировать текущий кадр узкополосного частотного сигнала во временной области и скорректированный высокочастотный сигнал во временной области и вырабатывать синтезированный сигнал.

В первом возможном способе реализации согласно третьему аспекту, в котором блок получения параметра содержит:

блок классификации, выполненный с возможностью классифицировать текущий кадр речевого/аудио сигнала в качестве первого типа сигнала или второго типа сигнала в соответствии с параметром наклона спектра текущего кадра речевого/аудио сигнала и корреляции между текущим кадром речевого/аудио сигнала и хронологическим кадром узкополосного частотного сигнала;

первый ограничивающий блок, выполненный с возможностью: если текущий кадр речевого/аудио сигнала является первым типом сигнала, ограничение параметра наклона спектра до величины менее чем или равной первому заранее заданному значению для получения значения предельного параметра наклона спектра и использование предельного значения параметра наклона спектра в качестве глобального параметра усиления высокочастотного сигнала во временной области; и

второй ограничивающий блок, выполненный с возможностью: если текущий кадр речевого/аудио сигнала является вторым типом сигнала, ограничение параметра наклона спектра значением в первом диапазоне для получения предельного значения параметра наклона спектра и использование предельного значения параметра наклона спектра в качестве параметра глобального усиления высокочастотного сигнала во временной области.

Со ссылкой на первый возможный способ реализации согласно третьему аспекту, в соответствии со вторым возможным способом реализации, в котором, первый тип сигнала является щелевым сигналом и второй тип сигнала является нещелевым сигналом; когда параметр tilt>5 наклона спектра и параметр cor корреляции меньше заданного значения, узкополосный сигнал классифицируется как щелевой, остальные как нещелевые; первое заданное значение равно 8; и первый заданный диапазон равен [0.5, 1].

Со ссылкой на любой способ третьего аспекта, первый возможный способ реализации согласно третьему аспекту и второй возможный способ реализации согласно третьему аспекту, третий возможный способ реализации дополнительно содержит:

блок весовой обработки, выполненный с возможностью выполнять весовую обработку соотношения энергии и глобального параметра усиления во временной области и использовать полученного взвешенное значение в качестве предсказанного глобального параметра усиления, в котором соотношение энергии является соотношением между энергией хронологического кадра высокочастотного сигнала во временной области и энергией текущего кадра исходного высокочастотного сигнала, в котором

корректирующий блок выполнен с возможностью корректировать исходный высокочастотный сигнал с помощью предсказанного глобального параметра усиления для получения скорректированного высокочастотного сигнала во временной области.

Со ссылкой на любой способ третьего аспекта, первый возможный способ реализации согласно третьему аспекту и второй возможный способ реализации согласно третьему аспекту, четвертый возможный способ реализации, в котором

блок получения параметра дополнительно выполнен с возможностью получать параметр огибающей во временной области, соответствующий исходному высокочастотному сигналу; и

корректирующий блок выполнен с возможностью корректировать исходный высокочастотный сигнал с помощью параметра огибающей во временной области и глобального параметра усиления во временной области.

В соответствии с четвертым аспектом настоящего изобретения, устройство обработки речевого/аудио сигнала включает в себя:

блок получения, выполненный с возможностью: когда речевой/аудио сигнал переключает полосу пропускания, получать исходный высокочастотный сигнал, соответствующий текущему кадру речевого/аудио сигнала;

блок получения параметра, выполненный с возможностью получать глобальный параметр усиления во временной области, соответствующий исходному высокочастотному сигналу;

блок взвешенной обработки, выполнен с возможностью выполнять взвешенную обработку соотношения энергии и глобального параметра усиления во временной области, и использовать полученное взвешенное значение в качестве предсказанного глобального параметра усиления, где соотношение энергии является соотношением между энергией хронологического высокочастотного сигнала во временной области и энергией текущего кадра исходного высокочастотного сигнала;

корректирующий блок, выполненный с возможностью корректировать исходный высокочастотный сигнал с помощью предсказанного глобального параметра усиления для получения скорректированного высокочастотного сигнала во временной области; и

синтезирующий блок, выполненный с возможностью синтезировать текущий кадр узкополосного частотного сигнала во временной области и скорректированный высокочастотный сигнал во временной области и вырабатывать синтезированный сигнал.

В первом возможном способе реализации согласно четвертому аспекту, в котором переключение полосы пропускания представляет собой переключение из широкополосного частотного сигнала на узкополосный частотный сигнал и блок получения параметра содержит:

блок получения глобального параметра усиления, выполненный с возможностью получать глобальный параметр усиления высокочастотного сигнала во временной области в соответствии с параметром наклона спектра текущего кадра речевого/аудио сигнала и корреляцию между текущим кадром речевого/аудио сигнала и хронологическим кадром узкополосного частотного сигнала.

Со ссылкой на первый возможный способ реализации четвертого аспекта, в соответствии со вторым возможным способом реализации, в котором блок получения глобального параметра усиления содержит:

блок классификации, выполненный с возможностью классифицировать текущий кадр речевого/аудио сигнала в качестве первого типа сигнала или второго типа сигнала в соответствии с параметром наклона спектра текущего кадра речевого/аудио сигнала и корреляции между текущим кадром речевого/аудио сигнала и хронологическим кадром узкополосного частотного сигнала;

первый ограничивающий блок, выполненный с возможностью: когда текущий кадр речевого/аудио сигнала является первым типом сигнала, ограничивать параметр наклона спектра до величины менее чем или равной первому заранее заданному значению, чтобы получить предельное значение параметра наклона спектра и использовать предельное значение параметра наклона спектра в качестве глобального параметра усиления высокочастотного сигнала во временной области; и

второй ограничивающий блок, выполненный с возможностью: если текущий кадр речевого/аудио сигнала является вторым типом сигнала ограничивать параметр наклона спектра значением в первом диапазоне, чтобы получить предельное значение параметра наклона спектра и использовать предельное значение параметра наклона спектра в качестве глобального параметра усиления высокочастотного сигнала во временной области.

Со ссылкой на второй возможный способ реализации четвертого аспекта, третий возможный способ реализации, в котором первый тип сигнала является щелевым сигналом и второй тип сигнала является нещелевым сигналом; когда параметр tilt>5 наклона спектра и параметр cor корреляции меньше заданного значения, то узкополосный частотный сигнала классифицируется как щелевой, остальные как нещелевые; первое заданное значение равно 8; и первый заданный диапазон равен [0.5, 1].

Со ссылкой на любой способ четвертого аспекта, первый возможный способ реализации четвертого аспекта и второй возможный способ реализации четвертого аспекта, в четвертом возможном способе реализации, в котором переключение полосы пропускания переключения представляет собой переключения из широкополосного частотного сигнала в узкополосный частотный сигнал и устройство дополнительно содержит:

блок получения огибающей во временной области, выполненный с возможностью использовать серию заданных значений как параметр огибающей высокочастотного сигнала во временной области текущего кадра речевого/аудио сигнала; и

корректирующий блок выполнен с возможностью корректировать исходный высокочастотный сигнал с помощью параметра огибающей во временной области и предсказанного глобального параметра усиления для получения скорректированного высокочастотного сигнала во временной области.

Со ссылкой на любой способ четвертого аспекта, первой возможный способ реализации четвертого аспекта и второй возможный способ реализации четвертого аспекта, в пятом возможном способе реализации, в котором получающий блок содержит:

блок получения сигнала возбуждения, выполненный с возможностью предсказывать сигнал возбуждения высокочастотного сигнала в соответствии с текущим кадром речевого/аудио сигнала;

блок получения коэффициента LPC, выполненный с возможностью предсказывать коэффициент LPC высокочастотного сигнала; и

синтезирующий блок, выполненный с возможностью синтезировать сигнал возбуждения высокочастотного сигнала и коэффициента LPC высокочастотного сигнала для получения предсказанного высокочастотного сигнала.

Со ссылкой на любой способ четвертого аспекта, первый возможный способ реализации четвертого аспекта и второй возможный способ реализации четвертого аспекта, в шестом возможном способе реализации, в котором переключение полосы пропускания представляет собой переключение из узкополосного частотного сигнала в широкополосный частотный сигнал и устройство дополнительно содержит:

блок установки весового коэффициента, выполненный с возможностью: когда узкополосные сигналы текущего кадра речевого/аудио сигнала и предшествующий кадр речевого/аудио сигнала имеет заданную корреляцию, использовать значение, полученное путем ослабления, в соответствии с размером шага, коэффициент взвешивания alfa соотношения энергии, соответствующий предшествующему кадру речевого/аудио сигнала в качестве весового коэффициента соотношения энергии, соответствующего текущему аудио кадру, в котором затухание выполняется покадрово до тех пор, пока величина alfa не будет равна 0.

В вариантах осуществления настоящего изобретения при переключении между широкополосным частотным диапазоном и узкополосным частотным диапазоном, высокочастотный сигнал корректируется таким образом, чтобы осуществить плавный переход высокочастотного сигнала между широкополосным частотным диапазоном и узкополосным частотным диапазоном, таким образом эффективно устраняя слуховой дискомфорт, вызванный переключением между широкополосным частотным диапазоном и узкополосным частотным диапазоном; дополнительно, поскольку алгоритм переключения полосы пропускания и алгоритм кодирования/декодирования высокочастотного сигнала до переключения находятся в одном домене сигнала, что обеспечивает не только отсутствие дополнительной задержки, но и простоту использования алгоритма, что также обеспечивает надлежащие характеристики выходного сигнала.

Краткое описание чертежей

Далее приводится краткое описание технических решений в вариантах осуществления настоящего изобретения со ссылкой на прилагаемые чертежи, необходимые для описания вариантов осуществления или предшествующего уровня техники. Очевидно, приведенные ниже сопровождающие чертежи показывают только некоторые варианты осуществления настоящего изобретения, и специалисты в этой области техники все еще могут получить другие чертежи, используя данные прилагаемые чертежи без творческих усилий.

Фиг. 1 представляет собой схематическую блок-схему последовательности операций варианта осуществления способа обработки речевого/аудио сигнала в соответствии с настоящим изобретением;

Фиг. 2 представляет собой схематическую блок-схему алгоритма другого варианта осуществления способа обработки речевого/аудио сигнала в соответствии с настоящим изобретением;

Фиг. 3 представляет собой схематическую блок-схему алгоритма другого варианта осуществления способа обработки речевого/аудио сигнала в соответствии с настоящим изобретением;

Фиг. 4 представляет собой схематическую блок-схему алгоритма другого варианта осуществления способа обработки речевого/аудио сигнала в соответствии с настоящим изобретением;

Фиг. 5 является структурной схемой варианта осуществления устройства обработки речевого/аудио сигнала в соответствии с настоящим изобретением;

Фиг. 6 представляет собой схему варианта осуществления устройства обработки речевого/аудио сигнала в соответствии с настоящим изобретением;

Фиг. 7 является структурной схемой одного варианта осуществления блока получения параметра в соответствии с настоящим изобретением;

Фиг. 8 является структурной схемой варианта осуществления блока получения глобального параметра усиления в соответствии с настоящим изобретением;

Фиг. 9 представляет собой схематичное представление варианта осуществления получающего блока в соответствии с настоящим изобретением; и

Фиг. 10 представляет собой структурную схему другого варианта осуществления устройства обработки речевого/аудио сигнала в соответствии с настоящим изобретением.

Подробное описание вариантов осуществления

Далее ясно приводится описание технических решений в вариантах осуществления настоящего изобретения со ссылкой на прилагаемые чертежи. Очевидно, что описанные варианты осуществления являются всего лишь частью от всех возможных вариантов осуществления настоящего изобретения. Все другие варианты осуществления, полученные специалистами в данной области техники на основании вариантов осуществления настоящего изобретения без творческих усилий, должны находиться в рамках объема патентной защиты настоящего изобретения.

В области цифровой обработки сигналов аудиокодеки и видеокодеки широко применяются в различных электронных устройствах, таких как мобильный телефон, устройство беспроводной связи, электронный секретарь (PDA), карманный или портативный компьютер, приемник GPS/навигатор, камера, аудио/видео плеер, видеокамера, видеомагнитофон и контрольно-измерительное устройство. Как правило, этот тип электронного устройства включает в себя аудио кодер или аудио декодер, где аудио кодер или декодер могут быть непосредственно реализованы с помощью цифровой схемы или микросхемы, например, DSP (цифровой сигнальный процессор) или быть реализованы с помощью кода программного обеспечения, который управляет процессором при выполнении обработки в соответствии с программным кодом.

В предшествующем уровне техники, в связи с тем, что полосы пропускания речевых/аудио сигналов, передаваемые в сети, разные, в процессе передачи речевых/аудио сигналов полосы частот речевых/аудио сигналов часто меняются, и присутствует такое явление, как переключение узкополосного речевого/аудио сигнала в широкополосный речевой/аудио сигнал и переключение широкополосного речевого/аудио сигнала в узкополосный речевой/аудио сигнал. Такой процесс переключения речевого/аудио сигнала между высокочастотным и низкочастотным частотными диапазонами называют переключением полосы пропускания. Переключение полосы пропускания включает в себя переключение узкополосного частотного сигнала в широкополосный частотный сигнал и переключение широкополосного частотного сигнала в узкополосный частотный сигнал. Узкополосный частотный сигнал, упомянутый в настоящем изобретении, представляет собой речевой сигнал, который имеет только низкочастотную составляющую и высокочастотная составляющая отсутствует после повышающей дискретизации и низкочастотной фильтрации, в то время, как широкополосный частотный речевой/аудио сигнал имеет как низкочастотную составляющую сигнала, так и высокочастотную составляющую сигнала. Узкополосный частотный сигнал и широкополосный частотный сигнал относительны. Например, для узкополосного сигнала широкополосный сигнал является широкополосным сигналом; и для широкополосного сигнала сверх широкополосный сигнал является широкополосным частотным сигналом. Как правило, узкополосный сигнал является речевым/аудио сигналом, частота дискретизации которого равна 8 кГц; широкополосным сигнал является речевым/аудио сигналом, частота дискретизации которого равна 16 кГц; и сверх широкополосный сигнал является речевым/аудио сигналом, частота дискретизаций которого составляет 32 кГц.

Когда алгоритм кодирования/декодирования высокочастотного сигнала перед переключение выбирается между алгоритмами кодирования/декодирования в соответствии с различными типами сигналов, или когда алгоритм кодирования высокочастотного сигнала до переключения представляет собой алгоритм кодирования во временной области, чтобы обеспечить непрерывность выходных сигналов при переключении, алгоритм переключения хранится в домене сигнала для обработки, где домен сигнала является тем же самым, что и алгоритм кодирования/декодирования высокочастотного сигнала до переключения. То есть, когда используется алгоритм кодирования/декодирования высокочастотного сигнала во временной области до переключения, то используется алгоритм переключения во временной области в качестве алгоритма переключения; когда используется алгоритм кодирования/декодирования высокочастотного сигнала в частотной области до переключения, алгоритм переключения в частотной области используется в качестве алгоритма переключения. В предшествующем уровне техники, когда алгоритм расширения частотного диапазона во временной области используется до переключения, то аналогичная технология переключения во временной области не используется после переключения.

При кодировании речевого/аудио сигнала, обработка обычно выполняется с помощью кадра как блока. Входной текущий аудио кадр, который должен быть обработан, является текущим кадром речевого/звукового сигнала. Текущий кадр речевого/аудио сигнала включает в себя узкополосной частотный сигнал и высокочастотный сигнал, то есть, текущий кадр узкополосного частотного сигнала и текущий кадр высокочастотного сигнала. Любой кадр речевого/аудио сигнала перед текущим кадром высокочастотного сигнала является хронологическим кадром речевого/аудио сигнала, который также включает в себя хронологический кадр узкополосного частотного сигнала и хронологический кадр высокочастотного сигнала. Предшествующий кадр речевого/аудио сигнала текущего кадра речевого/аудио сигнала является предыдущим кадром речевого/аудио сигнала.

Как показано на фиг. 1, вариант осуществления способа обработки речевого/аудио сигнала согласно настоящему изобретению включает в себя:

S101: Когда речевой/аудио сигнал переключает полосу пропускания, получение исходного высокочастотного сигнала, соответствующего текущему кадру речевого/аудио сигнала.

Текущий кадр речевого/аудио сигнала включает в себя текущий кадр узкополосного частотного сигнала и текущий кадр высокочастотного сигнала во временной области. Переключение полосы частот включает в себя переключение с узкополосного частотного сигнала в широкополосной частотный сигнал и переключение с широкополосного частотного сигнала в узкополосный частотный сигнал. В случае переключения с узкополосного частотного сигнала в широкополосной частотный сигнал, текущий кадр речевого/аудио сигнала является текущим кадром широкополосного частотного сигнала, включающий в себя узкополосный частотный сигнал и высокочастотный сигнал, и исходный высокочастотный сигнал текущего кадра речевого/аудио сигнала является реальным сигналом и может быть получен непосредственно из текущего кадра речевого/аудио сигнала. В случае переключения из широкополосного частотного сигнала в узкополосный частотный сигнал, текущий кадр речевого/аудио сигнала является текущим кадром узкополосного частотного сигнала, где текущий кадр высокочастотного сигнала во временной области пуст, исходный высокочастотный сигнал текущего кадра речевого/аудио сигнала является предсказанным сигналом и высокочастотный сигнал, соответствующий текущему кадру узкополосного частотного сигнала, должен быть предсказан и использоваться в качестве исходного высокочастотного сигнала.

S102: Получение глобального параметра усиления во временной области, соответствующего исходному высокочастотному сигналу.

В случае переключения с узкополосного частотного сигнала на широкополосной частотный сигнал, глобальный параметр усиления высокочастотного сигнала временной области может быть получен декодированием. В случае переключения из широкополосного частотного сигнала в узкополосный частотный сигнал, глобальный параметр усиления высокочастотного сигнала во временной области может быть получен в соответствии с текущим кадром сигнала: глобальный параметр усиления высокочастотного сигнала во временной области получают в соответствии с параметром наклона спектра узкополосного частотного сигнала и корреляцией между текущим кадром узкополосного частотного сигнала и хронологическим кадром узкополосного частотного сигнала.

S103: Выполнение весовой обработки соотношения энергии и глобального параметра усиления временной области и использование полученного взвешенного значения как предсказанного глобального параметра усиления, где соотношение энергии является соотношением между энергией высокочастотного сигнала во временной области хронологического кадра речевого/аудио сигнала и энергией исходного высокочастотного сигнала текущего кадра речевого/аудио сигнала.

Хронологический кадр конечного выходного речевого/аудио сигнала используется в качестве хронологического кадра речевого/аудио сигнала, и исходный высокочастотный сигнал используется в качестве текущего кадра речевого/аудио сигнала. Коэффициент соотношения энергии Ratio=Esyn(-1)/Esyn_tmp, где Esyn(-1) представляет собой энергию выходного высокочастотного сигнала syn во временной области хронологического кадра, и Esyn_tmp представляет энергию исходного высокочастотного сигнала syn временной области, соответствующего текущего кадра.

Предсказанный глобальный параметр усиления gain=alfa*Ratio+beta*gain′, где gain′ является глобальным параметром усиления временной области, alfa+beta=1, и значения alfa и beta отличаются в зависимости от типов различных сигналов.

S104: корректировка исходного высокочастотного сигнала, используя предсказанный глобальный параметр усиления для получения скорректированного высокочастотного сигнала во временной области.

Корректировка относится к процессу умножения сигнала, то есть, исходный высокочастотный сигнал умножается на предсказанный глобальный параметр усиления. В другом варианте осуществления на этапе S102 получаются параметр огибающей во временной области и глобальный параметр усиления во временной области, которые соответствуют исходному высокочастотному сигналу; соответственно, на этапе S104 исходный высокочастотный сигнал корректируется с помощью параметра огибающей во временной области и предсказанного глобального параметра усиления для получения скорректированного высокочастотного сигнала во временной области; то есть предсказанный высокочастотный сигнал умножается на параметр огибающей во временной области и предсказанный параметр глобального усиления во временной области для получения скорректированного высокочастотного сигнала во временной области.

В случае переключения с узкополосного частотного сигнала на широкополосный частотный сигнал, параметр огибающей высокочастотного сигнала временной области может быть получен путем декодирования. В случае переключения из широкополосного частотного сигнала в узкополосный частотный сигнал, параметр огибающей высокочастотного сигнала временной области может быть получен в соответствии с текущим кадром сигнала: последовательности заранее определенных значений или параметр огибающей высокочастотного сигнала временной области хронологического кадра может быть использован в качестве параметра огибающей высокочастотного сигнала временной области текущего кадра речевого/аудио сигнала.

S105: синтезирование текущего кадра узкополосного частотного сигнала во временной области и скорректированного высокочастотного сигнала во временной области и выработка синтезированного сигнала.

В предшествующем варианте осуществления при переключении между широкополосным частотным диапазоном и узкополосным частотным диапазоном, высокочастотный сигнал корректируется таким образом, чтобы осуществить плавный переход высокочастотного сигнала между широкополосным частотным диапазоном и узкополосным частотным диапазоном, тем самым эффективно устраняя слуховой дискомфорт, вызванный переключением между широкополосным частотным диапазоном и узкополосным частотным диапазоном; дополнительно, поскольку алгоритм переключения полосы пропускания и алгоритм кодирования/декодирования высокочастотного сигнала до переключения находятся в одном и том же домене сигнала, что обеспечивает не только отсутствие дополнительной задержки, но и наличие простого алгоритма, что также обеспечивает надлежащие характеристики выходного сигнала.

Со ссылкой на фиг. 2 показан другой вариант способа обработки речевого/аудио сигнала согласно настоящему изобретению, который включает в себя:

S201: когда широкополосный частотный сигнал переключается в узкополосный частотный сигнал, предсказание предсказанного высокочастотного сигнала, соответствующего текущему кадру узкополосного частотного сигнала.

Когда широкополосный частотный сигнал переключается в узкополосный частотный сигнал, предшествующий кадр является широкополосным частотным сигналом и текущий кадр является узкополосным частотным сигналом. Этап предсказания предсказанного высокочастотного сигнала, соответствующего текущему кадру узкополосного частотного сигнала, включает в себя предсказание сигнала возбуждения высокочастотного сигнала текущего кадра речевого/аудио сигнала в соответствии с текущим кадром узкополосного частотного сигнала; предсказание LPC (кодирование с линейным предсказанием, кодирование с линейным предсказанием) коэффициента высокочастотного сигнала текущего кадра речевого/аудио сигнала; и синтезирование предсказанного сигнала возбуждения высокой частоты и коэффициента LPC, чтобы получить предсказанный высокочастотный сигнал syn_tmp.

В одном варианте осуществления, параметры, такие как период основного тона, алгебраическая кодовая книга и коэффициент усиления, могут быть извлечены из узкополосного частотного сигнала, и сигнал возбуждения высокой частоты предсказывается посредством дискретизации и фильтрации.

В другом варианте осуществления, выполняются операции, такие как повышающая дискретизация, низкочастотная фильтрация для получения абсолютного значения или среднеквадратичного значения, для обработки узкополосного частотного сигнала временной области или сигнала возбуждения во временной области с узкополосного частотного сигнала возбуждения во временной области, так, чтобы предсказать высокочастотный сигнал возбуждения.

Предсказание коэффициента LPC высокочастотного сигнала, коэффициент LPC высокочастотного сигнала хронологического кадра или серии заданных значений может быть использован в качестве коэффициента LPC текущего кадра; или различные способы предсказания могут быть использованы для различных типов сигналов.

S202: Получение параметра огибающей во временной области и глобального параметра усиления во временной области, которые соответствуют предсказанному высокочастотному сигналу.

Серия заданных значений может быть использована в качестве параметра огибающей высокочастотного сигнала временной области текущего кадра. Узкополосные сигналы могут быть классифицированы, как правило, на несколько типов, серия значений может быть установлена для каждого типа и группа заданных параметров огибающей во временной области может быть выбрана в соответствии с типами текущего кадра узкополосных сигналов; или группа значений огибающей во временной области может быть установлена, например, когда количество огибающих временной области равно М, заданные значения могут быть М 0.3536s. В этом варианте осуществления получение параметра огибающей во временной области является возможным, но не необходимым этапом.

Глобальный параметр усиления высокочастотного сигнала временной области получают в соответствии с параметром наклона спектра узкополосного частотного сигнала и корреляцией между текущим кадром узкополосного частотного сигнала и хронологическим кадром узкополосного частотного сигнала, который включает в себя следующие этапы в одном из вариантов осуществления:

S2021: классификация текущего кадра речевого/аудио сигнала в качестве первого типа сигнала или второго типа сигнала в соответствии с параметром наклона спектра текущего кадра речевого/аудио сигнала и корреляция между текущим кадром узкополосного частотного сигнала и хронологического кадра узкополосного частотного сигнала, где в одном варианте осуществления первый тип сигнала представляет собой щелевой сигнал, и второй тип сигнала является нещелевым сигналом; и когда параметр tilt>5 наклона спектра и параметр cor корреляции меньше заданного значения, то узкополосный частотный сигнал классифицируется как щелевой, и остальные, как нещелевые.

Параметр cor, показывающий корреляцию между текущим кадром узкополосного частотного сигнала и хронологическим кадром узкополосного частотного сигнала, может быть определен в соответствии с величиной соотношения энергии между сигналами одного и той же частотного диапазона, или может быть определен в соответствии с соотношением энергией между несколькими частотными диапазонами, или может быть вычислен по формуле, показывающая автокорреляцию или взаимную корреляцию между сигналами временной области или показывающая автокорреляцию или взаимную корреляцию между сигналами возбуждения во временной области.

S2022: когда текущий кадр речевого/аудио сигнала является первым типом сигнала, параметр наклона спектра ограничивается до менее чем или равным первому заранее заданному значению, чтобы получить предельное значение параметра наклона спектра и использовать предельное значение параметра наклона спектра как параметр глобального усиления высокочастотного сигнала во временной области. То есть, когда параметр наклона спектра текущего кадра речевого/аудио сигнала меньше или равен первой заданной величине, то исходное значение параметра наклона спектра хранится в качестве предельного значения параметра наклона спектра; когда параметр наклона спектра текущего кадра речевого/аудио сигнала больше, чем первое заранее определенное значение, то первое заданное значение используется в качестве предельного значения параметра наклона спектра.

Глобальный параметр gain′ усиления во временной области получают в соответствии со следующей формулой: , где tilt является параметром наклона спектра, и ∂1 является первым заранее заданным значением.

S202: когда текущий кадр речевого/аудио сигнала является вторым типом сигнала, параметр наклона спектра ограничивается до значения в первом диапазоне, чтобы получить предельное значение параметра наклона спектра и использовать предельное значение параметра наклона спектра как глобальный параметр усиления высокочастотного сигнала временной области. То есть, когда параметр наклона спектра текущего кадра речевого/аудио сигнала относится к первому диапазону, то исходное значение параметра наклона спектра сохраняется в качестве предельного значения параметра наклона спектра; когда параметр наклона спектра текущего кадра речевого/аудио сигнала больше, чем верхний предел первого диапазона, то верхний предел первого диапазона используется в качестве предельного значения параметра наклона спектра; когда параметр наклона спектра текущего кадра речевого/аудио сигнала меньше нижнего предела первого диапазона, то нижняя граница первого диапазона используется в качестве предельного значения параметра наклона спектра.

Глобальный параметр gain′ усиления во временной области получают в соответствии со следующей формулой: , где tilt является параметром наклона спектра и [a,b] является первым диапазоном.

В одном варианте осуществления, получаются параметр tilt наклона спектра узкополосного частотного сигнала и параметр cor, показывающий корреляцию между текущим кадром узкополосного частотного сигнала и хронологическим кадром узкополосного частотного сигнала; текущий кадр сигналов классифицируются на два типа, щелевой и нещелевой, в соответствии с tilt и cor; когда параметр tilt наклона спектра >5 и корреляционный параметр cor меньше заданного значения, то узкополосный частотный сигнал классифицируется как щелевой, остальные как нещелевые; величина наклона ограничивается только диапазоном значений от 0,5 < = tilt < = 1,0 и используется в качестве нещелевого глобального параметра усиления временной области, и наклон ограничивается диапазоном значений tilt < = 8,0 и используется в качестве щелевого глобального параметра усиления во временной области. Для щелевого, параметр наклона спектра может иметь любое значение больше, чем 5, и для нещелевого, параметр наклона спектра может иметь любое значение, меньшее или равное 5, и может быть больше, чем 5. Чтобы гарантировать факт того, что параметр наклона наклон спектра может быть использован как оценочный глобальный параметр усиления во временной области, величина наклона ограничена в пределах диапазона значений и затем использована в качестве глобального параметра усиления во временной области. То есть, когда tilt>8, то определяется, что tilt=8 используется в качестве щелевого глобального параметра усиления во временной области; когда tilt<0,5, то определяется, что tilt=0,5 или когда tilt>1,0, то определяется, что tilt=1,0 и 0,5 или 1,0 используется в качестве нещелевого глобального параметра усиления во временной области.

S203: Выполнение весовой обработки соотношения энергии и глобального параметра усиления временной области и использование полученного взвешенного значения как предсказанный глобальный параметр усиления, где соотношение энергии является соотношением между энергией высокочастотного сигнала временной области хронологического кадра речевого/аудио сигнала и энергией исходного высокочастотного сигнала текущего кадра речевого/аудио сигнала.

Выполняется вычисление величины соотношения энергии Ratio=Esyn(-1)/ Esyn_tmp, и взвешенное значение наклона и соотношения используются в качестве предсказанного глобального параметра усиления текущего кадра, то есть gain=alfa*Ratio+beta*gain′, где gain′ является глобальным параметром усиления временной области, alfa+beta=1, значения alfa и beta отличаются в зависимости от различных типов сигналов, Esyn(-1) представляет собой энергию окончательного выходного высокочастотного сигнала syn временной области хронологического кадра, и Esyn_tmp представляет энергию предсказанного высокочастотного сигнала syn во временной области текущего кадра.

S204: корректировка предсказанного высокочастотного сигнала с помощью параметра огибающей во временной области и предсказанного глобального параметра усиления для получения скорректированного высокочастотного сигнала во временной области.

Предсказанный высокочастотный сигнал умножается на параметр огибающей во временной области и предсказанный глобальный параметр усиления во временной области для получения высокочастотного сигнала во временной области.

В этом варианте осуществления параметр огибающей во временной области является возможным. Когда включается в состав только глобальный параметр усиления во временной области, предсказанный высокочастотный сигнал может быть откорректирован с помощью предсказанного глобального параметра усиления для получения скорректированного высокочастотного сигнала во временной области. То есть, предсказанный высокочастотный сигнал умножается на предсказанный глобальный параметр усиления для получения скорректированного высокочастотного сигнала во временной области.

S205: синтезирование текущего кадра узкополосного частотного сигнала во временной области и скорректированного высокочастотного сигнала во временной области и выработка синтезированного сигнала.

Энергия Esyn высокочастотного сигнала syn во временной области используется для предсказания глобального параметра усиления временной области следующего кадра. То есть, значению Esyn присваивается Esyn(-1).

В вышеприведенном варианте осуществления корректируется частотный диапазон узкополосного частотного сигнала в соответствии с широкополосным частотным сигналом, таким образом, чтобы осуществить плавный переход от высокочастотной части между широкополосным частотным диапазоном и узкополосным частотным диапазоном, тем самым эффективно устраняя слуховой дискомфорт, вызванный переключением между широкополосным частотным диапазоном и узкополосным частотным диапазоном; дополнительно, поскольку осуществляется соответствующая обработка кадра при переключении, появившийся недостаток в ходе обновления параметра и состояния косвенно устраняется. Поддерживая алгоритм переключения полосы пропускания и алгоритм кодирования/декодирования высокочастотного сигнала до переключения в том же домене сигнала, обеспечивается не только отсутствие дополнительной задержки, но и наличие простого алгоритма, что также обеспечивает надлежащие характеристики выходного сигнала.

На фиг. 3 показан другой вариант способа обработки речевого/аудио сигнала согласно настоящему изобретению, который включает в себя:

S301: Когда узкополосный частотный сигнал переключается на широкополосный частотный сигнал, получение текущего кадра высокочастотного сигнала.

Когда узкополосный частотный сигнал переключается на широкополосный частотный сигнал, предшествующий кадр является узкополосным частотным сигналом и текущий кадр является широкополосным частотным сигналом.

S302: Получение параметра огибающей во временной области и глобального параметра усиления временной области, которые соответствуют высокочастотному сигналу.

Параметр огибающей во временной области и глобальный параметр усиления временной области могут быть получены непосредственно из текущего кадра высокочастотного сигнала. Получение параметра огибающей во временной области является возможным этапом.

S303: Выполнение весовой обработки соотношения энергии и глобального параметра усиления временной области и использование полученного взвешенного значения как предсказанный глобальный параметр усиления, где соотношение энергии является соотношением между энергией высокочастотного сигнала во временной области хронологического кадра речевого/аудио сигнала и энергией исходного высокочастотного сигнала текущего кадра речевого/аудио сигнала.

Поскольку текущий кадр является широкополосным частотным сигналом, все параметры высокочастотного сигнала могут быть получены путем декодирования. Для того чтобы обеспечить плавный переход при переключении, глобальный параметр усиления временной области сглаживается следующим образом:

Выполняется вычисление соотношения энергии Ratio=Esyn(-1)/Esyn_tmp, где Esyn(-1) представляет собой энергию окончательного выходного высокочастотного сигнала syn временной области хронологического кадра, и Esyn_tmp представляет энергию высокочастотного сигнала syn временной области текущего кадра.

Взвешенное значение глобального параметра усиления временной области и Ratio, которые получают путем декодирования, используется в качестве предсказанного глобального параметра усиления текущего кадра, то есть gain=alfa*Ratio+beta*gain′, где gain′ является глобальным параметром усиления во временной области, alfa+beta=1 и значения alfa и beta отличаются в зависимости от различных типов сигналов.

Когда узкополосные сигналы текущего аудио кадра и предшествующий кадр речевого/аудио сигнала имеют заданную корреляцию, то значение, полученное путем ослабления, в соответствии с определенным размером шага, весовой коэффициент alfa соотношения энергии, соответствующий предшествующему кадру речевого/аудио сигнала, используется в качестве весового коэффициента соотношения энергии, соответствующего текущему аудио кадру, где осуществляется ослабление силы сигнала кадр за кадром, до тех пор, пока величина alfa не будет равна 0.

Когда узкополосные частотные сигналы последовательных кадров являются одним и тем же типом сигнала или корреляция между узкополосными частотными сигналами последовательных кадров удовлетворяет определенному условию, то есть, последовательные кадры имеют определенную корреляцию или типы сигналов последовательных кадров аналогичны, величина alfa ослабляется кадр за кадром в соответствии с определенным размером шага до тех пор, пока значение alfa будет равно 0; когда узкополосные частотные сигналы последовательных кадров не имеют никакой корреляции, alfa напрямую ослабляется до 0, то есть, текущий результат декодирования поддерживается без выполнения процедуры взвешивания или коррекции.

S304: Корректировка высокочастотного сигнала с помощью параметра огибающей во временной области и предсказанного глобального параметра усиления для получения скорректированного высокочастотного сигнала во временной области.

Корректировка представляет собой умножение высокочастотного сигнала на параметр огибающей во временной области и предсказанный параметр глобального усиления во временной области для получения скорректированного высокочастотного сигнала во временной области.

В этом варианте осуществления параметр огибающей во временной области является возможным. Когда используется только глобальный параметр усиления во временной области, высокочастотный сигнал может быть скорректирован с использованием предсказанного глобального параметра усиления для получения скорректированного высокочастотного сигнала во временной области. То есть, высокочастотный сигнал умножается на предсказанный глобальный параметр усиления для получения скорректированного высокочастотного сигнала во временной области.

S305: синтезирование текущего кадра узкополосного частотного сигнала во временной области и скорректированного высокочастотного сигнала во временной области и выработка синтезированного сигнала.

В вышеприведенном варианте осуществления высокочастотный частотный диапазон широкополосного частотного сигнала соответствующий узкополосному частотному сигналу, корректируется таким образом, чтобы осуществить плавный переход от высокочастотной части между широкополосным частотным диапазоном и узкополосным частотным диапазоном, тем самым эффективно устраняя слуховой дискомфорт вызванный переключением между широкополосным частотным диапазоном и узкополосным частотным диапазоном; дополнительно, поскольку выполняется соответствующая обработка кадра при переключении, недостаток, который возникает во время обновления параметра и состояния, косвенно устраняются. Поддерживая алгоритм переключения полосы пропускания и алгоритм кодирования/декодирования высокочастотный сигнал перед переключением в том же домене сигнала, не только обеспечивает отсутствие дополнительной задержки, но и наличие простого алгоритма, что также обеспечивает надлежащие характеристики выходного сигнала.

На фиг. 4 показан другой вариант способа обработки речевого/аудио сигнала согласно настоящему изобретению, который включает в себя:

S401: Когда речевой/аудио сигнал переключает из широкополосного частотного сигнала в узкополосный частотный сигнал, получение исходного высокочастотного сигнала, который соответствует текущему кадру речевого/аудио сигнала.

Когда широкополосный частотный сигнал переключается в узкополосный частотный сигнал, предшествующий кадр является широкополосным частотным сигналом и текущий кадр является узкополосным частотным сигналом. Этап предсказания исходного высокочастотного сигнала, который соответствует текущему кадру узкополосного частотного сигнала, включает в себя: предсказание сигнала возбуждения высокочастотного сигнала текущего кадра речевого/аудио сигнала в соответствии с текущим кадром узкополосного частотного сигнала; предсказание коэффициента LPC высокочастотного сигнала текущего кадра речевого/аудио сигнала; и синтезирование предсказанного сигнала возбуждения высокочастотного сигнала и коэффициента LPC, чтобы получить предсказанный высокочастотный сигнал syn_tmp.

В одном варианте осуществления, параметры, такие как, период основного тона, алгебраическая кодовая книга и коэффициент усиления, могут быть извлечены из узкополосного частотного сигнала, и сигнал возбуждения высокочастотного сигнала предсказывается посредством выполнения повышающей дискретизации и фильтрации.

В другом варианте осуществления выполняется обработка, такая как повышающая дискретизация, низкочастотная фильтрация для получения абсолютного или среднеквадратического значения, узкополосного сигнала во временной области или сигнала возбуждения узкополосного сигнала во временной области так, чтобы предсказать высокочастотный сигнал возбуждения.

Может быть использовано предсказание коэффициента LPC высокочастотного сигнала, высокочастотного коэффициента LPC хронологического кадра или серии заданных значений в качестве коэффициента LPC текущего кадра; или различные способы предсказания могут быть использованы для различных типов сигналов.

S402: Получение глобального параметра усиления высокочастотного сигнала во временной области в соответствии с параметром наклона спектра текущего кадра речевого/аудио сигнала и корреляции между текущим кадром узкополосного частотного сигнала и хронологического кадра узкополосного частотного сигнала.

В одном варианте осуществления следующие этапы включают в себя:

S2021: классификация текущего кадра речевого/аудио сигнала в качестве первого типа сигнала или второго типа сигнала в соответствии с параметром наклона спектра текущем кадра речевого/аудио сигнала и корреляции между текущим кадром узкополосного частотного сигнала и хронологическим кадром узкополосного частотного сигнала, где в одном варианте осуществления первый тип сигнала является щелевым сигналом, и второй тип сигнала является нещелевым сигналом.

В одном варианте осуществления, когда параметр наклона спектра tilt>5 и корреляционный параметр cor меньше заданного значения, узкополосный частотный сигнал классифицируется как щелевой, остальные как нещелевые. Параметр cor, показывающий корреляцию между текущим кадром узкополосного частотного сигнала и хронологическим кадром узкополосного частотного сигнала, может быть определен в соответствии с величиной отношения энергии между сигналами в одном и том же частотном диапазоне или может быть определен в соответствии с энергией связи между несколькими частотными диапазонами, или может быть вычислен по формуле, которая показывает автокорреляцию или взаимную корреляцию между сигналами временной области, или показывающая автокорреляцию или взаимную корреляцию между сигналами возбуждения во временной области.

S2022: Когда текущий кадр речевого/аудио сигнала является первым типом сигнала, параметр наклона спектра ограничивается величиной равной или менее первому заранее заданному значению для получения предельного значения параметра наклона спектра и для использования предельного значения параметра наклона спектра как глобальный параметр усиления высокочастотного сигнала во временной области. То есть, когда параметр наклона спектра текущего кадра речевого/аудио сигнала меньше или равен первой заданной величине, исходное значение параметра наклона спектра хранится в качестве предельного значения параметра наклона спектра; когда параметр наклона спектра текущего кадра речевого/аудио сигнала больше, чем первое заранее определенное значение, то первое заданное значение используется в качестве предельного значения параметра наклона спектра.

Когда текущий кадр речевого/аудио сигнала является щелевым сигналом, глобальный параметр усиления во временной области получают в соответствии со следующей формулой: , где tilt является параметром наклона спектра и ∂1 является первым заранее заданным значением.

S2023: Когда текущий кадр речевого/аудио сигнала является вторым типом сигнала, параметр наклона спектра ограничивается до значения в первом диапазоне для получения предельного значения параметра наклона спектра и использования предельного значения параметра наклона спектра как глобальный параметр усиления высокочастотного сигнала временной области. То есть, когда параметр наклона спектра текущего кадра речевого/аудио сигнала относится к первому диапазону, исходное значение параметра наклона спектра сохраняется в качестве предельного значения параметра наклона спектра; когда параметр наклона спектра текущего кадра речевого/аудио сигнала больше, чем верхний предел первого диапазона, значение верхнего предела первого диапазона используется в качестве предельного значения параметра наклона спектра; когда параметр наклона спектра текущего кадра речевого/аудио сигнала меньше значения нижнего предела первого диапазона, значение нижней границы первого диапазона используется в качестве предельного значения параметра наклона спектра.

Когда текущий кадр речевого/аудио сигнала не является щелевым сигналом, глобальный параметр gain′ усиления во временной области получают в соответствии со следующей формулой: , где tilt является параметром наклона спектра и [a, b] является первым диапазоном.

В одном варианте осуществления получаются параметр tilt наклона спектра узкополосного частотного сигнала и параметр cor, показывающий корреляцию между текущим кадром узкополосного частотного сигнала и хронологическим кадром узкополосного частотного сигнала; текущий кадр сигналов подразделяются на два типа, щелевой и нещелевой, в соответствии с tilt и cor; когда параметр tilt наклона спектра >5 и корреляционный параметр cor меньше заданного значения, то узкополосный частотный сигнал классифицируется как щелевой, остальные как нещелевые; tilt ограничивается только диапазоном значений от 0,5 < = tilt < = 1,0 и используется в качестве нещелевого глобального параметра усиления во временной области, и tilt ограничивается диапазоном значений от наклона < = 8,0 и используется в качестве щелевого глобального параметра усиления временной области. Для щелевого варианта, параметр наклона спектра может иметь любое значение больше, чем 5 и для нещелевого, параметр наклона спектра может иметь любое значение, меньшее или равное 5 и может быть больше, чем 5. Чтобы гарантировать, что параметр наклона наклон спектра может быть использован в качестве предсказанного глобального параметра усиления, tilt ограничен в пределах диапазона значений и затем использован в качестве глобального параметра усиления временной области. То есть, когда tilt>8, то определяется, что tilt=8 и 8 используется в качестве глобального параметра усиления во временной области щелевой сигнала; когда tilt<0,5, то определяется, что tilt=0,5 или при tilt>1,0, то определяется, что tilt=1,0 и 0,5 или 1,0 используется в качестве параметра глобального усиления временной области нещелевого сигнала.

S403: корректировка высокочастотного сигнала с помощью глобального параметра усиления временной области для получения скорректированного высокочастотного сигнала во временной области.

В одном варианте осуществления исходный высокочастотный сигнал умножается на параметр глобального усиления временной области для получения скорректированного высокочастотного сигнала во временной области.

В другом варианте осуществления этапе S403 может включать в себя:

выполнение весовой обработки соотношения энергии и глобального параметра усиления во временной области и использование полученного взвешенного значения в качестве предсказанного глобального параметра усиления, где отношение энергии является соотношением между энергией хронологического кадра высокочастотного сигнала во временной области и энергией текущего кадра исходного высокочастотного сигнала; и

корректировку исходного высокочастотного сигнала с помощью предсказанного глобального параметра усиления для получения скорректированного высокочастотного сигнала во временной области; то есть, исходный высокочастотный сигнал умножается на предсказанный глобальный параметр усиления для получения скорректированного высокочастотного сигнала во временной области.

Возможно, перед этапом S403 способ может дополнительно включать в себя:

получение параметра огибающей во временной области, соответствующего исходному высокочастотному сигналу, и

корректировку исходного высокочастотного сигнала с помощью предсказанного глобального параметра усиления, которая включает в себя:

корректировку исходного высокочастотного сигнала с помощью параметра огибающей во временной области и глобального параметра усиления во временной области.

S404: синтезирование текущего кадра узкополосного частотного сигнала во временной области и скорректированного высокочастотного сигнала во временной области и выработка синтезированного сигнала.

В вышеприведенном варианте осуществления, когда широкополосный частотный диапазон переключается в узкополосный частотный диапазон, глобальный параметр усиления сигнала высокой частоты во временной области получают в соответствии с параметром наклона спектра и межкадровой корреляции. При использовании параметра наклона частотного спектра узкополосного диапазона, энергия взаимодействия между узкополосным частотным сигналом и высокочастотным сигналом может быть корректно оценена, с целью улучшения оценки энергии высокочастотного сигнала. При использовании межкадровой корреляции, межкадровая корреляция между высокочастотными сигналами может быть оценена путем создания эффективного использования корреляции между узкополосными кадрами. Таким образом, когда выполняется весовая обработка, осуществляется получение высокочастотного глобального параметра усиления, таким образом, также может быть получена информация в реальном масштабе времени и отсутствует нежелательный шум. Сигнал высокой частоты корректируется с помощью глобального параметра усиления во временной области, таким образом, чтобы осуществить плавный переход от высокочастотной части между широкополосным частотным диапазоном и в узкополосным частотным диапазоном, тем самым эффективно устраняет слуховой дискомфорт, вызванный переключением между широкополосным частотным диапазоном и узкополосным частотным диапазоном.

В связи с вышеупомянутым способом в вариантах осуществления настоящего изобретения дополнительно предоставляется устройство обработки речевого/аудио сигнала. Устройство может быть расположено на терминальном устройстве, сетевом устройстве или на измерительном устройстве. Устройство обработки сигнала речевого/аудио сигнала могут быть реализовано с помощью аппаратных средств или может быть реализовано посредством программного обеспечения, в сочетании с аппаратными средствами. Например, со ссылкой на фиг. 5 показан процессор, который осуществляет управление устройством обработки речевого/аудио сигнала для осуществления обработки речевого/аудио сигнала. Устройство обработки сигнала речевого/аудио сигнала может реализовать способы и процессы, изложенные выше в вариантах осуществления.

Со ссылкой на фиг. 6 показан вариант осуществления устройства обработки речевого/аудио сигнала, которое включает в себя:

получающий блок 601, выполненный с возможностью: когда речевой/аудио сигнал переключает полосу пропускания, получать исходный высокочастотный сигнал, соответствующий текущему кадру речевого/аудио сигнала;

блок 602 получения параметра, выполненный с возможностью получать глобальный параметр усиления во временной области, соответствующий исходному высокочастотному сигналу;

блок 603 весовой обработки, выполненный с возможностью выполнять весовую обработку соотношения энергии и глобального параметра усиления во временной области и использовать полученное взвешенное значение в качестве предсказанного глобального параметра усиления, где соотношение энергии является соотношением между энергией хронологического кадра высокочастотного сигнала во временной области и энергией текущего кадра исходного высокочастотного сигнала;

корректирующий блок 604, выполненный с возможностью корректировать исходный высокочастотный сигнал с помощью предсказанного глобального параметра усиления для получения скорректированного высокочастотного сигнала во временной области; и

синтезирующий блок 605, выполненный с возможностью синтезировать текущий кадр узкополосного сигнала во временной области и скорректированный высокочастотный сигнал во временной области и вырабатывать синтезированный сигнал.

В одном варианте осуществления переключение полосы пропускания представляет собой переключение из широкополосного частотного сигнала в узкополосный частотный сигнал и блок 602 получения параметра включает в себя:

блок получения глобального параметра усиления, выполненный с возможностью получать глобальный параметр усиления высокочастотного сигнала во временной области в соответствии с параметром наклона спектра текущего кадра речевого/аудио сигнала, и корреляцию между текущим кадром речевого/аудио сигнала и хронологическим кадром узкополосного частотного сигнала.

Как показано на фиг. 7, в другом варианте осуществления, переключение полосы пропускания представляет собой переключение из широкополосного частотного сигнала в узкополосный частотный сигнал и блок 602 получения параметра включает в себя:

блок 701 получения огибающей во временной области, выполненный с возможностью использовать серию заданных значений как параметр огибающей текущего кадра речевого/звукового сигнала во временной области; и

блок 702 получения глобального параметра усиления, выполненный с возможностью получать глобальный параметр усиления высокочастотного сигнала во временной области в соответствии с параметром наклона спектра текущего кадра речевого/аудио сигнала и корреляцию между текущим кадром речевого/аудио сигнала и хронологическим кадром узкополосного частотного сигнала.

Таким образом, корректирующий блок 604 выполнен с возможностью корректировать исходный высокочастотный сигнал с помощью параметра огибающей во временной области и предсказанного глобального параметра усиления для получения скорректированного высокочастотного сигнала во временной области.

Как показано на фиг. 8, дополнительно вариант осуществления блока 702 получения глобального параметра усиления включает в себя:

блок 801 классификации, выполненный с возможностью классифицировать текущий кадр речевого/аудио сигнала в качестве первого типа сигнала или второго типа сигнала в соответствии с параметром наклона спектра текущего кадра речевого/аудио сигнала и соотношения между текущим кадром речевого/аудио сигнала и хронологического кадра узкополосного частотного сигнала;

первый ограничивающий блок 802, выполненный с возможностью: когда текущий кадр речевого/аудио сигнала является первым типом сигнала, ограничивать параметр наклона спектра до величины меньше, чем или равной первому заранее заданному значению для получения предельного значения параметра наклона спектра, и использовать предельное значение параметра наклона спектра в качестве глобального параметра усиления высокочастотного сигнала во временной области; и

второй ограничивающий блок 803, выполненный с возможностью: если текущий кадр речевого/аудио сигнала является вторым типом сигнала, ограничивать параметр наклона спектра значением первого диапазона для получения предельного значения параметра наклона спектра, и использовать предельное значение параметра наклона спектра как глобальный параметр усиления высокочастотного сигнала во временной области.

Дополнительно, в варианте осуществления первый тип сигнала является щелевым сигналом и второй тип сигнала является нещелевым сигналом; когда параметр наклона спектра tilt>5 и параметр корреляции cor меньше заданного значения, то узкополосный частотный сигнал классифицируется как щелевой, остальные как нещелевые; первое заданное значение равно 8; и первый заданный диапазон является [0,5, 1].

Со ссылкой на фиг. 9, в варианте осуществления, показан получающий блок 601, который включает в себя:

блок 901 получения сигнала возбуждения, выполненный с возможностью предсказывать сигнал возбуждения высокочастотного сигнала в соответствии с текущим кадром речевого/аудио сигнала;

блок 902 получения коэффициента LPC, выполненный с возможностью предсказывать коэффициент LPC высокочастотного сигнала; и

блок 903 генерирования, выполненный с возможностью синтезировать сигнал возбуждения высокочастотного сигнала и коэффициента LPC высокочастотного сигнала для получения предсказанного высокочастотного сигнала.

В одном варианте осуществления переключение полосы пропускания представляет собой переключение узкополосного частотного сигнала в широкополосный частотный сигнал, и устройство обработки речевого/аудио сигнала дополнительно включает в себя:

блок установки весового коэффициента, выполненный с возможностью: когда узкополосные сигналы текущего аудио кадра речевого/аудио сигнала и предшествующий кадр речевого/аудио сигнала имеют заранее определенную корреляцию, использовать значение, полученное путем ослабления, в соответствии с определенным размером шага, весового коэффициента alfa отношения энергии, соответствующего предшествующему кадру речевого/аудио сигнала, в качестве весового коэффициента соотношения энергии, соответствующего текущему аудио кадру, где затухание выполняется покадрово, пока величина alfa не станет равно 0.

Со ссылкой на фиг. 10 показан другой вариант устройства обработки речевого/аудио сигнала, которое включает в себя:

блок 1001 предсказания, выполненный с возможностью: когда речевой/аудио сигнал переключается из широкополосного частотного сигнала в узкополосный частотный сигнал, получать исходный высокочастотный сигнал, соответствующий текущему кадру речевого/аудио сигнала;

блок 1002 получения параметра, выполненный с возможностью получать глобальный параметр усиления высокочастотного сигнала во временной области в соответствии с параметром наклона спектра текущего кадра речевого/аудио сигнала, и корреляцию между текущим кадром узкополосного частотного сигнала и хронологическим кадром узкополосного частотного сигнала;

корректирующий блок 1003, выполненный с возможностью корректировать исходный высокочастотный сигнал с помощью предсказанного глобального параметра усиления для получения скорректированного высокочастотного сигнала во временной области; и

синтезирующий блок 1004, выполненный с возможностью синтезировать текущий кадр узкополосного сигнала во временной области и скорректированный высокочастотный сигнал во временной области и вырабатывать синтезированный сигнал.

Как показано на фиг. 8, блок 1002 получения параметра включает в себя:

блок 801 классификации, выполненный с возможностью классифицировать текущий кадра речевого/аудио сигнала в качестве первого типа сигнала или второго типа сигнала в соответствии с параметром наклона спектра текущего кадра речевого/аудио сигнала и соотношения между текущим кадром речевого/аудио сигнала и хронологического кадра узкополосного частотного сигнала;

первый ограничивающий блок 802, выполненный с возможностью: когда текущий кадр речевого/аудио сигнала является первым типом сигнала, ограничивать параметр наклона спектра до величины меньше, чем или равной первому заранее заданному значению для получения предельного значения параметра наклона спектра, и использовать предельное значение параметра наклона спектра в качестве глобального параметра усиления высокочастотного сигнала во временной области; и

второй ограничивающий блок 803, выполненный с возможностью: если текущий кадр речевого/аудио сигнала является вторым типом сигнала, ограничивать параметр наклона спектра значением первого диапазона для получения предельного значения параметра наклона спектра, и использовать предельное значение параметра наклона спектр как глобальный параметр усиления высокочастотного сигнала во временной области.

Дополнительно, в варианте осуществления первый тип сигнала является щелевым сигналом и второй тип сигнала не является щелевым сигналом; когда параметр наклона спектра tilt>5 и параметр корреляции cor меньше заданного значения, то узкополосный частотный сигнал классифицируется как щелевой, остальные как нещелевые; первое заданное значение равно 8; и первый заданный диапазон является [0,5, 1].

Возможно, в одном варианте осуществления устройство обработки речевого/аудио сигнала дополнительно включает в себя:

блок весовой обработки, выполненный с возможностью выполнять весовую обработку соотношения энергии и глобального параметра усиления во временной области и использовать полученное взвешенное значение в качестве предсказанного глобального параметра усиления, где соотношение энергии является соотношением между энергией хронологического кадра высокочастотного сигнала во временной области и энергией текущего кадра исходного высокочастотного сигнала;

корректирующий блок, выполненный с возможностью корректировать исходный высокочастотный сигнал с помощью предсказанного глобального параметра усиления для получения скорректированного высокочастотного сигнала во временной области; и

В другом варианте осуществления, блок получения параметра дополнительно выполнено с возможностью получать параметр огибающей во временной области, соответствующий исходному высокочастотному сигналу; и корректирующий блок выполнен с возможностью корректировать исходный высокочастотный сигнал с помощью параметра огибающей во временной области и глобального параметра усиления во временной области.

Специалисту в данной области техники очевидно, что все или часть процессов способа в вариантах осуществления могут быть реализованы компьютерной программой, которая управляет функционированием соответствующей аппаратуры. Программа может храниться на читаемом компьютером носителе данных. При выполнении программы, выполняются процессы способа в вариантах осуществления. Носитель данных может включать в себя: магнитный диск, оптический диск, постоянное запоминающее устройство (память, доступная только для чтения, ROM) или оперативное запоминающее устройство (память с произвольной выборкой, RAM).

Вышеизложенное описывает лишь примерные варианты осуществления для иллюстрации настоящего изобретения, но объем настоящего изобретения не ограничивается этим. Модификации или изменения являются очевидными для специалистов в данной области техники без отхода от сущности и объема настоящего изобретения.

1. Способ обработки речевого/аудио сигнала, содержащий этапы, на которых:
получают при переключении речевого/аудио сигнала из широкополосного частотного сигнала в узкополосный частотный сигнал исходный высокочастотный сигнал, соответствующий текущему кадру речевого/аудио сигнала;
получают глобальный параметр усиления высокочастотного сигнала во временной области в соответствии с параметром наклона спектра текущего кадра речевого/аудио сигнала и корреляцией между текущим кадром узкополосного частотного сигнала и архивным кадром узкополосного частотного сигнала;
корректируют исходный высокочастотный сигнал с помощью глобального параметра усиления во временной области для получения скорректированного высокочастотного сигнала во временной области; и
синтезируют текущий кадр узкополосного сигнала во временной области и скорректированный высокочастотный сигнал во временной области и выводят синтезированный сигнал.

2. Способ по п. 1, в котором на этапе получения глобального параметра усиления высокочастотного сигнала во временной области в соответствии с параметром наклона спектра текущего кадра речевого/аудио сигнала и корреляцией между текущим кадром узкополосного частотного сигнала и архивным кадром узкополосного частотного сигнала:
относят текущий кадр речевого/аудио сигнала к первому типу сигнала или второму типу сигнала в соответствии с параметром наклона спектра текущего кадра речевого/аудио сигнала и корреляцией между текущим кадром узкополосного частотного сигнала и архивным кадром узкополосного частотного сигнала;
когда текущий кадр речевого/аудио сигнала является первым типом сигнала, ограничивают параметр наклона спектра значением, меньшим или равным первому заданному значению, для получения предельного значения параметра наклона спектра;
когда текущий кадр речевого/аудио сигнала является вторым типом сигнала, ограничивают параметр наклона спектра значением в первом диапазоне для получения предельного значения параметра наклона спектра; и
используют предельное значение параметра наклона спектра в качестве глобального параметра усиления высокочастотного сигнала во временной области.

3. Способ по п. 2, в котором первый тип сигнала является щелевым сигналом, а второй тип сигнала является нещелевым сигналом; когда параметр наклона спектра tilt>5 и параметр корреляции cor меньше заданного значения, то узкополосный частотный сигнал относится к щелевому сигналу, остальные сигналы относятся к нещелевым сигналам; первое заданное значение равно 8, а первый заданный диапазон представляет собой [0,5, 1].

4. Способ по п. 1, в котором на этапе корректирования исходного высокочастотного сигнала с помощью глобального параметра усиления во временной области для получения скорректированного высокочастотного сигнала во временной области
выполняют обработку взвешивания для отношения энергий и глобального параметра усиления во временной области и используют полученное взвешенное значение в качестве предсказанного глобального параметра усиления, при этом отношение энергий является отношением между энергией архивного кадра высокочастотного сигнала во временной области и энергией текущего кадра исходного высокочастотного сигнала; и
корректируют исходный высокочастотный сигнал с помощью предсказанного глобального параметра усиления.

5. Способ по п. 1, дополнительно содержащий этапы, на которых:
получают параметр огибающей во временной области, соответствующий исходному высокочастотному сигналу, при этом
на этапе коррекции исходного высокочастотного сигнала с помощью глобального параметра усиления
корректируют исходный высокочастотный сигнал с помощью параметра огибающей во временной области и глобального параметра усиления во временной области.

6. Способ обработки речевого/аудио сигнала, содержащий этапы, на которых:
получают при переключении полосы пропускания речевого/аудио сигнала исходный высокочастотный сигнал, соответствующий текущему кадру речевого/аудио сигнала;
получают глобальный параметр усиления исходного высокочастотного сигнала во временной области;
выполняют обработку взвешивания отношения энергий и глобального параметра усиления во временной области и используют полученное взвешенное значение в качестве предсказанного глобального параметра усиления, при этом отношение энергий является отношением между энергией архивного кадра высокочастотного сигнала во временной области и энергией текущего кадра исходного высокочастотного сигнала;
корректируют исходный высокочастотный сигнал с помощью предсказанного глобального параметра усиления для получения скорректированного высокочастотного сигнала во временной области; и
синтезируют текущий кадр узкополосного частотного сигнала во временной области и скорректированный высокочастотный сигнал во временной области и выводят синтезированный сигнал.

7. Способ по п. 6, в котором переключение полосы пропускания представляет собой переключение с широкополосного частотного сигнала на узкополосный частотный сигнал, при этом на этапе получения глобального параметра усиления исходного высокочастотного сигнала
получают глобальный параметр усиления высокочастотного сигнала во временной области в соответствии с параметром наклона спектра текущего кадра речевого/аудио сигнала и корреляцией между текущим кадром узкополосного частотного сигнала и архивным кадром узкополосного частотного сигнала.

8. Способ по п. 7, в котором на этапе получения глобального параметра усиления высокочастотного сигнала во временной области в соответствии с параметром наклона спектра текущего кадра речевого/аудио сигнала и корреляцией между текущим кадром узкополосного частотного сигнала и архивным кадром узкополосного частотного сигнала:
относят текущий кадр речевого/аудио сигнала к первому типу сигнала или второму типу сигнала в соответствии с параметром наклона спектра текущего кадра речевого/аудио сигнала и корреляцией между текущим кадром узкополосного частотного сигнала и архивным кадром узкополосного частотного сигнала;
когда текущий кадр речевого/аудио сигнала является сигналом первого типа, ограничивают параметр наклона спектра значением, меньшим или равным первому заданному значению, для получения предельного значения параметра наклона спектра;
когда текущий кадр речевого/аудио сигнала является сигналом второго типа, ограничивают параметр наклона спектра значением в первом диапазоне для получения предельного значения параметра наклона спектра; и
используют предельное значение параметра наклона спектра в качестве глобального параметра усиления высокочастотного сигнала во временной области.

9. Способ по п. 8, в котором первый тип сигнала является щелевым сигналом, а второй тип сигнала является нещелевым сигналом; при этом когда параметр наклона спектра tilt>5, а параметр корреляции cor меньше заданного значения, узкополосный частотный сигнал относится к щелевому сигналу, а остальные сигналы относятся к нещелевым сигналам, при этом первое заданное значение равно 8, а первый диапазон равен [0,5, 1].

10. Способ по п. 6, в котором переключение полосы пропускания представляет собой переключение от широкополосного частотного сигнала к узкополосному частотному сигналу, при этом на этапе получения исходного высокочастотного сигнала, соответствующего текущему кадру речевого/аудио сигнала
предсказывают высокочастотный сигнал возбуждения в соответствии с текущим кадром речевого/аудио сигнала;
предсказывают коэффициент LPC высокочастотного сигнала; и
синтезируют высокочастотный сигнал возбуждения и коэффициент LPC высокочастотного сигнала для получения предсказанного высокочастотного сигнала.

11. Способ по п. 6, в котором переключение полосы пропускания представляет собой переключение от узкополосного частотного сигнала к широкополосному частотному сигналу, при этом способ дополнительно содержит этап, на котором
когда узкополосные сигналы текущего кадра речевого/аудио сигнала и предшествующего кадра речевого/аудио сигнала имеют заданную корреляцию, используют значение, полученное путем ослабления, в соответствии с размером шага, весового коэффициента alfa отношения энергий, соответствующего предшествующему кадру речевого/аудио сигнала, в качестве весового коэффициента отношения энергий, соответствующего текущему аудио кадру, при этом выполняют ослабление покадрово, пока значение alfa не станет равно 0.

12. Устройство обработки речевого/аудио сигнала, содержащее:
блок предсказания, выполненный с возможностью получения при переключении речевого/аудио сигнала из широкополосного частотного сигнала в узкополосный частотный сигнал исходного высокочастотного сигнала, соответствующего текущему кадру речевого/аудио сигнала;
блок получения параметра, выполненный с возможностью получения глобального параметра усиления высокочастотного сигнала во временной области в соответствии с параметром наклона спектра текущего кадра речевого/аудио сигнала и корреляцией между текущим кадром узкополосного частотного сигнала и архивным кадром узкополосного частотного сигнала;
корректирующий блок, выполненный с возможностью корректировки исходного высокочастотного сигнала с помощью предсказанного глобального параметра усиления для получения скорректированного высокочастотного сигнала во временной области; и
синтезирующий блок, выполненный с возможностью синтезирования текущего кадра узкополосного сигнала во временной области и скорректированного высокочастотного сигнала во временной области и вывода синтезированного сигнала.

13. Устройство по п. 12, в котором блок получения параметра содержит:
блок отнесения, выполненный с возможностью отнесения текущего кадра речевого/аудио сигнала к сигналу первого типа или к сигналу второго типа сигнала в соответствии с параметром наклона спектра текущего кадра речевого/аудио сигнала и корреляцией между текущим кадром речевого/аудио сигнала и архивным кадром узкополосного частотного сигнала;
первый ограничивающий блок, выполненный с возможностью, когда текущий кадр речевого/аудио сигнала относится к первому типу сигнала, ограничивать параметр наклона спектра значением, меньшим или равным первому заданному значению, для получения предельного значения параметра наклона спектра, и использовать предельное значение параметра наклона спектра в качестве глобального параметра усиления высокочастотного сигнала во временной области; и
второй ограничивающий блок, выполненный с возможностью, когда текущий кадр речевого/аудио сигнала относится ко второму типу сигнала, ограничивать параметр наклона спектра значением в первом диапазоне для получения предельного значения параметра наклона спектра и использовать предельное значение параметра наклона спектра в качестве глобального параметра усиления высокочастотного сигнала во временной области.

14. Устройство по п. 13, в котором первый тип сигнала является щелевым сигналом, а второй тип сигнала является нещелевым сигналом; при этом когда параметр наклона спектра tilt>5 и параметр корреляции cor меньше заданного значения, узкополосный частотный сигнал относится к щелевому сигналу, а остальные сигналы относятся к нещелевым сигналам, причем первое заданное значение равно 8, а первый диапазон равен [0,5, 1].

15. Устройство по п. 12, дополнительно содержащее:
блок обработки взвешивания, выполненный с возможностью выполнения обработки взвешивания отношения энергий и глобального параметра усиления во временной области и использования полученного взвешенного значения в качестве предсказанного глобального параметра усиления, при этом отношение энергий представляет собой отношение между энергией архивного кадра высокочастотного сигнала во временной области и энергией текущего кадра исходного высокочастотного сигнала, при этом
корректирующий блок выполнен с возможностью корректировать исходный высокочастотный сигнал с помощью предсказанного глобального параметра усиления для получения скорректированного высокочастотного сигнала во временной области.

16. Устройство по п. 12, в котором
блок получения параметра дополнительно выполнен с возможностью получения параметра огибающей во временной области, соответствующего исходному высокочастотному сигналу, а
корректирующий блок выполнен с возможностью корректировать исходный высокочастотный сигнал с помощью параметра огибающей во временной области и глобального параметра усиления во временной области.

17. Устройство обработки речевого/аудио сигнала, содержащее:
получающий блок, выполненный с возможностью при переключении полосы пропускания речевого/аудио сигнала получать исходный высокочастотный сигнал, соответствующий текущему кадру речевого/аудио сигнала;
блок получения параметра, выполненный с возможностью получения глобального параметра усиления во временной области, соответствующего исходному высокочастотному сигналу;
блок обработки взвешивания, выполненный с возможностью выполнения обработки взвешивания для отношения энергий и глобального параметра усиления во временной области и использования полученного взвешенного значения в качестве предсказанного глобального параметра усиления, при этом отношение энергий представляет собой отношение между энергией архивного кадра высокочастотного сигнала во временной области и энергией текущего кадра исходного высокочастотного сигнала;
корректирующий блок, выполненный с возможностью коррекции исходного высокочастотного сигнала с помощью предсказанного глобального параметра усиления для получения скорректированного высокочастотного сигнала во временной области, и
синтезирующий блок, выполненный с возможностью синтезировать текущий кадр узкополосного частотного сигнала во временной области и скорректированный высокочастотный сигнал во временной области и выводить синтезированный сигнал.

18. Устройство по п. 17, в котором переключение полосы пропускания представляет собой переключение от широкополосного частотного сигнала к узкополосному частотному сигналу, при этом блок получения параметра содержит
блок получения глобального параметра усиления, выполненный с возможностью получения глобального параметра усиления высокочастотного сигнала во временной области в соответствии с параметром наклона спектра текущего кадра речевого/аудио сигнала и корреляцией между текущим кадром речевого/аудио сигнала и архивным кадром узкополосного частотного сигнала.

19. Устройство по п. 18, в котором блок получения глобального параметра усиления содержит:
блок отнесения, выполненный с возможностью отнесения текущего кадра речевого/аудио сигнала к первому типу сигнала или второму типу сигнала в соответствии с параметром наклона спектра текущего кадра речевого/аудио сигнала и корреляцией между текущим кадром речевого/аудио сигнала и архивным кадром узкополосного частотного сигнала;
первый ограничивающий блок, выполненный с возможностью, когда текущий кадр речевого/аудио сигнала относится к первому типу сигнала, ограничивать параметр наклона значением, меньшим или равным первому заданному значению, для получения предельного значение параметра наклона спектра и использовать предельное значение параметра наклона спектра в качестве глобального параметра усиления высокочастотного сигнала во временной области; и
второй ограничивающий блок, выполненный с возможностью, когда текущий кадр речевого/аудио сигнала относится ко второму типу сигнала, ограничивать параметр наклона спектра значением в первом диапазоне для получения предельного значения параметра наклона спектра и использовать предельное значение параметра наклона спектра в качестве глобального параметра усиления высокочастотного сигнала во временной области.

20. Устройство по п. 19, в котором первый тип сигнала является щелевым сигналом, а второй тип сигнала является нещелевым сигналом, при этом когда параметр наклона спектра tilt>5, а параметр корреляции cor меньше заданного значения, то узкополосный частотный сигнал относится к щелевому, остальные сигналы относятся к нещелевым сигналам; первое заданное значение равно 8, а первый диапазон равен [0,5, 1].

21. Устройство по п. 17, в котором переключение полосы пропускания представляет собой переключение из широкополосного частотного сигнала в узкополосный частотный сигнал, при этом устройство дополнительно содержит:
блок получения огибающей во временной области, выполненный с возможностью использования одной из последовательностей заданных значений в качестве параметра огибающей высокочастотного сигнала во временной области для текущего кадра речевого/аудио сигнала, а
корректирующий блок выполнен с возможностью корректировки исходного высокочастотного сигнала с помощью параметра огибающей во временной области и предсказанного глобального параметра усиления для получения скорректированного высокочастотного сигнала во временной области.

22. Устройство по любому из пп. 17-20, в котором получающий блок содержит:
блок получения сигнала возбуждения, выполненный с возможностью предсказания высокочастотного сигнала возбуждения в соответствии с текущим кадром речевого/аудио сигнала;
блок получения коэффициента LPC, выполненный с возможностью предсказания коэффициента LPC высокочастотного сигнала, и
синтезирующий блок, выполненный с возможностью синтеза высокочастотного сигнала возбуждения и коэффициента LPC высокочастотного сигнала для получения предсказанного высокочастотного сигнала.

23. Устройство по п. 17, в котором переключение полосы пропускания представляет собой переключение из узкополосного частотного сигнала в широкополосный частотный сигнал, при этом устройство дополнительно содержит
блок установки весового коэффициента, выполненный с возможностью, когда узкополосные сигналы текущего кадра речевого/аудио сигнала и предшествующего кадра речевого/аудио сигнала имеют заданную корреляцию, использования значения, полученного путем ослабления, в соответствии с размером шага, весового коэффициента alfa для отношения энергий, соответствующего предшествующему кадру речевого/аудио сигнала, в качестве весового коэффициента отношения энергий, соответствующего текущему аудиокадру, при покадровом выполнении ослабления, пока значение alfa не станет равно 0.



 

Похожие патенты:

Изобретение относится к средствам кодирования цифрового звукового сигнала. Технический результат заключается в сокращении количества бит, необходимого для передачи закодированного сигнала без изменения качества кодирования.

Изобретение относится к вычислительной технике. Технический результат заключается в адаптивном применении низкочастотной коррекции в ходе кодирования звуковых сигналов, содержащих выраженные низкочастотные тональные составляющие, без изменения декодера.

Изобретение относится к средствам кодирования и декодирования многоканального звукового сигнала. Технический результат заключается в повышении качества кодированного сигнала.

Изобретения относятся к области цифровой связи и технологиям обработки речи в условиях зашумления. Технический результат заключается в повышении отношения сигнал-шум очищенного речевого сигнала.

Изобретение относится к области декодирования аудио. Техническим результатом является исключение случаев, когда компоненты переходных сигналов имеют отрицательные акустические воздействия на выходные сигналы.

Изобретение относится к средствам для обработки аудиоданных и к области техники связи. Технический результат заключается в повышении эффективности кодирования.

Изобретение относится к области обеспечения представления сигнала повышающего микширования на основе представления сигнала понижающего микширования и объектно-связанной параметрической информации, которые включены в представление битового потока звукового содержания, и информации о визуализации.

Изобретение относится к средствам, генерирующим представление сигнала повышающего микширования на основе представления сигнала понижающего микширования с использованием объектно-ориентированной параметрической информации и с учетом данных аудиорендеринга.

Изобретение относится к способу кодирования аудио сигнала и средствам для осуществления этого способа. Технический результат изобретения заключается в создании концепции кодирования, позволяющей уменьшить сложность при сопоставимой или даже увеличенной эффективности кодирования.

Изобретение относится к кодеку, поддерживающему переключение между режимом кодирования с преобразованием с подавлением помех дискретизации во временной области и режимом кодирования временной области.

Изобретение относится к средствам генерирования шума в аудиокодеках. Технический результат заключается в обеспечении уменьшения скорости передачи битов и в повышении качества генерируемого шума. Аудиокодер содержит модуль оценки фонового шума, выполненный с возможностью определять параметрическую оценку фонового шума на основе представления в форме спектрального разложения входного аудиосигнала таким образом, что параметрическая оценка фонового шума спектрально описывает спектральную огибающую фонового шума входного аудиосигнала. Аудиокодер содержит кодер для кодирования входного аудиосигнала в поток данных в течение активной фазы. Аудиокодер содержит детектор, выполненный с возможностью обнаруживать вход в неактивную фазу после активной фазы на основе входного сигнала. Аудиокодер выполнен с возможностью кодировать в поток данных параметрическую оценку фонового шума в неактивной фазе. 7 н. и 11 з.п. ф-лы, 13 ил.

Изобретение относится к средствам кодирования и декодирования закодированного аудиосигнала. Технический результат заключается в обеспечении кодирования и декодирования информации импульсов с использованием меньшего количества битов для представления информации импульсов, что обеспечит возможность уменьшения скорости передачи соответствующим образом закодированного аудиосигнала. Устройство содержит декодер информации импульсов и декодер сигналов. Декодер информации импульсов выполнен с возможностью декодировать множество позиций импульсов, причем каждая из позиций импульсов указывает одну из позиций дорожки одной из дорожек, чтобы указать позицию одного из импульсов дорожки, и причем декодер информации импульсов выполнен с возможностью декодировать множество позиций импульса посредством использования количества позиций дорожки, указывающего общее количество позиций дорожки по меньшей мере одной из дорожек, общего количества импульсов, указывающего общее количество импульсов по меньшей мере одной из дорожек, и одного номера состояния. 6 н. и 9 з.п. ф-лы, 7 ил.

Изобретение относится к аудиокодеку, поддерживающему синтез шума в течение неактивных фаз. Техническим результатом является уменьшение скорости передачи битов с поддержанием достижимого качества формирования шума. Параметрическая оценка фонового шума непрерывно обновляется в течение активной фазы или фазы немолчания, так что формирование шума может начинаться сразу при переходе к неактивной фазе после активной фазы. Спектральная область очень эффективно используется для того, чтобы параметризовать фоновый шум, за счет этого обеспечивая синтез фонового шума, который является более реалистичным и в силу этого приводит к более прозрачному переключению активной фазы на неактивную. 5 н. и 22 з.п. ф-лы, 13 ил.

Изобретение относится к вычислительной технике. Технический результат заключается в обеспечении регулировки общего усиления без декодирования и дополнительного этапа повторного кодирования. Многорежимный аудио декодировщик для формирования декодированного представления аудио контента на основе закодированного потока, который настроен на декодирование значения коэффициента общего усиления в фрейме из закодированного потока битов, причем первое подмножество фреймов кодируется в первом режиме кодирования, а второе подмножество фреймов кодируется во втором режиме кодирования, причем каждый фрейм второго подмножества состоит более чем из одного подфрейма, декодирование, для подфрейма, состоящего, по крайней мере, из подмножества подфреймов второго подмножества фреймов, соответствующего элемента битового потока независимо от значения глобального коэффициента усиления соответствующего фрейма и завершающее декодирование битового потока с использованием значения коэффициента общего усиления и соответствующего элемента битового потока при декодировании подфреймов из подмножества подфреймов второго подмножества фреймов и значения коэффициента общего усиления при декодировании первого подмножества фреймов. 19 н. и 19 з.п. ф-лы, 11 ил.

Изобретение относится к области обработки звука, а именно к области параметрического пространственного преобразования звука с трансформацией первого параметрического пространственного аудиосигнала во второй параметрический пространственный аудиосигнал. Технический результат заключается в обеспечении возможности задания виртуального места нахождения и/или перцептивной пространственной ориентации слушателя, которые отличаются от локализации точек снятия звука или положения слушателя во время записи пространственной звуковой сцены. Технический результат достигается за счет устройства, включающего в свою конструкцию: модификатор пространственного аудиосигнала, предназначенный для корректировки первого параметрического пространственного аудиосигнала в зависимости от изменения первоначального местоположения слушателя или первоначальной ориентации слушателя с формированием второго параметрического пространственного аудиосигнала, при этом второе местоположение слушателя или вторичная ориентация слушателя соответствуют первоначальному положению слушателя или первоначальной ориентации слушателя с внесением соответствующих изменений. 8 н. и 14 з.п. ф-лы, 9 ил.

Изобретение относится к средствам генерирования, кодирования и декодирования водяного знака. Технический результат заключается в повышении надежности в случае воздействия на сигнал водяного знака доплеровского сдвига частоты. Генератор водяного знака для выработки, исходя из данных двоичного сообщения, сигнала цифрового водяного знака, содержит процессор информации, формирующий на основе информационных единиц данных двоичного сообщения первое время-частотное представление, где значения отображают данные двоичного сообщения; дифференциальный кодер, формирующий на базе первого время-частотного представления второе время-частотное представление, содержащее множество значений, разность двух из которых выражает соответствующее значение первого время-частотного представления, для выполнения дифференциального (разностного) кодирования значений первого время-частотного представления. Генератор водяного знака также содержит провайдер сигнала водяного знака, сконфигурированный для предоставления сигнала водяного знакана основе второго время-частотного представления. 15 н. и 8 з.п. ф-лы, 43 ил.

Изобретение относится к средствам передачи данных двоичного сообщения. Технический результат заключается в оптимизации формирования данных двоичного сообщения в зависимости от сигнала, маркированного водяным знаком, которое позволило бы увеличить объем данных двоичного сообщения, получаемых с сигналом с водяным знаком. Декодер водяного знака, в схему которого введены блок формирования время-частотного представления, блок памяти, детектор синхронизации и экстрактор водяного знака. Блок формирования время-частотного представления создает представление сигнала с водяным знаком в частотной области для множества временных блоков. Блок памяти сохраняет представление сигнала с водяным знаком в частотной области для множества временных блоков. Детектор синхронизации идентифицирует временной блок совмещения на основе частотного представления сигнала с водяным знаком в множестве временных блоков. Экстрактор водяного знака извлекает данные двоичного сообщения из хранящихся в памяти частотных представлений сигнала с водяным знаком во временных блоках, предшествующих идентифицированному временному блоку совмещения, с учетом удаленности от идентифицированного временного блока совмещения. 5 н. и 7 з.п. ф-лы, 39 ил.

Изобретение относится к средствам кодирования и декодирования звукового сигнала. Технический результат заключается в повышении эффективности кодирования. Декодер звукового сигнала, сформированный для обеспечения декодированного представления звукового сигнала на основе кодированного представления звукового сигнала, включающего информацию о частоте дискретизации, кодированную информацию о деформации времени и кодированное представление спектра, включает вычислитель деформации времени и декодер деформации. Вычислитель деформации времени формируется, чтобы адаптировать правило отображения для отображения кодовых слов кодированной информации о деформации времени на декодированных значениях деформации времени, описывающих декодированную информацию о деформации времени в зависимости от информации о частоте дискретизации. Декодер деформации, сформированный, чтобы обеспечить декодированное представление звукового сигнала на основе кодированного представления спектра и в зависимости от декодированной информации о деформации времени. 6 н. и 11 з.п. ф-лы, 35 ил.

Изобретение относится к технике связи. Технический результат - обеспечение формирования улучшенного сигнала микширования с понижением. Устройство для формирования улучшенного сигнала микширования с понижением на основе многоканального микрофонного сигнала включает пространственный анализатор, выполненный с возможностью вычислить ряд пространственных параметров звука, включающих информацию о направлении, описывающую направление прибытия прямого звука, информацию о мощности прямого звука и информацию о мощности диффузного звука на основе многоканального микрофонного сигнала. Устройство также включает калькулятор фильтра для того, чтобы вычислить параметры фильтра расширения в зависимости от информации о направлении, описывающей направление прибытия прямого звука, информации о мощности прямого звука и информации о мощности диффузного звука. Устройство также включает фильтр для того, чтобы фильтровать микрофонный сигнал или сигнал, полученный из микрофонного сигнала, используя параметры фильтра расширения, чтобы получить улучшенный сигнал микширования с понижением. 6 н. и 12 з.п. ф-лы, 7 ил.

Изобретение относится к технологиям кодирования/декодирования аудиоинформации. Техническим результатом является обеспечение понижения амплитудных ограничений. Предложено устройство кодирования аудиоинформации. Устройство содержит кодер для кодирования временного фрагмента входного аудиосигнала, подлежащего кодированию, для получения соответствующего кодированного фрагмента сигнала. Устройство кодирования аудиоинформации дополнительно содержит декодер для декодирования кодированного фрагмента сигнала для получения повторно декодированного фрагмента сигнала. Устройство обнаружения амплитудного ограничения предусмотрено для анализа повторно декодированного фрагмента сигнала относительно по меньшей мере одного из фактического амплитудного ограничения сигнала или перцепционного амплитудного ограничения сигнала и для генерирования соответствующего предупреждения об амплитудном ограничении. Кодер дополнительно выполнен с возможностью повторного кодирования временного фрагмента аудиосигнала по меньшей мере с одним измененным параметром кодирования, приводящим к пониженной вероятности амплитудного ограничения, в ответ на предупреждение об амплитудном ограничении. 3 н. и 25 з.п. ф-лы, 5 ил.
Наверх