Способ и устройство для обработки речевого сигнала

Авторы патента:

ШЛОМОТ Эйал (CN)

ДАЙ Цзиньлян (CN)

ЧЖАН Либинь (CN)

G10L19 - Техника анализа-синтеза речи для уменьшения избыточности, например в вокодерах ; кодирование или декодирование речи

Владельцы патента RU 2435233:

ХУАВЭЙ ТЕКНОЛОДЖИЗ КО., ЛТД. (CN)

Изобретение относится к области связи и, более конкретно, к способу и устройству для обработки речевого сигнала. При выполнении способ обработки речевого сигнала значения коэффициента ослабления энергии устанавливают для сигналов фонового шума, соответствующих полученным фреймам фонового шума, следующих после фрейма с маскированием стирания, таким образом, чтобы разности между значениями коэффициента ослабления энергии сигналов фонового шума, соответствующих фреймам фонового шума, и значениями коэффициента ослабления энергии сигналов, соответствующих их соответственным предшествующим фреймам, находились в пределах порогового диапазона. Ослаблением энергии сигналов фонового шума, соответствующих фреймам фонового шума, управляют, используя значения коэффициента ослабления энергии. В вариантах выполнения изобретения также предусмотрено устройство для обработки речевого сигнала. Технический результат состоит в том, что переход энергии между областью сигнала с маскированием стирания и областью сигнала фонового шума сделан естественным и плавным, так что обеспечивается повышение для слушателя комфортабельности восприятия звука. 2 н. и 14 з.п. ф-лы, 5 ил.

Область техники, к которой относится изобретение

Настоящее изобретение относится к области связи и, более конкретно, к способу обработки речевого сигнала и к устройству для обработки речевого сигнала.

Предшествующий уровень техники

В голосовой связи речевые сигналы типично обрабатываются в единицах фреймов. Длина каждого фрейма речевых сигналов обычно составляет от 10 миллисекунд (мс) до 30 мс. Для каждого фрейма речевых сигналов процесс основной обработки состоит в следующем:

В передатчике каждый фрейм речевых сигналов кодируют с помощью речевого кодера и кодированные биты упаковывают в речевой фрейм данных;

речевой фрейм данных передают через канал передачи данных из передатчика в приемник;

в приемнике принятый фрейм речевых данных декодируют с помощью речевого декодера и восстанавливают речевой сигнал.

Для речевого декодера восстановление речевого сигнала зависит от точного приема фрейма речевых данных, переданного из передатчика, и точный прием фрейма речевых данных зависит от канала передачи данных. Для канала передачи данных, если ресурсы канала передачи данных являются недостаточными, может возникнуть потеря фрейма речевых данных или ошибка фрейма речевых данных. В настоящее время влияние на качество передачи данных для фрейма речевых данных, связанное с потерей фрейма речевых данных или ошибкой фрейма речевых данных в канале передачи данных, может быть эффективно устранено с помощью технологии с маскированием стирания фрейма (FEC), широко используемой в речевом кодеке.

Технологии FEC, принятые в разных речевых кодеках, могут быть разными, но обычно включают в себя операции для ослабления амплитуды восстановленных речевых сигналов.

Технология FEC используется в речевых кодеках для выполнения обработки FEC в отношении фрейма речевых данных (соответствует фрейму с маскированием стирания). Однако не все речевые сигналы представляют собой голосовые сигналы, полностью произведенные голосом человека, и речевые сигналы могут также включать в себя сигналы фонового шума в неактивных интервалах речи человека (относительно голосового сигнала, сигнал фоновых шумов не является речевым сигналом). В речевом сигнале, обработанном с использованием с маскированием стирания, может возникнуть скачок энергии из-за присутствия сигнала фонового шума (соответствует фрейму фонового шума, произведенному речевым кодером), что может вызвать дискомфорт у слушателя при прослушивании. В частности, при потере фрейма фонового шума, дискомфорт при прослушивании, связанный со скачком энергии такого типа, может стать более серьезным.

Сущность изобретения

Техническая задача, решаемая вариантами выполнения настоящего изобретения, состоит в предоставления способа и устройства для обработки речевого сигнала, чтобы сделать переход энергии между областью сигнала с маскированием стирания и областью сигнала фонового шума естественным и плавным, для повышения комфортабельности ощущения у слушателя при прослушивании. Для решения упомянутой выше технической задачи варианты выполнения настоящего изобретения направлены на способ обработки речевого сигнала. Этот способ включает в себя:

когда получены один или больше фреймов фонового шума, следующих после фрейма с маскированием стирания, устанавливают значения коэффициента ослабления энергии для сигналов фонового шума, соответствующих полученным фреймам фонового шума, так чтобы разности между значениями коэффициента ослабления энергии сигналов фонового шума, соответствующих фреймам фонового шума, и значениями коэффициента ослабления энергии сигналов, соответствующих их соответственным предшествующим фреймам, находились в пределах порогового диапазона;

управляют ослаблением энергии сигналов фонового шума, соответствующих фреймам фонового шума, используя значения коэффициента ослабления энергии.

В соответствии с этим, варианты выполнения настоящего изобретения направлены на устройство для обработки речевого сигнала. Устройство включает в себя:

модуль получения фреймов фонового шума, выполненный с возможностью получения одного или больше фреймов фонового шума, следующих после фрейма с маскированием стирания;

модуль установки значений коэффициента ослабления энергии, выполненный с возможностью установки значений коэффициента ослабления энергии для сигналов фонового шума, соответствующих полученным фреймам фонового шума, так чтобы разности между значениями коэффициента ослабления энергии сигналов фонового шума, соответствующими фреймам фонового шума, и значениями коэффициента ослабления энергии сигналов, соответствующих их соответственным предшествующим фреймам, находились в пределах порогового диапазона;

модуль управления, выполненный с возможностью управления ослаблением энергии сигналов фонового шума, соответствующих фреймам фонового шума, используя значения коэффициента ослабления энергии.

В вариантах выполнения настоящего изобретения значения коэффициента ослабления энергии устанавливаются для сигналов фонового шума, соответствующих полученным фреймам фонового шума после фрейма с маскированием стирания, таким образом, чтобы разности между значениями коэффициента ослабления энергии сигналов фонового шума, соответствующих фреймам фонового шума, и значениями коэффициента ослабления энергии сигналов, соответствующих их соответственным предшествующим фреймам, находятся в пределах порогового диапазона; и ослаблением энергии сигналов фонового шума, соответствующих фреймам фонового шума, управляют, используя значения коэффициента ослабления энергии. Поэтому переход энергии между областью сигнала с маскированием стирания и областью сигнала фонового шума может быть естественным и плавным путем установки значений коэффициента ослабления энергии сигналов фонового шума и выполнения ослабления энергии в отношении сигналов фонового шума, используя значения коэффициента ослабления энергии, и, таким образом, для слушателя может быть усилено ощущение комфортабельного прослушивания звука.

Краткое описание чертежей

На фиг. 1 показана схема способа обработки речевого сигнала в соответствии с вариантом выполнения настоящего изобретения;

на фиг. 2 схематично показана амплитуда речевого сигнала, полученного в результате обработки речевого сигнала в соответствии с вариантом выполнения настоящего изобретения;

на фиг. 3 схематично показана амплитуда другого речевого сигнала, полученного в результате обработки речевого сигнала в соответствии с вариантом выполнения настоящего изобретения;

на фиг. 4 схематично показана амплитуда другого речевого сигнала, полученного в результате обработки речевого сигнала в соответствии с вариантом выполнения настоящего изобретения;

на фиг. 5 показана схема речевого декодера в соответствии с вариантом выполнения настоящего изобретения.

Подробное описание изобретения

Варианты выполнения настоящего изобретения направлены на способ и устройство для обработки речевого сигнала, в которых может быть выполнено ослабление энергии в отношении сигнала фонового шума путем установки и использования коэффициента ослабления энергии сигнала фонового шума; поэтому переход энергии между областью сигнала с маскированием стирания и областью сигнала фонового шума может быть естественным и плавным, и для слушателя может быть повышена комфортабельность восприятия звука.

В следующем описании будут подробно описаны варианты выполнения настоящего изобретения совместно с приложенными чертежами.

На фиг. 1 показана схема способа обработки речевого сигнала в соответствии с вариантом выполнения настоящего изобретения. На фиг. 2 схематично показана амплитуда речевого сигнала, полученная в результате обработки речевого сигнала в соответствии с вариантом выполнения настоящего изобретения. Как можно видеть на фиг. 1 и на фиг. 2, способ, показанный на фиг. 1, в основном, включает в себя следующие этапы.

101: Получают один или больше фреймов фонового шума, следующих после фрейма с маскированием стирания. Когда получен только один фрейм фонового шума, следующий после фрейма с маскированием стирания, обработка такого фрейма фонового шума может быть такой же, как и для описанного фрейма фонового шума B. В качестве примера, но не для ограничения, ниже иллюстрируются 7 последовательных фреймов фонового шума B, C, D, E, F, G и H. Таким образом, предшествующий фрейм для текущего полученного первого фрейма фонового шума B представляет собой фрейм A с маскированием стирания, и все соответствующие предшествующие фреймы для фреймов фонового шума, за исключением первого фрейма фонового шума B, представляют собой фреймы фонового шума. Сигнал, соответствующий такому фрейму фонового шума, представляет собой сигнал фонового шума. Например, предшествующий фрейм для фрейма фонового шума D представляет собой фрейм фонового шума C. В частности, можно определить, является ли текущий полученный фрейм фреймом фонового шума, в соответствии с флагом в головной части фрейма.

102: Значения коэффициента ослабления энергии установлены для сигналов фонового шума, соответствующих полученным фреймам фонового шума B, C, D, E, F, G и H, таким образом, чтобы разности между значениями коэффициента ослабления энергии сигналов фонового шума, соответствующих фреймам фонового шума B, C, D, E, F, G и H, и значения коэффициента ослабления энергии сигналов, соответствующих их соответственным предшествующим фреймам, находились в пределах порогового диапазона. В частности, этап 102 может быть выполнен следующим образом:

Во-первых, получают сохраненное значение α' коэффициента ослабления энергии сигнала с маскированием стирания, соответствующего фрейму А с маскированием стирания.

Во-вторых, исходное значение α_start коэффициента ослабления энергии для фреймов фонового шума устанавливают в соответствии со значением α' коэффициента ослабления энергии сигнала с маскированием стирания, соответствующего фрейму А с маскированием стирания. Разность между исходным значением α_start коэффициента ослабления энергии и значением α' коэффициента ослабления энергии сигнала с маскированием стирания, соответствующего фрейму с маскированием стирания, находится в пределах порогового диапазона. В частности, можно предположить α_start=α'.

В-третьих, суммарное значение исходного значения α_start коэффициента ослабления энергии и добавленного значения Δα коэффициента ослабления энергии, которое меньше, чем пороговое значение, устанавливают для значения коэффициента ослабления энергии сигнала фонового шума, соответствующего первому фрейму фонового шума B. Суммарные значения для значений коэффициента ослабления энергии сигналов, соответствующих соответственным предшествующим фреймам фонового шума для фреймов фонового шума, за исключением первого фрейма фонового шума B, и добавленное значение коэффициента ослабления энергии устанавливают отдельно для значений коэффициента ослабления энергии сигналов фонового шума, соответствующих фреймам фонового шума, за исключением первого фрейма фонового шума B. В частности, можно предположить: значение коэффициента ослабления энергии сигнала фонового шума, соответствующего фрейму фонового шума B, α_noiseB=α_start+Δα, то есть α_start представляет собой предварительное условие для α_noiseB;

значение коэффициента ослабления энергии сигнала фонового шума, соответствующего фрейму фонового шума C, α_noiseC=α_noiseB+Δα, то есть α_noiseB представляет собой предварительное условие для α_noiseC;

значение коэффициента ослабления энергии сигнала фонового шума, соответствующего фрейму фонового шума D, α_noiseD=α_noiseC+Δα, то есть α_noiseC представляет собой предварительное условие для α_noiseD;

значение коэффициента ослабления энергии сигнала фонового шума, соответствующего фрейму фонового шума E, α_noiseE=α_noiseD+Δα, то есть α_noiseD представляет собой предварительное условие для α_noiseE;

значение коэффициента ослабления энергии сигнала фонового шума, соответствующего фрейму фонового шума F, α_noiseF=α_noiseE+Δα, то есть α_noiseE представляет собой предварительное условие для α_noiseF;

значение коэффициента ослабления энергии сигнала фонового шума, соответствующего фрейму фонового шума G, α_noiseG=α_noiseF+Δα, то есть α_noiseF представляет собой предварительное условие для α_noiseG; и

значение коэффициента ослабления энергии сигнала фонового шума, соответствующего фрейму фонового шума H, α_noiseH=α_noiseG+Δα, то есть α_noiseG представляет собой предварительное условие для α_noiseH.

Следует отметить, когда получено множество последовательных фреймов фонового шума и значение α_noiseкоэффициента ослабления энергии сигнала фонового шума, соответствующего некоторому фрейму фонового шума, удовлетворяет условию α_noise≥1, в результате аналогичного итеративного процесса, как отмечено выше, можно установить α_noise=1 для удовлетворения требованиям обработки речевого сигнала. Для простоты, упомянутый выше итеративный процесс для установки значений коэффициента ослабления энергии сигналов фонового шума, соответствующих, по меньшей мере, двум фреймам фонового шума, может быть выражен следующим уравнением:

α_noise=α_noise+Δα

если α_noise≥1,

{α_noise=1}

В варианте выполнения Δα может быть, но не ограничивается этим, получено одним из следующих двух способов:

, где N=256;

, где L представляет собой заранее установленное количество фреймов фонового шума. В частности, значение L может быть равно 100.

103: Ослаблением энергии сигналов фонового шума, соответствующих фреймам фонового шума B, C, D, E, F, G и H, управляют, используя значения коэффициента ослабления энергии. В частности, этап 103 может быть выполнен следующим образом:

Во-первых, восстанавливают сигналы фонового шума, соответствующие фреймам фонового шума B, C, D, E, F, G и H.

Во-вторых, выполняют ослабление амплитуды для сигналов фонового шума, используя значения коэффициента ослабления энергии, таким образом, чтобы ослабление амплитуды было выполнено в отношении сигнала фонового шума, соответствующего фрейму фонового шума B, используя значение α_noiseB коэффициента ослабления энергии сигнала фонового шума, соответствующего фрейму фонового шума B, ослабление амплитуды выполняют для сигнала фонового шума, соответствующего фрейму фонового шума C, используя значение α_noiseC коэффициента ослабления энергии для сигнала фонового шума, соответствующего фрейму фонового шума C, и т.д. В частности, когда количество выборок сигнала фонового шума в каждом фрейме фонового шума равно М, выполняют ослабление амплитуды в отношении М выборок сигнала фонового шума, соответствующего каждому фрейму фонового шума, используя значения коэффициента ослабления энергии сигнала фонового шума, соответствующего каждому фрейму фонового шума. Для простоты, упомянутая выше обработка по ослаблению амплитуды в отношении М выборок сигнала фонового шума, соответствующего каждому из фреймов фонового шума, может быть выражена следующим уравнением, где noise(n) обозначает амплитуду n-ой выборки сигнала фонового шума среди М выборок сигнала фонового шума:

если (α_noise<1)

для (n=0; n<M; n++)

{noise {n)=noise{n)×α_noise}

В способе обработки речевого сигнала в соответствии с вариантом выполнения настоящего изобретения, как показано на фиг. 1, этапом 102 гарантируется, что разность между значением α_noiseкоэффициента ослабления энергии сигнала фонового шума, соответствующего первому фрейму фонового шума B, и значением α' коэффициента ослабления энергии сигнала с маскированием стирания, соответствующего фрейму A с маскированием стирания, не будет слишком велика, и также гарантируется, что, когда имеются, по меньшей мере, два фрейма фонового шума, разности между значениями коэффициента ослабления энергии сигналов фонового шума, соответствующих фреймам фонового шума C, D, E, F, G, H, и значениями коэффициента ослабления энергии сигналов фонового шума, соответствующих их соответственным предшествующим фреймам фонового шума, не будет слишком велика. На этапе 103 выполняют ослабление энергии в отношении сигналов фонового шума, соответствующих фреймам фонового шума, используя соответственные значения коэффициента ослабления энергии сигналов фонового шума, соответствующих фреймам фонового шума, для обеспечения естественного и плавного перехода энергии между областью сигнала с маскированием стирания и областью сигнала фонового шума, чтобы повысить для слушателя комфортабельность ощущения звука.

В варианте выполнения, этап 102, на котором значения коэффициента ослабления энергии устанавливают для сигналов фонового шума, соответствующих полученным фреймам фонового шума B, C, D, E, F, G и H, таким образом, чтобы разности между значениями коэффициента ослабления энергии сигналов фонового шума, соответствующих фреймам фонового шума B, C, D, E, F, G и H, и значениями коэффициента ослабления энергии сигналов, соответствующих их соответственным предшествующим фреймам, находились в пределах порогового диапазона, может быть выполнен путем использования способа обработки речевого сигнала в соответствии с вариантом выполнения настоящего изобретения, как показано на фиг. 3.

На фиг. 3 показана другая амплитуда речевого сигнала, полученная в результате обработки речевого сигнала в соответствии с вариантом выполнения настоящего изобретения, которая отличается от амплитуды речевого сигнала, полученной в результате обработки речевого сигнала в соответствии с вариантом выполнения настоящего изобретения, показанным на фиг. 2, тем, что используется способ "добавить 2 минус 1". Следует отметить, что упоминаемое ниже 2Δα также должно быть меньше, чем пороговое значение, так что можно допустить, что:

значение коэффициента ослабления энергии сигнала фонового шума, соответствующего фрейму фонового шума B, α_noiseB=α_start+2Δα, то есть α_start представляет собой предварительное условие для α_noiseB;

значение коэффициента ослабления энергии сигнала фонового шума, соответствующего фрейму фонового шума C, α_noiseC=α_noiseB-Δα, то есть α_noiseB представляет собой предварительное условие для α_noiseC;

значение коэффициента ослабления энергии сигнала фонового шума, соответствующего фрейму фонового шума D, α_noiseD=α_noiseC+2Δα, то есть α_noiseC представляет собой предварительное условие для α_noiseD;

значение коэффициента ослабления энергии сигнала фонового шума, соответствующего фрейму фонового шума E, α_noiseE=α_noiseD-Δα, то есть α_noiseD представляет собой предварительное условие для α_noiseE;

значение коэффициента ослабления энергии сигнала фонового шума, соответствующего фрейму фонового шума F, α_noiseF=α_noiseE+2Δα, то есть α_noiseF представляет собой предварительное условие для α_noiseF;

значение коэффициента ослабления энергии сигнала фонового шума, соответствующего фрейму фонового шума G, α_noiseG=α_noiseF-Δα, то есть α_noiseF представляет собой предварительное условие для α_noiseG;

значение коэффициента ослабления энергии сигнала фонового шума, соответствующего фрейму фонового шума H, α_noiseH=α_noiseG+2Δα, то есть α_noiseG представляет собой предварительное условие для α_noiseH.

Таким образом, в отношении значений коэффициента ослабления энергии сигналов фонового шума, соответствующих фреймам фонового шума B, C, D, E, F, G и H, выполняется приращение в относительно конкретном порядке до тех пор, пока значение коэффициента ослабления энергии сигнала фонового шума, соответствующего фрейму фонового шума, не достигнет 1, при этом гарантируется, что разности между значениями коэффициента ослабления энергии сигналов фонового шума, соответствующих фреймам фонового шума B, C, D, E, F, G и H, и соответственными значениями коэффициента ослабления энергии сигналов, соответствующих их соответственным предшествующим фреймам, находятся в пределах порогового диапазона. Поэтому другие аналогичные способы выполнения также можно рассмотреть как другие варианты выполнения настоящего изобретения, например такие способы выполнения, как показаны на фиг. 4.

На фиг. 4 показана амплитуда другого речевого сигнала, полученного в результате обработки речевого сигнала в соответствии с вариантом выполнения настоящего изобретения, которая, в основном, отличается от амплитуды речевого сигнала, полученного при обработке речевого сигнала в соответствии с вариантом выполнения настоящего изобретения, как показано на фиг. 2, тем, что значение α_noiseBкоэффициента ослабления энергии сигнала фонового шума, соответствующего фрейму фонового шума B, равно значению α_start, и значения коэффициента ослабления энергии сигналов фонового шума, соответствующих фреймам фонового шума C, D, E, F, G и H, последовательно увеличиваются на шаг Δα на основе α_noiseB.

На фиг. 2 показан способ обработки речевого сигнала в соответствии с другим вариантом выполнения настоящего изобретения, который включает в себя:

201: Получают один или больше фреймов фонового шума, следующих после фрейма с маскированием стирания. Когда получен только один фрейм фонового шума, следующий после фрейма с маскированием стирания, обработка этого фрейма фонового шума может быть такой же, как и для следующего упомянутого фрейма фонового шума B. В качестве примера, но без ограничений, далее представлены 7 последовательных фреймов фонового шума B, C, D, E, F, G и H. Таким образом, предшествующий фрейм для текущего полученного первого фрейма фонового шума B представляет собой фрейм A с маскированием стирания, и все предшествующие фреймы для фреймов фонового шума, за исключением первого фрейма фонового шума B, представляют собой фреймы фонового шума. Сигнал, соответствующий такому фрейму фонового шума, представляет собой сигнал фонового шума. Например, предшествующий фрейм для фрейма фонового шума D представляет собой фрейм фонового шума C. В частности, то, представляет ли собой текущий полученный фрейм фрейм фонового шума, может быть определено в соответствии с флагом в головной части фрейма.

202: значения коэффициента ослабления энергии устанавливаются для сигналов фонового шума, соответствующих полученным фреймам фонового шума B, C, D, E, F, G и H, таким образом, чтобы разности между значениями коэффициента ослабления энергии сигналов фонового шума, соответствующих фреймам фонового шума B, C, D, E, F, G и H, и значениями коэффициента ослабления энергии сигналов, соответствующих их соответственным предшествующим фреймам, находились в пределах порогового диапазона. Пороговый диапазон представляет собой диапазон значений разности между значениями коэффициента ослабления энергии сигналов фонового шума, соответствующих фреймам фонового шума, и значениями коэффициента ослабления энергии сигналов, соответствующих их соответственным предшествующим фреймам, которые получены в соответствии с требуемым качеством речевого сигнала. Такое пороговое значение представляет собой максимальное значение этого диапазона значений разности. См. этап 102 подробного описания воплощения способа 202, который не будет подробно описан здесь.

203: ослаблением энергии сигналов фонового шума, соответствующих фреймам фонового шума B, C, D, E, F, G и H, управляют, используя значения коэффициента ослабления энергии. См. этап 103 подробного описания воплощения способа 203, который не будет подробно описан здесь.

Устройство для обработки речевого сигнала в соответствии с вариантом выполнения настоящего изобретения будет описано ниже. Однако устройство для обработки речевого сигнала в соответствии с вариантами выполнения настоящего изобретения не ограничивается нижеследующим речевым декодером.

На фиг. 5 показана схема речевого декодера в соответствии с вариантом выполнения настоящего изобретения. Как можно видеть на фиг. 5 и фиг. 2, устройство, показанное на фиг. 5, в основном, включает в себя модуль 51 получения фреймов фонового шума, модуль 52 установки значений коэффициента ослабления энергии и модуль 53 управления. Модуль 52 установки значений коэффициента ослабления энергии включает в себя модуль 521 получения, модуль 522 первой установки, модуль 523 второй установки и модуль 524 третьей установки. Модуль 53 управления включает в себя модуль 531 получения сигналов фонового шума и модуль 532 обработки. Функции различных модулей состоят в следующем.

Модуль 51 получения фреймов фонового шума выполнен с возможностью получения фреймов фонового шума B, C, D, E, F, G и H, следующих после фрейма с маскированием стирания. Таким образом, предшествующий фрейм для текущего полученного первого фрейма фонового шума B представляет собой фрейм А с маскированием стирания, и все предшествующие фреймы для фреймов фонового шума, за исключение первого фрейма фонового шума B, представляют собой фреймы фонового шума. Сигнал, соответствующий такому фрейму фонового шума, представляет собой сигнал фонового шума. Например, предшествующий фрейм фрейма фонового шума D представляет собой фрейм фонового шума C. В частности, то, представляет ли собой или нет полученный фрейм текущий фрейм фонового шума, можно определить по флагу в головной части фрейма, что известно в предшествующем уровне техники и не будет подробно описано здесь.

Модуль 521 получения выполнен с возможностью получения сохраненного значения α' коэффициента ослабления энергии сигнала с маскированием стирания, соответствующего фрейму A с маскированием стирания.

Модуль 522 первой установки выполнен с возможностью установки исходного значения α_startкоэффициента ослабления энергии для фреймов фонового шума в соответствии со значением α' коэффициента ослабления энергии сигнала с маскированием стирания, соответствующего фрейму A с маскированием стирания. Разность между исходным значением α_startкоэффициента ослабления энергии и значением α' коэффициента ослабления энергии сигнала с маскированием стирания, соответствующего фрейму с маскированием стирания, находится в пределах порогового диапазона. В частности, можно допустить, что α_start=α'.

Модуль 523 второй установки выполнен с возможностью установки значения суммы исходного значения α_startкоэффициента ослабления энергии и добавленного значения Δα коэффициента ослабления энергии, которое меньше, чем пороговое значение для значения коэффициента ослабления энергии сигнала фонового шума, соответствующего первому фрейму фонового шума B. В частности, можно допустить, что:

значение коэффициента ослабления энергии сигнала фонового шума, соответствующего фрейму фонового шума B, α_noiseB=α_start+Δα, то есть α_start представляет собой предварительное условие для α_noiseB.

Модуль 524 третьей установки выполнен с возможностью установки значений суммы значений коэффициента ослабления энергии сигналов, соответствующих предшествующим фреймам фонового шума для фреймов фонового шума, за исключением первого фрейма фонового шума B, и добавленного значения коэффициента ослабления энергии для значений коэффициента ослабления энергии сигналов фонового шума, соответствующих фреймам фонового шума, за исключением первого фрейма фонового шума B. В частности, можно допустить, что:

Следует отметить, что когда получено множество последовательных фреймов фонового шума и значение α_noiseкоэффициента ослабления энергии сигнала фонового шума, соответствующего некоторому фрейму фонового шума, удовлетворяет условию α_noise≥1, в результате аналогичного итеративного процесса, как упомянуто выше, можно допустить, что α_noise=1 для удовлетворения требования обработки речевого сигнала. Для простоты, упомянутый выше итеративный процесс для установки значений коэффициента ослабления энергии сигналов фонового шума, соответствующих, по меньшей мере, двум фреймам фонового шума, с помощью модуля установки, может быть выражен следующим уравнением:

α_noise=α_noise+Δα

если (α_noise≥1)

{α_noise=1}

В варианте выполнения Δα может быть, но не ограничивается этим, получено одним из следующих двух способов:

Δα=, где N равно 256;

Δα=, где L представляет предварительно установленное количество фреймов фонового шума. В частности, значение L может быть равно 100.

Модуль 53 управления выполнен с возможностью управления ослаблением энергии сигналов фонового шума, соответствующих фреймам фонового шума B, C, D, E, F, G и H, используя значения коэффициента ослабления энергии. В частности, модуль 53 управления может включать в себя модуль 531 получения сигналов фонового шума и модуль 532 обработки.

Модуль 531 получения сигнала фонового шума выполнен с возможностью восстановления сигналов фонового шума, соответствующих фреймам фонового шума B, C, D, E, F, G и H.

Модуль 532 обработки выполнен с возможностью выполнять ослабление амплитуды в отношении сигналов фонового шума, используя значения коэффициента ослабления энергии, например, выполнять ослабление амплитуды сигнала фонового шума, соответствующего фрейму фонового шума B, используя значения α_noiseBкоэффициента ослабления энергии сигнала фонового шума, соответствующего фрейму фонового шума B, выполнять ослабление амплитуды в отношении сигнала фонового шума, соответствующего фрейму фонового шума C, используя значение α_noiseCослабления энергии сигнала фонового шума, соответствующего фрейму фонового шума C, и так далее. В частности, когда количество выборок сигнала фонового шума в каждом фрейме фонового шума равно М, ослабление амплитуды выполняют в отношении М выборок сигнала фонового шума, соответствующего каждому фрейму фонового шума, используя значение коэффициента ослабления энергии сигнала фонового шума, соответствующее каждому фрейму фонового шума. Для простоты процесс выполнения ослабления амплитуды в отношении М выборок сигнала фонового шума, соответствующего каждому фрейму фонового шума, с помощью модуля 532 обработки, может быть выражен следующим уравнением, где noise(n) обозначает амплитуду n-ой выборки сигнала фонового шума в М выборках сигнала фонового шума:

если (α_noise<1)

для (n=0; n<М; n++)

{noise (n)=noise {n)×α_noise}

В речевом декодере в соответствии с вариантом выполнения настоящего изобретения, как показано на фиг. 5, модуль 52 установки значений коэффициента ослабления энергии выполнен с возможностью обеспечивать то, что разность между значением α_noise коэффициента ослабления энергии сигнала фонового шума, соответствующего первому фрейму фонового шума B, и значением α' коэффициента ослабления энергии сигнала с маскированием стирания, соответствующего фрейму A с маскированием стирания, не слишком велика, и также обеспечивать то, что когда имеются, по меньшей мере, два фрейма фонового шума, разность между значениями коэффициента ослабления энергии сигналов фонового шума, соответствующих фреймам фонового шума C, D, E, F, G, H, и значениями коэффициента ослабления энергии сигналов фонового шума, соответствующих их соответственным предшествующим фреймам фонового шума, соответственно, не будет слишком велика. В модуле 53 управления ослабление энергии выполняют в отношении сигналов фонового шума, соответствующих фреймам фонового шума, путем использования соответственных значений коэффициента ослабления энергии сигналов фонового шума, соответствующих фреймам фонового шума, с тем чтобы сделать переход энергии между областью сигнала с маскированием стирания и сигналом фонового шума естественным и плавным для повышения для слушателя комфортабельности ощущения звука.

В варианте выполнения модуль 52 установки значения коэффициента ослабления энергии выполнен с возможностью осуществления следующих функций: установка значений коэффициента ослабления энергии для сигналов фонового шума, соответствующих полученным фреймам фонового шума B, C, D, E, F, G и H, таким образом, чтобы разности между значениями коэффициента ослабления энергии сигналов фонового шума, соответствующих фреймам фонового шума B, C, D, E, F, G и H, и соответствующими значениями коэффициента ослабления энергии сигналов, соответствующих их предшествующим фреймам, находились в пределах порогового диапазона. Модуль 52 установки значения коэффициента ослабления энергии также может использовать способ обработки речевого сигнала в соответствии с вариантом выполнения настоящего изобретения, показанным на фиг. 3.

Схема другой амплитуды речевого сигнала, полученной при обработке речевого сигнала в соответствии с вариантом выполнения настоящего изобретения, как показано на фиг. 3, отличается от амплитуды речевого сигнала, полученной при обработке речевого сигнала в соответствии с вариантом выполнения настоящего изобретения, показанного на фиг. 2, тем, что здесь используется способ "добавить 2 минус 1". Следует отметить, что упоминаемое далее 2Δα также должно быть меньше порогового диапазона, так что можно допустить:

значение коэффициента ослабления энергии сигнала фонового шума, соответствующего фрейму фонового шума B, α_noiseB=α_start+2Δα, то есть a_start представляет собой предварительное условие для α_noiseB;

значение коэффициента ослабления энергии для сигнала фонового шума, соответствующего фрейму фонового шума С, α_noiseC=α_noiseB-Δα, то есть α_noiseB представляет собой предварительное условие для α_noiseC;

значение коэффициента ослабления энергии для сигнала фонового шума, соответствующего фрейму фонового шума D, α_noiseD=α_noiseC+2Δα, то есть α_noiseC представляет собой предварительное условие для α_noiseD;

значение коэффициента ослабления энергии для сигнала фонового шума, соответствующего фрейму фонового шума E, α_noiseE=α_noiseD-Δα, то есть α_noiseD представляет собой предварительное условие для α_noiseE;

значение коэффициента ослабления энергии для сигнала фонового шума, соответствующего фрейму фонового шума F, α_noiseF=α_noiseE+2Δα, то есть α_noiseE представляет собой предварительное условие для α_noiseF;

значение коэффициента ослабления энергии для сигнала фонового шума, соответствующего фрейму фонового шума G, α_noiseG=α_noiseF-Δα, то есть α_noiseF представляет собой предварительное условие для α_noiseG;

значение коэффициента ослабления энергии для сигнала фонового шума, соответствующего фрейму фонового шума H, α_noiseH=α_noiseG+2Δα, то есть α_noiseG представляет собой предварительное условие для α_noiseH.

Таким образом, для значений коэффициента ослабления энергии сигналов фонового шума, соответствующих фреймам фонового шума B, C, D, E, F, G и H, выполняют приращение в относительно конкретном порядке до тех пор, пока значение коэффициента ослабления энергии сигнала фонового шума, соответствующего фрейму фонового шума, не достигнет 1, при этом гарантируется, что разности между значениями коэффициента ослабления энергии сигналов фонового шума, соответствующих фреймам фонового шума B, C, D, E, F, G и H, и соответствующими значениями коэффициента ослабления энергии сигналов, соответствующих их предшествующим фреймам, будут в пределах порогового диапазона. Поэтому также можно рассмотреть другие аналогичные способы реализации, как другие варианты выполнения настоящего изобретения, например, другую амплитуду речевого сигнала, получаемую при обработке речевого сигнала в соответствии с вариантом выполнения настоящего изобретения, как показано на фиг. 4, можно использовать аналогичным образом. Следует отметить следующее:

1. В упомянутых выше вариантах выполнения настоящего изобретения фреймы фонового шума B, C, D, E, F, G и H приняты как пример для иллюстрации. Однако настоящее изобретение также применимо в практических условиях с большим или меньшим количеством фреймов фонового шума.

2. Упомянутые выше пороговые значения могут быть выбраны в соответствии с практическими условиями из, но без ограничений: 2Δα, 2,5Δα, 3Δα и т.д., где Δα=. Исходные значения коэффициента ослабления энергии и добавленное значение коэффициента ослабления энергии, используемые в вариантах выполнения настоящего изобретение, могут быть определены в соответствии с пороговым диапазоном и практическими условиями.

Когда потерянный фрейм представляет собой фрейм фонового шума, поскольку энергия сигнала с маскированием стирания, полученного с использованием существующей технологии FEC, может быть ослаблена более резко, чем в случае, когда не происходит потеря фрейма фонового шума, если будет получен фрейм фонового шума, следующий после фрейма с маскированием стирания, скачок при переходе энергии между областью сигнала с маскированием стирания и областью сигнала фонового шума может быть более заметен, чем в случае, когда не происходит потеря фрейма фонового шума. В этих условиях, путем использования вариантов выполнения настоящего изобретения, переход энергии между областью сигнала с маскированием стирания и областью сигнала фонового шума может быть эффективно сделан естественным и плавным для повышения комфортабельности восприятия звука слушателем.

Кроме того, для специалиста в данной области техники будет понятно, что все или части потоков в упомянутых выше вариантах выполнения способа могут быть воплощены путем подачи инструкций в соответствующие аппаратные средства с помощью программы. Программа может быть сохранена на считываемом компьютером носителе информации. Программа, при ее исполнении, может включать в себя потоки упомянутых выше вариантов выполнения различных способов. Носители информации могут представлять собой магнитный диск, оптический диск, постоянное запоминающее устройство (ROM, ПЗУ) или оперативное запоминающее устройство (RAM, ОЗУ) и т.д.

Конкретные варианты выполнения настоящего изобретения были описаны выше. Следует отметить, что для специалиста в данной области техники дополнительные модификации и улучшения могут быть выполнены без выхода за рамки принципов настоящего изобретения. Эти модификации и улучшения следует рассматривать как подпадающие под объем охраны настоящего изобретения.

1. Способ обработки речевого сигнала, отличающийся тем, что содержит этапы, на которых:
когда получены один или больше фреймов фонового шума, следующих после фрейма с маскированием стирания, устанавливают значения коэффициента ослабления энергии для сигнала фонового шума, соответствующего полученным фреймам фонового шума, так чтобы разности между значениями коэффициента ослабления энергии сигналов фонового шума, соответствующих фреймам фонового шума, и значениями коэффициента ослабления энергии сигналов, соответствующих их соответственным предшествующим фреймам, находились в пределах порогового диапазона;
управляют ослаблением энергии сигналов фонового шума, соответствующих фреймам фонового шума, используя значения коэффициента ослабления энергии.

2. Способ обработки речевого сигнала по п.1, отличающийся тем, что при установке значений коэффициента ослабления энергии для сигналов фонового шума, соответствующих полученным фреймам фонового шума:
получают значение коэффициента ослабления энергии сигнала с маскированием стирания, соответствующего фрейму с маскированием стирания;
устанавливают исходное значение коэффициента ослабления энергии для фреймов фонового шума в соответствии со значением коэффициента ослабления энергии сигнала с маскированием стирания, соответствующего фрейму с маскированием стирания, при этом разность между исходным значением коэффициента ослабления энергии и значением коэффициента ослабления энергии сигнала с маскированием стирания, соответствующего фрейму с маскированием стирания, находится в пределах порогового диапазона;
устанавливают суммарное значение исходного значения коэффициента ослабления энергии и добавленного значения коэффициента ослабления энергии, которое меньше, чем пороговое значение, для значения коэффициента ослабления энергии сигнала фонового шума, соответствующего первому из полученных фреймов фонового шума, следующих после фрейма с маскированием стирания.

3. Способ обработки речевого сигнала по п.2, отличающийся тем, что дополнительно содержит:
когда получены, по меньшей мере, два фрейма фонового шума, следующих после фрейма с маскированием стирания, устанавливают суммарные значения для значений коэффициента ослабления энергии сигналов, соответствующих предшествующим соответствующим фреймам фонового шума для фреймов фонового шума, за исключением первого фрейма фонового шума, и добавленного значения коэффициента ослабления энергии для значений коэффициента ослабления энергии сигналов фонового шума, соответствующих фреймам фонового шума, за исключением первого фрейма фонового шума.

4. Способ обработки речевого сигнала по п.3, отличающийся тем, что добавленное значение коэффициента ослабления энергии равно 1/256 или установленному значению, причем это установленное значение получают путем деления значения разности между 1 и исходным значением коэффициента ослабления энергии на заранее заданное количество фреймов фонового шума.

5. Способ обработки речевого сигнала по п.4, отличающийся тем, что заранее заданное количество фреймов фонового шума равно 100.

6. Способ обработки речевого сигнала по п.1 или 2, отличающийся тем, что пороговое значение представляет собой максимальный диапазон разности между значениями коэффициента ослабления энергии сигналов фонового шума, соответствующих фреймам фонового шума, и значениями коэффициента ослабления энергии сигналов, соответствующих их соответственным предшествующим фреймам, при этом пороговое значение получают в соответствии с требуемым качеством речевого сигнала.

7. Способ обработки речевого сигнала по любому одному из пп.1-5, отличающийся тем, что исходное значение коэффициента ослабления энергии равно значению коэффициента ослабления энергии сигнала с маскированием стирания, соответствующего фрейму с маскированием стирания.

8. Способ обработки речевого сигнала по любому одному из пп.1-5, отличающийся тем, что при управлении ослаблением энергии сигналов фонового шума, соответствующих фреймам фонового шума, используя значения коэффициента ослабления энергии:
восстанавливают сигналы фонового шума, соответствующие фреймам фонового шума; и
выполняют ослабление амплитуды в отношении сигналов фонового шума, используя значения коэффициента ослабления энергии, как выражено следующим уравнением:
если (α_noise<1),
для (n=0; n<М; n++),
{noise(n)=noise(n)×α_noise},
где noise(n) обозначает амплитуду n-го сигнала фонового шума среди М сигналов фонового шума, α_noise обозначает значение коэффициента ослабления энергии сигнала фонового шума, соответствующего фрейму фонового шума.

9. Способ обработки речевого сигнала по любому одному из пп.1-5, отличающийся тем, что фрейм с маскированием стирания представляет собой фрейм фонового шума, в отношении которого выполнена обработка по маскированию стирания.

10. Устройство для обработки речевого сигнала, отличающееся тем, что содержит:
модуль получения фреймов фонового шума, выполненный с возможностью получения одного или больше фреймов фонового шума, следующих после фрейма с маскированием стирания;
модуль установки значений коэффициента ослабления энергии, выполненный с возможностью установки значений коэффициента ослабления энергии для сигналов фонового шума, соответствующих полученным фреймам фонового шума, так чтобы разности между значениями коэффициента ослабления энергии сигналов фонового шума, соответствующих фреймам фонового шума, и значениями коэффициента ослабления энергии сигналов, соответствующих их соответственным предшествующим фреймам, находились в пределах порогового диапазона;
модуль управления, выполненный с возможностью управления ослаблением энергии сигналов фонового шума, соответствующих фреймам фонового шума, используя значения коэффициента ослабления энергии.

11. Устройство для обработки речевого сигнала по п.10, отличающееся тем, что модуль установки значений коэффициента ослабления энергии содержит:
модуль получения, выполненный с возможностью получения значения коэффициента ослабления энергии сигнала с маскированием стирания, соответствующего фрейму с маскированием стирания;
первый модуль установки, выполненный с возможностью установки исходного значения коэффициента ослабления энергии для фреймов фонового шума в соответствии со значением коэффициента ослабления энергии сигнала с маскированием стирания, соответствующего фрейму с маскированием стирания, при этом разность между исходным значением коэффициента ослабления энергии и значением коэффициента ослабления энергии сигнала с маскированием стирания, соответствующего фрейму с маскированием стирания, находится в пределах порогового диапазона;
второй модуль установки, выполненный с возможностью установки суммарного значения исходного значения коэффициента ослабления энергии и добавленного значения коэффициента ослабления энергии, которое меньше, чем пороговое значение, для значения коэффициента ослабления энергии сигнала фонового шума, соответствующего первому из полученных фреймов фонового шума, следующих после фрейма с маскированием стирания.

12. Устройство обработки речевого сигнала по п.11, отличающееся тем, что, когда получены, по меньшей мере, два фрейма фонового шума, следующих после фрейма с маскированием стирания, модуль установки значения коэффициента ослабления энергии дополнительно содержит:
третий модуль установки, выполненный с возможностью установки значения суммы коэффициента ослабления энергии сигналов, соответствующих соответственным предшествующим фреймам фонового шума для фреймов фонового шума, за исключением первого фрейма фонового шума, и добавленного коэффициента ослабления энергии, для значений коэффициента ослабления энергии сигналов фонового шума, соответствующих фреймам фонового шума, за исключением первого фрейма фонового шума.

13. Устройство для обработки речевого сигнала по п.10, отличающееся тем, что пороговое значение представляет собой диапазон максимальной разности между значениями коэффициента ослабления энергии сигналов фонового шума, соответствующих фреймам фонового шума, и значениями коэффициента ослабления энергии сигналов, соответствующих их соответственным предшествующим фреймам, которое получено в соответствии с требуемым качеством речевого сигнала.

14. Устройство для обработки речевого сигнала по любому одному из пп.10-12, отличающееся тем, что модуль управления содержит:
модуль получения сигналов фонового шума, выполненный с возможностью восстановления сигналов фонового шума, соответствующих фреймам фонового шума;
модуль обработки, выполненный с возможностью ослабления амплитуды в отношении сигналов фонового шума, используя значения коэффициента ослабления энергии, как выражено следующим уравнением:
если (α_noise<1),
для (n=0; n<М; n++),
{noise(n)=noise(n)×α_noise},
где noise(n) обозначает амплитуду n-го сигнала фонового шума среди М сигналов фонового шума, α_noise обозначает значение коэффициента ослабления энергии сигнала фонового шума, соответствующего фрейму фонового шума.

15. Устройство для обработки речевого сигнала по любому одному из пп.10-12, отличающееся тем, что фрейм с маскированием стирания представляет собой фрейм фонового шума, в отношении которого выполнена обработка по маскированию стирания.

16. Устройство для обработки речевого сигнала по любому одному из пп.10-12, отличающееся тем, что представляет собой речевой декодер.

Изобретение относится к параметрическим многоканальным декодерам типа стереодекодера, в частности к устройствам и способам для синтезирования звука, который может быть представлен наборами параметров, каждый из которых содержит характеристики синусоид, представляющие синусоидальные составляющие звука, и характеристики, представляющие другие компоненты.

Синтез потерянных блоков цифрового аудиосигнала с коррекцией питч-периода // 2432625

Способ уменьшения объема данных при широкополосном кодировании речевого сигнала // 2432624

Изобретение относится к области цифровой связи и может быть использовано в системах телеинформационных коммуникаций при широкополосном кодировании речевого сигнала.

Аппаратура и метод многоканального параметрического преобразования // 2431940

Изобретение относится к многоканальному преобразованию параметров, в частности к генерированию параметров когерентности и параметров выходного уровня, которые указывают на пространственные свойства между двумя звуковыми сигналами, основанными на объектно-параметровом базовом представлении звукового воспроизведения в пространстве.

Устройство декодирования параметров, устройство кодирования параметров и способ декодирования параметров // 2431892

Усовершенствованный метод кодирования и параметрического представления кодирования многоканального объекта после понижающего микширования // 2430430

Изобретение относится к декодированию множественных объектов путем преобразования закодированного многообъектного сигнала с помощью многоканального понижающего микширования и вспомогательных управляющих данных.

Кодирование аудиосигнала // 2428748

Изобретение относится к кодированию аудиосигнала, более конкретно к способу, устройствам, системе и машиночитаемому носителю, поддерживающим такое кодирование. .

Системы, способы и устройство для широкополосного кодирования и декодирования неактивных кадров // 2428747

Изобретение относится к обработке речевых сигналов. .

Способ формирования отпечатка для звукового сигнала // 2427909

Изобретение относится к области формирования «отпечатка» для полезного сигнала, представляющего собой данные, предназначенные для восприятия пользователем. .

Система и способ обеспечения синхронизации для адаптивной многоскоростной широкополосной прерываемой передачи // 2427043

Аудиопроцессор и способ обработки звука с высококачественной коррекцией частоты основного тона (варианты) // 2436174

Изобретение относится к аудиопроцессору и способу для цифровой обработки звукового сигнала в последовательность фреймов посредством дискретизации и повторной дискретизации сигнала в зависимости от частоты основного тона

Ослабление чрезмерной тональности, в частности, для генерирования возбуждения в декодере при отсутствии информации // 2437170

Изобретение относится к обработке цифровых аудиосигналов, таких как речевые сигналы в области телекоммуникации, в частности к декодированию таких сигналов

Системы, способы и устройство для широкополосного кодирования и декодирования активных кадров // 2437171

Изобретение относится к обработке речевых сигналов

Способ кодирования/декодирования индексов кодовой книги для квантованного спектра мдкп в масштабируемых речевых и аудиокодеках // 2437172

Изобретение относится к средствам кодирования/декодирования спектра модифицированного дискретного косинусного преобразования

Способ и устройство для обработки звукового сигнала // 2439717

Изобретение относится к способу и устройству обработки звукового сигнала

Способ и устройство для обработки звукового сигнала // 2439718

Изобретение относится к способу и устройству обработки звукового сигнала

Устройство и способ для синтезирования выходного сигнала // 2439719

Изобретение относится к синтезированию с применением аудиорендеринга выходного стереосигнала или выходного многоканального аудиосигнала, сформированных в результате понижающего микширования с использованием дополнительных управляющих данных

Способ и устройство для обработки звукового сигнала // 2439720

Изобретение относится к кодированию и декодированию звуковых сигналов с использованием спектральных данных сигнала

Аудиокодер для кодирования аудиосигнала, имеющего импульсоподобную и стационарную составляющие, способы кодирования, декодер, способ декодирования и кодированный аудиосигнал // 2439721

Изобретение относится к кодированию источников, в частности к кодированию источников звука, при котором аудиосигнал обрабатывается, по меньшей мере, двумя различными аудиокодерами, использующими два различных алгоритма кодирования

Системы и способы затенения первого пакета, соответствующего первой битовой скорости, во втором пакете, соответствующем второй битовой скорости // 2440628

Изобретение относится к технологии обработки речи, в частности к затенению первого пакета