Патенты автора СЕХЛЬСТЕДТ, Мартин (SE)

Изобретение относится к области вычислительной техники для обработки аудиоданных. Технический результат заключается в исключении артефактов воспроизведения аудиоданных с отсечением концов последних речевых сегментов, таких как речевой фрагмент, заканчивающийся неречевым взрывом. Технический результат достигается за счет определения первичного решения обнаружения голосовой активности (VAD) на основании голосовой активности; определения окончательного решения VAD на основании того, выполняется ли добавление хвостов сигнала первичного решения; определения меры краткосрочной голосовой активности на основании прошлых первичных решений; определения меры долгосрочной голосовой активности на основании прошлых окончательных решений или прошлых первичных решений; и определения альтернативного окончательного решения для регулирования добавления хвостов сигнала на основании меры краткосрочной голосовой активности и меры долгосрочной голосовой активности. 3 н. и 11 з.п. ф-лы, 9 ил.

Изобретение относится к области вычислительной техники для обработки аудиосигналов. Технический результат заключается в повышении точности оценивания фонового шума в аудиосигналах. Технический результат достигается за счет первого коэффициента усиления линейного предсказания, вычисленного как соотношение между энергией остаточного сигнала из первого линейного предсказания и энергией остаточного сигнала из второго линейного предсказания для сегмента аудиосигнала, причем второе линейное предсказание происходит из более высокого порядка, чем первое линейное предсказание; и второго коэффициента усиления линейного предсказания, вычисленного как соотношение между энергией остаточного сигнала из второго линейного предсказания и энергией остаточного сигнала из третьего линейного предсказания для сегмента аудиосигнала, причем третье линейное предсказание происходит из более высокого порядка, чем второе линейное предсказание; определения, содержит ли сегмент аудиосигнала паузу, на основе, по меньшей мере, упомянутого по меньшей мере одного параметра; и если определено, что сегмент аудиосигнала содержит паузу, обновления оценки фонового шума на основе сегмента аудиосигнала. 4 н. и 10 з.п. ф-лы, 24 ил.

Изобретение относится к средствам оценки фонового шума звуковых сигналов. Технический результат заключается в повышении точности детектирования в аудиосигнале речи или музыки. Уменьшают текущее оценочное значение фонового шума, когда определено, что сегмент аудиосигнала содержит музыку и текущее оценочное значение фонового шума превышает минимальное значение. Это должно быть выполнено, когда энергетический уровень сегмента аудиосигнала больше порога, превышающего долговременный минимальный энергетический уровень, который определяется по множеству предыдущих сегментов аудиосигнала, или когда энергетический уровень сегмента аудиосигнала меньше порога, превышающего долговременный минимальный энергетический уровень, но в сегменте аудиосигнала не обнаружена пауза. 7 н. и 4 з.п. ф-лы, 9 ил.

 


Наверх