Патенты автора СЕХЛЬСТЕДТ Мартин (SE)

Изобретение относится к средствам для оценки фонового шума. Технический результат заключается в повышении точности детектирования в аудиосигнале речи или музыки. Уменьшают текущее оценочное значение фонового шума в ответ на определение, что сегмент аудиосигнала содержит музыку, и определение, что текущее оценочное значение фонового шума превышает минимальное значение, когда энергетический уровень сегмента аудиосигнала меньше порога, превышающего долговременный минимальный энергетический уровень (lt_min), который определен по множеству предыдущих сегментов аудиосигнала, и не обнаружена пауза в сегменте аудиосигнала. Блок оценки фонового шума также выполнен с возможностью уменьшения текущего оценочного значения фонового шума в ответ на определение, что сегмент аудиосигнала содержит музыку, и определение, что текущее оценочное значение фонового шума превышает минимальное значение, когда энергетический уровень сегмента аудиосигнала меньше порога. 3 н. и 15 з.п. ф-лы, 9 ил.

Изобретение относится к средствам для оценивания фонового шума в аудиосигнале. Технический результат заключается в повышении точности оценивания, содержит ли аудиосигнал активную речь или музыку. Получают по меньшей мере один параметр, ассоциированный с сегментом аудиосигнала, такой как кадр или часть кадра, на основе: первого коэффициента усиления линейного предсказания, вычисленного как соотношение между остаточным сигналом из линейного предсказания 0-го порядка и остаточным сигналом из линейного предсказания 2-го порядка для сегмента аудиосигнала; и второго коэффициента усиления линейного предсказания, вычисленного как соотношение между остаточным сигналом из линейного предсказания 2-го порядка и остаточным сигналом из линейного предсказания 16-го порядка для сегмента аудиосигнала. Определяют, содержит ли сегмент аудиосигнала паузу на основе полученного по меньшей мере одного параметра. Обновляют оценку фонового шума на основе сегмента аудиосигнала, когда сегмент аудиосигнала содержит паузу. 4 н. и 11 з.п. ф-лы, 25 ил.

Изобретение относится к области обнаружения речевой активности (VAD). Техническим результатом является уменьшение риска отсечения середины и окончания речевых пакетов путем добавления хвостов сигнала. Способ включает в себя этапы: определение меры краткосрочной активности на основании количества активных фреймов в памяти, определение меры долгосрочной активности на основании количества активных фреймов, если превышено одно из первого и второго пороговых значений. 2 н. и 11 з.п. ф-лы, 9 ил.

Изобретение относится к средствам для оценивания фонового шума в аудиосигнале. Технический результат заключается в повышении точности оценивания, содержит ли аудиосигнал активную речь или музыку или нет. Получают по меньшей мере один параметр, ассоциированный с сегментом аудиосигнала, такой как кадр или часть кадра, на основе: первого коэффициента усиления линейного предсказания, вычисленного как соотношение между остаточным сигналом из линейного предсказания 0-го порядка и остаточным сигналом из линейного предсказания 2-го порядка для сегмента аудиосигнала; и второго коэффициента усиления линейного предсказания, вычисленного как соотношение между остаточным сигналом из линейного предсказания 2-го порядка и остаточным сигналом из линейного предсказания 16-го порядка для сегмента аудиосигнала. Определяют, содержит ли сегмент аудиосигнала паузу, на основе полученного по меньшей мере одного параметра. Обновляют оценку фонового шума на основе сегмента аудиосигнала, когда сегмент аудиосигнала содержит паузу. 7 н. и 16 з.п. ф-лы, 24 ил.

Изобретение относится к области обнаружения голосовой активности (VAD). Техническим результатом является сокращение возможности отсечения речи в речевых пакетах за счет более конкретного добавления хвостов сигнала. Способ включает в себя создание сигнала, указывающего на первичное решение VAD, и определение необходимости добавления хвостов сигнала, определение необходимости добавления хвостов сигнала выполняется в зависимости от меры краткосрочной активности и меры долгосрочной активности. Затем создается сигнал, указывающий на окончательное решение VAD. 5 н. и 22 з.п. ф-лы, 9 ил.

 


Наверх