Усовершенствованная коррекция потери кадров с помощью речевой информации - заявка 2016146916 на патент на изобретение в РФ

1. Способ обработки цифрового аудиосигнала, содержащего последовательность отсчетов, распределенных в последовательных кадрах, причем способ реализуют при декодировании упомянутого сигнала, чтобы заменить по меньшей мере один потерянный кадр сигнала во время декодирования,
причем способ содержит этапы, на которых:
a) осуществляют поиск в доступном при декодировании сегменте полезного сигнала по меньшей мере одного периода в сигнале, определяемого на основе упомянутого полезного сигнала,
b) анализируют сигнал в упомянутом периоде, чтобы определить спектральные компоненты сигнала в упомянутом периоде,
c) синтезируют по меньшей мере одну замену для потерянного кадра путем построения синтезированного сигнала из:
суммы компонент, выбранных из упомянутых определенных спектральных компонент, и
шума, добавленного к сумме компонент,
при этом величину шума, добавленного к сумме компонент, взвешивают на основании речевой информации полезного сигнала, полученного при декодировании.
2. Способ по п. 1, в котором шумовой сигнал, добавляемый к сумме компонент, взвешивают посредством меньшего коэффициента усиления в случае наличия речевой информации в полезном сигнале.
3. Способ по п. 2, в котором шумовой сигнал получают путем нахождения разности между полезным сигналом и суммой выбранных компонент.
4. Способ по п. 1, в котором число компонент, выбираемых для сложения, больше в случае наличия речевой информации в полезном сигнале.
5. Способ по п. 1, в котором на этапе а) осуществляют поиск периода в сегменте (Nc) полезного сигнала большей длительности в случае наличия речевой информации в полезном сигнале.
6. Способ по п. 1, в котором речевую информацию передают в битовом потоке, принимаемом при декодировании и соответствующем упомянутому сигналу, содержащему последовательность отсчетов, распределенных в последовательных кадрах,
при этом в случае потери кадра при декодировании используют речевую
информацию, содержащуюся в кадре полезного сигнала, предшествующем потерянному кадру.
7. Способ по п. 6, в котором речевая информация поступает из кодера, генерирующего битовый поток и определяющего речевую информацию, при этом речевую информацию кодируют одним битом в битовом потоке.
8. Способ по п. 7, в котором шумовой сигнал, добавленный к сумме компонент, взвешивают с меньшим коэффициентом усиления в случае наличия речевой информации в полезном сигнале, при этом, если сигнал является речевым, то коэффициент усиления равен 0,25, а в противном случае равен 1.
9. Способ по п. 6, в котором речевая информация поступает от кодера, определяющего значение равномерности спектра, получаемое путем сравнения амплитуд спектральных компонент сигнала с фоновым шумом, причем упомянутый кодер доставляет упомянутое значение в двоичном виде в битовом потоке.
10. Способ по п. 7, в котором шумовой сигнал, добавленный к сумме компонент, взвешивают с меньшим коэффициентом усиления в случае наличия речевой информации в полезном сигнале, при этом значение коэффициента усиления определяют как функцию упомянутого значения равномерности.
11. Способ по п. 9, в котором упомянутое значение равномерности сравнивают с порогом, чтобы определить:
что сигнал является речевым, если значение равномерности ниже порога, и
что сигнал не является речевым в противном случае.
12. Способ по п. 7, в котором количество компонент, выбранных для суммирования, больше в случае наличия речевой информации в полезном сигнале, при этом:
если сигнал является речевым, то выбирают спектральные компоненты, имеющие амплитуду больше, чем амплитуда первых соседних спектральных компонент, а также первые соседние спектральные компоненты, и
в противном случае выбирают только спектральные компоненты, имеющие амплитуду больше, чем амплитуда первых соседних спектральных компонент.
13. Способ по п. 7, в котором на этапе а) осуществляют поиск в упомянутом периоде сегмента полезного сигнала больше длины в случае наличия речевой информации в полезном сигнале, при этом:
если сигнал является речевым, то осуществляют поиск периода в сегменте полезного сигнала длительностью более 30 миллисекунд,
в противном случае осуществляют поиск периода в сегменте полезного сигнала
длительностью менее 30 миллисекунд.
14. Считываемый компьютером носитель, содержащий код компьютерной программы, причем компьютерная программа содержит команды для реализации способа по любому из пп. 1-13 при выполнении программы процессором.
15. Устройство для декодирования цифрового аудиосигнала, содержащего последовательность отсчетов, распределенных в последовательных кадрах, при этом устройство содержит компьютерную схему для замены по меньшей мере одного потерянного кадра сигнала посредством:
a) поиска в доступном при декодировании сегменте (Nc) полезного сигнала по меньшей мере одного периода в сигнале, определяемого на основе упомянутого полезного сигнала,
b) анализа сигнала в упомянутом периоде, чтобы определить спектральные компоненты сигнала в упомянутом периоде,
c) синтеза по меньшей мере одного кадра для замены потерянного кадра путем построения синтезированного сигнала из:
суммы компонент, выбранных из упомянутых определенных спектральных компонент, и
шума, добавленного к сумме компонент,
при этом величина шума, добавленного к сумме компонент, взвешена на основании речевой информации полезного сигнала, полученного при декодировании.
16. Устройство для кодирования цифрового аудиосигнала, содержащее компьютерную схему для предоставления речевой информации в потоке данных, доставляемом кодирующим устройством, выполненное с возможностью различать речевой сигнал, который вероятно является вокализованным, от музыкального сигнала, и в случае речевого сигнала устройство выполнено с возможностью:
определять, что сигнал является речевым или стандартным, чтобы рассматривать его в целом как речевой, или
определять, что сигнал является неактивным, переходным или неречевым, чтобы рассматривать его в целом как неречевой.
Наверх