Способ формирования сигнала возбуждения в низкоскоростных вокодерах с линейным предсказанием

Авторы патента:

G10L19/08 - определение или кодирование функций возбуждения; определение или кодирование параметров долгосрочных прогнозов

Владельцы патента RU 2400832:

Государственное образовательное учреждение высшего профессионального образования Академия Федеральной службы охраны Российской Федерации (Академия ФCО России) (RU)

Изобретение относится к области цифровой связи и может быть использовано в системах телеинформационных коммуникаций для эффективного кодирования речевых сигналов. Техническим результатом является уменьшение скорости передачи данных по каналам связи за счет эффективного кодирования речевых сигналов на основе линейного предсказания. Указанный технический результат достигается посредством отказа от передачи по каналу связи информации о сигнале возбуждения, который синтезируют непосредственно на приеме по данным о параметрах синтезирующей модели. По каналу связи передают информацию о параметрах синтезирующего фильтра, содержащих информацию о коэффициентах предсказания или линейных спектральных частотах, а также значение коэффициента усиления сигнала возбуждения. На приеме по данным параметрам рассчитывают амплитудно-частотную характеристику синтезирующего фильтра на фазовых углах его полюсов и формируют спектр амплитуд и фаз сигнала возбуждения. Сигнал возбуждения формируют на основе данных о спектрах его амплитуд и фаз и коэффициенте усиления. 2 ил.

Изобретение относится к области цифровой связи и может быть использовано в системах телеинформационных коммуникаций для эффективного кодирования речевых сигналов.

Основной проблемой цифрового представления речевого сигнала является задача качественного и компактного кодирования данных для их передачи по цифровым каналам связи. Решение этой проблемы позволит в условиях заданного критерия качества связи увеличить пропускную способность линейных трактов и каналов передачи. Часто в некоторых задачах кодирования речевого сигнала предполагается снизить скорость передачи при сохранении качественных показателей ее восприятия.

Среди многообразия методов кодирования речевых сигналов одним из наиболее эффективных является метод линейного предсказания. Метод линейного предсказания речи принадлежит к классу методов, использующих модель речевого сигнала в виде отклика линейной системы с переменными параметрами (голосового тракта) на соответствующий сигнал возбуждения (порождающий сигнал). Анализатор речепреобразующего устройства выделяет из короткого сегмента речевого сигнала параметры состояния линейной системы и сигнала возбуждения, позволяющие синтезатору восстановить исходный сигнал с требуемой степенью верности.

Известны способы синтеза сигналов возбуждения в вокодерах с линейным предсказанием, основанные на анализе остатка линейного предсказания (О.И.Шелухин, Н.Ф.Лукьянцев. Цифровая обработка и передача речи. М., Радио и Связь, 2000 г. - С.102-166; Рабинер Л.Р., Шафер Р.В. Цифровая обработка речевых сигналов. - М.: Радио и связь, 1981. - С.365-428).

В устройствах, реализующих данные способы, осуществляется анализ остатка линейного предсказания с целью синтеза сигналов возбуждения на приеме. При этом по каналу связи передается информация о коэффициентах формирующей модели, параметрах, характеризующих сигнал возбуждения и кодируемый речевой сигнал.

Для эффективного представления сигнала возбуждения в таких устройствах используются различные способы снижения информативной избыточности данных последовательностей (патенты US №7289952 от 30.10.2007, US №7233896 от 10.07.2007, US №7133823 от 7.11.2006, US №5963897 от 5.10.1999, US №6757650 от 29.06.2004, RU №2163399 от 22.10.1997, RU №97117357 от 20.02.2001).

Недостатком данных способов является значительное расходование информационного ресурса на представление сигнала возбуждения при его передаче по каналу связи, и, следовательно, относительно высокая скорость передачи данных по каналам связи при эффективном кодировании речи.

Техническим результатом предлагаемого способа является уменьшение скорости передачи данных по каналам связи при эффективном кодировании речевых сигналов на основе линейного предсказания.

Для достижения данного технического результата в вокодере с линейным предсказанием предлагается исключить передачу по каналу связи информации о сигнале возбуждения. Формирование сигнала возбуждения можно реализовать непосредственно на приеме по данным о синтезирующей модели. При этом по каналу связи передается информация только о параметрах формирующей модели, коэффициенте усиления и параметрах, характеризующих кодируемый речевой сигнал, которые должны быть рассчитаны на каждом квазистационарном сегменте анализа речевого сигнала.

Экспериментальные исследования модели линейного предсказания речи показали, что если подвергнуть анализу остаток линейного предсказания, то ясно прослеживается практически незначительно искаженный речевой сигнал. Данный факт указывает на схожесть нормированных спектральных плотностей мощности реального речевого сигнала и остатка линейного предсказания, и дальнейшие исследования подтвердили данное предположение. В качестве синтезирующего фильтра при линейном предсказании используют рекурсивный фильтр, при этом его полюсы отражают максимумы формируемой амплитудно-частотной характеристики (АЧХ), которые соответствуют максимумам спектральной плотности мощности анализируемого сегмента речевого сигнала на участке квазистационарности. Параметры синтезирующей системы при линейном предсказании отражают формантную структуру речи на участке квазистационарности. В качестве таких параметров используют линейные спектральные частоты. При этом достаточно передавать и принимать данные о значениях линейных спектральных частот и их амплитудах. Сигнал возбуждения в таком вокодере с линейным предсказанием формируется как суперпозиция формантных частот спектральной плотности мощности речевого сигнала на участке квазистационарности. При этом начальные фазы соответствующих частот рассчитывают в предположении о равномерном распределении. В литературе, посвященной анализу и восприятию речевого сигнала, указывается на тот факт, что информация о фазовом спектре речевого сигнала является несущественной для его разборчивости и на ухудшение его восприятия влияет незначительно (Маркел Дж.Д., А.Х.Грэй. Линейное предсказание речи. - М.: Связь, 1980. - С.166-196).

Сущность предлагаемого способа заключается в следующем. Для формирования сигнала возбуждения в вокодере на основе линейного предсказания на приеме из кадра передачи выделяют параметры синтезирующего фильтра, содержащие информацию о коэффициентах предсказания или линейных спектральных частотах, а также значение коэффициента усиления сигнала возбуждения. По данным параметрам рассчитывают АЧХ синтезирующего фильтра на фазовых углах его полюсов и формируют спектр амплитуд и фаз сигнала возбуждения. Затем формируют сигнал возбуждения на основе данных о коэффициенте усиления и спектрах его амплитуд и фаз, который используют в синтезирующем фильтре липредера для формирования цифрового речевого сигнала на участке квазистационарности.

Алгоритм функционирования предложенной системы, реализующей способ формирования сигнала возбуждения в низкоскоростных вокодерах с линейным предсказанием, представлен на фиг.1.

Проведенный анализ уровня техники позволил установить, что аналоги, характеризующиеся совокупностью признаков, тождественных всем признакам заявленного технического решения, отсутствуют, что указывает на соответствие заявленного способа условию патентоспособности "новизна".

Благодаря новой совокупности существенных признаков системы, обеспечивающих исключение информации о сигнале возбуждения из формата кадра передачи и его формирование на приеме по значениям параметров синтезирующей модели, достигается значительное снижение скорости передачи данных в канале связи.

Анализ существующих технических решений в данной области показал, что введенные отличительные признаки в них отсутствуют и не следуют явным образом из уровня техники. Следовательно, заявленное техническое решение удовлетворяет критерию "изобретательский уровень".

Промышленная применимость введенных элементов обусловлена наличием элементной базы, на основе которой они могут быть выполнены.

Заявленное техническое решение поясняется чертежом (фиг.2), на котором показана функциональная схема устройства, реализующего способ формирования сигнала возбуждения в низкоскоростных вокодерах с линейным предсказанием посредством использования информации о параметрах синтезирующей модели.

Устройство, реализующее данный способ, состоит из блока приема кадра передачи вокодера с линейным предсказанием 1, на который непосредственно поступает информационная последовательность кадра передачи. Он соединен с блоком выделения параметров синтезирующего фильтра 2, в котором происходит формирование совокупности параметров, описывающих данный фильтр. Сформированные параметры подаются на блок расчета значений АЧХ синтезирующего фильтра на фазовых углах его полюсов 3. Данный блок соединен с блоком формирования сигнала возбуждения 4. На другие входы блока 4 подается сигнал с блока формирования начальных фаз спектральных составляющих сигнала возбуждения 5, а также поступает сигнал от блока 1, в котором содержится дополнительная информация для формирования сигнала возбуждения, например значение коэффициента усиления. Сформированный сигнал возбуждения подается на блок 6 - получатель сигнала возбуждения низкоскоростного вокодера с линейным предсказанием, где используется для возбуждения синтезирующего фильтра приемной части вокодера с линейным предсказанием.

Устройство, реализующее заявленный способ, работает следующим образом. Кадр передачи вокодера с линейным предсказанием, сформированный на участке квазистационарности речевого сигнала, поступает на блок 1, в котором происходит его анализ и выделение информационной составляющей, описывающей формирующий фильтр. Данный сигнал поступает на блок 2, в котором вычисляются значения полюсов передаточной функции синтезирующего фильтра, по которым в блоке 3 рассчитывается значения его АЧХ на соответствующих фазовых углах. В блоке 4 происходит формирование сигнала возбуждения синтезирующего фильтра по данным о его спектре амплитуд, полученным с блока 3, спектре фаз и коэффициенте усиления, полученных с блоков 5 и 1 соответственно. Данный сигнал возбуждения далее подается в блок 6, где используется для возбуждения синтезирующего фильтра приемной части вокодера с линейным предсказанием.

К достоинствам способа следует отнести тот факт, что устранение из кадра передачи информации о сигнале возбуждения позволяет значительно снизить скорость передачи данных в канале связи, а также уменьшить вычислительную сложность алгоритма кодирования речевого сигнала на передающей стороне. Использование предлагаемого технического решения для формирования сигнала возбуждения в вокодерах с линейным предсказанием позволит понизить скорость передачи данных в канале связи на 40-50% от известных решений, либо перераспределить информационный ресурс, предоставляемый каналом связи, на формирование дополнительных сервисов абонентского обслуживания.

Приведенные технические решения показывают, что устройство, воплощающее изобретение при его осуществлении, способно обеспечить более низкую скорость передачи данных за счет устранения из кадра передачи информации о сигнале возбуждения и формировании его на приеме по параметрам, описывающим модель голосового тракта.

Способ синтеза сигналов возбуждения в вокодерах с линейным предсказанием, основанный на формировании сигнала возбуждения путем использования параметров синтезирующего фильтра, отличающийся тем, что для формирования сигнала возбуждения в вокодере на основе линейного предсказания на приеме из кадра передачи выделяют параметры синтезирующего фильтра, содержащие информацию о коэффициентах предсказания или линейных спектральных частотах, а также значение коэффициента усиления сигнала возбуждения, по данным параметрам рассчитывают амплитудно-частотную характеристику синтезирующего фильтра на фазовых углах его полюсов и формируют спектр амплитуд и фаз сигнала возбуждения, затем формируют сигнал возбуждения на основе данных о коэффициенте усиления и спектрах его амплитуд и фаз, который используют в синтезирующем фильтре вокодера с линейным предсказанием для формирования сегмента речевого сигнала на участке квазистационарности.

Кодирование аудиосигнала с низкой скоростью передачи битов // 2368018

Изобретение относится к кодированию и декодированию широкополосных сигналов, таких как отдельные аудиосигналы. .

Аудиокодирование // 2353980

Изобретение относится к кодированию и декодированию аудиосигналов. .

Способ и устройство для квантования усиления в широкополосном речевом кодировании с переменной битовой скоростью передачи // 2316059

Изобретение относится к способу и устройству квантования усиления для воплощения в методе кодирования дискретизированного звукового сигнала, обработанного в процессе кодирования последовательными кадрами из L выборок, где каждый кадр делится на некоторое число подкадров и каждый подкадр содержит некоторое число N выборок, где N<L.

Поиск в глубину по алгебраической шифровальной книге для быстрого кодирования речи // 2175454

Цифровой предсказывающий вокодер // 1088061

Цифровой синтезатор речи // 974404

Способ возбуждения синтезаторов речи // 966725

Устройство для тонального возбуждения цифрового синтезатора речи // 936019

Устройство поиска в фиксированных таблицах кодирования и способ поиска в фиксированных таблицах кодирования // 2425428

Изобретение относится к устройству и способу формирования перцепционно взвешенного синтетического сигнала при поиске фиксированной таблицы кодирования

Способ улучшения восприятия синтезированной речи при реализации процедуры анализа через синтез в вокодерах с линейным предсказанием // 2445719

Изобретение относится к области цифровой связи и может быть использовано в системах телеинформационных коммуникаций для эффективного кодирования речевых сигналов

Устройство поиска фиксированных таблиц кодирования и способ поиска фиксированных таблиц кодирования // 2458412

Изобретение относится к устройству поиска в фиксированной таблице кодирования, которое немного сдерживает увеличение объема операций, даже если фильтр, применяемый к импульсу возбуждения, имеет характеристику, которая не может быть представлена посредством нижней треугольной матрицы, и реализует квазиоптимальный поиск в фиксированной таблице кодирования

Устройство кодирования аудио и способ кодирования аудио // 2458413

Изобретение относится к устройству и способу кодирования речи, в частности к устройству и способу кодирования речи для выполнения поиска фиксированной кодовой книги

Способ и устройство кодирования кадров перехода в речевых сигналах // 2462769

Изобретение относится к способу цифрового кодирования звукового сигнала, например речевого или аудиосигнала, в частности к способу и устройству кодирования кадров перехода и кадров, следующих за переходом в звуковом сигнале

Кодирующее устройство и способ кодирования // 2463674

Устройство для микширования множества входных данных // 2473140

Изобретение относится к устройствам для микширования множества входных потоков данных для получения потока данных, которые могут применяться, например, в области систем конференц-связи, включая системы видео- и телеконференций

Способ кодирования сигнала и способ декодирования сигнала // 2486610

Изобретение относится к способу, устройству и системе для кодирования и декодирования сигналов

Способ снижения скорости передачи низкоскоростных вокодеров с линейным предсказанием // 2495504

Изобретение относится к области цифровой связи и может быть использовано в системах телеинформационных коммуникаций для эффективного кодирования речевых сигналов. Техническим результатом предлагаемого способа является уменьшение скорости передачи данных по каналам связи при эффективном кодировании речевых сигналов с сохранением качественных показателей синтезированного сигнала. Поставленная цель в вокодере с линейным предсказанием достигается посредством отказа от передачи по каналу связи информации о сигнале возбуждения. Сигнал возбуждения идентифицируют непосредственно на приеме по данным о параметрах синтезирующей модели при помощи нейронной сети. По каналу связи передают информацию о коэффициентах формирующей модели, коэффициенте усиления, параметрах, характеризующих кодируемый речевой сигнал, которые рассчитывают на каждом квазистационарном сегменте анализа речевого сигнала. 3 ил.

Способ кодирования, способ декодирования, устройство кодера, устройство декодера, программа и носитель записи // 2510974

Изобретение относится к способу кодирования и более конкретно к способу кодирования периода основного тона. Технический результат заключается в повышении эффективности компрессии периодов основного тона. В ходе кодирования вычисляются периоды основного тона для сигналов временной последовательности в заранее заданном временном интервале и выводится код, соответствующий таковым. В этом кодировании разрешающие способности для выражения периодов основного тона и/или режима кодирования периода основного тона переключаются в соответствии с тем, удовлетворяет ли индекс, указывающий уровень периодичности и/или стационарности сигналов временной последовательности, условию, указывающему высокую или низкую периодичность и/или стационарность. В этом декодировании в соответствии с тем, удовлетворяет ли индекс, указывающий уровень периодичности и/или стационарности, индекс, включаемый во входной код или получаемый исходя из входного кода, соответствующего заранее заданному временному интервалу, условию, указывающему высокую периодичность и/или стационарность, режим декодирования для кода, включенного во входной код, соответствующего периодам основного тона, переключается для декодирования кода, соответствующего периодам основного тона, чтобы получать периоды основного тона, соответствующие заранее заданному временному интервалу. 14 н. и 18 з.п. ф-лы, 28 ил., 9 табл.