Способ сжатия звуковой информации и система для его реализации

Авторы патента:

G10L19/02 - с использованием спектрального анализа, например преобразовательные вокодеры, вокодеры с поддиапазонами

Изобретение относится к области передачи и хранения акустической информации и может быть использовано при проектировании систем цифровой радиосвязи, радио и телевидения, телефонии, систем цифровой звукозаписи и звуковоспроизведения. До и после оптимальной фильтрации фильтром, в процессе которой производят выбор номеров наборов коэффициентов фильтров с помощью устройства выбора фильтра и запоминающего устройства коэффициентов фильтров, осуществляют сжатие динамического диапазона сигналов - входного сигнала и сигнала после оптимальной фильтрации соответственно. Устройство выбора форм и запоминающего устройства форм производят выбор параметров форм сигнала, полученного после второго сжатия динамического диапазона. Здесь номера наборов коэффициентов фильтров и параметров форм выбирают наиболее близкими к заданным из заранее запомненных по аналогичной звуковой информации, а по каналам связи в декодер передают коэффициенты сжатия динамического диапазона, номера наборов коэффициентов фильтров и параметров форм, которые определяют объем сжатой информации. Технический результат заключается в устранении избыточности акустической информации (сжатие информации), что позволяет уменьшить требуемую пропускную способность канала связи (требуемую емкость памяти для хранения звуковой информации) при одновременной возможности адаптации под конкретный класс звукового сигнала, например мужскую и женскую речь, симфоническую музыку и др., с заданной в достаточно широком диапазоне степенью сжатия, а также улучшить качество восстанавливаемого выходного сигнала с данного устройства. 2 с.п. ф-лы, 3 ил.

Изобретение относится к области передачи и хранения акустической информации и может быть использовано при проектировании систем цифровой радиосвязи, радио- и телевещания, телефонии, систем цифровой звукозаписи и звуковоспроизведения.

Известны способы, системы и устройства сжатия звуковой информации.

Система сжатия "ADPCM" используется в стандартах беспроводных телефонов DECT (Европа), PACS (США), PHS (Япония). Здесь адаптивная дифференциально-импульсная модуляция основана на предсказании и кодировании приращений соседних отсчетов звукового сигнала (В.А. Погрибной, Дельта-модуляция в цифровой обработке сигналов, М.: Радио и связь, 1990) - [1], (В.М. Назаров, Ю.Н. Прохоров, Методы цифровой обработки и передачи речевых сигналов, М.: Радио и связь, 1985) - [2], (Ю.А. Громаков, Современные технологии подвижной связи, Радио, 1997, N 5) - [3].

В стандарте сотовых сетей подвижной связи GSM 900 (GSM 1800) использована система сжатия "PRE - LTR", основанная на линейном предсказании речи (линейное предиктивное кодирование) - [2], [3], (Маркел ДЖ. Д., Грэй А.Х., Линейное предсказание речи: Пер. с англ., под ред. Ю.Н. Прохорова и В.С. Звездина, М.: Связь, 1980) - [4].

Система сжатия "PRE - LTR" ориентирована только на речевые сигналы, характеризуется большой вычислительной сложностью и малоизменяемым коэффициентом сжатия.

На кодировании в выделенных частотных диапазонах работает система сжатия "MUSICAM", используемая в стандартах цифрового радиовещания "Эврика 147/DAB", USA DR - [2], (А. Демин, Л. Кацнельсон, Система цифрового радиовещания "Эврика 147", Радио, 1996, N 8) - [5]. Эта система имеет большую вычислительную сложность и малоизменяемый коэффициент сжатия.

Для сравнительного анализа с заявляемым изобретением использован способ сжатия звуковой информации, используемый в работе беспроводных телефонов и система сжатия АДРСМ с адаптивной дифференциально-импульсной кодовой модуляцией (АДИКМ), структурное построение которой составляют фильтр, состоящий из фильтра-предсказателя, включенного в цепь обратной связи последовательно соединенных сумматора и квантователя, устройство оценки коэффициентов фильтра и кодер канала - [2, стр. 11]. В устройстве оценки коэффициентов фильтра анализируется текущий спектр входного сигнала и по нему определяются коэффициенты фильтра-предсказателя для минимизации сигнала ошибки. Сигнал ошибки формируется из разницы между входным сигналом и предсказанным. В кодере канала сигнал ошибки и коэффициенты фильтра объединяются в единый информационный поток, кодируются с применением статистического кодирования (и помехоустойчивого, если требуется), образуя выходной сигнал, который поступает в канал связи и ЗУ. Здесь коэффициент сжатия определяется отношением амплитуд входного сигнала и сигнала ошибки

Известные способ сжатия звуковой информации и система, его реализующая, характеризуясь простотой своей реализации, имеет следующие недостатки: - ограниченный диапазон коэффициента сжатия сверху, так как частоты дискретизации входного сигнала и сигнала ошибки совпадают; - плохое качество восстановления при фиксированном коэффициенте сжатия; - плохая адаптация к различным классам акустической информации.

Изобретение решает задачу - максимально устранить избыточность акустической информации (сжатие информации), что позволяет уменьшить требуемую пропускную способность канала связи (требуемую емкость памяти для хранения звуковой информации) при одновременной возможности адаптации под конкретный класс звукового сигнала с заданной в достаточно широком диапазоне степенью сжатия, а также улучшить качество восстанавливаемого выходного сигнала с данного устройства.

Поставленная задача достигается тем, что по способу сжатия звуковой информации, включающему оптимальную фильтрацию звукового сигнала, до и после оптимальной фильтрации, в процессе которой производят выбор номеров наборов коэффициентов фильтров, проводят сжатие динамического диапазона сигналов, после чего производят выбор параметров форм сигнала, полученного после второго сжатия динамического диапазона, при этом номера наборов коэффициентов фильтров и параметры форм выбирают наиболее близкими к данным из заранее запомненных по аналогичной звуковой информации, а по каналам связи передают коэффициенты сжатия динамического диапазона, номера наборов коэффициентов фильтров и параметры форм, которые определяют объем сжатой информации.

В систему сжатия звуковой информации, содержащую цифровой фильтр, устройство оценки коэффициентов фильтра, вход которого соединен с первым входом цифрового фильтра, и кодер канала, дополнительно введены первый блок автоматического регулирования уровня, первый выход которого подключен к первому входу цифрового фильтра, и второй блок автоматического регулирования уровня, вход которого подключен к выходу цифрового фильтра, устройство выбора фильтра и запоминающее устройство коэффициентов фильтров, связанное с устройством выбора фильтра через его первый вход, второй вход которого соединен с выходом устройства оценки коэффициентов фильтра, а первый выход - со вторым входом цифрового фильтра, устройство выбора форм и запоминающее устройство форм, связанное с устройством выбора форм через его первый вход, второй вход которого соединен с первым выходом второго блока автоматического регулирования уровня, второй выход которого, а также вторые выходы первого блока автоматического регулирования уровня, устройства выбора фильтра и выход устройства выбора форм подключены к соответствующим входам кодера канала, выход которого является выходом системы сжатия звуковой информации, входом которой является вход первого блока автоматического регулирования уровня.

Сущность изобретения поясняется на фиг. 1, где представлена блок-схема заявляемой системы, фиг. 2 - иллюстрация прохождения сигнала по блокам системы, фиг. 3 - иллюстрация работы блоков автоматической регулировки уровня.

Здесь: 1. Первый блок автоматической регулировки уровня (АРУ 1).

2. Устройство оценки коэффициентов фильтра.

3. Устройство выбора фильтра.

4. Запоминающее устройство коэффициентов фильтров.

5. Цифровой фильтр.

6. Второй блок автоматической регулировки уровня (АРУ 2).

7. Устройство выбора форм.

8. Запоминающее устройство форм.

9. Кодер канала.

10. Квантователь.

12. Фильтр-предсказатель.

Для входного сигнала системы сжатия звуковой информации является вход блока автоматической регулировки уровня (АРУ 1), первый выход которого через устройство оценки коэффициентов фильтра 2 подключен на второй вход устройства выбора фильтра 3, первый вход которого соединен с запоминающим устройством коэффициентов фильтров 4. Первый же выход АРУ 1 подключен на первый вход цифрового фильтра 5, второй вход которого соединен с первым выходом устройства выбора фильтра 3, а выход - со входом второго блока автоматической регулировки уровня (АРУ 2) 6, первый выход которого подключен второму входу устройства выбора форм 7, первый вход которого соединен с запоминающим устройством форм 8.

Вторые выходы первого и второго блоков автоматической регулировки уровня 1 и 6, устройства выбора фильтра 3 и выход устройства выбора форм 7 подключены к соответствующим входам кодера канала 9. Цифровой фильтр 5 состоит из последовательно соединенных сумматора 10 и квантователя 11, в обратную связь которых включен фильтр-предсказатель 12; первым входом фильтра 5 является первый вход сумматора 10, вторым входом фильтра 5 - второй вход фильтра-предсказателя 12, а выходом фильтра 5 является выход квантователя 11, соединенный с первым входом фильтра-предсказателя 12.

Суть заявляемого способа звуковой информации - передавать не сам сигнал, а некие коэффициенты, описывающие сигнал с достаточной степенью точности.

Система может быть реализована как аппаратно, так и программно.

Входным сигналом для системы является цифровой звуковой сигнал с частотой дискретизации FD и N уровнями квантования по амплитуде. Входной сигнал S (фиг. 2, а) поступает на блок АРУ 1, в котором выделяется огибающая сигнала, производится нормировка сигнала (приведение уровня сигнала в диапазоне 0...1) и вторичное квантование сигнала с числом уровней квантования N 1.

Далее сигнал S' (фиг. 2, б) с выхода АРУ 1 поступает через устройство 2 оценки коэффициентов фильтра на устройство 3 выбора фильтра и цифровой фильтр 5. Устройство 3 выбора фильтра анализирует текущий спектр сигнала и выбирает из базы данных запоминающего устройства 4 коэффициентов фильтров на заданном интервале времени коэффициенты фильтра, передаточная характеристика которого в наибольшей степени согласована с текущим спектром. Номер NF выбранного фильтра поступает в кодер канала 9, а коэффициенты - на фильтр 5, который преобразует спектр сигнала в равномерный. После фильтрации сигнал S'' (фиг. 2, в) поступает на блок АРУ 2 6, действие которого аналогично действию АРУ 1. Сигнал S''' (фиг. 2, г) с блока АРУ 2 6 является сигналом с минимальным динамическим диапазоном и равномерным спектром. Он поступает на устройство 7 выбора форм, которое осуществляет ассоциативный поиск наиболее подходящей формы из запоминающего устройства форм 8 к отрезкам сигнала и формирует параметры каждой формы: номер, смещение и амплитуду.

В запоминающих устройствах коэффициентов фильтров 4 и форм 8 хранятся наборы коэффициентов фильтров и наборы наиболее встречающихся форм, соответственно ранее запомненные.

Все параметры сигнала, полученные при преобразовании сигнала каждым блоком: коэффициенты сжатия динамического диапазона с АРУ 1 1 и АРУ 2 6, номера наборов коэффициентов фильтров с устройства 3 и параметры форм с устройства 7, поступают на кодер 9 канала, где осуществляется группирование всех параметров и коэффициентов в единый поток информации, который кодируется с применением статистического кодирования, выравнивается по скорости и поступает в виде однородного цифрового потока в канал связи или на запоминающее устройство.

Таким образом, предложенные способ сжатия звуковой информации и система, его реализующая, позволяют: - значительно уменьшить требуемую емкость памяти для хранения звуковой информации здесь в отличие от системы ADPCM передаются не коэффициенты фильтра, а номер набора коэффициентов фильтра из запоминающего устройства коэффициентов фильтров, наиболее близкий по коэффициентам. Например, если всего 16 коэффициентов по 8 бит каждый, то в ADPCM требуется передать 16х8=128 бит, то в данной системе при запоминающем устройстве на 2048 наборов коэффициентов фильтра надо передать только 11 бит или в 11,6 раз меньше. Такую же ситуацию определяет и использование устройства выбора форм и запоминающего устройства форм - значительно уменьшить динамический диапазон наличием двух блоков автоматической регулировки уровня АРУ 1 и АРУ 2, - иметь возможность легкой адаптации под конкретный класс звукового сигнала, например мужская, женская речь, симфоническая музыка и др., с заданной в достаточно широком диапазоне степенью сжатия или уровнем искажения в результате предложенного построения архитектуры системы сжатия, т.к. в запоминающих устройствах содержимое формируется в соответствии с текущим классом звуковой информации, т.е. присутствует элемент самообучения,
- улучшить качество восстанавливаемого выходного сигнала с данной системы. Для восстановления сжатого сигнала построение системы восстановления может быть выполнено согласно функции, обратной операциям сжатия.

Реализация системы не требует уникальных элементов и возможна на известных логических микросхемах памяти, процессорах обработки сигналов (при аппаратной реализации) или на общественных языках программирования: Ассемблер, Си, Паскаль Бейсик (при программной реализации).

Так, в блоках автоматической регулировки уровня АРУ 1 и АРУ 2 (фиг. 3) выделяется огибающая SH по максимальным значениям сигнала S и SL - по минимумам сигнала S, строятся модели огибающих SL^* и SH^* и вычисляются коэффициенты огибающей, производится нормировка сигнала S^*=(S-SL^*)/(SH^*-SL^*) и далее идет квантование на заданное количество уровней N. При восстановлении сигнала огибающие SL^*и SH^* восстанавливаются по коэффициентам огибающей, а сигнал S по формуле S = S^*

(SH^* - SL^*) + SL^*, т.е. производится операция, обратная АРУ.

Устройство выбора фильтра 3 выбирается из запоминающего устройства коэффициентов фильтров 4 на заданном интервале времени такой выбор коэффициентов фильтра, при котором выходной сигнал S'' минимален, посылает этот выбор коэффициентов фильтра на фильтр 5, а номер этого набора - в кодер канала 9.

Устройство выбора форм 7: в запоминающем устройстве форм 8 хранятся наборы наиболее встречающихся форм длиной от L до 2L - 1, сигнал S''', поступающий на устройство 7, разбивается последовательно на отрезки длиной не менее L и не более 2L - 1, для конкретной длины формы из запоминающего устройства 8 находится форма, наиболее коррелированная с данным отрезком сигнала, в кодер 9 канала поступают параметры отрезка сигнала: номер, смещение, амплитуда.

Кодер канала осуществляет группирование всех параметров и коэффициентов в единый поток информации, который кодируется одним из известных способов статистического кодирования плюс помехоустойчивое кодирование в зависимости от параметров канала связи (Справочник по теоретическим основам радиоэлектронники под редакцией Б. Х. Кривицкого, В.Н. Дулина в 2-х томах, М., "Энергия", 1977).

Формула изобретения

1. Способ сжатия звуковой информации, включающий оптимальную фильтрацию звукового сигнала, отличающийся тем, что до и после оптимальной фильтрации, в процессе которой производят выбор номеров наборов коэффициентов фильтров, производят сжатие динамического диапазона сигналов, после чего производят выбор параметров форм сигнала, полученного после второго сжатия динамического диапазона, при этом номера наборов коэффициентов фильтров и параметры форм выбирают наиболее близкими к данным из заранее запомненным по аналогичной звуковой информации, а по каналам связи передают коэффициенты сжатия динамического диапазона, номера наборов коэффициентов фильтров и параметры форм, которые определяют объем сжатой информации.

2. Система сжатия звуковой информации, содержащая цифровой фильтр, устройство оценки коэффициентов фильтра, вход которого соединен с первым входом цифрового фильтра, и кодер канала, отличающаяся тем, что она дополнительно содержит первый блок автоматического регулирования уровня, первый выход которого подключен к первому входу цифрового фильтра, и второй блок автоматического регулирования уровня, вход которого подключен к выходу цифрового фильтра, устройство выбора фильтра и запоминающее устройство коэффициентов фильтров, связанное с устройством выбора фильтра через его первый вход, второй вход которого соединен с выходом устройства оценки коэффициентов фильтра, а первый выход - с вторым входом цифрового фильтра, устройство выбора форм и запоминающее устройство форм, связанное с устройством выбора форм через его первый вход, второй вход которого соединен с первым выходом второго блока автоматического регулирования уровня, второй выход которого, а также вторые выходы первого блока автоматического регулирования уровня, устройства выбора фильтра и выход устройства выбора форм подключены к соответствующим входам кодера канала, выход которого является выходом системы сжатия звуковой информации, входом которой является вход первого блока автоматического регулирования уровня.

РИСУНКИ

Рисунок 1, Рисунок 2, Рисунок 3

Изобретение относится к техническим средствам быстрого оценивания качества передачи речи по каналам связи или в помещениях

Устройство для распознавания речевых сигналов // 1695376

Изобретение относится к технике обработки речевых сигналов оптическими методами и может быть использовано при распознавании сигналов для сокращения избыточности речевого потока при его вводе в вычислительную систему, работающую в режиме обмена с оператором на естественном языке

Устройство распознавания речевых сигналов // 1691881

Изобретение относится к обработке речевых сигналов оптическими методами и может быть использовано для решения задач распознавания сигналов с целью сокращения избыточности речевого потока при его вводе в вычислительную систему, работающую в режиме обмена с оператором на естественном языке

Устройство для распознавания речевых сигналов // 1597897

Изобретение относится к радиотехнике и направлено на повышение надежности распознавания речевых команд, а также обеспечение возможности автоматизации процесса подстройки под диктора

Способ вокодерных преобразований речевых сигналов и устройство для его осуществления // 1525731

Способ анализа и синтеза речи и устройство для его осуществления // 1501138

Изобретение относится к речевой информатике и может быть использовано в вычислительной технике и технике связи для выделения и реконструкции речевых сообщений

Вокодер // 1490689

Изобретение относится к анализу и синтезу речи и может быть использовано в системах вокодерной телефонии

Способ распознавания речи // 1483481

Способ анализа и синтеза речи и устройство для его осуществления // 1434487

Изобретение относится к речевой информатике и может быть использовано в системах вокодерной телефонии

Цифровой анализатор спектра уолша речевых сигналов // 1425710

Изобретение относится к вычислительной технике, а именно к средствам отработки речевых сигналов с использованием преобразования Уолша, и может найти применение в системах автоматического распознавания, речи

Способ обнаружения и коррекции аномальных цифровых ошибок при передаче речи методом импульсно-кодовой модуляции // 2148277

Изобретение относится к технике цифровой обработки речевых сигналов, передаваемых по линиям связи методом импульсно-кодовой модуляции (ИКМ) , и может быть использовано для повышения помехозащищенности многоканальных систем передачи цифровой телефонии

Устройство обнаружения и коррекции аномальных цифровых ошибок при передаче речи методом импульсно-кодовой модуляции // 2159470

Изобретение относится к технике цифровой обработки речевых сигналов, передаваемых по линиям связи методом импульсно-кодовой модуляции (ИКМ), и может быть использовано для повышения помехозащищенности многоканальных систем передачи цифровой телефонии