Устройство кодирования аудиосигнала, устройство декодирования аудиосигнала, способ кодирования аудиосигнала и способ декодирования аудиосигнала

Авторы патента:

ЭХАРА Хироюки (JP)

КАВАСИМА Такуя (JP)

G10L19/035 - Техника анализа-синтеза речи для уменьшения избыточности, например в вокодерах ; кодирование или декодирование речи

Владельцы патента RU 2669706:

ФРАУНХОФЕР-ГЕЗЕЛЛЬШАФТ ЦУР ФЕРДЕРУНГ ДЕР АНГЕВАНДТЕН ФОРШУНГ Е.Ф. (DE)

Изобретение относится к средствам для кодирования и декодирования аудиосигнала. Технический результат заключается в повышении эффективности кодирования. Формируют спектр посредством выполнения преобразования над входным аудиосигналом в частотную область. Разделяют спектр на подполосы, которые являются заданными полосами частот. Получают для каждой из подполос квантованную энергию подполосы. Анализируют тональность спектров подполос и выводят результат анализа. Выбирают вторую подполосу из числа упомянутых подполос на основании результата анализа тональности и квантованной энергии подполосы. Определяют первое количество битов, подлежащих выделению первой подполосе, среди подполос. Формируют первую кодированную информацию посредством кодирования спектра подполосы среди спектров подполос, который включен в первую подполосу, посредством использования первого количества битов. Формируют вторую кодированную информацию посредством кодирования спектра подполосы среди спектров подполос, который включен во вторую подполосу, посредством использования фильтра основного тона. 8 н. и 6 з.п. ф-лы, 9 ил.

ОБЛАСТЬ ТЕХНИКИ, К КОТОРОЙ ОТНОСИТСЯ ИЗОБРЕТЕНИЕ

[0001]

Настоящее изобретение относится к методике кодирования и методике декодирования для улучшения качества звука аудиосигналов, таких как речевые сигналы и музыкальные сигналы.

УРОВЕНЬ ТЕХНИКИ

[0002]

Методика кодирования для сжатия аудиосигналов на низкой битовой скорости является методикой, важной для осуществления эффективного использования радиоволн и им подобного в мобильной связи. При этом в последнее время увеличивается потребность в улучшении качества звука в телефонной связи, и ожидается реализация услуг телефонной связи, которые будут создавать большее ощущение присутствия. Для реализации таких услуг необходимо кодировать аудиосигналы, имеющие широкую полосу частот, на более высокой битовой скорости. Однако данный подход вступает в противоречие с эффективным использованием радиоволн и полос частот.

[0003]

Теперь в качестве примера будет рассмотрена методика кодирования аудиосигнала, внедренная Стандартом G.719 (NPL 1).

[0004]

В Стандарте G.719, после кодирования аудиосигнала, частотное преобразование выполняется над аудиосигналом, и заданные биты выделяются спектру, полученному в результате частотного преобразования. В частности, спектр разделяется на подполосы, имеющие заданные ширины полос частот, и блок (блок, имеющий необходимое количество битов), используемый при квантовании, на основании квантования вектора решетки выделяется каждой из подполос в порядке убывания энергии следующим образом.

[0005]

(1)

Один блок выделяется подполосе, имеющей самую большую энергию среди всех подполос.

[0006]

Один бит выделяется на спектр. Поэтому, если количество спектральных дискретных отсчетов в подполосе восемь, например, то один блок содержит восемь битов (следует отметить, что максимальное количество битов, которые могут быть выделены на спектр, составляет девять битов, и поэтому, если количество спектральных дискретных отсчетов в подкадре составляет восемь, то может быть выделено вплоть до 72 битов).

[0007]

(2)

Квантованная энергия подполосы той подполосы, которой был выделен один блок, уменьшается на два уровня (6 дБ). Если некоторое количество битов, выделенных подполосе, которой был выделен один блок, превышает максимальное значение (девять битов), то подполоса исключается из квантования в последующих циклах.

[0008]

(3)

Возвращаясь к (1) выше, тот же самый процесс повторяется.

[0009]

На Фиг.6 показана энергия подполосы каждой подполосы. На горизонтальной оси представлена частота, а на вертикальной оси представлена амплитуда в логарифмической шкале. На данном чертеже энергия подполосы каждой подполосы представлена горизонтальной линией вместо точки. Длина каждой горизонтальной линии представляет собой ширину полосы частот каждой подполосы.

[0010]

На Фиг.7 и Фиг.8 показаны схемы, изображающие примеры результатов выделения битов каждой подполосе в случае использования способа кодирования, определенного в Стандарте G.719. На этих чертежах на горизонтальной оси представлена частота, а на вертикальной оси представлено выделенное количество битов. На Фиг.7 показан случай битовой скорости в 128 Кбит/с, а на Фиг.8 показан случай битовой скорости в 64 Кбит/с.

[0011]

В случае 128 Кбит/с для выделения доступен большой запас битов, и поэтому, девять битов, которые являются максимальным значением, могут быть выделены большому количеству подполос (спектрам), и качество аудиосигналов может поддерживаться на высоком уровне.

[0012]

Напротив, в случае 64 Кбит/с никакой подполосе не выделяется девяти битов, которые являются максимальным значением, однако каждой подполосе выделяются некоторые биты. Соответственно, считается, что ухудшение качества аудиосигналов может быть устранено, и может быть реализовано эффективное использование радиоволн и полосы частот.

Список цитируемых документов

Патентная литература

[0013]

PTL 1: Публикация нерассмотренной заявки на патент Японии (перевод заявки PCT) № 2013-534328

PTL 2: Международная публикация № 2005/027095

Непатентная литература

[0014]

NPL 1: Стандарт G.719 ITU-T, 2008

РАСКРЫТИЕ ИЗОБРЕТЕНИЯ

[0015]

Однако необходимо дальнейшее способствование эффективному использованию радиоволн и полос частот. В данном случае, при кодировании аудиосигнала, имеющего частоту дискретизации приблизительно 32 кГц на низкой битовой скорости в 20 Кбит/с или менее посредством использования вышеописанного способа, внедренного Стандартом G.719, оказывается не возможным резервирование блока (некоторого количества битов), используемого при квантовании всех подполос, что является проблемой.

[0016]

На Фиг.9 показана схема, изображающая пример результата выделения битов каждой подполосе в случае использования способа кодирования, определенного в Стандарте G.719, при 20 Кбит/с. Как изображено, выделение битов оказывается безуспешным не только в высокочастотном диапазоне, но также и, в зависимости от ситуации, в низкочастотном диапазоне, который важен для слуха. Следовательно, кодирование спектров в соответствующих подполосах не возможно, что в результате приводит к значительному ухудшению качества аудиосигналов.

[0017]

Для решения такой проблемы может быть использован способ динамического изменения способа выделения битов (PTL 1).

[0018]

Однако способ выделения битов изменяется, в то время как использован единый способ кодирования (способ квантования) без изменения способа кодирования (способа квантования), и поэтому данный подход к ухудшению качества аудиосигналов имеет ограниченное действие.

[0019]

В настоящем изобретении предложена методика кодирования и методика декодирования для реализации высококачественных аудиосигналов с уменьшением общей битовой скорости.

[0020]

Устройство кодирования аудиосигнала согласно настоящему изобретению включает в себя временно-частотный преобразователь, который формирует спектр посредством выполнения преобразования над входным аудиосигналом в частотную область, разделяет спектр на подполосы, которые являются заданными полосами частот, и выводит спектры подполос; квантователь энергии подполосы, который получает, для каждой из подполос, квантованную энергию подполосы; вычислитель тональности, который анализирует тональность спектров подполос и выводит результат анализа; выделитель битов, который выбирает вторую подполосу, для которой квантование выполняется вторым квантователем, из числа упомянутых подполос, на основании результата анализа тональности и квантованной энергии подполосы, и определяет первое количество битов, подлежащих выделению первой подполосе, среди упомянутых подполос, для которой квантование выполняется первым квантователем; и мультиплексор, который мультиплексирует в информацию кодированную информацию, выводимую из первого квантователя и из второго квантователя, квантованную энергию подполосы и результат анализа тональности, и выводит мультиплексированную информацию. Первый квантователь выполняет импульсное кодирование спектра подполосы среди спектров подполос, который включен в первую подполосу, посредством использования первого количества битов, и второй квантователь кодирует спектр подполосы среди спектров подполос, который включен во вторую подполосу, посредством использования фильтра основного тона.

[0021]

Следует отметить, что общие или частные варианты осуществления могут быть реализованы в качестве системы, способа, интегральной схемы или компьютерной программы, или любого выборочного сочетания системы, устройства, способа, интегральной схемы и компьютерной программы.

[0022]

С помощью устройства кодирования, устройства декодирования, и так далее согласно настоящему изобретению, возможно кодировать и декодировать высококачественные аудиосигналы с уменьшением общей битовой скорости.

КРАТКОЕ ОПИСАНИЕ ЧЕРТЕЖЕЙ

[0023]

[Фиг.1] На Фиг.1 показана блок-схема устройства кодирования согласно первому варианту осуществления настоящего изобретения.

[Фиг.2] На Фиг.2 показана подробная блок-схема выделителя битов устройства кодирования согласно первому варианту осуществления настоящего изобретения.

[Фиг.3] На Фиг.3 показана схема для описания функционирования, выполняемого устройством кодирования согласно первому варианту осуществления настоящего изобретения.

[Фиг.4] На Фиг.4 показана блок-схема устройства декодирования согласно второму варианту осуществления настоящего изобретения.

[Фиг.5] На Фиг.5 показана подробная блок-схема выделителя битов устройства декодирования согласно второму варианту осуществления настоящего изобретения.

[Фиг.6] На Фиг.6 показана схема для описания энергии подполосы в устройстве кодирования согласно уровню техники.

[Фиг.7] На Фиг.7 показана схема для описания результата выделения битов подполосам в устройстве кодирования согласно уровню техники.

[Фиг.8] На Фиг.8 показана схема для описания результата выделения битов подполосам в устройстве кодирования согласно уровню техники.

[Фиг.9] На Фиг.9 показана схема для описания результата выделения битов подполосам в устройстве кодирования согласно уровню техники.

ОСУЩЕСТВЛЕНИЕ ИЗОБРЕТЕНИЯ

[0024]

Далее конфигурации и функционирование в вариантах осуществления настоящего изобретения будут описаны со ссылкой на чертежи. Аудиосигналы, которые являются входными сигналами в устройство кодирования настоящего изобретения и выходными сигналами из устройства декодирования настоящего изобретения, концептуально включают в себя речевые сигналы, музыкальные сигналы, имеющие более широкую полосу, и сигналы, в которых смешаны эти типы сигналов.

[0025]

В настоящем изобретении «входные аудиосигналы» концептуально включают в себя музыкальные сигналы, речевые сигналы, и сигналы, в которых смешаны оба типа сигналов. Термин «квантованная энергия подполосы» означает энергию, полученную посредством квантования энергии подполосы, которая является суммой или средним значением энергии спектров подполос в подполосе, а энергия подполосы может быть получена посредством вычисления суммы квадратов спектров подполос в некоторой подполосе, например. Термин «тональность» означает степень, до которой создается пик спектра в конкретной частотной составляющей, и результат анализа тональности может быть представлен численным значением, кодированием или чем-либо им подобным. Термин «импульсное кодирование» означает кодирование, при котором спектр приблизительно представлен с использованием импульсов.

[0026]

Термин «относительно низкий» означает случай нахождения ниже в результате сравнения между подполосами и соответствует случаю нахождения ниже среднего значения всех подполос или случаю нахождения ниже заданного значения. Термин «подполоса в высокочастотном диапазоне» означает подполосу, которая расположена ближе к высокочастотной стороне среди множества подполос.

[0027]

Следует отметить, что первый квантователь (спектра), второй квантователь (спектра), первый декодер (спектра), второй декодер (спектра), первая подполоса, вторая подполоса, третья подполоса, четвертая подполоса, первое количество битов, второе количество битов, третье количество битов и четвертое количество битов, описанные в вариантах осуществления и формуле изобретения, отличаются друг от друга для обозначения не их порядка, а их категории.

[0028]

(Первый вариант осуществления)

На Фиг.1 показана блок-схема, изображающая конфигурацию и функционирование устройства 100 кодирования аудиосигнала согласно первому варианту осуществления. Устройство 100 кодирования аудиосигнала, изображенное на Фиг.1, включает в себя временно-частотный преобразователь 101, квантователь 102 энергии подполосы, вычислитель 103 тональности, выделитель 104 битов, нормализатор 105, первый квантователь 106 спектра, второй квантователь 107 спектра и мультиплексор 108. С мультиплексором 108 соединена антенна A. Устройство 100 кодирования аудиосигнала и антенна вместе составляют устройство терминала или устройство базовой станции.

[0029]

Временно-частотный преобразователь 101 выполняет преобразование над входным аудиосигналом во временной области в частотную область и формирует спектр входного аудиосигнала (именуемый в дальнейшем «спектром»). Временно-частотное преобразование выполняется посредством использования MDCT (измененного дискретного косинусного преобразования), например, но не ограничено данным преобразованием. Временно-частотное преобразование может быть выполнено посредством использования DCT (дискретного косинусного преобразования), DFT (дискретного преобразования Фурье) или преобразования Фурье, например.

[0030]

Временно-частотный преобразователь 101 разделяет спектр на подполосы, которые являются заданными полосами частот. Заданные полосы частот могут быть расположены на равных интервалах или могут быть расположены на различных интервалах, в частности, на длинных интервалах в высокочастотном диапазоне и на коротких интервалах в низкочастотном диапазоне, например.

[0031]

Временно-частотный преобразователь 101 выводит спектры, полученные делением на подполосы, в квантователь 102 энергии подполосы, в вычислитель 103 тональности и в нормализатор 105 в качестве спектров подполос.

[0032]

Квантователь 102 энергии подполосы получает, для каждой подполосы, энергию подполосы, которая является энергией спектра подполосы, квантует энергию подполосы и получает квантованную энергию подполосы. В частности, энергия подполосы может быть получена посредством вычисления суммы квадратов спектров подполос в подполосе; однако, данное вычисление не ограничивается этим. Энергия подполосы может быть получена посредством выполнения интегрирования над амплитудами спектров подполос для каждой подполосы, например. В случае усреднения энергии подполосы сумма квадратов разделяется на количество спектров (ширины подполосы) в подполосе. Энергия подполосы, полученная таким образом, квантуется в соответствии с заданной шириной шага.

[0033]

Квантователь 102 энергии подполосы выводит полученную квантованную энергию подполосы в нормализатор 105 и в выделитель 104 битов и выводит кодированную квантованную энергию подполосы, полученную посредством кодирования квантованной энергии подполосы, в мультиплексор 108.

[0034]

Вычислитель 103 тональности анализирует спектры подполос, включенные в каждую подполосу, и определяет тональность подполосы. Тональность является степенью, до которой создается пик спектра в конкретной частотной составляющей, и концептуально включает в себя пиковость, что означает, что присутствует заметное пиковое значение. Тональность может быть получена посредством квантования через вычисление соотношения между амплитудой среднего спектра в целевой подполосе и амплитудой максимального спектра, присутствующего в подполосе, например. Считается, что спектры подполос имеют тональность (пиковость), если полученное значение превышает заданную пороговую величину. В данном варианте осуществления вычислитель 103 тональности формирует пиковый/тональный флаг, установленный в единицу, если полученное значение превышает заданное значение, или формирует пиковый/тональный флаг, установленный в ноль, если полученное значение равно или меньше заданной пороговой величины, и выводит пиковый/тональный флаг в выделитель 104 битов и в мультиплексор 108 в качестве результата анализа. Вычислитель 103 тональности может вывести в качестве результата анализа вышеописанное соотношение.

[0035]

Вычислитель тональности функционирует следующим образом.

[0036]

В условиях низкой битовой скорости для эффективного квантования спектра, в котором спектральная энергия распределена по всей подполосе, в частности, шумоподобного спектра, эффективен способ на основании фильтра основного тона (то есть способ, в котором спектр высокочастотного диапазона выражается посредством использования спектра низкочастотного диапазона). Поэтому, степень распределения энергии внутри подполосы определяется из меры пиковости/тональности (соотношения между мощностью пика и средней мощностью или чего-либо тому подобного) спектра в подполосе, и если пиковость/тональность спектра не выше, то подполоса подвергается квантованию на основании фильтра основного тона.

[0037]

Выделитель 104 битов обращается к квантованной энергии подполосы и пиковому/тональному флагу каждой подполосы и выделяет биты из запаса битов, который соответствует общему количеству битов, доступных для кодирования, спектру подполосы в каждой подполосе. В частности, выделитель 104 битов вычисляет и определяет первое количество битов, которое является некоторым количеством битов, подлежащих выделению первым подполосам, которые являются подполосами, для которых квантование выполняется первым квантователем спектра, и выводит результат в первый квантователь 106 спектра в качестве информации о выделенных битах. Дополнительно, выделитель 104 битов выбирает и идентифицирует вторые подполосы, которые являются подполосами, для которых квантование выполняется вторым квантователем 107 спектра, и выводит результат во второй квантователь 107 спектра в качестве режима квантования.

[0038]

Конфигурация и функционирование выделителя 104 битов подробно описаны ниже.

[0039]

Следует отметить, что в данном варианте осуществления выделитель 104 битов обращается к пиковому/тональному флагу и квантованной энергии подполосы каждой подполосы в данном порядке; однако, порядок обращения может быть любым порядком.

[0040]

Относительно вторых подполос, которые подвергаются квантованию вторым квантователем 107 спектра, подполосы во всей полосе могут быть потенциальными вторыми подполосами. В целом, полоса, имеющая низкую квантованную энергию подполосы, и полоса, имеющая низкую тональность, главным образом, присутствуют в высокочастотном диапазоне, и, поэтому, целевыми могут быть только подполосы, присутствующие в конкретном высокочастотном диапазоне. Например, только четыре или пять подполос в высокочастотном диапазоне могут быть целевыми.

[0041]

Аудиосигнал обычно имеет более высокую тональность в низкочастотном диапазоне и низкую тональность в высокочастотном диапазоне, и поэтому подполосы в высокочастотном диапазоне по существу подвергаются квантованию на основании фильтра основного тона. Соответственно, может использоваться альтернативный способ, в котором все подполосы в более высоком частотном диапазоне по сравнению с подполосой, выбранной на основании тональности, могут быть подвергнуты квантованию на основании фильтра основного тона, и в качестве режима квантования могут быть переданы только номера подполос.

[0042]

Нормализатор 105 нормализует (разделяет) каждый спектр подполосы по входной квантованной энергии подполосы для формирования нормализованного спектра подполосы. В результате разность в амплитудах амплитуды между подполосами нормализуется. Нормализатор 105 выводит нормализованный спектр подполосы в первый квантователь 106 спектра и во второй квантователь 107 спектра.

[0043]

Следует отметить, что нормализатор 105 может иметь любую конфигурацию.

[0044]

Несмотря на то, что нормализатор 105 выполнен в виде одного компонента в данном варианте осуществления, нормализатор 105 может быть выполнен в предыдущем каскаде первого квантователя 106 спектра и в предыдущем каскаде второго квантователя 107 спектра, то есть может быть выполнен в виде двух компонентов.

[0045]

Первый квантователь 106 спектра является примером первого квантователя и квантует спектры подполос, принадлежащие первым подполосам, для которых квантование должно быть выполнено первым квантователем 106 спектра, среди входных нормализованных спектров подполос посредством использования первого количества битов, выделенных выделителем 104 битов. Первый квантователь 106 спектра выводит результат квантования во второй квантователь 107 спектра в качестве квантованных спектров и выводит первую кодированную информацию, полученную посредством кодирования квантованных спектров, в мультиплексор 108.

[0046]

Первый квантователь 106 спектра использует импульсный кодер. Примеры импульсного кодера включают в себя квантователь вектора решетки, который выполняет квантование вектора решетки, и импульсный кодер, который выполняет импульсное кодирование, при котором спектр подполосы приблизительно представлен малым количеством импульсов. То есть любой квантователь может использоваться, пока квантователь использует способ квантования, подходящий для квантования спектра, имеющего высокую тональность, или способ квантования с использованием малого количества импульсов.

[0047]

Следует отметить, что при чрезвычайно низкой битовой скорости, более высокий результат от поддержания качества звука может ожидаться при помощи квантования с использованием импульсного кодирования, при котором спектр подполосы приблизительно представлен малым количеством импульсов в сравнении с квантованием вектора решетки.

[0048]

Второй квантователь 107 спектра является примером второго квантователя и может использовать способ квантования с использованием расширенной полосы (модель предсказания с использованием фильтра основного тона), как описано ниже, например.

[0049]

В данном случае, фильтр основного тона является блоком обработки, который выполняет обработку, представленную выражением 1 ниже.

[0050]

[Уравнение 1]

y[i]=x[i]+β×y[i-T]

[0051]

В общем случае, фильтр основного тона относится к фильтру, который выделяет цикл (T) основного тона для сигнала на оси времени (выделяет составляющую основного тона на оси частоты) и является, например, цифровым фильтром, представленным выражением 1 для дискретного сигнала x[i], если количество отводов составляет один. Однако фильтр основного тона в данном варианте осуществления задан в качестве блока обработки, который выполняет обработку, представленную выражением 1, и не выполняет обязательно выделение основного тона на сигнале на оси времени.

[0052]

В данном варианте осуществления фильтр основного тона (блок обработки, представленный выражением 1) применяется к последовательности Mq[i] MDCT-коэффициентов квантования. В частности, в выражении 1 выполнены установки, в частности, x[i]=0 (i≥K, где K является нижней граничной частотой MDCT-коэффициента, который подвергнут кодированию) и y[i]=Mq[i] (i<K), и вычисляется y [i] (K≤i≤Kʹ, где Kʹ является верхней граничной частотой MDCT-коэффициента, который подвергнут кодированию). Значение T, с помощью которого минимизируется ошибка между MDCT-коэффициентом Mt[i], который подвергнут кодированию, и вычисленным y[i], кодируется в качестве информации о запаздывании. Такое кодирование спектра на основании фильтра основного тона раскрыто в PTL 2, например.

[0053]

Второй квантователь 107 спектра относится к режиму квантования и идентифицирует вторые подполосы (нормализованные спектры подполос), для которых квантование должно быть выполнено вторым квантователем 107 спектра. В результате, идентифицируются значения вышеописанных K и Kʹ. Затем, осуществляется поиск подполосы или полосы квантованного спектра, для которой нормализованный спектр подполосы (соответствующий вышеописанному Mt[i], где K≤i≤Kʹ), относящийся к идентифицированным вторым подполосам (частоте в диапазоне от K до Kʹ), имеет максимальную корреляцию с квантованным спектром (соответствующим вышеописанному Mq[i], где i<K), и положение подполосы или полосы используется для формирования информации о запаздывании (соответствующей вышеописанному T). Примеры информации о запаздывании включают в себя абсолютное положение или относительное положение подполосы или полосы, или номер подполосы. Второй квантователь 107 спектра кодирует и выводит информацию о запаздывании в мультиплексор 108 в качестве второй кодированной информации.

[0054]

Следует отметить, что в данном варианте осуществления кодированная квантованная энергия подполосы мультиплексируется и передается мультиплексором 108, а коэффициент усиления может быть сформирован декодером. Поэтому коэффициент усиления не кодируется. Однако коэффициент усиления может быть кодирован и передан. В данном случае, вычисляется коэффициент усиления между вторыми подполосами, для которых должно быть выполнено квантование, и подполосой квантованного спектра, который имеет максимальную корреляцию, и второй квантователь 107 спектра кодирует и выводит информацию о запаздывании и коэффициент усиления в мультиплексор 108 в качестве второй кодированной информации.

[0055]

Следует отметить, что в общем случае ширина полосы пропускания подполосы в высокочастотном диапазоне устанавливается шире подполосы в низкочастотном диапазоне. Однако, некоторые подполосы в низкочастотном диапазоне, подвергающиеся копированию, имеют низкую энергию и не могут быть подвергнуты квантованию вектора решетки. В данном случае, может предполагаться, что такие подполосы являются нулевыми спектрами, или могут быть добавлены помехи, чтобы избежать внезапного изменения спектра между подполосами.

[0056]

Мультиплексор 108 мультиплексирует и выводит квантованную энергию подполосы, первую кодированную информацию, вторую кодированную информацию и пиковые/тональные флаги в антенну в качестве кодированной информации.

[0057]

Антенна A передает кодированную информацию в устройство декодирования аудиосигнала. Кодированная информация достигает устройства декодирования аудиосигнала через различные узлы и базовые станции.

[0058]

Теперь ниже подробно описан выделитель 104 битов.

[0059]

На Фиг.2 показана блок-схема, изображающая подробную конфигурацию и функционирование выделителя 104 битов устройства 100 кодирования аудиосигнала согласно первому варианту осуществления. Выделитель 104 битов, изображенный на Фиг.2, включает в себя резервуар 111 битов, резервуар 112 битов, вычислитель 113 выделения битов и определитель 114 режима квантования.

[0060]

Резервуар 111 битов обращается к пиковым/тональным флагам, которые выводятся из вычислителя 103 тональности, и резервирует некоторое количество битов, необходимое для второго квантования спектра, выполняемого вторым квантователем 107 спектра, если какой-либо из пиковых/тональных флагов установлен нулевым.

[0061]

В данном варианте осуществления количество битов, необходимых для кодирования информации о запаздывании, резервируется на основании фильтра основного тона. Зарезервированное количество битов исключается из запаса битов, который соответствует общему количеству битов, доступных для квантования, и оставшийся запас битов выводится в резервуар 112 битов. Следует отметить, что запас битов поставляется квантователем 102 энергии подполосы, что означает, что биты, которые остаются после исключения количества битов, необходимых для переменного кодирования квантованной энергии подполосы, доступны первому квантователю 106 спектра, второму квантователю 107 спектра и для квантования (кодирования) пиковых/тональных флагов. Квантователь 102 энергии подполосы не формирует обязательно информацию о запасе битов.

[0062]

Резервуар 112 битов резервирует количество битов, используемых для пиковых/тональных флагов. В данном варианте осуществления пиковые/тональные флаги передаются посредством использования пяти подполос в высокочастотном диапазоне, и поэтому, резервуар 112 битов резервирует пять битов, например.

[0063]

Резервуар 112 битов выводит, в вычислитель 113 выделения битов, который находится в адаптивном выделителе битов, количество битов, которые остаются после исключения количества битов, зарезервированных резервуаром 112 битов, из запаса битов, введенного из резервуара 111 битов. Сумма количества битов, зарезервированных резервуаром 111 битов, и количества битов, зарезервированных резервуаром 112 битов, соответствует третьему количеству битов. Подполоса, для которой пиковый/тональный флаг установлен нулевым, соответствует третьей подполосе.

[0064]

Следует отметить, что порядок резервуара 111 битов и резервуара 112 битов может быть изменен. В данном варианте осуществления резервуар 111 битов и резервуар 112 битов являются отдельными блоками; однако, действия этих резервуаров могут быть выполнены одновременно в единственном блоке. Альтернативно, действия могут быть выполнены внутри вычислителя 113 выделения битов.

[0065]

Вычислитель 113 выделения битов вычисляет выделение битов для подполосы, для которых квантование выполняется первым квантователем 106 спектра. В частности, вычислитель 113 выделения битов сначала выделяет количество битов, выведенных из резервуара 112 битов, каждой подполосе с обращением к квантованной энергии подполосы. Выделение выполняется с помощью способа, описанного в разделе с уровнем техники, в котором определение в отношении того, важна ли подполоса для слуха, выполняется на основании амплитуды квантованной энергии подполосы, и подполосе, которая определена важной, отдается приоритет, и выделение битов выполняется на данной подполосе. В результате подполосе, имеющей квантованную энергию подполосы, равную нулю, ниже нуля или ниже заданного значения, никаких битов не выделяется.

[0066]

После выделения вычислитель 113 выделения битов обращается к введенным пиковым/тональным флагам и исключает подполосы (третьи подполосы), для которых пиковые/тональные флаги установлены нулевыми, из выделения битов. То есть вычислитель 113 выделения битов идентифицирует только подполосы, имеющие высокую пиковость (подполосы, для которых пиковые/тональные флаги установлены в единицу), в качестве целевых подполос для выделения битов и выделяет биты подполосам. Вычислитель 113 выделения битов идентифицирует подполосы (первые подполосы), которым биты должны быть выделены, создает информацию о выделенных битах, которая указывает количество битов, подлежащих выделению подполосам, и выводит эту информацию в определитель 114 режима квантования сначала.

[0067]

Определитель 114 режима квантования принимает информацию о выделенных битах, выводимую из вычислителя 113 выделения битов, и пиковые/тональные флаги. В случае, при котором присутствует подполоса в высокочастотном диапазоне, которая имеет высокую тональность (которая подвергается квантованию первым квантователем 106 спектра) и которой никаких битов выделено не было, определитель 114 режима квантования повторно задает подполосу в качестве некоторой подполосы (четвертой подполосы), для которой квантование выполняется вторым квантователем 107 спектра, и выводит количество битов (четвертое количество битов), необходимых для квантования вторым квантователем спектра, в вычислитель 113 выделения битов для вычитания этого количества битов из информации о выделенных битах. То есть определитель 114 режима квантования выделяет количество битов, необходимое для квантования вторым квантователем 107 спектра, интересующей полосе и выводит это количество выделенных битов (четвертое количество битов). Альтернативно, определитель 114 режима квантования может вычесть это количество выделенных битов из запаса битов, доступного первому квантователю 106 спектра, и вывести результат в вычислитель 113 выделения битов.

[0068]

Определитель 114 режима квантования идентифицирует подполосы, для которых квантование выполняется вторым квантователем 107 спектра, и выводит результат во второй квантователь 107 спектра в качестве режима квантования. В частности, определитель 114 режима квантования задает подполосы (третьи подполосы) в высокочастотном диапазоне, которые имеют низкую тональность (для которой пиковые/тональные флаги установлены нулевыми), и подполосы (четвертые подполосы) в высокочастотном диапазоне, которым никаких битов выделено не было, в качестве подполос (вторых подполос), для которых квантование выполняется вторым квантователем 107 спектра, и выводит эти подполосы в качестве режима квантования.

[0069]

Вновь вычислитель 113 выделения битов обновляет запас битов посредством вычитания количества битов (четвертого количества битов), принятых от определителя 114 режима квантования, из количества битов (запаса битов), введенных от резервуара 112 битов, и повторно вычисляет выделение битов для подполосы, для которой квантование выполняется первым квантователем 106 спектра. В случае приема обновленного запаса битов от определителя режима квантования вычислитель 113 выделения битов повторно вычисляет выделение битов для подполосы, для которой квантование выполняется первым квантователем 106 спектра, посредством использования обновленного запаса битов. Следовательно, первое количество битов равно значению, полученному посредством вычитания третьего количества битов и четвертого количества битов из общего количества битов (запаса битов).

[0070]

Вычислитель 113 выделения битов выводит количество битов (первое количество битов), полученное после повторного вычисления, и информацию о подполосах (первых подполосах), для которых квантование выполняется первым квантователем 106 спектра, в первый квантователь спектра 106 в этот раз в качестве информации о выделенных битах.

[0071]

В случае, при котором повторное вычисление не нужно выполнять, потому что всем подполосам выделены биты в результате первого вычисления выделения битов вычислителем 113 выделения битов, например, вычислитель 113 выделения битов может вывести информацию о выделенных битах непосредственно в первый квантователь 106 спектра.

[0072]

На Фиг.3 показана блок-схема последовательности операций способа функционирования, выполняемого устройством 100 кодирования аудиосигнала согласно первому варианту осуществления, в частности, функционирование, выполняемое выделителем 104 битов.

[0073]

Сначала выделитель 104 битов получает квантованную энергию подполосы от квантователя 102 энергии подполосы (S1).

[0074]

Затем, выделитель 104 битов получает пиковые/тональные флаги в высокочастотном диапазоне от вычислителя 103 тональности (S2).

[0075]

Выделитель 104 битов после этого идентифицирует подполосы (третьи подполосы), для которых квантование должно быть выполнено вторым квантователем 107 спектра, на основании пиковых/тональных флагов, и резервуар 111 битов и резервуар 112 битов резервируют там биты (третье количество битов), используемые при квантовании вторым квантователем 107 спектра (S3).

[0076]

Вычислитель 113 выделения битов в выделителе 104 битов определяет количество битов, подлежащих выделению подполосам, которые подвергаются квантованию первым квантователем 106 спектра, на основании квантованной энергии подполосы (S4).

[0077]

Определитель 114 режима квантования в выделителе 104 битов проверяет данное количество битов, выделенных подполосам в высокочастотном диапазоне, определенном вычислителем 113 выделения битов, снова идентифицирует подполосы (вторые подполосы), для которых квантование должно быть выполнено вторым квантователем 107 спектра, в качестве необходимых, и обновляет запас битов для первого квантователя 106 подполосы (S5).

[0078]

Наконец, вычислитель 113 выделения битов в выделителе 104 битов повторно вычисляет выделение битов (первое количество битов) для первого квантователя 106 спектра посредством использования обновленного запаса битов (S6).

[0079]

С помощью устройства кодирования аудиосигнала согласно данному варианту осуществления возможно реализовать кодирование высококачественных аудиосигналов с уменьшением общей битовой скорости.

[0080]

В частности, с помощью конфигураций и функционирования на Фиг.2 и Фиг.3, возможно реализовать выделение битов, которое не создает подполосу, для которых квантование не выполняется (количество выделенных битов становится нулевым) в высокочастотном диапазоне, в котором ширина подполосы особенно широка, и которое максимизирует количество подполос, для которых квантование выполняется первым квантователем. Соответственно, возможно реализовать адаптивное выделение битов, которое может достигать лучшей производительности при ограниченной битовой скорости.

[0081]

(Второй вариант осуществления)

На Фиг.4 показана блок-схема, изображающая конфигурацию и функционирование устройства декодирования 200 аудиосигнала согласно второму варианту осуществления. Устройство декодирования 200 аудиосигнала, изображенное на Фиг.4, включает в себя демультиплексор 201, декодер 202 энергии подполосы, выделитель 203 битов, первый декодер 204 спектра, второй декодер 205 спектра, денормализатор 206 и частотно-временной преобразователь 207. С демультиплексором 201 соединена антенна A. Устройство декодирования 200 аудиосигнала и антенна вместе составляют устройство терминала или устройство базовой станции.

[0082]

Демультиплексор 201 принимает кодированную информацию, принятую антенной A, и демультиплексирует кодированную информацию в кодированную квантованную энергию подполосы, первую кодированную информацию, вторую кодированную информацию и пиковые/тональные флаги. Демультиплексор 201 выводит кодированную квантованную энергию подполосы в декодер 202 энергии подполосы, первую кодированную информацию в первый декодер 204 спектра, вторую кодированную информацию во второй декодер 205 спектра и пиковые/тональные флаги в выделитель 203 битов.

[0083]

Декодер 202 энергии подполосы декодирует кодированную квантованную энергию подполосы, формирует декодированную квантованную энергию подполосы и выводит декодированную квантованную энергию подполосы в выделитель 203 битов и в денормализатор 206.

[0084]

Выделитель 203 битов обращается к декодированной квантованной энергии подполосы каждой подполосы и пиковым/тональным флагам и определяет выделение битов, которые выделены первым декодером 204 спектра, и битов, которые выделены вторым декодером 205 спектра. В частности, выделитель 203 битов определяет количество битов (первое количество битов), подлежащих выделению при декодировании первой кодированной информации первым декодером 204 спектра, и подполосы (первые подполосы), которым выделены биты, и выводит результат в качестве информации о выделенных битах. Дополнительно, выделитель 203 битов идентифицирует и выбирает подполосы (вторые подполосы), для которых вторая кодированная информация должна быть декодирована вторым декодером 205 спектра, и выводит результат во второй декодер 205 спектра в качестве режима квантования.

[0085]

Выделитель 203 битов имеет ту же самую конфигурацию и выполняет тоже самое действие, что и выделитель 104 битов, изображенный на Фиг.5 и описанный в описании устройства кодирования. Поэтому, за подробностями функционирования следует обращаться к описанию выделителя 104 битов в устройстве кодирования.

[0086]

Первый декодер 204 спектра декодирует первую кодированную информацию посредством использования первого количества битов, указанных информацией о выделенных битах, формирует первый декодированный спектр и выводит первый декодированный спектр во второй декодер 205 спектра.

[0087]

Второй декодер 205 спектра использует первый декодированный спектр для подполос, идентифицированных с помощью режима квантования, декодирует вторую кодированную информацию, формирует второй декодированный спектр, формирует восстановленный спектр посредством объединения второго декодированного спектра с первым декодированным спектром и выводит восстановленный спектр.

[0088]

Денормализатор 206 регулирует амплитуду (коэффициент усиления) восстановленного спектра c обращением к декодированной квантованной энергии подполосы и выводит результат в частотно-временной преобразователь 207.

[0089]

Частотно-временной преобразователь 207 преобразовывает восстановленный спектр в частотной области в выходной аудиосигнал во временной области и выводит выходной аудиосигнал. Примеры частотно-временного преобразования включают в себя преобразование, которое является обратным преобразованию, описанному в описании частотно-временного преобразования.

[0090]

С помощью устройства декодирования аудиосигнала согласно данному варианту осуществления возможно реализовать декодирование высококачественных аудиосигналов с уменьшением общей битовой скорости.

[0091]

(Заключение)

Устройство кодирования аудиосигнала и устройство декодирования аудиосигнала согласно настоящему изобретению были описаны в первом и втором вариантах осуществления. Устройство кодирования и устройство декодирования согласно настоящему изобретению могут концептуально быть выполнены в виде промежуточного изделия или некоторого компонента, в частности, системной платы или полупроводникового устройства, или в виде готового изделия, такого как устройство терминала или устройство базовой станции. В случае, при котором устройство кодирования и устройство декодирования согласно настоящему изобретению выполнены в виде промежуточного изделия или компонента, устройство кодирования и устройство декодирования объединяются с антенной, DA/AD-преобразователем, усилителем, громкоговорителем, микрофоном и так далее для образования готового изделия.

[0092]

Следует отметить, что в блок-схемах на Фиг.1, Фиг.2, Фиг.4 и Фиг.5 показаны конфигурации и функционирование (способы) исключительно разработанных устройств и могут быть применимы к случаю, при котором программа для выполнения функционирования (способов) настоящего изобретения устанавливается на аппаратном устройстве общего назначения и исполняется процессором, чтобы тем самым реализовать данное функционирование (способы). Примеры аппаратного устройства общего назначения, которое является вычислительным устройством, включают в себя различные портативные информационные терминалы, такие как персональный компьютер и смартфон, и различные портативные телефоны.

[0093]

Примеры исключительно разработанных устройств включают в себя не только готовые изделия (потребительские электронные изделия), такие как переносной телефон и стационарный телефон, но также и промежуточные изделия и компоненты, такие как системная плата и полупроводниковое устройство.

Промышленная применимость

[0094]

Устройство кодирования аудиосигнала и устройство декодирования аудиосигнала согласно настоящему изобретению применимы в устройстве или компоненте, участвующих в записи, передаче и воспроизведении аудиосигналов.

Список условных обозначений

[0095]

100 устройство кодирования аудиосигнала

101 временно-частотный преобразователь

102 квантователь энергии подполосы

103 вычислитель тональности

104 выделитель битов

105 нормализатор

106 первый квантователь спектра

107 второй квантователь спектра

108 мультиплексор

111 резервуар битов

112 резервуар битов

113 вычислитель выделения битов

114 определитель режима квантования

200 устройство декодирования аудиосигнала

201 демультиплексор

202 декодер энергии подполосы

203 выделитель битов

204 первый декодер спектра

205 второй декодер спектра

206 денормализатор

207 частотно-временной преобразователь

211 резервуар битов

212 резервуар битов

213 вычислитель выделения битов

214 определитель режима квантования

1. Устройство кодирования аудиосигнала, содержащее:

временно-частотный преобразователь, который формирует спектр посредством выполнения преобразования над входным аудиосигналом в частотную область, разделяет спектр на подполосы, которые являются заданными полосами частот, и выводит спектры подполос;

квантователь энергии подполосы, который получает для каждой из подполос квантованную энергию подполосы;

вычислитель тональности, который анализирует тональность спектров подполос и выводит результат анализа;

выделитель битов, который выбирает вторую подполосу, для которой квантование выполняется вторым квантователем, из числа упомянутых подполос, на основании результата анализа тональности и квантованной энергии подполосы, и определяет первое количество битов, подлежащих выделению первой подполосе среди упомянутых подполос, для которой квантование выполняется первым квантователем; и

мультиплексор, который мультиплексирует в информацию кодированную информацию, выводимую из первого квантователя и из второго квантователя, квантованную энергию подполосы и результат анализа тональности и выводит мультиплексированную информацию, при этом

первый квантователь выполняет импульсное кодирование спектра подполосы среди спектров подполос, который включен в первую подполосу, посредством использования первого количества битов, и

второй квантователь кодирует спектр подполосы среди спектров подполос, который включен во вторую подполосу, посредством использования фильтра основного тона.

2. Устройство кодирования аудиосигнала по п.1, в котором выделитель битов выбирает вторую подполосу из числа упомянутых подполос, которые находятся в высокочастотном диапазоне.

3. Устройство кодирования аудиосигнала по п.2, в котором выделитель битов выбирает подполосу среди упомянутых подполос, в которой тональность ниже заданной пороговой величины, в качестве второй подполосы.

4. Устройство кодирования аудиосигнала по п.2, в котором выделитель битов выбирает подполосу среди подполос, у которой квантованная энергия подполосы равна нулю или ниже заданного значения, в качестве второй подполосы.

5. Устройство кодирования аудиосигнала по п.1, в котором выделитель битов определяет первое количество битов посредством вычитания второго количества битов, подлежащих выделению второй подполосе, из общего количества битов, доступных для квантования.

6. Устройство кодирования аудиосигнала по п.5, в котором выделитель битов вычисляет третье количество битов среди общего количества битов, подлежащих выделению третьей подполосе, выбранной из числа упомянутых подполос на основании результата анализа тональности,

выбирает в качестве четвертой подполосы подполосу среди упомянутых подполос, которой не выделено никакого бита, когда количество битов, полученных посредством вычитания третьего количества битов из общего количества битов, выделены первой подполосе на основании квантованной энергии подполосы, и вычисляет четвертое количество битов, подлежащих выделению, в случае, при котором кодирование выполняется на четвертой подполосе вторым квантователем, и

выбирает третью подполосу и четвертую подполосу в качестве других вторых подполос, для которых квантование выполняется вторым квантователем, и определяет количество битов, полученных посредством вычитания третьего количества битов и четвертого количества битов из общего количества битов, в качестве первого количества битов, подлежащих выделению первой подполосе, для которой квантование выполняется первым квантователем.

7. Устройство кодирования аудиосигнала по п.1, в котором результат анализа от вычислителя тональности выводится в качестве флага, указывающего, превышает ли тональность заданную пороговую величину.

8. Устройство декодирования аудиосигнала для декодирования кодированной информации, выводимой из устройства кодирования аудиосигнала, при этом устройство декодирования аудиосигнала содержит:

демультиплексор, который демультиплексирует кодированную информацию в первую кодированную информацию, вторую кодированную информацию, квантованную энергию подполосы, полученную посредством квантования энергии каждой подполосы среди подполос, и результат анализа тональности, вычисленный для каждой подполосы среди упомянутых подполос;

выделитель битов, который выбирает вторую подполосу, для которой декодирование выполняется вторым декодером, из числа упомянутых подполос на основании результата анализа тональности и квантованной энергии подполосы, и определяет первое количество битов, подлежащих выделению первой подполосе, среди упомянутых подполос, для которых декодирование выполняется первым декодером; и

частотно-временной преобразователь, который формирует и выводит выходной аудиосигнал посредством выполнения преобразования над спектром, выводимым из второго декодера во временную область, при этом

первый декодер формирует первый декодированный спектр посредством декодирования первой кодированной информации с использованием первого количества битов, и

второй декодер формирует второй декодированный спектр посредством декодирования второй кодированной информации и формирует восстановленный спектр посредством выполнения декодирования с использованием второго декодированного спектра и первого декодированного спектра.

9. Устройство терминала, содержащее:

устройство кодирования аудиосигнала по п.1 и

антенну, которая передает кодированную информацию.

10. Устройство базовой станции, содержащее:

устройство кодирования аудиосигнала по п.1 и

антенну, которая передает кодированную информацию.

11. Устройство терминала, содержащее:

антенну, которая принимает и выводит в демультиплексор кодированную информацию; и

устройство декодирования аудиосигнала по п.8.

12. Устройство базовой станции, содержащее:

антенну, которая принимает и выводит в демультиплексор кодированную информацию; и

устройство декодирования аудиосигнала по п.8.

13. Способ кодирования аудиосигнала, содержащий этапы, на которых:

формируют спектр посредством выполнения преобразования над входным аудиосигналом в частотную область;

разделяют спектр на подполосы, которые являются заданными полосами частот, и выводят спектры подполос;

получают для каждой из подполос квантованную энергию подполосы;

анализируют тональность спектров подполос и выводят результат анализа;

выбирают вторую подполосу из числа упомянутых подполос на основании результата анализа тональности и квантованной энергии подполосы;

определяют первое количество битов, подлежащих выделению первой подполосе, среди подполос;

формируют первую кодированную информацию посредством кодирования спектра подполосы среди спектров подполос, который включен в первую подполосу, посредством использования первого количества битов;

формируют вторую кодированную информацию посредством кодирования спектра подполосы среди спектров подполос, который включен во вторую подполосу, посредством использования фильтра основного тона; и

мультиплексируют вместе и выводят первую кодированную информацию и вторую кодированную информацию.

14. Способ декодирования аудиосигнала для декодирования кодированной информации, выводимой из устройства кодирования аудиосигнала, причем способ декодирования аудиосигнала содержит этапы, на которых:

демультиплексируют кодированную информацию в первую кодированную информацию, вторую кодированную информацию, квантованную энергию подполосы, полученную посредством квантования энергии каждой подполосы среди подполос, и результат анализа тональности, вычисленный для каждой подполосы среди упомянутых подполос;

определяют первое количество битов, подлежащих выделению первой подполосе, среди упомянутых подполос;

формируют первый декодированный спектр посредством декодирования первой кодированной информации с использованием первого количества битов;

формируют второй декодированный спектр посредством декодирования второй кодированной информации и формируют восстановленный спектр посредством выполнения декодирования с использованием второго декодированного спектра и первого декодированного спектра; и

формируют и выводят выходной аудиосигнал посредством выполнения преобразования для восстановленного спектра во временную область.

Изобретение относится к области декодирования звука. Технический результат – повышение эффективности декодирования битового потока.

Кодер, декодер и способы для обратно совместимого пространственного кодирования аудиообъектов с переменным разрешением // 2669079

Изобретение относится к средствам кодирования и декодирования аудиосигнала. Технический результат заключается в повышении качества кодированного аудиосигнала.

Кодер и декодер аудиосигнала, использующие процессор частотной области, процессор временной области и кросспроцессор для непрерывной инициализации // 2668397

Изобретение относится к кодированию и декодированию аудиосигнала. Технический результат – обеспечение усовершенствованого принципа аудиокодирования.

Способ и устройство вывода аудиосигнала, способ и устройство кодирования, способ и устройство декодирования и программа // 2668113

Изобретение относится к средствам для кодирования, декодирования и вывода аудиосигнала. Технический результат заключается в повышении качества аудиосигнала.

Способ и устройство для сжатия и распаковки представления на основе амбиофонии высшего порядка // 2668060

Изобретение относится к средствам для сжатия и распаковки представления на основе амбиофонии высшего порядка. Технический результат заключается в повышении эффективности сжатия.

Сжатие разложенных представлений звукового поля // 2668059

Изобретение относится к средствам для сжатия разложенных представлений звукового поля. Технический результат заключается в повышении эффективности обработки звукового поля.

Оптимизированный масштабный коэффициент для расширения диапазона частот в декодере сигналов звуковой частоты // 2668058

Изобретение относится к средствам для расширения диапазона частот при декодировании аудиосигналов. Технический результат заключается в повышении эффективности расширения диапазона частот без дополнительной информации из кодера.

Способы и системы переключения технологий кодирования в устройстве // 2667973

Изобретение относится к средствам для переключения технологии кодирования при кодировании аудиосигнала. Технический результат заключается в сокращении артефактов на границах кадров и несогласованностей энергии при переключении технологии кодирования.

Устройство и способ декодирования и программа // 2667627

Изобретение относится к обработке аудиосигналов. Технический результат – повышение качества звука.

Способ распознавания протоколов низкоскоростного кодирования речи // 2667462

Изобретение предназначено для распознавания протоколов низкоскоростного кодирования речи (НСКР). Технический результат заключается в повышении точности распознавания протоколов НСКР.

Квантование аудиопараметров // 2670377

Изобретение относится к средствам для аналого-цифрового преобразования аудио. Технический результат заключается в повышении эффективности аналого-цифрового преобразования аудио. Вычисляют первую ошибку квантования, которая описывает ошибку, полученную в результате квантования без предсказания для аудиопараметра фрагмента аудиосигнала. Вычисляют вторую ошибку квантования, которая описывает ошибку, полученную в результате квантования с предсказанием для упомянутого аудиопараметра фрагмента аудиосигнала. Определяют, превосходит ли вторая ошибка квантования первую ошибку квантования, по меньшей мере, на адаптивный запас, который зависит от количества последовательных фрагментов аудиосигнала, предшествующих упомянутому фрагменту аудиосигнала, в котором было выполнено квантование упомянутого аудиопараметра с использованием квантования с предсказанием. Предоставляют упомянутый аудиопараметр фрагмента аудиосигнала, квантованный с использованием квантования без предсказания, в качестве части кодированного аудиосигнала в том случае, когда результат упомянутого определения положительный. Иначе предоставляют упомянутый аудиопараметр фрагмента аудиосигнала, квантованного с использованием квантования с предсказанием, в качестве части кодированного аудиосигнала. 3 н. и 20 з.п. ф-лы, 6 ил.

Принцип кодирования информации // 2670384

Изобретение относится к области аудиокодирования. Технический результат заключается в повышении эффективности аудиокодирования. Технический результат достигается за счет анализа информационного сигнала (IS) для получения коэффициентов линейного предсказания предсказательного полинома A(z); преобразования коэффициентов линейного предсказания предсказательного полинома A(z) в значения частоты (f1…fn) спектрального частотного представления (RES, IES) предсказательного полинома A(z); ограничения числового диапазона спектров (RES, IES) полиномов P(z) и Q(z) путем умножения полиномов P(z) и Q(z) или одного или более полиномов, выведенных из полиномов P(z) и Q(z), на фильтрационный полином B(z), причем фильтрационный полином B(z) симметричен и не имеет корней на единичной окружности; получения квантованных значений частоты (fq1…fqn) из значений частоты (f1…fn); и формирования битового потока (BS), содержащего квантованные значения частоты (fq1…fqn). 3 н. и 17 з.п. ф-лы, 8 ил.

Способ и устройство для обнаружения голосовой активности // 2670785

Изобретение относится к области обнаружения речевой активности (VAD). Техническим результатом является уменьшение риска отсечения середины и окончания речевых пакетов путем добавления хвостов сигнала. Способ включает в себя этапы: определение меры краткосрочной активности на основании количества активных фреймов в памяти, определение меры долгосрочной активности на основании количества активных фреймов, если превышено одно из первого и второго пороговых значений. 2 н. и 11 з.п. ф-лы, 9 ил.

Способ аудиокодирования и соответствующее устройство // 2670790

Изобретение относится к технологиям аудиокодирования. Технический результат заключается в повышении эффективности аудиокодирования. Технический результат достигается за счет осуществления обработки временно-частотного преобразования на сигнале временной области текущего кадра аудио, для получения спектральных коэффициентов текущего кадра аудио; получения одного или более опорных параметров кодирования текущего кадра аудио; и если полученный опорный параметр кодирования текущего кадра аудио удовлетворяет любому одному из набора условий параметра, кодируют спектральные коэффициенты текущего кадра аудио на основании алгоритма возбуждения, кодированного с преобразованием; или если полученный опорный параметр кодирования текущего кадра аудио не удовлетворяет ни одному из набора условий параметра, кодируют спектральные коэффициенты текущего кадра аудио на основании алгоритма кодирования с преобразованием высокого качества. 6 н. и 16 з.п. ф-лы, 10 ил.

Способ и устройство для формирования из представления hoa-сигналов в области коэффициентов смешанного представления упомянутых hoa-сигналов в пространственной области/области коэффициентов // 2670797

Изобретение относится к средствам для формирования из представления НОА-сигналов в области коэффициентов смешанного представления упомянутых НОА-сигналов в пространственной области. Технический результат заключается в обеспечении формирования представления НОА-сигналов в пространственной области без уменьшения динамического диапазона и без потери качества сигнала. Разделяют вектор HOA-сигналов в области коэффициентов на первый вектор сигналов в области коэффициентов, имеющий постоянное количество HOA-коэффициентов, и второй вектор сигналов в области коэффициентов, имеющий переменное во времени количество HOA-коэффициентов. Преобразовывают первый вектор сигналов в области коэффициентов в соответствующий вектор сигналов в пространственной области посредством умножения упомянутого вектора сигналов в области коэффициентов на обратную матрицу матрицы преобразования. Подвергают PCM-кодированию упомянутый вектор сигналов в пространственной области для получения вектора подвергшихся PCM-кодированию сигналов в пространственной области. Нормируют упомянутый второй вектор сигналов в области коэффициентов, причем нормирование является адаптивным нормированием. 7 н. и 8 з.п. ф-лы, 8 ил.

Способ и устройство для определения параметра межканальной временной разности // 2670843

Изобретение относится к области обработки аудио. Технический результат - уменьшение объема вычислений в процессе поиска и вычисление межканальной временной разности в процессе кодирования стерео. Способ включает в себя: определение опорного параметра согласно сигналу временной области в первом и втором звуковых каналах, где опорный параметр соответствует последовательности получения сигнала временной области в первом и втором звуковых каналах, и сигналы временной области в первом и втором звуковых каналах соответствуют одному и тому же периоду времени (S110); определение диапазона поиска согласно опорному параметру и ограничительному значению Tmax, где ограничительное значение Tmax определяется согласно частоте выборки сигнала временной области в первом звуковом канале, и диапазон поиска попадает в пределы [-Tmax, 0] или диапазон поиска попадает в пределы [0, Tmax] (S120); и выполнение обработки осуществления поиска в пределах диапазона поиска на основе сигналов частотной области в первом и втором звуковых каналах, чтобы определить первый параметр межканальной временной разности ITD, соответствующий первому звуковому каналу и второму звуковому каналу (S130). 2 н. и 8 з.п. ф-лы, 6 ил.