Способ встраивания цифровой информации в аудиосигнал



Способ встраивания цифровой информации в аудиосигнал
Способ встраивания цифровой информации в аудиосигнал
Способ встраивания цифровой информации в аудиосигнал
Способ встраивания цифровой информации в аудиосигнал
Способ встраивания цифровой информации в аудиосигнал
Способ встраивания цифровой информации в аудиосигнал
Способ встраивания цифровой информации в аудиосигнал

 


Владельцы патента RU 2505868:

Корпорация "САМСУНГ ЭЛЕКТРОНИКС Ко., Лтд." (KR)
ООО "ЦИФРАСОФТ" (RU)

Изобретение относится к технологиям обработки цифровых сигналов, в частности к способам внедрения цифровой информации в аудиосигнал для целей телекоммуникаций. Способ встраивания цифровой информации в аудиосигнал, включающий выполнение следующих операций: разделяют цифровую информацию на высокоприоритетный и низкоприоритетный потоки, причем высокоприоритетные данные встраивают посредством частотно-селективной эхо-модуляции, а низкоприоритетные данные встраивают посредством шумоподобных сигналов или с использованием цифровой модуляции с многими несущими; разделяют исходный аудиосигнал на первую частотную часть и вторую частотную часть, причем первую частотную часть исходного аудиосигнала модулируют посредством частотно-селективной эхо-модуляции с различными величинами задержки и амплитуды эхо-сигнала, а вторую частотную часть исходного аудиосигнала подают на блок психоакустического анализа на основе психоакустической модели, учитывающей эффект частотного и/или временного маскирования, при этом с помощью блока психоакустического анализа формируют на каждом интервале анализа спектральную маску, отражающую порог слышимости искажений, и данную спектральную маску применяют к сигналу со многими несущими или к шумоподобному сигналу с последующим добавлением полученного сигнала в блоке психоакустического анализа ко второй частотной части исходного аудиосигнала; комбинируют две модулированные частотные части акустического сигнала. 4 з.п. ф-лы, 7 ил.

 

Изобретение относится к технологиям обработки цифровых сигналов, в частности к способам внедрения цифровой информации в аудиосигнал для целей телекоммуникаций.

Использование акустических волн для передачи информации известно с доисторических времен. Однако и сейчас в сфере телекоммуникаций имеются ниши, в которых применение акустики предпочтительнее любых других средств. В частности, это касается скрытой от наблюдателя передачи информации на небольшие расстояния без использования радио- или оптической связи. Примером может служить использование акустической связи для обмена цифровой информацией между мобильными устройствами. При этом важным преимуществом использования такого вида связи является то, что аппаратной модернизации традиционных устройств связи, как правило, не требуется, достаточно лишь дополнительного программного обеспечения.

Из уровня техники известны различные подходы к решению проблем акустической связи. Один из способов вставки малозаметных сигналов, несущих цифровую информацию, в аудиозаписи основывается на добавлении к аудиосигналу шумоподобного сигнала (spread spectrum signal) с уровнем ниже порога слышимости (см. I.J.Сох, J.Kilian, Т.Leighton and T.Shamoon, "A secure, robust watermark for multimedia", Lecture Notes in Computer Science, Volume 1174/1996, pp.185-206 (1996)) [1].

Другим решением данной проблемы может являться «эхо-модуляция». В этом варианте, к аудиосигналу добавляются небольшие по уровню эхо-сигналы, задержка и уровень которых модулируется в зависимости от цифровой информации (см. Gruhl. D., Lu, A, and Bender, W., "Echo Hiding," Proceedings of the First International Workshop on Information Hiding, Cambridge, UK, May 30-June 1, 1996, pp.293-315) [2].

В заявке США №20110144979 «DEVICE AND METHOD FOR ACOUSTIC COMMUNICATION» [3] предложен способ вставки цифровой информации в аудиосигналы на базе цифровой модуляции со многими несущими с использованием психоакустических особенностей слуховой системы человека.

Способы, основанные на широкополосных сигналах с амплитудой ниже уровня шумов (далее упоминаются как «шумоподобные сигналы») или на базе цифровой модуляции со многими несущими с использованием психоакустического маскирования, как правило, достигают более высоких скоростей передачи информации, чем способы, основанные на эхо-модуляции. В некоторых реализациях такие способы позволяют незаметно вставлять в аудиосигнал цифровой поток информации со скоростью передачи до нескольких килобит в секунду. Тем не менее, из-за психоакустических особенностей человеческого слуха эти способы имеют тенденцию к использованию высоких частот звукового диапазона, так как именно на этих частотах заметно проявляется эффект частотно-временного маскирования. В то же время, при распространении звука в воздухе высокие частоты имеют тенденцию к быстрому затуханию с увеличением расстояния от источника звука до приемника (микрофона) и, кроме того, не могут огибать физические препятствия, встречающиеся на пути распространения звука. Как результат, такие системы наиболее приспособлены только для таких приложений, где предполагается передача информации в звуке на сравнительно небольших расстояниях (например, десятки сантиметров) и имеется прямая видимость между источником звука и микрофоном.

С другой стороны, эхо-модуляция менее чувствительна к наличию препятствий на пути между источником звука и микрофоном и подходит для передачи информации в звуке на сравнительно больших расстояниях (например, несколько метров). Однако этот вид передачи также обладает недостатками, прежде всего, низкой скоростью передачи данных (как правило, несколько бит или десятков бит в секунду) и чувствительностью к шумам и нелинейным искажениям, например, вследствие перегрузки микрофона на коротких расстояниях.

Задача, на решение которой направлено заявляемое изобретение, состоит в том, чтобы минимизировать недостатки, присущие двум вышеупомянутым способам, а именно добиться более высоких скоростей передачи данных в звуковом сигнале и увеличить расстояние уверенного приема передаваемых данных.

Технический результат достигается за счет разработки усовершенствованного способа внедрения цифровой информации в аудиосигнал. При этом заявляемый способ оптимальным образом комбинирует достоинства двух вышеназванных подходов и предусматривает выполнение следующих операций:

- разделяют цифровую информацию на высокоприоритетный и низкоприоритетный потоки;

- разделяют исходный аудиосигнал на первую частотную часть и вторую частотную часть;

- добавляют, по меньшей мере, один эхо-сигнал, амплитуда или задержка которого зависит от высокоприоритетного потока цифровой информации, в первую часть исходного аудиосигнала;

- модулируют низкоприоритетным потоком цифровой информации шумоподобный коммуникационный сигнал, спектр которого сформирован на основе психоакустического анализа второй части исходного аудиосигнала, и добавляют шумоподобный коммуникационный сигнал ко второй части исходного аудиосигнала;

- комбинируют две модулированные части акустического сигнала.

Заявляемое техническое решение позволяет оптимально использовать емкость открытого акустического канала передачи информации. В частности, если расстояние между источником звука и микрофоном приемного устройства сравнительно невелико, то предлагаемое решение будет демонстрировать высокие скорости передачи данных в звуковом сигнале. Когда расстояние между источником звука и микрофоном увеличивается, скорость передачи будет плавно уменьшаться. Если расстояние между источником звука и микрофоном увеличивается значительно или имеются препятствия на пути распространения звука, предлагаемый способ, тем не менее, позволяет передавать цифровые данные в звуке, хотя и с более низкой скоростью передачи.

Далее существо заявляемого изобретения поясняется с привлечением графических материалов.

Фиг.1 - последовательная вставка цифровых данных в аудио.

Фиг 2 - иллюстрация принципа обычной эхо-модуляции (вид 2.1)

и предлагаемой частотно-селективной эхо-модуляции (вид 2.2).

Фиг 3 - примеры трех частотно-селективных эхо-фильтров с различной задержкой эхо-сигнала в соответствии с настоящим изобретением (импульсные характеристики).

Фиг.4 - амплитудная и фазовая частотные характеристики частотно-селективного эхо-сигнала (пример).

Фиг.5 - энергетический спектр предлагаемого эхо-модулированного сигнала (основной сигнал+эхо-сигнал, два варианта задержки эхо-сигнала).

Фиг.6 - предпочтительный вариант реализации схемы вставки цифровой информации в аудиосигнал в соответствии с предлагаемым изобретением.

Фиг.7 - пример схемы выделения цифровой информации из аудиосигнала, закодированного в соответствии с предлагаемым изобретением.

Очевидно, что самый простой подход к комбинированию двух типов модуляции заключается в последовательном кодировании аудиосигнала двумя вышеуказанными способами (см. Фиг.1). Однако такой подход имеет два серьезных недостатка:

- так как обе схемы модифицируют один и тот же сигнал, модуляция, добавленная на втором этапе, негативно повлияет на сигнал, добавленный на первом этапе, и приведет к ухудшению характеристик при декодировании (или вообще приведет к невозможности декодирования данных, добавленных на первом этапе);

- кроме того, последовательная модуляция будет заметно ухудшать качество исходного аудиосигнала, так как при этом вносимые искажения будут накапливаться или даже усиливаться.

Заявляемый способ позволяет избежать этих негативных последствий.

Во-первых, стоит отметить, что способ передачи с использованием шумоподобных широкополосных сигналов или на базе цифровой модуляции со многими несущими является предпочтительным, поскольку он обеспечивает высокую скорость передачи и, при правильном алгоритме формирования сигнала, дает менее заметные на слух искажения. Поэтому эхо-модуляция должна применяться только в тех ситуациях, когда нельзя полагаться на способ передачи с использованием шумоподобных сигналов или на базе цифровой модуляции со многими несущими. К сожалению, далеко не всегда имеется достоверная информация о том, позволяют ли условия распространения акустического сигнала применять модуляцию с многими несущими или с шумоподобными сигналами. Кроме того, в большинстве практических приложений рассматриваемых способов передача информации ведется в одном направлении, т.е. без обратного канала. При этом, если эффективность передачи на основе модуляции со многими несущими или модуляции с шумоподобными сигналами снижается, это, как правило, означает, что расстояние между источником звукового сигнала и микрофоном достаточно большое.

Основная идея заявляемого способа состоит в том, чтобы оптимизировать эхо-модуляцию для таких сценариев, когда эхо-модуляция, скорее всего, является единственно возможным способом передачи данных по акустическому каналу. Для этого предлагается концепция частотно-селективной эхо-модуляции. Эта концепция схематически проиллюстрирована на Фиг.2. Здесь основной момент заключается в том, что задержанный сигнал (эхо) не только уменьшается по амплитуде, как в обычных схемах, но также и подвергается линейному преобразованию с целью удаления определенных спектральных составляющих. Одно из очевидных достоинств такого преобразования - это удаление верхних частот, хотя, в качестве альтернативы, может быть использована и полосовая фильтрация. Как и в известных способах, внедрение данных может осуществляться за счет амплитудной модуляции или задержки таких эхо-сигналов.

Один из примеров практической реализации частотно-селективной эхо-модуляции, в соответствии с заявляемым изобретением, проиллюстрирован на Фиг.3 (во временной области), а соответствующий частотный отклик такого эхо-сигнала показан на Фиг.4. Как видно из Фиг.4, энергия эхо-сигнала сосредоточена преимущественно в частотной полосе ниже 3 кГц.

Суммарный спектр аудиосигнала, промодулированного предлагаемой частотно-селективной эхо-модуляцией (основной сигнал+эхо), показан на Фиг.5. Как можно видеть, модулированный сигнал имеет неравномерную частотную характеристику в области низких частот, в то время как в области более высоких частот спектральная характеристика плоская. Это дает два преимущества:

- аудиоискажения возникают только в определенной частотной области, что делает их менее заметными для человеческого слуха;

- участки спектра, не занятые эхо-сигналом, могут быть использованы для вставки сигнала со многими несущими или шумоподобного сигнала.

В то же время, при большом расстоянии между источником звука и микрофоном предлагаемая частотно-селективная эхо-модуляция может демонстрировать примерно такую же скорость и помехозащищенность передачи, как и обычная эхо-модуляция. Это возможно, так как в такой ситуации высокие звуковые частоты существенно затухают и не несут полезной информации.

Заявляемое изобретение работает следующим образом. На Фиг.6 показана типичная реализация кодера для вставки цифровой информации в аудиосигнал в соответствии с предлагаемым изобретением. Сначала информация, предназначенная для передачи, разбивается на две части:

- высокоприоритетные данные, включающие только основную информацию;

- низкоприоритетные данные, включающие как основную, так и дополнительную, менее существенную, информацию.

Высокоприоритетные данные встраиваются посредством предложенной частотно-селективной эхо-модуляции, а низкоприоритетные данные встраиваются посредством шумоподобных сигналов или с использованием цифровой модуляции со многими несущими. Для достижения этого исходный аудиосигнал разделяется на две комплиментарные части посредством полосового, низкочастотного или высокочастотного фильтра 607, линии 609 задержки и вычитателя. При этом под термином «комплиментарные» части имеется в виду, что их суммирование дает исходный аудиосигнал. Длина линии задержки соответствует групповому времени задержки фильтра. Затем первая часть модулируется посредством предложенной схемы частотно-селективной эхо-модуляции. Такая модуляция может быть реализована с помощью набора фильтров 605-608 с импульсными характеристиками, подобными той, которая изображена на Фиг.3, но с различными величинами задержки и амплитуды эхо-сигнала.

Задержка и амплитуда эхо-сигнала в данном случае отражает определенную комбинацию закодированных бит. Для реализации динамической модуляции в каждый конкретный момент (в зависимости от текущей комбинации закодированных бит) сигнал на выходе одного из фильтров выбирается с помощью мультиплексора. Предпочтительно, чтобы переход от одной комбинации бит к другой производился плавно для минимизации заметных на слух искажений аудиосигнала. Это может быть реализовано путем введения небольшого переходного интервала, на протяжении которого сигнал с выхода фильтра, соответствующего текущей комбинации бит, плавно уменьшается, в то время как сигнал с выхода фильтра, соответствующего следующей комбинации бит, плавно увеличивается в соответствии с некоторой гладкой функцией w(k).

Данные с использованием цифровой модуляции со многими несущими и психоакустического маскирования встраиваются во вторую часть исходного аудиосигнала, предпочтительно содержащую более высокочастотные составляющие. Для реализации этого вторая часть исходного аудиосигнала подается на блок 613 психоакустического анализа на основе психоакустической модели, учитывающей эффект частотного и/или временного маскирования. Блок 613 психоакустического анализа формирует на каждом интервале анализа спектральную маску, отражающую порог слышимости искажений, и данная спектральная маска применяется к сигналу со многими несущими или к шумоподобному сигналу. Затем полученный сигнал добавляется в блоке 612 ко второй части исходного аудиосигнала. Как вариант, могут также использоваться более сложные варианты маскирования, описанные, например, в [3].

Как и в большинстве традиционных подходов, для повышения помехоустойчивости передачи данных высокоприоритетный и низкоприоритетный потоки могут быть закодированы с помощью той или иной схемы помехоустойчивого кодирования (например, сверточного кода, турбо-кода и т.д.), также могут быть использованы блочный или сверточные перемежители для устранения эффекта импульсных помех (см. блоки 601-603 и 614-615 соответственно).

Заявляемый способ встраивания цифровой информации в звуковой сигнал может быть реализован в виде специализированного аппаратного модуля на базе полупроводниковых элементов или может быть реализован в виде программного обеспечения для мобильных или портативных устройств, персональных компьютеров или серверов.

Схема для декодирования сигнала, встроенного предлагаемым способом, может быть также реализована в виде аппаратного модуля или встроенного программного обеспечения для мобильных или портативных устройств. Различные алгоритмы могут быть использованы для декодирования данных, встроенных в аудиосигнал в соответствии с заявляемым способом. В целом, устройство декодирования будет включать в себя общий микрофон для захвата акустического сигнала и два связанных модуля обработки сигнала для декодирования высокоприоритетных и низкоприоритетных данных. На практике предпочтительно, чтобы переходы между символами в части, промодулированной частотно-селективной эхо-модуляцией, были синхронизированы с переходами между фреймами в схеме цифровой модуляции со многими несущими. Как правило, высокоприоритетный поток может быть декодирован в более сложной помеховой обстановке и может, в этом случае, обеспечить дополнительную информацию для синхронизации декодера низкоприоритетного потока и априорную информацию для некоторых бит потока (см. декодер 701 эхо-модулированного сигнала и декодер 702 шумоподобного сигнала на Фиг.7).

Заявляемое техническое решение может быть использовано, помимо прочего, в геолокационных приложениях, где информация о местоположении может быть встроена в аудиосигнал. В этом случае, высокоприоритетные данные могут включать в себя только долготу и широту места, а низкоприоритетные данные могут содержать дополнительную информацию, такую как название места, подсказки, ссылки на Интернет ресурсы и другое.

1. Способ встраивания цифровой информации в аудиосигнал, включающий выполнение следующих операций:
разделяют цифровую информацию на высокоприоритетный и низкоприоритетный потоки, причем высокоприоритетные данные встраивают посредством частотно-селективной эхо-модуляции, а низкоприоритетные данные встраивают посредством шумоподобных сигналов или с использованием цифровой модуляции со многими несущими;
разделяют исходный аудиосигнал на первую частотную часть и вторую частотную часть, причем первую частотную часть исходного аудиосигнала модулируют посредством частотно-селективной эхо-модуляции с различными величинами задержки и амплитуды эхо-сигнала, а вторую частотную часть исходного аудиосигнала подают на блок психоакустического анализа на основе психоакустической модели, учитывающей эффект частотного и/или временного маскирования, при этом с помощью блока психоакустического анализа формируют на каждом интервале анализа спектральную маску, отражающую порог слышимости искажений, и данную спектральную маску применяют к сигналу со многими несущими или к шумоподобному сигналу с последующим добавлением полученного сигнала в блоке психоакустического анализа ко второй частотной части исходного аудиосигнала;
комбинируют две модулированные частотные части акустического сигнала.

2. Способ по п.1, отличающийся тем, что шумоподобный коммуникационный сигнал является сигналом со многими несущими.

3. Способ по п. 1, отличающийся тем, что эхо-сигналы, добавляемые в первую частотную часть аудиосигнала, имеют ограниченный частотный спектр.

4. Способ по п. 1, отличающийся тем, что эхо-сигналы, добавляемые в первую частотную часть аудиосигнала, имеют низкочастотный спектр.

5. Способ по п.1, отличающийся тем, что эхо-сигналы, добавляемые в первую частотную часть аудиосигнала, имеют высокочастотный спектр.



 

Похожие патенты:

Изобретение относится к области аудио обработки, особенно обработки пространственных свойств аудио. Сущность изобретения состоит в том, что устройство (100) для формирования выходного пространственного многоканального аудио сигнала на основе входного аудио сигнала и входного параметра.

Изобретение относится к области цифровой связи, а именно к методам сокращения объема данных при их обработке. Предлагаемый способ может быть использован для уменьшения затрат вычислительных ресурсов и требуемого объема запоминающих устройств при создании кодовых книг и реализации алгоритмов поиска опорных векторов в них, в том числе при осуществлении низкоскоростного кодирования речевых сигналов.

Устройство (300, 400) параметрического стереофонического повышающего микширования, генерирующее левый сигнал (206) и правый сигнал (207) из монофонического сигнала (204) понижающего микширования на основе пространственных параметров (205).

Изобретение относится к устройству, которое реализует кодирование и декодирование с уменьшенной задержкой, используя методику многоканального кодирования и декодирования звука соответственно.

Изобретение относится к аудиокодекам без потерь, а более конкретно, к многоканальному аудиокодеку без потерь, который использует адаптивную сегментацию с возможностью точек произвольного доступа (RAP) и возможностью множества наборов параметров предсказания (MPPS).

Устройство для обеспечения набора пространственных указателей, связанных с аудиосигналом повышающего микширования, имеющим более двух каналов, на основе двухканального сигнала микрофона, содержит анализатор сигнала и генератор дополнительной пространственной информации.

Изобретение относится к вычислительной технике. .

Изобретение относится к области телекоммуникационных систем. .

Изобретение относится к средствам кодирования и декодирования аудиоданных и включения их в цифровой транспортный поток данных. Технический результат заключается в повышении качества звука за счет точного выравнивания каналов аудиоданных относительно друг друга по времени. Принимают на входе кодера множества совмещенных по времени аудиосигналов. Дискретизируют сигналы, совмещенные по времени, чтобы сформировать выровненные кадры аудиоданных предопределенного размера. Назначают идентичные временные метки в единицу времени всем из множества совмещенных аудиосигналов. Включают помеченные таким образом аудиосигналы в цифровой транспортный поток данных. 7 н.з. и 8 з.п. ф-лы, 8 ил.

Изобретение относится к вычислительной технике. Технический результат заключается в повышении эффективности иерархического кодирования/декодирования аудио. Способ иерархического кодирования аудио включает разделение коэффициентов частотной области аудио сигнала после модифицированного дискретного косинусного преобразования (МДКП) на множество поддиапазонов кодирования, квантование и кодирование значений огибающей амплитуды поддиапазонов кодирования; распределение битов в каждый поддиапазон кодирования основного уровня, квантование и кодирование коэффициентов частотной области основного уровня, чтобы получить закодированные биты коэффициентов частотной области основного уровня; вычисление значения огибающей амплитуды каждого поддиапазона кодирования остаточного сигнала основного уровня; распределение битов в каждый поддиапазон кодирования расширенного уровня, квантование и кодирование сигнала кодирования расширенного уровня, чтобы получить закодированные биты сигнала кодирования расширенного уровня; мультиплексирование и упаковку закодированных битов значения огибающей амплитуды каждого поддиапазона кодирования, состоящего из коэффициентов частотной области основного уровня и расширенного уровня, закодированных битов частотных коэффициентов основного уровня и закодированных битов сигнала кодирования расширенного уровня, затем передачу на сторону декодирования. 4 н. и 18 з.п. ф-лы, 12 ил., 9 табл.

Изобретение относится к форматам данных мультимедийных приложений, которые используют иерархические слои данных. Техническим результатом является обеспечение возможности обнаружения потери синхронизации между данными улучшающего слоя и данными основного слоя во время декодирования, в то время как количество синхронизирующей информации и контрольной информации в потоке данных улучшающего слоя удерживается низким. Способ кодирования аудио- или видеосигнала, имеет поток битов основного слоя и поток битов улучшающего слоя, относящийся к потоку битов основного слоя. Данные основного слоя и данные улучшающего слоя структурированы в пакеты, и пакеты потока битов основного слоя имеют соответствующие пакеты потока битов улучшающего слоя. Согласно способу осуществляют вычисление контрольной суммы пакета потока битов основного слоя и соответствующего пакета потока битов улучшающего слоя. А также энтропийно кодируют пакет потока битов основного слоя, получая энтропийно кодированный выровненный по байтам пакет основного слоя, начинающийся с синхронизационного слова. 4 н. и 9 з.п. ф-лы, 7 ил.

Шумозаполнитель для создания шумозаполненного спектрального представления звукового сигнала на основе входного спектрального представления звукового сигнала состоит из идентификатора спектральной области, созданного для идентификации спектральных областей входного спектрального представления, отделенных от ненулевых спектральных областей входного спектрального представления, по крайней мере, одной промежуточной спектральной областью для того, чтобы получить идентифицированные спектральные области; и устройства для вставки шума, созданно для того, чтобы выборочно вносить шум в идентифицированные спектральные области для получения шумозаполненного спектрального представления звукового сигнала. Вычислитель параметра шумозаполнения для расчета параметра шумозаполнения на основе квантованного спектрального представления звукового сигнала включает в себя идентификатор спектральной области, как упоминалось выше, и вычислитель значения шума, предназначенный для выборочного рассмотрения ошибок квантования в идентифицированных спектральных областях для расчета параметра шумозаполнения. Соответственно, возможно получить кодированное представление звукового сигнала, представляющее звуковой сигнал. Технический результат - улучшение шумозаполнения кодированного звукового сигнала, ограничивая нежелательные искажения. 6 н. и 9 з.п. ф-лы, 9 ил.

Изобретение относится к аудиосигналам и к устройствам или способам для их получения, передачи, преобразования и воспроизведения. Технический результат заключается в улучшении стереофонического воспроизведения монофонически отображаемого источника звука. Монофонический аудиосигнал любой характеристики направленности - при параметризации угла фи (1205), который заключают главная ось (1203) и направление прихода источника сигнала (1204), фиктивного левого угла раскрыва альфа (1206), а также фиктивного правого угла раскрыва бета (1207), а также характеристики направленности стереофонизируемого монофонического сигнала (представленного в полярных координатах) - подвергается целенаправленно коррекции по разности времен распространения (1210, 1211) и уровней (выводится из 1212 и 1213). В результате получаются М-сигнал и S-сигнал, которые позволяют MS-матрицирование (и тем самым стереофоническое воспроизведение первоначально монофонического аудиосигнала). 6 н. и 8 з.п. ф-лы, 20 ил.

Аудиокодер (100) для кодирования отсчетов аудиосигнала включает в себя первый кодер с временным наложением (алиасингом) (110) для кодирования аудиоотсчетов в первой области кодирования по первому правилу кадрирования, с приложением стартового окна и стопового окна. Аудиокодер (100), далее включающий в себя второй кодер (120) для кодирования отсчетов во второй области кодирования, обрабатывающий задаваемое форматом фрейма число аудиоотсчетов и содержащий ряд аудиоотсчетов интервала стабилизации режима кодирования, применяющий другое, второе, правило кадрирования, при этом фрейм второго кодера (120) является кодированным представлением последовательных во времени аудиоотсчетов, число которых задается форматом фрейма. Аудиокодер (100) включает в себя, кроме того, контроллер (130), выполняющий коммутацию с первого кодера (110) на второй кодер (120) в соответствии с характеристикой аудиоотсчетов и обеспечивающий корректировку второго правила кадрирования при переключении с первого кодера (110) на второй кодер (120) или модифицирующий стартовое окно или стоповое окно первого кодера (110) с сохранением второго правила кадрирования без изменения. Технический результат - улучшение коммутации между множеством рабочих областей при кодировании звука как во временной, так и в частотной областях. 14 н. и 20 з.п. ф-лы, 28 ил.

Изобретение относится к вычислительной технике. Технический результат заключается в улучшении качества расширенного выходного аудиосигнала. Аппаратный блок для расширения сжатого аудио сигнала, содержащего один или более сжатых аудио каналов в расширенный звуковой сигнал, содержащий множество расширенных аудиоканалов, причем аппаратный блок включает блок расширения, настроенный на использование текущих значений переменных параметров расширения для расширения сжатого аудио сигнала и получения расширенного звукового сигнала; а также модуль интерполяции параметров, настроенный на получение одного или нескольких текущих интерполированных параметров расширения, которые будут использоваться в блоке расширения на основе информации, описывающей первый комплекснозначный параметр расширения и последующий второй комплекснозначный параметр расширения, причем модуль интерполяции параметров настроен на независимую интерполяцию между величиной магнитуды первого комплекснозначного параметра расширения и величиной магнитуды второго комплекснозначного параметра расширения, и между значением фазы первого комплекснозначного параметра расширения и значением фазы (256) второго комплекснозначного параметра расширения, для получения одного или нескольких текущих интерполированных комплекснозначных параметров расширения. 3 н. и 12 з.п. ф-лы, 8 ил.

Изобретение относится к вычислительной технике. Технический результат заключается в повышении точности квантования в векторном квантовании. Устройство векторного квантования содержит первую секцию выбора, которая выбирает классификационный кодовый вектор, указывающий тип характеристик, имеющих корреляцию с вектором, подлежащим квантованию, из множества классификационных кодовых векторов; вторую секцию выбора, которая выбирает первую кодовую книгу, соответствующую выбранному классификационному кодовому вектору, из множества первых кодовых книг; первую секцию квантования, которая квантует вектор, подлежащий квантованию, используя множество первых кодовых векторов, составляющих выбранную первую кодовую книгу, чтобы получить первый код; третью секцию выбора, которая выбирает первую матрицу, соответствующую выбранному классификационному кодовому вектору, из множества матриц; и вторую секцию квантования, которая квантует первый вектор остатка, являющийся разностью между первым кодовым вектором, указанным первым кодом, и вектором, подлежащим квантованию, с использованием множества вторых кодовых векторов и выбранной первой матрицы, чтобы получить второй код. 4 н. и 5 з.п. ф-лы, 6 ил.

Изобретение относится к средствам многоканального повышающего микширования с применением многоканальной декорреляции. Технический результат заключается в повышении качества кодирования сигнала при уменьшении ресурсоемкости. Система линейных уравнений применяется для повышающего микширования количества N звуковых сигналов с целью генерирования большего количества М звуковых сигналов, которые являются психоакустически декоррелированными относительно друг друга, и может применяться для улучшения представления рассеянного звукового поля. Линейные уравнения определяются матрицей, которая устанавливает множество векторов в М-мерном пространстве, существенно ортогональных друг к другу. Раскрыты способы получения системы линейных уравнений. 4 н. и 6 з.п. ф-лы, 6 ил.

Изобретение относится к средствам кодирования и декодирования аудио потока на основе преобразования входного звукового сигнала. Технический результат заключается в уменьшении объема закодированных данных. Получают аудио поток, содержащий информацию, описывающую диапазон частот аудио контента, и информацию, описывающую ошибку многополосной дискретизации. Определяют ошибку многополосной дискретизации для множества диапазонов частот входного звукового сигнала, в котором имеется информация об усилении для отдельных диапазонов. Рассчитывают среднюю ошибку дискретизации для множества частотных диапазонов входного аудио сигнала. Исключаются диапазоны частот, спектральные компоненты которых полностью квантованы к нулю. Вводят шум в спектральные компоненты для множества диапазонов частот, причем информация об усилении в отдельных диапазонах частот связана с общим значением интенсивности многополосного шума. 7 н.з. и 11 з.п. ф-лы, 23 ил.
Наверх