Устройство и способ для воспроизведения аудиосигнала, устройство и способ для генерирования кодированного аудиосигнала, компьютерная программа и кодированный аудиосигнал

Изобретение относится к средствам для генерирования и воспроизведения аудиосигнала. Технический результат заключается в обеспечении возможности генерирования и воспроизведения аудиосигнала при уменьшении доступной скорости передачи данных. Устройство содержит первое воспроизводящее средство, выполненное с возможностью воспроизведения первой части аудиосигнала на основании первых данных. Средство предоставления выполняется с возможностью предоставления сигнала-заплаты во второй частотной полосе, причем сигнал-заплата является по меньшей мере частично некоррелированным относительно первой части аудиосигнала или является по меньшей мере частично декоррелированной версией первой части аудиосигнала, которая была смещена во вторую частотную полосу. Второе воспроизводящее средство выполняется с возможностью воспроизведения второй части аудиосигнала во второй частотной полосе на основании вторых данных и сигнала-заплаты. Объединяющее средство выполняется с возможностью объединения воспроизводимой первой части аудиосигнала и сигнала-заплаты перед воспроизведением второй части аудиосигнала вторым воспроизводящим средством. 6 н. и 9 з.п. ф-лы, 13 ил.

 

Настоящее изобретение имеет отношение к устройству, способу и компьютерной программе для воспроизведения аудиосигнала и, в частности, к устройству, способу и компьютерной программе для воспроизведения аудиосигнала в ситуациях, в которых уменьшается доступная скорость передачи данных. Помимо этого, настоящее изобретение имеет отношение к устройству, способу и компьютерной программе для генерирования кодированного аудиосигнала и соответствующему кодированному аудиосигналу.

Перцепционно адаптивное кодирование аудиосигналов, для эффективного хранения и передачи этих сигналов с уменьшенной скоростью передачи данных, получило распространение во многих областях. Известны алгоритмы кодирования, в частности такие, как MPEG-1/2, «MP3» 3-го уровня, Усовершенствованное кодирование аудио (AAC-Advanced Audio Coding) MPEG-2/4 или Комплексное кодирование речи и аудио (USAC-Unified Speech and Audio Coding) MPEG-H. Лежащие в основе методы кодирования, особенно при достижении наименьших скоростей передачи битов, приводят к снижению качества аудио. Часто ухудшение, главным образом, вызвано ограничением полосы пропускания аудиосигнала для передачи на стороне устройства кодирования.

В такой ситуации, как известно для существующего уровня техники, чтобы подвергнуть аудиосигнал ограничению полосы частот на стороне устройства кодирования и закодировать только нижнюю полосу аудиосигнала, используется высококачественное устройство кодирования аудио. Верхняя полоса, однако, только очень грубо характеризуется набором параметров, которые выражают, например, огибающую спектра верхней полосы. Затем на стороне устройства декодирования синтезируется верхняя полоса путем вставки заплаты из декодированного сигнала нижней полосы в свободную в противном случае верхнюю полосу, и выполняя последующие управляемые настройки параметров.

Стандартные способы для расширения полосы пропускания аудиосигналов с ограниченной полосой частот используют функцию копирования низкочастотных частей сигнала (LF-low-frequency) в высокочастотный диапазон (HF-high frequency), чтобы аппроксимировать информацию, отсутствующую из-за ограничения полосы частот. В принципе, такая функция копирования технически эквивалентна спектральному сдвигу, вычисленному во временной области посредством модуляции с одной боковой полосой (SSB-single sideband), но в вычислительном отношении гораздо менее сложна. Такие способы, как, например, Репликация спектральной полосы (SBR-Spectral Band Replication), описываются в документах М. Дитц (M. Dietz), Л. Лильерид (L. Liljeryd), К. Кьерлинг (K. Kjörling) и О. Кунц (O. Kunz), "Репликация спектральной полосы, новый подход в кодировании аудио" ("Spectral Band Replication, a novel approach in audio coding"), 112-й Съезд AES, Мюнхен, май 2002 г.; С. Мелтцер (S. Meltzer), Р. Бем (R. Böhm) и Ф. Хенн (F. Henn), "Аудиокодеки с улучшенной SBR для цифрового вещания, такого, как "Всемирное Цифровое Радиовещание" (DRM)" ("SBR enhanced audio codecs for digital broadcasting such as "Digital Radio Mondiale" (DRM)"), 112-й Съезд AES, Мюнхен, май 2002 г.; Т. Циглер (T. Ziegler), А. Эрет (A. Ehret), П. Экстранд (P. Ekstrand) и М. Лутцкий (M. Lutzky), "Улучшенный mp3 с SBR: Особенности и возможности нового алгоритма mp3PRO" ("Enhancing mp3 with SBR: Features and Capabilities of the new mp3PRO Algorithm"), 112-й Съезд AES, Мюнхен, май 2002 г.; Международный стандарт ISO/IEC 14496-3:2001/FPDAM 1, "Расширение полосы пропускания" («Bandwidth Extension»), ISO/IEC, 2002, или "Способ и устройство расширения полосы пропускания речевых сигналов" ("Speech bandwidth extension method and apparatus"), Васу Айенгар (Vasu Iyengar) и др. Патент США Номер 5,455,888.

В этих способах не выполняется гармоническая транспозиция, а последовательные полосовые сигналы нижней полосы вводятся в последовательные каналы банка фильтров верхней полосы. Тем самым достигается грубая аппроксимация верхней полосы аудиосигнала. Затем, на следующем этапе, эта грубая аппроксимация сигнала аппроксимируется к исходному посредством пост-обработки с использованием управляющей информации, полученной из исходного сигнала. При этом, например, коэффициенты масштабирования служат для адаптации огибающей спектра, обратного фильтрования и добавления минимального уровня шума, чтобы адаптировать тональность, и дополнения синусоидальными частями сигнала, что также описано в Стандарте MPEG-4.

Как известно из методов гармонических расширений полосы пропускания, описанных в работе Ф. Нагеля (Nagel, F.); С. Диша (Disch, S.) «Способ гармонического расширения полосы пропускания для аудиокодеков» («A Harmonic Bandwidth Extension Method for Audio Codecs»), Международная конференция по акустике и обработке речи и сигналов (ICASSP - Int. Conf. on Acoustics, Speech and Signal Processing) IEEE, 2009 г.; в работе Ф. Нагеля; С. Диша; Н. Реттельбаха (Rettelbach, N.) «Способ расширения полосы пропускания под управлением фазового вокодера с новой обработкой переходных процессов для аудиокодеков» («A Phase Vocoder Driven Bandwidth Extension Method with Novel Transient Handling for Audio Codecs»), 126-й Съезд AES, 2009 г.; в работе Х. Жонга (Zhong, H.); Л. Виллемоеса (Villemoes, L.); П. Экстранда, и др. «Гармоническая репликация спектральной полосы на базе QMF» («QMF Based Harmonic Spectral Band Replication», 131-й Съезд Общества инженеров-акустиков (AES-Audio Engineering Society), 2011 г.; в работе Л. Виллемоеса; П. Экстранда; П. Хеделина (Hedelin, P.) «Способы для расширенной гармонической транспозиции» («Methods for enhanced harmonic transposition»), Рабочая группа IEEE по применениям обработки сигналов к аудио и акустике, (WASPAA-Workshop on Applications of Signal Processing to Audio and Acoustics), 2011 г., при синтезе верхней полосы в сигнал могут быть внесены нежелательные слышимые нечеткости. Одной причиной (из многих) упомянутых нечеткостей является спектральное отклонение заплаты и/или эффекты диссонанса в переходных зонах между нижней полосой и первой заплатой или между последовательными заплатами. Методы гармонических расширений полосы пропускания предназначены для улучшения этих двух аспектов, пусть и ценой вычислительной сложности.

Вычисления в банке фильтров и вставка заплаты в области банка фильтров, особенно при гармоническом расширении полосы пропускания, действительно могут превратиться в высокие вычислительные затраты. В WO 98/57436 описывается усовершенствованный метод вставки заплаты, который, в некоторых определенных пределах, может избежать эффектов диссонанса, вводя так называемые защитные полосы частот между разными спектральными заплатами и выполняя модифицированную вставку заплаты с повышающим копированием, чтобы уменьшить спектральное отклонение, сохраняя приемлемую вычислительную сложность.

Кроме этого, существуют дополнительные способы, например, так называемое «слепое расширение полосы пропускания», описанное в работе Э. Ларсена (E. Larsen), Р. М. Аартса (R. M. Aarts) и М. Данессиса (M. Danessis), «Эффективное высокочастотное расширение полосы пропускания музыки и речи» («Efficient high-frequency bandwidth extension of music and speech»), на 112-ом Съезде AES, Мюнхен, Германия, май 2002 г., в которых не используется информация об исходном ВЧ диапазоне. Кроме того, существует также способ так называемого «Искусственного расширения полосы пропускания», который описан в работе К. Каюхке (K. Käyhkö), «Устойчивое широкополосное улучшение для узкополосного речевого сигнала» («A Wideband Enhancement for Narrowband Speech Signal»); научно-исследовательский отчет, Хельсинкский технологический университет, Лаборатория акустики и обработки аудиосигналов, 2001 г.

В работе Дж. Макинена (J. Makinen) и др.: AMR-WB+: «Новый стандарт кодирования аудио для транслирования подвижных услуг передачи аудиоинформации 3-го поколения» («A new audio coding standard for 3rd generation mobile audio services Broadcasts»), IEEE, ICASSP ’05, описывается способ для расширения полосы пропускания, в котором операция копирования для расширения полосы пропускания с повышающим копированием последовательных полосовых сигналов в соответствии с технологией SBR заменяется на зеркальное отображение, например, путем повышающей дискретизации.

Дополнительные технологии для расширения полосы пропускания описаны в следующих документах. Р. М. Аартс, Э. Ларсен и О. Аувелтьес (O. Ouweltjes), «Комплексный подход к низко- и высокочастотному расширению полосы пропускания» («A unified approach to low- and high frequency bandwidth extension»), 115-й Съезд AES, Нью-Йорк, США, октябрь 2003 г.; Э. Ларсен и Р. М. Аартс, «Расширение полосы пропускания аудио - применение в психоакустике, обработке сигналов и конструировании громкоговорителей» («Audio Bandwidth Extension - Application to psychoacoustics, Signal Processing and Loudspeaker Design»), John Wiley & Sons, Ltd., 2004 г.; Э. Ларсен, Р. М. Аартс и М. Данессис, «Эффективное высокочастотное расширение полосы пропускания музыки и речи» («Efficient high-frequency bandwidth extension of music and speech»), 112-й Съезд AES, Мюнхен, май 2002 г.; Дж. Макхоул (J. Makhoul), «Спектральный анализ речи с помощью линейного предсказания» («Spectral Analysis by Linear Prediction»), Протоколы IEEE по аудио и электроакустике, AU-21(3), июнь 1973 г.; Заявка на патент США 08/951,029; Патент США Номер 6,895,375.

Известные способы гармонического расширения полосы пропускания демонстрируют высокую сложность. С другой стороны, способы расширения полосы пропускания пониженной сложности демонстрируют потери качества. В частности, при низкой скорости передачи битов, и в сочетании с низкой пропускной способностью в НЧ диапазоне, могут возникать такие артефакты, как нечеткость и тембр, неприятные для восприятия. Причиной этого является прежде всего тот факт, что аппроксимированная ВЧ часть основывается на одной или более операциях прямого копирования или зеркального отображения НЧ части спектра.

Задачей настоящего изобретения является предоставить устройство и способ для воспроизведения аудиосигнала в улучшенной форме. Более того, задачей настоящего изобретения является предоставить устройство и способ для генерирования кодированного аудиосигнала, который может быть воспроизведен в улучшенной форме. Дополнительной задачей настоящего является предоставить соответствующую компьютерную программу и соответствующий кодированный аудиосигнал.

Эта задача успешно выполняется с помощью устройства для воспроизведения аудиосигнала по п. 1 формулы изобретения, способа для воспроизведения аудиосигнала по п. 13 формулы изобретения, устройства для генерирования кодированного аудиосигнала по п. 12 формулы изобретения, способа для генерирования кодированного аудиосигнала по п. 13 формулы изобретения, компьютерной программы по п. 14 формулы изобретения и кодированного аудиосигнала по п. 15 формулы изобретения.

Варианты осуществления настоящего изобретения обеспечивают устройство для воспроизведения аудиосигнала на основании первых данных, представляющих кодированную версию первой части аудиосигнала в первой частотной полосе, и вторых данных, представляющих вспомогательную информацию о второй части аудиосигнала во второй частотной полосе, причем вторая частотная полоса содержит частоты более высокие, чем первая частотная полоса, при этом устройство содержит:

первое воспроизводящее средство, выполненное с возможностью воспроизведения первой части аудиосигнала на основании первых данных;

средство предоставления, выполненное с возможностью предоставления сигнала-заплаты во второй частотной полосе, причем сигнал-заплата является некоррелированным относительно первой части аудиосигнала или является декоррелированной версией первой части аудиосигнала, которая была смещена во вторую частотную полосу;

второе воспроизводящее средство, выполненное с возможностью воспроизведения второй части аудиосигнала во второй частотной полосе на основании вторых данных и сигнала-заплаты; и

объединяющее средство для объединения воспроизводимой первой части аудиосигнала и сигнала-заплаты перед воспроизведением второй части аудиосигнала вторым воспроизводящим средством или для объединения воспроизводимой первой части аудиосигнала и воспроизводимой второй части аудиосигнала.

Варианты осуществления настоящего изобретения обеспечивают способ для воспроизведения аудиосигнала на основании первых данных, представляющих кодированную версию первой части аудиосигнала в первой частотной полосе, и вторых данных, представляющих вспомогательную информацию о второй части аудиосигнала во второй частотной полосе, причем вторая частотная полоса содержит частоты более высокие, чем первая частотная полоса, при этом способ содержит этапы, на которых:

воспроизводят аудиосигнал в первой частотной полосе на основании первых данных;

предоставляют сигнал-заплату во второй частотной полосе, причем сигнал-заплата является некоррелированным относительно первой части аудиосигнала или является декоррелированной версией первой части аудиосигнала, которая была смещена во вторую частотную полосу;

воспроизводят аудиосигнал во второй частотной полосе на основании вторых данных и сигнала-заплаты; и

объединяют воспроизводимую первую часть аудиосигнала и сигнал-заплату перед воспроизведением второй части аудиосигнала или объединяют воспроизводимую первую часть аудиосигнала и воспроизводимую вторую часть аудиосигнала.

Варианты осуществления настоящего изобретения имеют отношение к воспроизведению аудиосигнала, предусматривающему расширение полосы пропускания с использованием декоррелированных аудиосигналов частичной полосы. В отличие от уже существующих способов, большинства искажений сигналов и артефактов, которые в настоящее время типичны для расширений полосы пропускания, можно избежать при помощи декоррелированных аудиосигналов частичной полосы для расширения полосы пропускания, а не коррелированных (копированных с повышением или зеркально отображенных) аудиосигналов частичной полосы. Это достигается путем предоставления аудиосигнала, который формирует основу для воспроизведения высокочастотной части аудиосигнала, некоррелированного или декоррелированного относительно первой части (НЧ части) аудиосигнала. Варианты осуществления настоящего изобретения основаны на утверждении, что корреляция между низкочастотной частью и высокочастотной частью не должна поддерживаться при воспроизведении второй части сигнала из аудиосигнала. Наоборот, авторы изобретения приходят к выводу, что артефактов, таких, как нечеткость и тембр, неприятных для восприятия, можно избежать, используя декоррелированный или полностью некоррелированный сигнал-заплату.

Варианты осуществления настоящего изобретения обеспечивают устройство для генерирования кодированного аудиосигнала, причем кодированный аудиосигнал содержит первые данные, представляющие кодированную версию первой части аудиосигнала в первой частотной полосе, и вторые данные, представляющие вспомогательную информацию о второй части аудиосигнала во второй частотной полосе, причем вторая частотная полоса содержит частоты более высокие, чем первая частотная полоса, при этом устройство содержит:

средство добавления декорреляционной информации, выполненное с возможностью добавления к кодированному аудиосигналу информации о степени декорреляции, которая должна быть использована между первой частью аудиосигнала и сигналом-заплатой, на основании которой воспроизводится вторая часть аудиосигнала при воспроизведении аудиосигнала из кодированного аудиосигнала.

Варианты осуществления настоящего изобретения обеспечивают способ для генерирования кодированного аудиосигнала, причем кодированный аудиосигнал содержит первые данные, представляющие кодированную версию первой части аудиосигнала в первой частотной полосе, и вторые данные, представляющие вспомогательную информацию о второй части аудиосигнала во второй частотной полосе, причем вторая частотная полоса содержит частоты более высокие, чем первая частотная полоса, при этом способ содержит этап, на котором:

добавляют к кодированному аудиосигналу информацию о степени декорреляции, которая должна быть использована между первой частью аудиосигнала и сигналом-заплатой, на основании которой воспроизводится вторая часть аудиосигнала при воспроизведении аудиосигнала из кодированного аудиосигнала.

Варианты осуществления настоящего изобретения обеспечивают кодированный аудиосигнал, который содержит:

первые данные, представляющие кодированную версию первой части аудиосигнала в первой частотной полосе;

вторые данные, представляющие вспомогательную информацию о второй части аудиосигнала во второй частотной полосе, причем вторая частотная полоса содержит частоты более высокие, чем первая частотная полоса; и

информацию о степени декорреляции, которая должна быть использована между первой частью аудиосигнала и сигналом-заплатой, на основании которой воспроизводится вторая часть аудиосигнала при воспроизведении аудиосигнала из кодированного аудиосигнала.

Итак, варианты осуществления настоящего изобретения позволяют генерировать кодированный аудиосигнал таким образом, чтобы позволить декодировать кодированный аудиосигнал надлежащим образом, используя надлежащую степень декорреляции. Надлежащая степень декорреляции может быть определена на стороне устройства кодирования на основании характеристик первой части и/или второй части аудиосигнала.

В дальнейшем варианты осуществления настоящего изобретения разъясняются более подробно со ссылкой на прилагаемые чертежи, на которых:

Фиг. 1a демонстрирует структурную схему варианта осуществления устройства для воспроизведения аудиосигнала;

Фиг. 1b демонстрирует структурную схему другого варианта осуществления устройства для воспроизведения аудиосигнала;

Фиг. 2 демонстрирует структурную схему дополнительного варианта осуществления устройства для воспроизведения аудиосигнала;

Фиг. 3 демонстрирует структурную схему варианта осуществления устройства для генерирования кодированного аудиосигнала;

Фиг. 4a демонстрирует схематичную иллюстрацию стороны устройства кодирования с учетом вариантов осуществления настоящего изобретения;

Фиг. 4b демонстрирует схематичную иллюстрацию стороны устройства декодирования с учетом вариантов осуществления настоящего изобретения;

Фиг. 5a и 5b демонстрируют диаграммы, иллюстрирующие преимущества вариантов осуществления настоящего изобретения;

Фиг. 6 демонстрирует структурную схему устройства для воспроизведения аудиосигнала, от которого отталкивается настоящее изобретение; и

Фиг. 7a-7d демонстрируют диаграммы сигналов, полезные при разъяснении работы устройства, продемонстрированного на Фиг. 6.

Перед подробным разъяснением вариантов осуществления настоящего изобретения, считаем целесообразным коротко обсудить теоретические соображения, лежащие в основе изобретения.

Как указывалось выше, расширения полосы пропускания, основанные на операциях копирования (или операциях зеркального отображения), например, как SBR (SBR = Репликация спектральной полосы (Spectral Band Replication)), копируют большие части НЧ спектра непосредственно в ВЧ диапазон.

Пример устройства с SBR описывается со ссылкой на Фиг. 6 и 7. Огибающая аудиосигнала 2 продемонстрирована на Фиг. 7a. Аудиосигнал 2 содержит низкочастотную часть (или низкочастотную полосу) 4 и высокочастотную часть (или высокочастотную полосу) 6. Как правило, при перцепционном кодировании аудиосигналов, низкочастотная часть 4 кодируется посредством высококачественного устройства кодирования аудио, такого, как устройство кодирования с PCM (PCM = импульсно- кодовая модуляция (pulse code modulation)), тогда как верхняя полоса только очень грубо характеризуется вспомогательной информацией. Данные, представляющие кодированную низкочастотную часть, и данные, представляющие вспомогательную информацию, передаются с использованием соответствующего основного кодека. Фиг. 6 демонстрирует сигнал 8 основной полосы от основного кодека, который представляет низкочастотную часть 4, показанную на Фиг. 7b. Этот сигнал 8 поступает на модуль модуляции с одной боковой полосой/повышающего копирования, где сигнал 8 смещается в частотный диапазон высокочастотной части 6. Этот смещенный сигнал показан как сигнал 10 на Фиг. 7c. Смещенный сигнал 10 и сигнал 8 поступают на модуль 12 вставки заплат, где оба сигнала объединяются (суммируются) для получения спектра, показанного на Фиг. 7c. Часть 8 сигнала может быть смещена в p различных диапазонов верхних частот, где p ≥ 1. Таким образом объединение одного или нескольких (p) смещенных сигналов и сигнала 8 может иметь место в модуле 12 вставки заплат.

Выходной сигнал модуля 12 вставки заплат поступает на модуль 14 пост-обработки, который также принимает вспомогательную информацию 16, представляющую аудиосигнал в высокочастотной части 6. Таким образом, высокочастотная часть 10’ аудиосигнала 6 воспроизводится на основании вспомогательной информации 16 и аудиосигнала низкочастотной части 4. Получающийся аудиосигнал показан на Фиг. 7d. Модуль 14 пост-обработки выводит полнополосный выходной сигнал с охватом частотных диапазонов низкочастотной части 4 и высокочастотной части 6.

Соответственно, расширения полосы пропускания на основании операций копирования (или операций зеркального отображения), такие как, например, SBR, копируют большие части низкочастотного спектра непосредственно в высокочастотный диапазон. Это может быть достигнуто в результате применения модуляции с одной боковой полосой представления во временной области аудиосигнала или прямого процесса копирования (копирования с повышением) в спектральном представлении аудиосигнала. Этот этап обработки обычно называют "вставка заплаты".

Вообще, может быть множество заплат, копируемых в различные высокочастотные полосы. Соответствующие частотные полосы могут перекрываться или нет. Каждая из соответствующих ВЧ заплат, таким образом, полностью коррелирует с низкочастотным диапазоном, из которого она была извлечена. Авторы настоящего изобретения пришли к выводу, что тем самым модуляции временной огибающей могут происходить в результате наложения обоих сигналов с частотой, которая зависит от спектрального расстояния между НЧ полосой и спектральным положением соответственной ВЧ заплаты.

С системно-теоретической точки зрения, это явление следует рассматривать как сопряженное с работой гребенчатого фильтра с конечной импульсной характеристикой (КИХ), содержащего задержку n отсчетов при Fs в качестве частоты дискретизации. Этот фильтр имеет амплитудно-частотную характеристику с шириной гребенки (спектральное расстояние между двумя максимумами амплитудно-частотной характеристики) 1/n*Fs. Таким образом, системно-теоретическая двойственность имеет следующие прямые соответствия:

временная задержка <-> перенос частоты

амплитудно-частотная характеристика <-> временная огибающая.

Авторы настоящего изобретения пришли к выводу, что временные модуляции в результате этого слышимы с помехами и могут проявляться в автокорреляционной функции величины формы волны в виде периодически повторяющихся боковых максимумов. Такие периодически повторяющиеся боковые максимумы в автокорреляционной последовательности огибающей шумового сигнала для SBR с повышающим копированием показаны на Фиг. 5a. Фиг. 5a демонстрирует автокорреляционную функцию амплитудной огибающей белого шума, причем полоса пропускания расширяется тремя заплатами прямого повышающего копирования, которые полностью коррелируют между собой и с НЧ полосой.

Только когда НЧ и ВЧ сигнал демонстрирует одинаковую амплитуду, достигается максимальная глубина модуляции. На практике, следовательно, эффект модуляции часто немного ниже, потому что, как правило, ВЧ диапазон заметно тише (менее громкий), чем НЧ диапазон. Шумоподобные сигналы или квазистационарные сигналы с выраженной структурой обертонов должны считаться особенно важными по отношению к артефактам модуляции.

В случае наличия нескольких заплат (p на Фиг. 6), которые полностью коррелируют между собой, вышеупомянутая двойственность тоже справедлива, конечно. Оказывается, что временная модуляция амплитудной огибающей сопряжена с амплитудно-частотной характеристикой соответствующего КИХ-фильтра.

Итак, в соответствии с вариантами осуществления настоящего изобретения, заплата или заплаты декоррелируются друг от друга и от НЧ полосы. В вариантах осуществления настоящего изобретения используются одно или несколько декорреляционных средств, чтобы декоррелировать сигнал, полученный из низкочастотных составляющих сигнала, соответственно, перед тем, как он будет вставлен в диапазон(ы) верхних частот и, в зависимости от ситуации, подвергнут пост-обработке.

Варианты осуществления настоящего изобретения избегают указанных проблем, которые возникают вследствие операции копирования или операции зеркального отображения, благодаря использованию взаимно декоррелированных заплат. В вариантах осуществления настоящего изобретения, соответственные ВЧ заплаты декоррелируются от НЧ полосы по отдельности с помощью декорреляционных средств, например, посредством фазовых фильтров или другими известными способами декорреляции, или сразу синтезируются заплаты в декоррелированной по своей природе форме.

В вариантах осуществления настоящего изобретения степень декорреляции может жестко определяться или регулироваться на стороне устройства декодирования, или она может передаваться в качестве параметра от устройства кодирования на устройство декодирования. Кроме того, может декоррелироваться вся заплата, или только определенные части заплаты. Части заплаты, подлежащие декорреляции, также могут передаваться в качестве параметра от устройства кодирования на устройство декодирования как часть соответствующей информации, добавляемой к кодированному аудиосигналу.

Подход настоящего изобретения выгоден по сравнению с традиционными подходами для расширения полосы пропускания, поскольку искажения и окрашивания звука в результате создания помех или паразитных модуляций огибающей, как они имеются в современных способах, основанных на модуляции с одной боковой полосой/повышающем копировании НЧ полосы, безусловно предотвращаются при подходе настоящего изобретения. Это достигается при помощи ВЧ заплат, которые являются декоррелированными версиями НЧ части сигнала или которые полностью некоррелированы по отношению к НЧ части сигнала.

Далее описывается сценарий, в котором могут быть реализованы варианты осуществления настоящего изобретения, со ссылкой на Фиг. 4a и 4b.

Сторона устройства кодирования продемонстрирована на Фиг. 4a, а сторона устройства декодирования продемонстрирована на Фиг. 4b. Аудиосигнал подается в комбинированный фильтр нижних/ верхних частот на вход 700. Комбинированный фильтр нижних/верхних частот, с одной стороны, включает в себя фильтр нижних частот (LP-lowpass), для генерирования отфильтрованной по нижним частотам версии аудиосигнала, представленной через 703 на Фиг. 7a. Этот отфильтрованный по нижним частотам аудиосигнал кодируется устройством 704 кодирования аудио. Устройство кодирования аудио представляет собой, например, устройство кодирования MP3 (MPEG-1/2 3-го уровня) или устройство кодирования AAC, описанные в стандарте MPEG-2/4. Альтернативные устройства кодирования аудио, обеспечивающие прозрачное или предпочтительно перцепционно прозрачное представление аудиосигнала 703 с ограниченной полосой частот, могут использоваться в устройстве 704 кодирования, чтобы генерировать полностью закодированный или перцепционно закодированный и перцепционно прозрачно закодированный аудиосигнал 705, соответственно. Верхняя полоса аудиосигнала выводится на выход 706 частью фильтрования верхних частот фильтра 702, обозначенной "HP". Прошедшая через фильтр верхних частот часть аудиосигнала, т.е. верхняя полоса или ВЧ полоса, также обозначаемая как ВЧ часть, поставляется на средство 707 вычисления параметров, которое выполнено с возможностью вычисления различных параметров (представляющих вспомогательную информацию, представляющую высокочастотную часть аудиосигнала). Этими параметрами являются, например, огибающая спектра верхней полосы 706 в относительно низком разрешении, к примеру, за счет представления коэффициента масштабирования для каждой группы частот на перцепционно адаптированной шкале (критические полосы), например, для каждой барк-полосы на шкале барков. Еще одним параметром, который может быть вычислен средством 707 вычисления параметров, является минимальный уровень шума в верхней полосе, чья энергия на полосе может быть связана с энергией огибающей в этой полосе. Дополнительными параметрами, которые могут быть вычислены средством 707 вычисления параметров, включают в себя меру тональности для каждой частичной полосы верхней полосы, которая указывает, как спектральная энергия распределяется в полосе, т.е. распределяется ли спектральная энергия в полосе относительно равномерно, причем в таком случае в этой полосе имеется атональный сигнал, или концентрируется ли энергия в полосе относительно сильно в определенном месте, причем в таком случае скорее тональный сигнал имеется для этой полосы. Дополнительные параметры содержат в себе явную кодировку пиков, относительно сильно выступающих в верхней полосе по высоте и частоте, как модель расширения полосы пропускания, при реконструкции без такой явной кодировки заметных синусоидальных участков в верхней полосе будет лишь восстановление один в один самым элементарным образом, или вообще не будет.

В любом случае, средство 707 вычисления параметров выполняется с возможностью генерирования параметров 708 только для верхней полосы, которая может быть подвергнута аналогичным этапам по снижению энтропии, поскольку они могут также выполняться в устройстве 704 кодирования аудио для квантованных спектральных значений, как, например дифференциальное кодирование, предсказание или кодирование по алгоритму Хаффмана, и т.д. Затем представление 708 параметров и аудиосигнал 705 поставляются на средство 709 форматирования потока данных, которое выполняется с возможностью предоставления на выходной стороне потока 710 данных, который обычно представляет собой битовый поток в определенном формате, как это, например, стандартизировано в Стандарте MPEG4.

Сторона декодера, которая была бы подходящей для настоящего изобретения, продемонстрирована на Фиг. 7b. Поток 710 данных вводится в средство 711 интерпретации потока данных, которое выполнено с возможностью отделения части 708 параметров от части 705 аудиосигнала. Часть 708 параметров декодируется декодером 712 параметров для получения декодированных параметров 713. Параллельно с этим, часть 705 аудиосигнала декодируется декодером 714 аудио для получения аудиосигнала 777, который представлен через 8 на Фиг. 6, например.

В зависимости от реализации, аудиосигнал 777 может быть выведен через первый выход 715. Тогда на выходе 715 может быть получен аудиосигнал с небольшой полосой пропускания и, следовательно, также и с низким качеством. Для повышения качества, однако, может быть выполнено расширение 720 полосы пропускания, используя подход настоящего изобретения, как описано ниже со ссылкой на Фиг. 1a, 1b и 2, чтобы получить аудиосигнал 112 на стороне выхода с расширенной или высокой полосой пропускания, соответственно, и с высоким качеством.

Один вариант осуществления устройства согласно настоящему изобретению для воспроизведения аудиосигнала и, тем самым, расширения его полосы пропускания, продемонстрирован на Фиг. 1a. Устройство содержит первое воспроизводящее средство 100, средство 102 предоставления, объединяющее средство 104 и второе воспроизводящее средство 106. В некоторых случаях может быть предусмотрен обнаружитель 108 перехода. Первое воспроизводящее средство 100 принимает на свой вход первые данные 120, представляющие кодированную версию первой части аудиоданных в первой частотной полосе. Например, первые данные 120 могут соответствовать части 705 аудиосигнала, показанной на Фиг. 4b. Первое воспроизводящее средство 100 воспроизводит аудиосигнал в первой частотной полосе на основании первых данных 120. Например, первое воспроизводящее средство 100 может быть образовано декодером 714 аудио, показанным на Фиг. 4b. Первое воспроизводящее средство 100 выводит аудиосигнал в первой частотной полосе, который может соответствовать аудиосигналу 777, показанному на Фиг. 4b. Аудиосигнал 777 поступает на средство 102 предоставления, которое предоставляет сигнал-заплату 122 во второй частотной полосе. Сигнал-заплата 122 является, по меньшей мере, частично некоррелированным относительно первой части аудиосигнала 777 или является, по меньшей мере, частично декоррелированной версией первой части аудиосигнала, которая была смещена во вторую частотную полосу. Аудиосигнал 777 и сигнал-заплата 122 объединяются, например суммируются, в объединяющем средстве 104. Объединенный сигнал 124 выводится и поступает на второе воспроизводящее средство 106. Второе воспроизводящее средство 106 принимает объединенный сигнал 124 и вторые данные 126, представляющие вспомогательную информацию о второй части аудиосигнала во второй частотной полосе. Например, вторые данные 126 могут соответствовать декодированным параметрам 713, описанным выше со ссылкой на Фиг. 4b. Второе воспроизводящее средство 106 воспроизводит аудиосигнал во второй частотной полосе на основании сигнала-заплатки (в составе объединенного сигнала 124) и на основании вторых данных 126.

В вариантах осуществления настоящего изобретения первая частотная полоса может соответствовать частотному диапазону, соотнесенному с первой частью аудиосигнала, показанного на Фиг. 7a, а вторая частотная полоса может соответствовать частотному диапазону, соотнесенному со второй частью аудиосигнала, показанного на Фиг. 7a.

В соответствии с вариантом осуществления, показанным на Фиг. 1a, второе воспроизводящее средство 106 выводит воспроизводимый аудиосигнал 128 с высокой полосой пропускания.

В альтернативном варианте осуществления, показанном на Фиг. 1b, выход средства 102 предоставления соединяется со вторым воспроизводящим средством 106, а выход второго воспроизводящего средства 106 соединяется с объединяющим средством 104. Таким образом, в соответствии с вариантом осуществления, показанным на Фиг. 1b, аудиосигнал 130 во второй частотной полосе воспроизводится из сигнала-заплаты, предоставленного средством 102 предоставления, до объединения сигнала-заплаты с первой частью 777 аудиосигнала. И вновь, второе воспроизводящее средство воспроизводит аудиосигнал 130 во второй частотной полосе на основании вторых данных 126 и сигнала-заплаты 122. В соответствии с вариантом осуществления, показанным на Фиг. 1b, объединяющее средство 104 выводит воспроизводимый аудиосигнал 128.

В вариантах осуществления настоящего изобретения средство предоставления содержит модуль смещения и декорреляционное средство, которые выполнены с возможностью генерирования сигнала-заплаты в виде декоррелированной версии первой части аудиосигнала, смещенной во вторую частотную полосу. В вариантах осуществления настоящего изобретения средство предоставления выполняется с возможностью предоставления синтезированного сигнала-заплаты, который является некоррелированным относительно первой части аудиосигнала. В вариантах осуществления настоящего изобретения средство предоставления выполнено с возможностью предоставления множества сигналов-заплат для множества верхних частотных полос. В таких вариантах осуществления второе воспроизводящее средство и второе объединяющее средство выполняются с возможностью воспроизведения множества вторых частей сигнала и объединения множества частей сигнала в воспроизводимый аудиосигнал.

Один из вариантов осуществления устройства для воспроизведения аудиосигнала с использованием расширения полосы пропускания, которое использует декоррелированные аудиосигналы частичной полосы, показан на Фиг. 2. Устройство принимает сигнал основной полосы от основного кодека, который может быть сигналом 777, показанным на Фиг. 4b. Сигнал 777 поступает на модуль 200 смещения. Модуль 200 смещения выполняется с возможностью смещения сигнала 777 из низкочастотного диапазона в высокочастотный диапазон, например, из частотного диапазона, соотнесенного с низкочастотной частью 4 на Фиг. 7a, в частотный диапазон, соотнесенный с высокочастотной частью 6 на Фиг. 7a.

Модуль 200 смещения может быть выполнен с возможностью простого повышающего копирования части 777 сигнала в высокочастотный диапазон в частотной области. В качестве альтернативы, модуль 200 смещения может быть реализован в виде модуля модуляции с одной боковой полосой, выполненного с возможностью исполнения модуляции с одной боковой полосой во временной области для того, чтобы сместить первую часть аудиосигнала из первой частотной полосы во вторую частотную полосу.

Смещенная первая часть аудиосигнала поступает на декорреляционный модуль 202a. Смещенная декоррелированная первая часть аудиосигнала выводится декорреляционным модулем 202a в качестве сигнала-заплаты 204. Сигнал-заплата 204 поступает на модуль 206 вставки заплат, в котором сигнал-заплата 204 объединяется с первой частью 777 аудиосигнала. Например, сигнал-заплата и первая часть аудиосигнала связываются или суммируются в модуле 206 вставки заплат. Объединенный сигнал выводится из модуля 206 вставки заплат и поступает в модуль 210 пост-обработки.

Модуль 210 пост-обработки принимает вторые данные 212 и представляет собой второе воспроизводящее средство, выполненное с возможностью воспроизведения второй части аудиосигнала во второй частотной полосе на основании вторых данных 212 и сигнала-заплаты 204 (который включен в объединенный сигнал 208). И вновь, вторые данные 212 представляют вспомогательную информацию и могут соответствовать декодированным параметрам 713, описанным выше со ссылкой на Фиг. 4b. Полнополосный выходной сигнал 214 модуля 210 пост-обработки представляет собой воспроизводимый аудиосигнал.

В варианте осуществления, показанном на Фиг. 2, модуль 200 смещения и декорреляционный модуль 202a представляют собой средство предоставления, выполненное с возможностью предоставления сигнала-заплаты 204.

В вариантах осуществления настоящего изобретения, модуль 200 смещения может выполняться с возможностью смещения первой части 777 аудиосигнала во множество из p различных частотных полос. Декорреляционный модуль 202a-202p может быть предусмотрен для каждой смещенной версии, чтобы предоставить p сигналов-заплат. В случае использования более одной заплат (например, p заплат), эти p заплат должны быть некоррелированными между собой и с НЧ полосой. Затем смещенные версии, соотнесенные с каждой частотной полосой, объединяются в модуле 206 вставки заплат. Вторые данные, представляющие вспомогательную информацию для каждой из верхних частотных полос, могут предоставляться на модуль 210 пост-обработки, чтобы множество частей верхних частот аудиосигнала воспроизводились в модуле 210 пост-обработки.

В вариантах осуществления настоящего изобретения первая и вторая частотные полосы (и, возможно, дополнительные частотные полосы) могут перекрываться или могут не перекрываться по частоте.

Соответственно, в вариантах осуществления настоящего изобретения, средство предоставления содержит смещающий модуль, выполненный с возможностью смещения первой части аудиосигнала в первой частотной полосе во вторую частотную полосу или во множество различных вторых частотных полос, и декорреляционное средство для декорреляции смещенной версии первой части аудиосигнала от первой части аудиосигнала. В вариантах осуществления настоящего изобретения декорреляционное средство может иметь такие же характеристики, как известные, например, из декорреляции при пространственном кодировании аудио. В вариантах осуществления настоящего изобретения декорреляционное средство может обеспечивать достаточную декорреляцию для того, чтобы избежать искажений сигнала и артефактов, которые типичны для традиционных расширений полосы пропускания с использованием репликации спектральной полосы. Декорреляционное средство может обеспечивать сохранение огибающей спектра первой части аудиосигнала и/или может обеспечивать сохранение временной огибающей, т.е. переходных процессов, первой части аудиосигнала. А значит, проектирование подходящего декорреляционного средства может, как правило, подразумевать компромисс между сохранением переходных процессов и декорреляцией.

В вариантах осуществления настоящего изобретения декорреляционное средство может быть реализовано в виде БИХ-фильтра (БИХ = бесконечная импульсная характеристика) во временной области или временной области частичной полосы, например, фазового фильтра, в котором декорреляция достигается посредством изменений групповой задержки. В вариантах осуществления настоящего изобретения декорреляционное средство может быть выполнено с возможностью обеспечения фазовой рандомизации коэффициентов спектрального разложения в комплексном (с избыточной дискретизацией) преобразовании/ представлении банка фильтров (представлении ДПФ, КЗФ) (ДПФ = дискретное преобразование Фурье; КЗФ = квадратурный зеркальный фильтр). В вариантах осуществления настоящего изобретения декорреляционное средство может выполняться с целью обеспечения применения частотно-зависимой временной задержки в представлении банка фильтров.

Варианты осуществления настоящего изобретения могут содержать адаптивное средство декорреляции сигналов, которое изменяет степень декорреляции для того, чтобы сохранить переходные процессы. Высокая декорреляция может быть предусмотрена для квазистационарных сигналов, а низкая декорреляция может быть предусмотрена для переходных сигналов. Соответственно, в вариантах осуществления настоящего изобретения, средство предоставления для предоставления сигнала-заплаты может быть выполнено с возможностью переключения между различными степенями декорреляции.

В вариантах осуществления, средство предоставления для предоставления сигнала-заплаты может быть выполнено с возможностью переключения между различными степенями декорреляции в зависимости от того, содержит ли первая часть сигнала признак сильной корреляции между первой частью аудиосигнала и второй частью аудиосигнала. Вариантами осуществления для такого признака являются переходный процесс в первой части аудиосигнала, вокализованная речь, состоящая из серий импульсов в первой части аудиосигнала, и/или звук медных духовых инструментов в первой части аудиосигнала. В дальнейшем описываются варианты осуществления, в которых признаком является переходный процесс в первой части аудиосигнала.

В вариантах осуществления настоящего изобретения, устройство может содержать обнаружитель, выполненный с возможностью обнаружения, содержит ли первая часть аудиосигнала переходный процесс. Такой обнаружитель 108 схематично показан на Фиг. 1a и 1b. В зависимости от выходного сигнала обнаружителя 108, средство 102 предоставления может быть выполнено с возможностью предоставления сигнала-заплаты с высокой декорреляцией для квазистационарных сигналов, т.е. когда первая часть аудиосигнала не имеет переходного процесса, и с низкой декорреляцией, если первая часть аудиосигнала имеет переходные сигналы.

В альтернативных вариантах осуществления настоящего изобретения устройство может содержать адаптивное средство декорреляции сигналов, которое активируется для квазистационарных сигналов и деактивируется для частей переходных сигналов. Другими словами, средство предоставления может быть выполнено с возможностью вывода смещенной первой части сигнала без ее декорреляции в случае, если первая часть сигнала содержит части переходных сигналов, и вывода декоррелированного сигнала-заплаты только в том случае, если первая часть сигнала не содержит переходных процессов или частей переходных сигналов. В таких вариантах осуществления второе воспроизводящее средство выполнено с возможностью воспроизведения аудиосигнала во второй частотной полосе на основании вторых данных и сигнала-заплаты, если первая часть аудиосигнала не содержит переходного процесса, и выполняется с возможностью воспроизведения аудиосигнала во второй частотной полосе на основании вторых данных и версии первой части аудиосигнала, которая была смещена во вторую частотную полосу и которая не была декоррелирована, если первая часть аудиосигнала содержит переходный процесс.

Переходный процесс или переходные части могут рассматриваться как заключающиеся в том, что аудиосигнал значительно изменяется в целом, т.е. что, например, энергия аудиосигнала изменяется более чем на 50% от одной временной части до следующей временной части, т.е. увеличивается или уменьшается. 50%-ый порог является только примером, однако, и может также принимать меньшие или большие значения. В качестве альтернативы, для обнаружения переходного процесса, также можно рассматривать изменение распределения энергии, например, при переходе от звонкого звука к шипящему.

В вариантах осуществления настоящего изобретения средство предоставления может быть выполнено с возможностью предоставления синтезированного сигнала-заплаты, который является некоррелированным относительно первой части аудиосигнала. Другими словами, вставка заплаты с некоррелированным синтезированным сигналом-заплатой (таким, как синтезированный шум) может быть уже достаточным, если параметрическая пост-обработка хорошо детализирована (сценарий кодека с высокой битовой скоростью) или если ВЧ полоса сигнала является шумоподобной, так или иначе.

В вариантах осуществления настоящего изобретения, корреляция НЧ полосы и ВЧ полосы в рамках расширения полосы пропускания (подобного SBR), тем не менее полезна для улучшения слишком грубой временной сетки параметрической пост-обработки (например, вследствие сценария кодека с низкой битовой скоростью), точного воспроизведения переходных процессов и сохранения тонов, которые обладают богатой структурой обертонов (обычно декорреляция не влияет на тональность и, следовательно, сохранение тональности не представляет собой проблему при разработке декорреляционного средства).

Что касается известных декорреляционных средств, к примеру, имеющих отношение к декорреляции при пространственном кодировании аудио, делается отсылка на WO 2007/118583 A1, например.

В вариантах осуществления настоящего изобретения, средство 102 предоставления может содержать адаптивное декорреляционное средство, которое регулирует декорреляцию ВЧ заплат на основании параметра, передаваемого от устройства кодирования на устройство декодирования. В таких вариантах осуществления устройство выполнено с целью воспроизведения аудиосигнала на основании первых данных, вторых данных и третьих данных, содержащих информацию о степени декорреляции, которая должна быть использована между первой частью аудиосигнала и сигналом-заплатой, на основании которой воспроизводится вторая часть при воспроизведении аудиосигнала из кодированного аудиосигнала. Такие третьи данные могут быть добавлены к кодированным аудиоданным на стороне устройства кодирования, например, при помощи средства 300 добавления декорреляционной информации, показанного на Фиг. 3 в настоящей заявке. Устройство, показанное на Фиг. 3, соответствует устройству, показанному на Фиг. 4a, за исключением средства добавления декорреляционной информации.

Средство 300 добавления декорреляционной информации принимает выход фильтра 702 нижних частот и может выявлять характеристики из выходного сигнала фильтра 702 нижних частот. Например, средство добавления декорреляционной информации может обнаруживать переходные процессы в выходном сигнале фильтра 702 нижних частот. В зависимости от характеристик выхода фильтра 702 нижних частот, средство добавления декорреляционной информации добавляет к кодированному аудиосигналу 710 информацию о степени декорреляции, которая должна быть использована между первой частью аудиосигнала и сигналом-заплатой, на основании которой воспроизводится вторая часть при воспроизведении аудиосигнала из кодированного аудиосигнала. Например, декорреляционная информация может давать указание средству предоставления на стороне устройства декодирования выполнять низкую декорреляцию или вообще не выполнять декорреляцию в случае, если есть переходные части в низкочастотной части аудиосигнала.

В вариантах осуществления настоящего изобретения, средство добавления декорреляционной информации может также принимать высокочастотную часть 706 аудиосигнала и может быть выполнено с возможностью извлечения из нее характеристик. Например, в случае, если средство добавления декорреляционной информации обнаруживает, что ВЧ полоса является шумоподобной, оно может рекомендовать средству предоставления на стороне устройства декодирования предоставить сигнал-заплату на основании синтезированного шумового сигнала.

В таких вариантах осуществления кодированный аудиосигнал 320, представленный потоком 710 данных, содержит первые данные 321, представляющие кодированную версию первой части аудиосигнала, вторые данные 322, представляющие вспомогательную информацию о второй части аудиосигнала во второй частотной полосе, и информацию 323 о степени декорреляции, которая должна быть использована между первой частью аудиосигнала и сигналом-заплатой, на основании которой воспроизводится вторая часть при воспроизведении аудиосигнала из кодированного аудиосигнала.

Соответственно, варианты осуществления настоящего изобретения обеспечивают улучшенный подход к воспроизведению аудиосигнала, т.е. к расширению на стороне устройства декодирования полосы пропускания аудиосигнала. В других вариантах осуществления, настоящее изобретение предоставляет устройство для генерирования кодированного аудиосигнала. Еще в одних вариантах осуществления, настоящее изобретение имеет отношение к таким кодированным аудиосигналам.

Полезный эффект, достигаемый благодаря подходу согласно настоящему изобретению, может проявляться при сравнении автокорреляционной последовательности огибающей шумового сигнала для SBR с повышающим копированием (показано на Фиг. 5a) с автокорреляционной последовательностью огибающей шумового сигнала декоррелированных заплат, как показано на Фиг. 5b в настоящей заявке. На Фиг. 5b представлена автокорреляционная функция амплитудной огибающей белого шума, причем полоса пропускания расширяется тремя заплатами, некоррелированными между собой и относительно НЧ полосы. На Фиг. 5b ясно показано исчезновение нежелательных боковых максимумов, показанных на Фиг. 5a.

Настоящая заявка применима или подходит для всех приложений работы с аудио, в которых недоступна полная полоса пропускания. Подход согласно настоящему изобретению может пригодиться в распространении или широковещании аудио-информационного наполнения, как, например, приложения цифрового радио, потоковой передачи через сеть Интернет и аудиосвязи. Варианты осуществления настоящего изобретения имеют отношение к расширению полосы пропускания с использованием декоррелированных аудиосигналов частичной полосы.

Хотя некоторые аспекты и были описаны применительно к устройству, понятно, что эти аспекты также представляют описание соответствующего способа, в котором блок или устройство соответствуют этапу способа или функциональной характеристике этапа способа. Аналогично, аспекты, описанные применительно к этапу способа, также представляют описание соответствующего блока или элемента или функциональную характеристику соответствующего устройства.

В зависимости от технических условий конкретной реализации варианты осуществления настоящего изобретения могут быть реализованы аппаратно или программно. Реализация может быть выполнена с использованием цифровой среды хранения, например, гибкого диска, DVD, CD, ПЗУ, ППЗУ, СППЗУ, ЭСППЗУ или запоминающего устройства с групповой перезаписью, с сохраненными на ней считываемыми в электронном виде управляющими сигналами, которые взаимодействуют (или способны к взаимодействию) с программируемой компьютерной системой таким образом, чтобы выполнялся соответственный способ.

Некоторые варианты осуществления в соответствии с настоящим изобретением содержат носитель данных со считываемыми в электронном виде управляющими сигналами, которые способны к взаимодействию с программируемой компьютерной системой таким образом, чтобы выполнялся один из способов, описанных в данном документе.

Вообще, варианты осуществления настоящего изобретения могут быть реализованы в форме компьютерного программного продукта с программным кодом, причем программный код производит операции для выполнения одного из способов при выполнении компьютерного программного продукта на компьютере. Программный код может, например, сохраняться на материальном машиночитаемом носителе.

Другие варианты осуществления содержат компьютерную программу для выполнения одного из способов, описанных в данном документе, сохраненную на машиночитаемом носителе или энергонезависимой среде хранения.

Другими словами, один из вариантов осуществления способа согласно настоящему изобретению представляет собой, соответственно, компьютерную программу с программным кодом для выполнения одного из способов, описанных в данном документе, при выполнении компьютерной программы на компьютере.

Дополнительный вариант осуществления способов согласно настоящему изобретению представляет собой, соответственно, носитель данных (или цифровой носитель данных или считываемый компьютером носитель), содержащий записанную на него компьютерную программу для выполнения одного из способов, описанных в данном документе.

Дополнительный вариант осуществления способа согласно настоящему изобретению представляет собой, соответственно, поток данных или последовательность сигналов, представляющих компьютерную программу для выполнения одного из способов, описанных в данном документе. Поток данных или последовательность сигналов могут, например, быть реализованы с возможностью передачи через соединение связи для передачи данных, например через сеть Интернет.

Дополнительный вариант осуществления содержит средство обработки, например, компьютер или программируемое логическое устройство, выполненное с возможностью или приспособленное для выполнения одного из способов, описанных в данном документе.

Дополнительный вариант осуществления содержит компьютер с установленной на нем компьютерной программой для выполнения одного из способов, описанных в данном документе.

В некоторых вариантах осуществления, программируемое логическое устройство (например, программируемая пользователем вентильная матрица) может использоваться для выполнения некоторых или всех функциональных возможностей способов, описанных в данном документе. В некоторых вариантах осуществления программируемая пользователем вентильная матрица может взаимодействовать с микропроцессором с целью выполнения одного из способов, описанных в данном документе. В общем случае предпочтительно, если способы выполняются каким-либо аппаратным устройством.

Описанные выше варианты осуществления всего лишь поясняют принципы настоящего изобретения. Понятно, что модификации и вариации конструкций и элементов, описанных в данном документе, будут очевидны для специалистов в данной области техники. Суть, следовательно, в том, что ограничиваться следует только объемом следующей далее формулы изобретения, а не конкретными элементами, представленными посредством описания и объяснения вариантов осуществления в данном документе.

1. Устройство для воспроизведения аудиосигнала на основании первых данных (120; 321; 705), представляющих кодированную версию первой части аудиосигнала в первой частотной полосе, и вторых данных (126; 322; 708), представляющих вспомогательную информацию о второй части аудиосигнала во второй частотной полосе, причем вторая частотная полоса содержит частоты более высокие, чем первая частотная полоса, при этом упомянутое устройство содержит:

первое воспроизводящее средство (100), выполненное с возможностью воспроизведения первой части (777) аудиосигнала на основании первых данных (120; 321; 705);

средство (102; 200, 202а) предоставления, выполненное с возможностью предоставления сигнала-заплаты (122; 204) во второй частотной полосе, причем сигнал-заплата (122; 204) является некоррелированным относительно первой части (777) аудиосигнала или по меньшей мере частично декоррелированной версией первой части (777) аудиосигнала, которая была смещена во вторую частотную полосу;

второе воспроизводящее средство (106) (106), представляющее собой пост-процессор и выполненное с возможностью воспроизведения второй части аудиосигнала во второй частотной полосе на основании вторых данных (126; 322; 708) и сигнала-заплаты (122; 204), при этом огибающая спектра второй части аудиосигнала, минимальный уровень шума во второй части аудиосигнала, мера тональности для каждой частичной полосы во второй части аудиосигнала и явное кодирование синусоидальных участков во второй части аудиосигнала представляют собой вспомогательную информацию, представляемую вторыми данными; и

объединяющее средство (104) для объединения воспроизводимой первой части (777) аудиосигнала и сигнала-заплаты (122; 204) перед воспроизведением второй части аудиосигнала вторым воспроизводящим средством или для объединения воспроизводимой первой части (777) аудиосигнала и воспроизводимой второй части аудиосигнала.

2. Устройство по п. 1, в котором второе воспроизводящее средство (106) выполнено с возможностью воспроизведения аудиосигнала во второй частотной полосе на основании вторых данных (126; 322; 708) и сигнала-заплаты (122; 204), если первая часть (777) аудиосигнала не содержит переходного процесса, вокализованной речи, состоящей из серий импульсов, и/или звука медных духовых инструментов, и в котором второе воспроизводящее средство (106) выполнено с возможностью воспроизведения аудиосигнала во второй частотной полосе на основании вторых данных (126; 322; 708) и версии первой части аудиосигнала, которая была смещена во вторую частотную полосу и которая не была декоррелирована, если первая часть (777) аудиосигнала содержит переходный процесс, вокализованную речь, состоящую из серий импульсов, и/или звук медных духовых инструментов.

3. Устройство по п. 1, в котором средство (102) предоставления выполнено с возможностью предоставления синтезированного сигнала-заплаты, который является некоррелированным относительно первой части аудиосигнала.

4. Устройство по п. 3, в котором синтезированный сигнал-заплата является шумовым сигналом.

5. Устройство по п. 1, в котором средство (102) предоставления содержит модуль (200) смещения и декорреляционное средство (202а…202р), которые выполнены с возможностью генерирования сигнала-заплаты (122; 204) в виде декоррелированной версии первой части (777) аудиосигнала, смещенной во вторую частотную полосу.

6. Устройство по п. 5, в котором декорреляционное средство (202а…202р) выполнено с возможностью сохранения по меньшей мере одной из огибающей спектра первой части (777) аудиосигнала и временной огибающей первой части (777) аудиосигнала.

7. Устройство по п. 5, в котором декорреляционное средство (202а…202р) содержит одно из следующего:

фазовый фильтр, выполненный с возможностью вызывать изменения групповой задержки в первой части аудиосигнала;

фазовый рандомизатор, выполненный с возможностью вызывать фазовую рандомизацию коэффициентов спектрального разложения первой части аудиосигнала; и

исполнительное средство, выполненное с возможностью применения частотно-зависимой временной задержки к суб-частям первой части аудиосигнала.

8. Устройство по п. 5, в котором декорреляционное средство (202а…202р) содержит адаптивное средство декорреляции сигналов, выполненное с возможностью изменения степени декорреляции для того, чтобы применять более высокую декорреляцию, если первая часть (777) аудиосигнала не содержит переходного процесса, вокализованной речи, состоящей из серий импульсов, и/или звука медных духовых инструментов, и применять более низкую декорреляцию или не применять декорреляцию, если первая часть (777) аудиосигнала содержит переходный процесс, вокализованную речь, состоящую из серий импульсов, и/или звук медных духовых инструментов.

9. Устройство по п. 2, содержащее обнаружитель (108), выполненный с возможностью обнаружения, содержит ли первая часть (777) сигнала аудиосигнала переходный процесс, вокализованную речь, состоящую из серий импульсов, и/или звук медных духовых инструментов.

10. Устройство по п. 1, в котором средство (200, 202а…202р) предоставления выполнено с возможностью предоставления второго сигнала-заплаты в третьей частотной полосе, причем второй сигнал-заплата является некоррелированным относительно первой части аудиосигнала или является декоррелированной версией первой части аудиосигнала, которая была смещена в третью частотную полосу, причем второй сигнал-заплата является некоррелированным или декоррелированным относительно первого сигнала-заплаты, при этом устройство содержит третье воспроизводящее средство, причем третье воспроизводящее средство выполнено с возможностью воспроизведения третьей части аудиосигнала на основании второго сигнала-заплаты и третьих данных, представляющих вспомогательную информацию о третьей части аудиосигнала в третьей частотной полосе, причем третья частотная полоса содержит частоты более высокие, чем вторая частотная полоса.

11. Способ для воспроизведения аудиосигнала на основании первых данных (120; 321; 705), представляющих кодированную версию первой части аудиосигнала в первой частотной полосе, и вторых данных (126; 322; 708), представляющих вспомогательную информацию о второй части аудиосигнала во второй частотной полосе, причем вторая частотная полоса содержит частоты более высокие, чем первая частотная полоса, при этом упомянутый способ содержит этапы, на которых:

воспроизводят аудиосигнал (777) в первой частотной полосе на основании первых данных (120; 321; 705);

предоставляют сигнал-заплату (122; 204) во второй частотной полосе, причем сигнал-заплата (122; 204) является некоррелированным относительно первой части (777) аудиосигнала или по меньшей мере частично декоррелированной версией первой части (777) аудиосигнала, которая была смещена во вторую частотную полосу;

воспроизводят вторую часть аудиосигнала во второй частотной полосе на основании вторых данных (126; 322; 708) и сигнала-заплаты (122; 204) посредством пост-процессора, при этом огибающая спектра второй части аудиосигнала, минимальный уровень шума во второй части аудиосигнала, мера тональности для каждой частичной полосы во второй части аудиосигнала и явное кодирование синусоидальных участков во второй части аудиосигнала представляют собой вспомогательную информацию, представляемую вторыми данными; и

объединяют воспроизводимую первую часть (777) аудиосигнала и сигнал-заплату (122; 204) перед воспроизведением второй части аудиосигнала или объединяют воспроизводимую первую часть (777) аудиосигнала и воспроизводимую вторую часть аудиосигнала.

12. Устройство для генерирования кодированного аудиосигнала (320), причем кодированный аудиосигнал (320) содержит первые данные (321), представляющие кодированную версию первой части (703) аудиосигнала в первой частотной полосе, и вторые данные (322), представляющие вспомогательную информацию о второй части (706) аудиосигнала во второй частотной полосе, причем вторая частотная полоса содержит частоты более высокие, чем первая частотная полоса, при этом устройство содержит:

средство (300) добавления декорреляционной информации, выполненное с возможностью добавления к кодированному аудиосигналу (320), в дополнение к первым данным (321) и вторым данным (322), информации (323) о степени декорреляции, которая должна быть использована между первой частью аудиосигнала и сигналом-заплатой, на основании которой посредством пост-процессора воспроизводится вторая часть аудиосигнала при воспроизведении аудиосигнала из кодированного аудиосигнала, при этом огибающая спектра второй части аудиосигнала, минимальный уровень шума во второй части аудиосигнала, мера тональности для каждой частичной полосы во второй части аудиосигнала и явное кодирование синусоидальных участков во второй части аудиосигнала представляют собой вспомогательную информацию, представляемую вторыми данными.

13. Способ для генерирования кодированного аудиосигнала (320), причем кодированный аудиосигнал (320) содержит первые данные (321), представляющие кодированную версию первой части (703) аудиосигнала в первой частотной полосе, и вторые данные (322), представляющие вспомогательную информацию о второй части (706) аудиосигнала во второй частотной полосе, причем вторая частотная полоса содержит частоты более высокие, чем первая частотная полоса, при этом способ содержит этапы, на которых:

добавляют к кодированному аудиосигналу (320), в дополнение к первым данным (321) и вторым данным (322), информацию (323) о степени декорреляции, которая должна быть использована между первой частью аудиосигнала и сигналом-заплатой, на основании которой посредством пост-процессора воспроизводится вторая часть аудиосигнала при воспроизведении аудиосигнала из кодированного аудиосигнала (320), при этом огибающая спектра второй части аудиосигнала, минимальный уровень шума во второй части аудиосигнала, мера тональности для каждой частичной полосы во второй части аудиосигнала и явное кодирование синусоидальных участков во второй части аудиосигнала представляют собой вспомогательную информацию, представляемую вторыми данными.

14. Считываемый компьютером носитель, хранящий компьютерную программу, содержащую программный код для выполнения способа по п. 11 при выполнении этой компьютерной программы на компьютере.

15. Считываемый компьютером носитель, хранящий компьютерную программу, содержащую программный код для выполнения способа по п. 13 при выполнении этой компьютерной программы на компьютере.



 

Похожие патенты:

Изобретение описывает способ сравнения первого входящего аудиотрека с индексированным аудиотреком. Технический результат – устранение затрат производительной мощности, имеющих место при сравнении более крупных частей аудиосигнатур.

Изобретение относится к области техники кодирования, декодирования и обработки аудиосигнала, в частности, он относится к средствам восстановления высокочастотного контента аудиосигнала из низкочастотного контента того же аудиосигнала.

Изобретение относится к области обработки звуковых сигналов. Технический результат изобретения заключается в уменьшении амплитудного спектра шума.

Изобретение относится к обработке аудиосигналов и предназначено для для произвольных сдвигов частоты в области поддиапазонов. Технический результат - повышение качества воспроизведения аудиосигнала.

Изобретение относится к средствам генерации аудиосигнала. Технический результат заключается в уменьшении шумовых составляющих в речевом аудиосигнале.

Изобретение относится к средствам для обработки аудио сигнала. Технический результат заключается в уменьшении влияния переходных процессов на качество звука.

Данное изобретение относится к технологиям распознавания речи, т.е. перевода звукового сигнала, содержащего речь, в транскрипционное представление.

Изобретение относится к средствам повышения разборчивости и натуральности звучания аудиокомпозиции в акустической шумовой обстановке. Технический результат заключается в повышении разборчивости и натуральности звучания аудиокомпозиции в акустической шумовой обстановке за счет снижения эффекта маскирования полезного звукового сигнала нестационарными акустическими шумами при помощи использования частотно-зависимого адаптивного усиления.

Изобретение относится к средствам расширения ширины полосы. Технический результат заключается в обеспечении возможности уменьшения объема вычислений при расширении ширины полосы и подавления ухудшения качества в ширине полосы, которая должна быть расширена.

Изобретение относится к области радиотехники, в частности к активным радиолокационным методам получения информации, и может преимущественно использоваться для дистанционного перехвата из-за границы охраняемой зоны, установленной вокруг здания, конфиденциальной речевой информации, циркулирующей в защищаемом помещении (ЗП) здания.

Изобретение относится к системам и способам определения набора коэффициентов интерполяции. Технический результат изобретения заключается в оптимизировании пропускной способности, уравновешивая тем самым желаемую среднюю битовую скорость восстанавливаемого речевого сигнала.  Способ для определения набора коэффициентов интерполяции посредством электронного устройства включает в себя определение значения на основе свойства текущего кадра и свойства предыдущего кадра, определение того, находится или нет значение за пределами диапазона, определение набора коэффициентов интерполяции на основе значения и индикатора режима прогнозирования, если значение находится за пределами диапазона.

Изобретение относится к области квантования коэффициентов кодирования с линейным предсказанием. Технический результат – обеспечение повышения эффективности квантования аудио или речевого сигнала посредством выбора оптимального модуля квантования.

Группа изобретений относится к технологиям кодирования/декодирования аудио информации. Техническим результатом является повышение эффективности кодирования/декодирования аудио информации.

Изобретение относится к средствам возбуждения смешанной кодовой книги для кодирования речи. Технический результат заключается в повышении воспринимаемого качества речевого сигнала по сравнению с системами кодирования, использующими только импульсное возбуждение или только шумовое возбуждение.

Изобретение относится к аудиосистемам и предназначено для генерирования сигнала вывода аудио. Технический результат - повышение точности воспроизведения аудиосигнала.

Изобретение относится к области многоканального звукового кодирования. Техническим результатом является повышение качества кодированного и декодированного звукового сигнала.

Изобретение относится к обработке метаданных и предназначено для перекодировки метаданных с пониженной вычислительной сложностью. Технический результат - повышение точности перекодировки метаданных.

Группа изобретений относится к многокаскадным фильтрам и может быть использована для фильтрации данных с использованием таких фильтров. Техническим результатом является обеспечение параллельной обработки данных.

Изобретение относится к кодированию цифрового звука, а именно к средствам кодирования звуковых сигналов, содержащих составляющие разного характера. Технический результат заключается в повышении точности воспроизведения звука.

Изобретение относится к аудио кодированию. Технический результат заключается в повышении эффективности кодирования при незначительных вычислительных затратах.

Изобретение относится к средствам для кодирования и декодирования кодированного аудиосигнала. Технический результат заключается в предоставлении усовершенствованного принципа кодирования/декодирования, позволяющего уменьшить скорость передачи битов. Устройство для декодирования кодированного сигнала содержит: аудиодекодер в спектральной области для формирования первого декодированного представления первого набора первых спектральных частей, представляющих собой остаточные спектральные прогнозные значения; модуль повторного формирования частоты для формирования восстановленной второй спектральной части с использованием первой спектральной части из первого набора первых спектральных частей, при этом восстановленная вторая спектральная часть дополнительно содержит остаточные спектральные прогнозные значения; и обратный прогнозный фильтр для выполнения обратного прогнозирования по частоте с использованием остаточных спектральных значений для первого набора первых спектральных частей и восстановленной второй спектральной части с использованием информации прогнозного фильтра, включенной в кодированный аудиосигнал. 6 н. и 14 з.п. ф-лы, 41 ил.
Наверх