Параметрическое многоканальное декодирование

Авторы патента:

ТЕРССЕН Дитер Е.М. (BE)

КЛЕЙН МИДДЕЛИНК Марк (NL)

ГЕРРИТС Андреас Й. (NL)

ШЧЕРБА Марек (NL)

G10L19/02 - с использованием спектрального анализа, например преобразовательные вокодеры, вокодеры с поддиапазонами

Владельцы патента RU 2433489:

КОНИНКЛЕЙКЕ ФИЛИПС ЭЛЕКТРОНИКС Н.В. (NL)

Изобретение относится к параметрическим многоканальным декодерам типа стереодекодера, в частности к устройствам и способам для синтезирования звука, который может быть представлен наборами параметров, каждый из которых содержит характеристики синусоид, представляющие синусоидальные составляющие звука, и характеристики, представляющие другие компоненты. Звуковое декодирующее устройство (1) выполнено с возможностью декодирования звука, представленного наборами параметров, причем каждый набор включает в себя синусоидальные параметры (SP), представляющие синусоидальные компоненты звука, и дополнительные параметры (NP, ТР), представляющие дополнительные компоненты звука, такие как шум и/или нестационарные сигналы. Прибор включает в себя отдельный блок генератора синусоид (17, 18) для каждого выходного канала (L, R), в то время как блоки генератора дополнительных компонентов (20; 21) совместно используются всеми каналами. Технический результат - упрощение синтеза звука. 4 н. и 14 з.п. ф-лы, 4 ил.

Представленное изобретение относится к параметрическим многоканальным декодерам типа стереодекодера. В частности, представленное изобретение относится к приборам и способам для синтезирования звука, который, в свою очередь, может быть представлен наборами параметров, причем каждый набор содержит характеристики синусоид, представляющих синусоидальные составляющие звука, и характеристики, представляющие другие компоненты.

Хорошо известно, что можно представить звук наборами параметров. Так называемые способы параметрического кодирования используются для того, чтобы эффективно кодировать звук, представляя этот звук рядом параметров. Соответствующий декодер способен правильно восстановить первоначальный звук, используя этот ряд параметров. Этот ряд параметров может быть разделен на наборы, причем каждый набор соответствует индивидуальному источнику звукового сигнала (канал звукового сопровождения), звуков человеческого голоса или музыкального инструмента.

Популярный протокол MIDI (Цифровой интерфейс музыкального инструмента) позволяет представлять музыку источника наборами команд для музыкальных инструментов. Каждая команда присвоена определенному инструменту. Каждый инструмент может использовать один или более каналов звука (это называется "голоса" в MIDI). Число каналов звука, которые могут использоваться одновременно, называют числом полифонии или полифонией. Команды MIDI можно эффективно передавать и/или записывать.

Обычно синтезаторы содержат данные определения звука, например звуковой банк данных или данные для исправления. В звуковом банке данных образцы звука инструментов записаны как звуковые данные, в то время как данные для исправления определяют параметры управления для генераторов звука.

Команды MIDI заставляют синтезатор отыскивать звуковые данные из звукового банка данных и синтезировать звуки, созданные на основе этих данных. Эти звуковые данные могут быть подлинными образцами звука, которые переведены в цифровую форму, как в случае условного синтеза волновой таблицы. Однако образцы звуков обычно требуют больших объемов памяти, которые невозможно создать в относительно малогабаритных приборах, в частности в ручных устройствах потребителя, таких как мобильные (сотовые) телефоны.

С другой стороны, образцы звука могут быть представлены параметрами, которые могут определяться амплитудой, частотой, фазой и/или параметрами формы огибающей и которые позволяют восстанавливать образцы звука. Хранение параметров образцов звука, как правило, требует значительно меньшего объема памяти, чем хранение подлинных образцов звука. Однако синтез звука может быть ресурсоемким при создании компьютеризированным способом. Это особенно справедливо в случае, когда много наборов параметров, представляющих различные каналы звука ("голоса" в MIDI), должны синтезироваться одновременно (высокая степень полифонии). Объем вычислений обычно увеличивается линейно с увеличением числа каналов ("голосов"), которые нужно синтезировать, то есть с увеличением степени полифонии. Это затрудняет использование таких способов в ручных устройствах.

Статья "Низкая степень сложности параметрического стереокодирования" Е. Schuijers, J.Breebaart, H. Pumhagen и J. Engdegard, опубликованная в журнале «Соглашение общества разработок инженерных звуковых систем» №6073, Берлин (Германия), в мае 2004, описывает параметрический звуковой декодер (фиг 8) . Звуковой сигнал был разделен на ряд нестационарных процессов, синусоидальных составляющих и на компоненты шума, представленные своими параметрами. Это параметрическое изображение звукового сигнала может быть записано в звуковом банке данных. Параметрический декодер (или синтезатор) использует это параметрическое изображение, чтобы восстановить первоначальный входной звуковой сигнал.

В параметрическом кодере предыдущего поколения синусоиды, нестационарные процессы и шум подвергались направленной обработке: использовались стереопараметры, чтобы создать два выходных канала (левый и правый в стереосистемах) из единственного канала. Эта направленная обработка выполнена в области преобразования частот, такой как частотная область или область QMF (Квадратурный Зеркальный Фильтр), таким образом, это существенно увеличивает эффективность направленной обработки.

Однако для того, чтобы быть в состоянии выполнить направленную обработку синусоид нестационарных сигналов и шума в области преобразования, необходимо синтезировать эти компоненты звука в области преобразования. Было обнаружено, что это существенно увеличивает степень сложности синтеза звука.

Соавторы представленного изобретения отметили, что алгоритм синтезирования звука в частотной области или области QMF показывает, что синтез нестационарных сигналов и шума в области частотного преобразования является неэффективным и существенно увеличивает сложности синтеза звука.

Задачей представленного изобретения является преодоление этих и других проблем, имевших место в предыдущих поколениях устройств, и создание нового устройства для создания звука, представленного наборами параметров, которое позволит значительно упростить синтез звука.

Соответственно, представленное изобретение обеспечивает устройство для создания звука, представленного наборами параметров, каждый набор включает в себя синусоидальные параметры, представляющие синусоидальные компоненты звука, и дополнительные параметры, представляющие дополнительные компоненты звука; устройство включает в себя:

- первый блок создания синусоидальных компонентов для создания синусоидальных компонентов только для первого выходного канала в ответ на синусоидальные параметры,

- второй блок создания синусоидальных компонентов для создания синусоидальных компонентов только для второго выходного канала в ответ на синусоидальные параметры,

- по меньшей мере, один блок создания дополнительных компонентов для создания общих дополнительных компонентов для первого выходного канала и второго выходного канала в ответ на дополнительные параметры, и

- первый блок комбинации для генерирования сигналов первого выходного канала и второй блок комбинации для генерирования сигналов второго выходного канала в ответ на объединение общих дополнительных компонентов с синусоидальными компонентами первого выходного канала и второго выходного канала соответственно,

- и в котором общие дополнительные компоненты являются, по меньшей мере, одним из компонентов нестационарных сигналов и компонентов шума.

Обеспечивая отдельный блок создания синусоидальных компонентов для каждого выходного канала, но совместно используемый блок создания дополнительных компонентов, количество блоков создания уменьшено и, следовательно, степень сложности устройства также уменьшена. В устройстве представленного изобретения синусоидальные компоненты созданы для каждого канала индивидуально, в то время как дополнительные компоненты, такие как компоненты шума и/или компоненты нестационарных процессов, созданы блоком, общим для выходных каналов. Следовательно, устройство представленного изобретения имеет, по меньшей мере, на один блок создания меньше, чем устройство предыдущего поколения.

Представленное изобретение основано на предположении, что синусоидальные звуковые компоненты содержат наиболее направленную информацию, или, по меньшей мере, наиболее детализированную основную информацию, и что, в частности, шум содержит очень немного направленной информации, или очень грубо направленную информацию. Это позволяет тем же самым компонентам шума использоваться для обоих (или всех) каналов. Эти совместно используемые компоненты шума (в общем, дополнительные) объединены с канало-специфическими синусоидальными компонентами в соответствующих блоках комбинации для того, чтобы создать выходные каналы, которые содержат как синусоидальные компоненты, характерные для специфического канала, так и общие компоненты шума.

В предпочтительной реализации устройство представленного изобретения дополнительно включает в себя:

- два блока создания дополнительных компонентов для создания первого типа дополнительных компонентов и второго, другого типа дополнительных компонентов, соответственно, и

- по меньшей мере, один дополнительный блок комбинации для объединения дополнительных компонентов, созданных двумя блоками создания дополнительных компонентов.

Два блока создания дополнительных компонентов, как шума, так и нестационарных сигналов (и/или любых других дополнительных компонентов), общих для выходных каналов, обеспечивают работу. В результате можно избежать установки обоих двойных (или многоканальных) блоков создания шума и двойных (или многоканальных) блоков создания нестационарных сигналов. Следовательно, в этой реализации можно оптимально установить первый блок создания дополнительных компонентов для создания компонентов нестационарных сигналов, и можно оптимально установить второй блок создания дополнительных компонентов для создания компонентов шума.

Преимуществом изобретения является то, что устройство дополнительно включает в себя первый и второй блоки взвешивания для взвешивания общих дополнительных компонентов для первого выходного канала и второго выходного канала соответственно. Это позволяет уровню общих дополнительных компонентов изменяться в выходном канале, таким образом создавая более правдоподобное воспроизведение звука.

В особенно удачной реализации блоки создания синусоидальных компонентов являются также блоками создания области преобразования, а блоки создания дополнительных компонентов являются также блоками создания временной области. Поэтому в этой реализации только синусоидальные компоненты синтезируются в области преобразования (например, частота), причем этот синтез может быть выполнен очень эффективно. Дополнительные компоненты, такие как шум и компоненты нестационарных сигналов, синтезируются во временной области; таким образом, исключается неэффективный синтез в области преобразования этих компонентов. В результате получено существенное уменьшение сложности устройства.

Эта особенно удачная реализация дополнительно включает в себя блок преобразования для преобразования параметров синусоиды в области преобразования и блок управления направлением для добавления направленной информации к преобразованным синусоидальным параметрам, для того чтобы создать первый выходной канал и второй выходной канал. Эта предпочтительная реализация особенно подходит для использования в качестве параметрического декодера.

В другой удачной реализации блоки создания выполнены с возможностью получения множественных наборов параметров, эти наборы связаны с другими входными каналами. Эта реализация особенно удобна для использования как синтезатора, например MIDI синтезатора.

Хотя устройство представленного изобретения уже обсуждалось в варианте использования только двух выходных каналов, представленное изобретение не ограничено только этим вариантом.

В частности, устройство представленного изобретения может быть выполнено с возможностью создания, по меньшей мере, трех выходных каналов, с возможностью увеличения до шести выходных каналов. Понятно, что шесть выходных каналов могут использоваться в так называемых звуковых системах 5.1., которые включают пять основных звуковых выходных каналов (левый передний, левый задний, правый передний, правый задний и центральный) плюс сверхнизкочастотный динамик для басового звука. Когда устройство представленного изобретения выполнено для трех или более выходных каналов, оно имеет, по меньшей мере, три блока создания синусоидальных компонентов и менее чем три блока создания дополнительных компонентов. Особым достоинством является то, что устройство все еще имеет единственный, совместно используемый блок создания дополнительных компонентов в устройстве дополнительных компонентов, упомянутые компоненты могут быть, например, шумом или нестационарными сигналами.

Как упомянуто выше, устройство представленного изобретения может успешно использоваться как MIDI синтезатор или как параметрический декодер звука, такой как параметрический стерео- или мультиканальный декодер.

Как было показано, система звука может удачно включать в себя данное устройство. Такая система звука может быть системой звука для потребителя, включающей усилитель, динамик или подобные излучатели. Другие звуковые системы могут включать в себя музыкальные инструменты, телефонные устройства типа мобильных (сотовых) телефонов, переносные аудиоплейеры типа MP3 и ААС плейеры, компьютерные звуковые системы и т.д.

Представленное изобретение также обеспечивает способ создания звука представленными наборами параметров, причем каждый набор включает в себя синусоидальные параметры, представляющие синусоидальный компонент звука, и дополнительные параметры, представляющие дополнительные компоненты звука; способ включает в себя этапы:

- создание синусоидальных компонентов только первого выходного канала в ответ на синусоидальные параметры,

- создание синусоидальных компонентов только второго выходного канала в ответ на синусоидальные параметры,

- создание общих дополнительных компонентов для первого выходного канала и второго выходного канала в ответ на дополнительные параметры, и

- генерирование первого выходного канала (L) и второго выходного канала (R) в ответ на объединение общих дополнительных компонентов с синусоидальными компонентами первого выходного канала и второго выходного канала, соответственно; и в котором общие дополнительные компоненты являются, по меньшей мере, одним из компонентов нестационарных сигналов и компонентов шума.

Этот способ, в котором синусоидальные звуковые компоненты первого канала, синусоидальные звуковые компоненты второго канала и дополнительные звуковые компоненты обоих каналов создаются по отдельным этапам, имеет те же самые преимущества, как устройство, определенное выше.

Способ представленного изобретения может удачно включать в себя дополнительные этапы:

- создание первого типа дополнительных компонентов и второго, другого типа дополнительных компонентов, и

- объединение этих двух типов дополнительных компонентов.

В типичной реализации первый тип дополнительных компонентов включает в себя нестационарные сигналы, и второй тип дополнительных компонентов включает в себя шум.

Предложенный способ может дополнительно включать в себя этап взвешивания общих дополнительных компонентов для первого выходного канала (L) и для второго выходного канала (R) соответственно, предпочтительно до смешивания этих дополнительных компонентов с индивидуальными (выходными) каналами.

В особенно выгодной реализации способа в соответствии с представленным изобретением синусоидальные компоненты создаются в области преобразования, и дополнительные компоненты создаются во временной области. Это значительно уменьшает сложность и затраты на расчеты, включенные в представленный способ.

Способ представленного изобретения может дополнительно включать в себя этапы по преобразованию синусоидальных параметров в области преобразования и добавления направленной информации к преобразованным синусоидальным параметрам, для того чтобы создать первый выходной канал и второй выходной канал. При добавлении направленной информации, такой как стереоинформация, могут быть созданы два или более выходных каналов из единственного источника синусоидальных параметров. Добавляя и обрабатывая направленную информацию в области преобразования, можно эффективно генерировать индивидуальные выходные каналы.

Представленное изобретение дополнительно обеспечивает компьютерный программный продукт для выполнения способа, как определено выше. Компьютерный программный продукт может включать в себя набор из компьютерных исполнительных команд, сохраненных на носителе информации типа CD или DVD. Набор компьютерных исполнительных команд, которые позволяют запрограммированному компьютеру исполнять способ, как определено выше, может также позволять осуществлять загрузку от отдаленного сервера, например, через Интернет.

Существующее изобретение будет дополнительно объяснено ниже на примерах реализаций, показанных на сопроводительных чертежах, на которых:

Фиг.1 схематично показывает параметрический стереодекодер предыдущего поколения;

Фиг.2 схематично показывает параметрический стереодекодер в соответствии с представленным изобретением;

Фиг.3 схематично показывает параметрический стереосинтезатор предыдущего поколения;

Фиг.4 схематично показывает параметрический стереосинтезатор в соответствии с представленным изобретением.

Параметрический стереодекодер 1', соответствующий устройству предыдущего поколения, показан на фиг.1. Он включает в себя источник синусоид 11, источник нестационарных сигналов 12 и источник шума 13, блок комбинации 14, блок QMF анализа (QMFA) 15, параметрический стереоблок (PS) 16, первый блок QMF синтеза (QMFS) 17 и второй блок QMF синтеза(QMFS) 18.

Источник синусоид 11, источник нестационарных сигналов 12 и источник шума 13 создают параметры синусоид (SP), параметры нестационарных сигналов (TP) и параметры шума (NP), соответственно, и подает эти параметры в блок комбинации (сумматора) 14. Эти параметры могут быть записаны в источниках 11, 12 и 13, или могут быть переданы через эти источники, например, от демультиплексора.

Блок комбинации 14 передает объединенные параметры в блок QMF анализа (QMFA) 15. Этот блок QMF анализа 15 преобразует параметры из временной области в QMF (Квадратурный Зеркальный Фильтр) область, которой эквивалентна частотная область. Этот блок QMF анализа 15 может включать в себя один или более фильтров QMF, но может также быть составлен банком фильтров и одним или более блоком FFT (быстродействующее преобразование Фурье). Результирующие параметры области QMF (или частоты) тогда будут обработаны параметрическим стереоблоком (PS) 16, который также получает параметрический стереосигнал PSS, содержащий стереоинформацию. Используя эту стереоинформацию, параметрический блок стерео создает ряд левых (область QMF) параметров и ряд правых (область QMF) параметров, которые подаются к левому QMF блоку синтеза (QMFS) 17 и правому QMF блоку синтеза (QMFS) 18. Блоки синтеза QMF 17 и 18 преобразуют наборы QMF параметров во временную область, чтобы создать левый сигнал L и правый сигнал R, соответственно.

Хотя устройство 1' на фиг.1 может хорошо работать, оно требует большого количества вычислений. В особенности синтез в QMF (частота) области очень сложен и поэтому не эффективен. Поэтому схемы, необходимые для этого синтеза, дороги, поскольку они обеспечивают относительно медленную обработку.

Соавторы представленного изобретения выяснили, что большое количество вычислений, необходимое для синтезирования звука в области частот или в области QMF, вызвано тем фактом, что нестационарные сигналы и шум очень трудно эффективно синтезировать. Напротив, синтез синусоид в частотной или QMF областях может быть эффективно выполнен. Поскольку в параметрическом декодере присутствуют синусоидальные параметры и по меньшей мере один из параметров нестационарного сигнала и параметров шума, можно произвести отдельный синтез, в зависимости от типа параметров. Соответственно, в декодере представленного изобретения синусоидальные компоненты синтезируются в частотной области или ее эквиваленте (например. QMF), в то время как другой компонент или компоненты синтезируются в другой области, предпочтительно во временной области. Предлагаемая реализация декодера в соответствии с представленным изобретением показана на фиг.2.

Параметрический стереодекодер 1, в соответствии с представленным изобретением, просто объясняется с помощью обобщенного примера фиг.2; также включает в себя источник синусоид 11, источник нестационарных сигналов 12 и источник шума 13. Декодер 1 далее содержит параметрический стереоблок (PS) 16, первый блок QMF синтеза (QMFS) 17 и второй блок QMF синтеза (QMFS) 18, блок QMF анализа (QMFA) 19, первый блок синтеза временной области (TDS) 20, второй блок синтеза временной области (TDS) 21, блок вычисления коэффициента усиления (GC) 22, первый многоканальный блок 23, первый блок комбинации 24, второй многоканальный блок 25, второй блок комбинации 26 и третий блок комбинации 27.

Источник синусоид 11, источник нестационарных сигналов 12 и источник шума 13 создают параметры синусоид (SP), параметры нестационарных сигналов (TP) и параметры шума (NP) соответственно. Эти параметры могут быть сохранены в источниках 11, 12 и 13 или могут быть переданы через эти источники, например, от демультиплексора.

Согласно представленному изобретению, только параметры синусоиды (SP) подаются к блоку QMF анализа (QMFA) 19. Этот блок QMF анализа 19, который по существу сообщается с блоком QMFA 15 на фиг.1, преобразует эти параметры из временной области в область QMF (Квадратурный Зеркальный Фильтр), которая по существу является эквивалентом частотной области. Блок QMF анализа 19 может включать в себя один или более QMF фильтров, которые могут быть известны по существу, но могут также быть составлены банком фильтров и одним или более блоком FFT (Быстродействующее Преобразование Фурье), которые могут быть известны по существу. Результирующие QMF (или частота) параметры затем обработаны параметрическим стереоблоком (PS) 16, который также получает параметрический стереосигнал PSS, содержащий стереоинформацию. Используя эту стереоинформацию, параметрический стереоблок 16 создает ряд левых (область QMF) параметров и ряд правых (область QMF) параметров, которые подаются на левый блок QMF синтеза (QMFS) 17 и на правый блок QMF синтеза (QMFS) 18 соответственно. Эти блоки QMF синтеза 17 и 18 преобразуют наборы параметров области QMF параметров области для области времени, и эти преобразованные параметры подаются к первому блоку комбинации 24 и второму блоку комбинации 26 соответственно. В данной реализации показано, что блоки комбинации 24 и 26 составлены сумматорами, но данное изобретение этими возможностями не ограничено, и могут быть предусмотрены и другие блоки комбинации, включая блоки взвешивания.

В декодере представленного изобретения только синусоидальные параметры (SP) подаются к блоку QMF анализа (19 на фиг.2). Параметры нестационарного сигнала (TP) и/или параметры шума (NP), в соответствии с представленным изобретением, не подаются к блоку QMF анализа, но подаются к блокам синтеза области времени 20 и 21, соответственно. В результате нестационарные сигналы и шум синтезируются во временной области вместо области QMF (в общем, преобразование), что очень упрощает синтез. Техническая структура блоков синтеза временной области (TDS) 20 и 21 может быть известна по существу и описана, например, в статье "Успехи в параметрическом кодировании для высококачественного аудио", написанной W. Oomen, E. Schuijers, B. den Brinker и J. Breebaart, в журнале Общества разработки аудио № 5852, Амстердам (Нидерланды), в марте 2003, содержание которой включено в настоящее описание в качестве ссылки.

Синтезируемый шум и нестационарные сигналы объединяются в третьем блоке комбинации 27, который, как показано в данной реализации, также представлен сумматором. Затем объединенный шум и нестационарные сигналы подаются как к первому умножителю 23, так и ко второму умножителю 25 для установки коэффициента усиления в зависимых каналах сигналов, созданных блоком контроля 22. Блок контроля коэффициента усиления (GC) 22 получает параметрический стереосигнал PSS и устанавливает соответствующие коэффициенты усиления сигналов в зависимости от этого сигнала. Регулируемые по уровню нестационарные сигналы и сигналы шума затем объединяются с выходными сигналами блоков QMF синтеза 17 и 18 путем объединения блоков 24 и 26, чтобы создать левый выходной сигнал L и правый выходной сигнал R соответственно.

Как упомянуто выше, анализ и синтез шума и/или нестационарных сигналов в частотной области или QMF области, как правило, неэффективны и очень сложны. В декодере представленного изобретения эта задача решена только путем синтезирования синусоид в области QMF (или частота) и синтезирования нестационарных сигналов и шума во временной области. Чтобы дополнительно упростить декодер, синтез нестационарных сигналов и шума не выполняется для каждого канала отдельно, но выполняется блоками синтеза (20 и 21 на фиг.2), которые совместно используются всеми каналами. Канально-зависимая информация добавляется к общим нестационарным сигналам и шуму через блок вычисления коэффициента усиления 22 и умножители 23 и 25, которые определяют канально-зависимые коэффициенты усиления.

Отмечено, что в реализации на фиг.2 нестационарные сигналы и шум объединены (в сумматоре 27) прежде, чем их канально-зависимый коэффициент усиления откорректирован. В результате коэффициент усиления нестационарных сигналов и шума управляет вместе, и поэтому он независим от типов сигнала (нестационарные сигналы или шум). Могут быть предусмотрены те реализации данного изобретения, в которых не объединены синтезируемые нестационарные сигналы и шум, до тех пор пока их соответствующие коэффициенты усиления не были откорректированы. В таких вариантах реализаций умножители соединились, чтобы блок регулировки усиления (GC), блок 22 мог быть установлен между блоком синтеза области времени 20 и блоком комбинации 27, и между блоком синтеза области времени 21 и блоком комбинации 27.

Отмечено, что или источник нестационарных сигналов 12, или источник шума 13 можно не включать, в таком случае третий блок комбинации 27 также можно не включать. В типичной реализации, по меньшей мере, будут присутствовать источник синусоид 11 и источник шума 13; а источник нестационарных сигналов 12 является дополнительным по выбору. Хотя стерео (два канала) декодер и был показан на фиг.2, но представленное изобретение не имеет ограничений, и в его состав могут входить многоканальные декодеры, имеющие три или более каналов; любые необходимые переделки очевидны для специалистов. Поэтому представленное изобретение также обеспечивает декодер 5.1.

Декодер 1 представленного изобретения обычно работает во временном интервале: анализ и синтез выполнены в сегментах времени (временной пакет или кадр), которые могут частично перекрываться.

В дополнение к декодеру, представленное изобретение также имеет синтезатор для синтезирования звука, например, с использованием данных управления от потока MIDI или картотеки MIDI. Звуковой синтезатор, соответствующий устройству предыдущего поколения, схематично показан на фиг.3.

В звуковой синтезатор 2', в соответствии с устройством предыдущего поколения, устанавливают для воспроизведения два "голоса" или звуковые входные каналы VI и V2, каждый составлен источником параметров. Синтезатор этого типа описан, например, в статье “Параметрическое аудиокодирование, основанное на волновом синтезе” М. Szczerba, W. Oomen и М. Klein Middelink, журнал Общества разработки аудио № 6063, Берлин (Германия), 20 мая 2004.

Первый источник параметров 81 (голос VI) включает в себя источник нестационарных сигналов 31, источник синусоид 32 и источник шума 33 для создания параметров нестационарных сигналов (TP), параметров синусоид (SP) и параметров шума (NP) соответственно, и дополнительный источник панорамирования 34 для создания параметров панорамирования (PP). Точно так же второй источник параметров 82 (голос V2) включает в себя источник нестационарных сигналов 35, источник синусоид 36 и источник шума 37 для создания параметров нестационарных сигналов (TP), параметров синусоид (SP) и параметров шума (NP), соответственно, и дополнительный источник панорамирования 38 для создания параметров панорамирования (PP).

Звуковой синтезатор 2' дополнительно включает в себя первый блок генератора 47, включающий в себя первый генератор нестационарных сигналов (TG) 51, первый генератор синусоид (SG) 52 и первый генератор шума (NG) 53, и второй блок генератора 48, включающий в себя второй генератор нестационарных сигналов (TG) 54, второй генератор синусоид (SG) 55 и второй генератор шума (NG) 56. Первый блок генератора 47 создает звуковые сигналы, которые объединены первым блоком комбинации 61 в первый (левый) звуковой выходной канал L, в то время как второй блок генератора 48 создает звуковые сигналы, которые объединены вторым блоком комбинации 62 во второй (правый) звуковой выходной канал R.

Отмечено, что звуковые выходные каналы L и R, каждый, содержат звуковое воспроизведение от двух звуковых входных каналов (или "голосов") VI и V2. Далее отмечено, что количество звуковых входных каналов и звуковых выходных каналов, показанных на фиг.3, является только примером, и что могут присутствовать более чем два звуковых входных канала и/или более чем два звуковых выходных канала.

Звуковые параметры распределены между генераторами рядом блоков взвешивания 39-44. Например, первый блок взвешивания 39 соединен с первым источником параметров нестационарных сигналов 31 и с первым и вторым генераторами нестационарных сигналов 51 и 54 для того, чтобы распределять параметры нестационарных сигналов первого голоса VI по двум каналам L и R. Первый блок взвешивания 39 может использовать предопределенные коэффициенты взвешивания, например 0,5 и 0,5, или 0,4 и 0,6, но может также управляться параметрами панорамирования (PP), созданными дополнительным блоком панорамирования 34 первого голоса VI. Таким образом, все параметры распределены по всем генераторам.

Понятно, что синтезатор 2', фиг.3, относительно сложен, и что его сложность существенно увеличивается, когда еще добавляются звуковые входные каналы и/или звуковые выходные каналы. Для так называемых звуковых систем 5,1. были бы необходимы шесть блоков генераторов, а в общей сложности необходимо 18 генераторов. Очевидно, что это нежелательно.

Синтезатор в соответствии с представленным изобретением схематично показан посредством обобщенного примера на фиг.4. Синтезатор 2 из представленного изобретения также включает в себя первый источник параметров 81 и второй источник параметров 82. Первый источник параметров 81 (голос VI) включает в себя источник нестационарных сигналов 31, источник синусоид 32 и источник шума 33 для создания параметров нестационарных сигналов (TP), параметров синусоид (SP) и параметров шума (NP), соответственно, и дополнительный источник панорамирования 34 для создания параметров панорамирования (PP). Точно так же второй источник параметров 82 (голос V2) включает в себя источник нестационарных сигналов 35, источник синусоид 36 и источник шума 37 для создания параметров нестационарных сигналов (TP), параметров синусоид (SP) и параметров шума (NP), соответственно, и дополнительный источник панорамирования 38 для создания параметров панорамирования (PP).

Однако, в отличие от синтезатора 2' предыдущего поколения, синтезатор 2 представленного изобретения, показанный на фиг.4, не имеет многоканальных блоков генератора (47 и 48 на фиг.3). Вместо этого синтезатор 2 имеет два генератора синусоид (SG) 52 и 55, один для каждого выходного звукового канала, как на фиг.3, но единственный генератор шума (NG) 58 и единственный генератор нестационарных сигналов (TG) 59. Параметры нестационарных сигналов (TP) от источников нестационарных сигналов 31 и 35 подведены к единственному генератору нестационарных сигналов (TG) 59, который создает нестационарные сигналы для обоих каналов. Точно так же параметры шума от источников шума 33 и 37 поданы к генератору сигнала шума (NG) 58, который создает сигналы шума для обоих каналов. Для каждого канала дополнительные блоки комбинации 63 и 65, соответственно, предусмотрены для объединения сигналов шума и нестационарных сигналов этого канала. Тогда уровень звука каждого канала можно регулировать блоками регулировки уровня 64 и 66, соответственно, которые включены между блоками комбинации 63 и 61 и между блоками комбинации 65 и 62, соответственно. Блоки регулировки уровня 64 и 66 могут получать сигналы взвешивания от блока управления панорамирования (PC) 57, или могут быть выполнены с возможностью применения фиксированных, предопределенных коэффициентов взвешивания.

Единственный дополнительный блок управления панорамирования (PC) 57 получает параметры панорамирования (PP) для обоих голосов VI и V2 от блоков панорамирования 34 и 38. Блок 57 преобразует эти параметры панорамирования в соответствующие панорамированные управляющие сигналы, которые подаются на блоки регулировки уровня (или взвешивание) 64 и 66 и на генераторы синусоид 52 и 55 для того, чтобы управлять уровнями звука на выходе и, таким образом, определять направление звука на выходе.

При сравнении фиг.3 и 4 ясно, что синтезатор 2 с фиг.4 значительно проще, чем синтезатор 2' предыдущего поколения с фиг.3. Кроме того, синтезатор 2 из представленного изобретения может легко быть переделан для того, чтобы включить больше входных каналов звука и/или выходных каналов звука, без существенного увеличения его сложности. Количество генераторов шума (NG) и генераторов нестационарных сигналов (TG) не будет увеличено, поскольку эти генераторы распределены среди выходных каналов. Только количество генераторов синусоид придется увеличить, плюс связанные блоки комбинации и взвешивания на выходной канал.

Отмечено, что блоки параметров панорамирования (PP) 34 и 38, блок управления панорамирования 57 и блоки регулировки уровня 64 и 66 являются дополнительными, и что данное изобретение может быть использовано без этих блоков. Однако эти блоки будут присутствовать в предпочтительной реализации этого изобретения.

Далее отмечено, что источники параметров 31-38 могут быть внешними по отношению к синтезатору 2. Другими словами, согласно предлагаемому изобретению, может быть предусмотрен синтезатор, который имеет входные терминалы для получения параметров нестационарных сигналов, параметров синусоид, параметров шума и/или параметров панорамирования, и для которых входные терминалы тогда составляют источники 31-38. В некоторых реализациях параметры нестационарных сигналов и связанные компоненты синтезатора можно не включать, синтезатор может быть выполнен с возможностью только того, чтобы создать шум и синусоиды. В других вариантах реализации могут быть обеспечены множественные генераторы нестационарных сигналов, в то время как только генератор шума разделен между выходными каналами.

Для того чтобы улучшить локализацию звука, при совместном использовании генераторов среди выходных каналов, могут быть применены постпроцессоры, такие как фильтры и линии задержки. Таким образом достигнута улучшенная направленная обработка (панорамирование). Это может быть особенно полезным при создании 3D (трехмерного) звука, где позиционирование достигается путем фильтрации (обычно используется фильтр HRTFs - связанные головные передаточные функции - который хорошо известен специалистам), и предусмотрено в схеме с ограниченным числом каналов.

Могут быть выполнены и другие постпроцессоры по обработке, например, добавление реверберации и эффектов хора. Только при применении реверберации к синусоидальным компонентам синтезируемого звукового сигнала существенно уменьшается сложность синтезатора, в то время как уменьшение эффекта реверберации едва заметно.

Как уже было упомянуто, синтезатор представленного изобретения не ограничен применениями стерео, но может также использоваться как многоканальный, имеющий три или более каналов, например, для звуковой системы 5,1. Обработка параметров предпочтительно выполнена в сегмент времени, каждый параметр определяет тип сигнала (шум, нестационарный сигнал или синусоида) для особого сегмента времени (например, кадр).

Предлагаемое изобретение основано на предположении, что только синусоидальные компоненты могут эффективно синтезироваться в спектральной области. Предлагаемое изобретение основано на дополнительном предположении, что человеческое ухо менее чувствительно к направлению нестационарного сигнала и компонентов сигнала шума, чем к направлению синусоидальных компонентов сигнала. Следует отметить, что любые термины, используемые в этом документе, не должны рассматриваться, чтобы ограничить возможности представленного изобретения. В частности, слова "содержит" и "содержащий" не означают, что можно исключить любые элементы, специально не заявленные. Единственные (схемы) элементы могут быть заменены множеством (схем) элементов или их эквивалентами.

Специалистам будет понятно, что представленное изобретение не ограничено рассмотренными вариантами реализаций и что можно сделать много изменений и добавлений, не отступая от пределов возможностей данного изобретения, как это определено в приложенной формуле изобретения.

1. Устройство (1, 2) для создания звука, представленного наборами параметров, причем каждый набор включает в себя синусоидальные параметры (SP), представляющие синусоидальные компоненты звука, и дополнительные параметры (NP, ТР), представляющие дополнительные компоненты звука, причем устройство включает:
- первый блок (17; 52) создания синусоидальных компонентов для приема синусоидальных параметров и создания синусоидальных компонентов только первого выходного канала (L) в ответ на синусоидальные параметры,
- второй блок (18; 53) создания синусоидальных компонентов для приема синусоидальных параметров и создания синусоидальных компонентов только второго выходного канала (R) в ответ на синусоидальные параметры,
- по меньшей мере, один блок (20, 21; 58, 59) создания дополнительных компонентов, представляющий собой, по меньшей мере, один из блока создания компонентов нестационарного сигнала и блока создания компонентов шума для приема дополнительных параметров для создания общих дополнительных компонентов для первого выходного канала (L) и второго выходного канала (R) в ответ на дополнительные параметры, и
- первый блок (24; 62) комбинации, соединенный с первым блоком (17; 52) создания синусоидальных компонентов, вторым блоком (18; 53) создания синусоидальных компонентов и блоком (20, 21; 58, 59) создания дополнительных компонентов и выполненный с возможностью генерирования первого выходного канала, и второй блок (26; 62) комбинации для генерирования второго выходного канала в ответ на объединения общих дополнительных компонентов с синусоидальными компонентами первого выходного канала (L) и второго выходного канала (R) соответственно,
и при этом общие дополнительные компоненты являются, по меньшей мере, одним из компонентов нестационарного сигнала и компонентов шума.

2. Устройство по п.1, содержащее
два блока (20, 21; 58, 59) создания дополнительных компонентов для создания первого типа дополнительных компонентов и второго другого типа дополнительных компонентов соответственно, и
по меньшей мере, один дополнительный блок (27; 63, 65) комбинации для объединения дополнительных компонентов, созданных двумя блоками создания дополнительных компонентов.

3. Устройство по п.2, в котором первый блок (20; 59) создания дополнительных компонентов выполнен с возможностью создания нестационарных процессов и второй блок (21; 58) создания дополнительных компонентов выполнен с возможностью создания шума.

4. Устройство по п.1, дополнительно содержащее первый и второй блоки (23, 25; 64, 66) взвешивания для взвешивания общих дополнительных компонентов для первого выходного канала (L) и второго выходного канала (R) соответственно.

5. Устройство по п.1, в котором синусоидальные компоненты блоков (17, 18; 52, 55) создания преобразуют блоки создания областей и в котором блоки (20, 21) создания дополнительных компонентов являются блоками создания временной области.

6. Устройство по п.5, дополнительно содержащее блок (19) преобразования для преобразования синусоидальных параметров (SP) в области преобразования и блок (16) управления направлением для добавления информации (PSS) о направлении к преобразованным синусоидальным параметрам, чтобы воспроизводить первый выходной канал (L) и второй выходной канал (R).

7. Устройство по п.1, в котором блоки (52, 55, 58, 59) создания выполнены с возможностью получения множественных наборов параметров, причем наборы связаны с различными входными каналами (V1, V2).

8. Устройство по п.1, выполненное с возможностью создания, по меньшей мере, трех выходных каналов, предпочтительно шести выходных каналов.

9. Устройство по п.1, которое является синтезатором MIDI.

10. Устройство по п.1, которое является параметрическим звуковым декодером.

11. Звуковая система, содержащая устройство (1, 2) по п.1.

12. Способ создания звука, представленного наборами параметров, причем каждый набор включает в себя синусоидальные параметры (SP), представляющие синусоидальные компоненты звука, и дополнительные параметры (NP, ТР), представляющие дополнительные компоненты звука; способ включает в себя этапы:
- создания синусоидальных компонентов только первого выходного канала (L) в ответ на синусоидальные параметры,
- создания синусоидальных компонентов только второго выходного канала (R) в ответ на синусоидальные параметры,
- создания общих дополнительных компонентов для первого выходного канала (L) и второго выходного канала (R) в ответ на дополнительные параметры, и
- генерирования первого выходного канала (L) и второго выходного канала (R) в ответ на объединение общих дополнительных компонентов с синусоидальными компонентами первого выходного канала (L) и второго выходного канала (R) соответственно,
- и в котором общие дополнительные компоненты являются, по меньшей мере, одним из компонентов нестационарных сигналов и компонентов шума.

13. Способ по п.12, содержащий дополнительные этапы:
- создания первого типа дополнительных компонентов и второго другого типа дополнительных компонентов, и
- объединения этих двух типов дополнительных компонентов.

14. Способ по п.13, в котором первый тип дополнительных компонентов включает в себя нестационарные сигналы, и второй тип дополнительных компонентов включает в себя шум.

15. Способ по п.12, дополнительно содержащий этап взвешивания общих дополнительных компонентов для первого выходного канала (L) и второго выходного канала (R) соответственно.

16. Способ по п.12, в котором синусоидальные компоненты создают в области преобразования и в котором дополнительные компоненты создают во временной области.

17. Способ по п.16, дополнительно содержащий этапы преобразования синусоидальных параметров (SP) в область преобразования и добавления информации (PSS) о направлении к преобразованным синусоидальным параметрам для создания первого выходного канала (L) и второго выходного канала (R).

18. Носитель информации, хранящий компьютерный программный продукт, содержащий набор из исполняемых компьютером команд, которые позволяют запрограммированному компьютеру исполнять способ по п.12.

Изобретение относится к банку фильтров анализа, банку фильтров синтеза и системам, включающим в себя любой из вышеупомянутых банков фильтров, которые могут быть применены, например, в современном аудиокодировании, аудиодекодировании или иных областях, связанных с трансляцией звуковых сигналов.

Устройство и способ для обработки действительного сигнала поддиапазона для ослабления эффектов наложения спектров // 2421830

Изобретение относится к обработке аудио- или видеосигналов и, в частности, к банкам фильтров для преобразования сигнала в спектральное представление. .

Способ компрессии аудиоданных // 2421829

Изобретение относится к технике цифровой обработки сигналов и может быть использовано в системах сжатия звуковых сигналов. .

Способ двоичного кодирования показателей квантования огибающей сигнала, способ декодирования огибающей сигнала и соответствующие модули кодирования и декодирования // 2420816

Изобретение относится к способам передачи и хранения цифровых звуковых сигналов, в частности, к способам двоичного кодирования показателей квантования, определяющих огибающую сигнала.

Устройство и способ для генерации значений подполос звукового сигнала и устройство и способ для генерации отсчетов звукового сигнала во временной области // 2420815

Изобретение относится к кодированию и декодированию звука. .

Аудиодекодирование // 2420814

Изобретение относится к аудиодекодированию и в особенности к декодированию сигналов MPEG Surround. .

Системы и способы для изменения окна с кадром, ассоциированным с аудио сигналом // 2418323

Изобретение относится к технологии обработки речевых сигналов, в частности система и способы относятся к изменению окна с кадром, ассоциированным с аудио сигналом.

Кодирование информационного сигнала // 2413312

Изобретение относится к кодированию информационных сигналов, например, аудиокодированию, в частности, к кодированию с копированием спектральных полос (SBR). .

Устройство и способ для генерации значений субполос звукового сигнала и устройство и способ для генерации аудиоотсчетов временной области // 2411645

Изобретение относится к устройству и способу для генерации значений субполос звукового сигнала, к устройству и способу для генерации отсчетов временной области. .

Способ обнаружения пауз в речевых сигналах и устройство его реализующее // 2399103

Изобретение относится к области цифровой обработки речевых данных и может быть использовано в различных приложениях, например в IР-телефонии. .

Аудиопроцессор и способ обработки звука с высококачественной коррекцией частоты основного тона (варианты) // 2436174

Изобретение относится к аудиопроцессору и способу для цифровой обработки звукового сигнала в последовательность фреймов посредством дискретизации и повторной дискретизации сигнала в зависимости от частоты основного тона

Способ и устройство для обработки звукового сигнала // 2439720

Изобретение относится к кодированию и декодированию звуковых сигналов с использованием спектральных данных сигнала

Системы и способы затенения первого пакета, соответствующего первой битовой скорости, во втором пакете, соответствующем второй битовой скорости // 2440628

Изобретение относится к технологии обработки речи, в частности к затенению первого пакета

Способ и устройство для обнаружения звуковой активности и классификации звуковых сигналов // 2441286

Эффективная реализация наборов фильтров анализа и синтеза для кодеров/декодеров mpeg aac и mpeg aac eld // 2442232

Изобретение относится к кодерам и декодерам, в частности, к реализации набора фильтров для перспективного аудиокодирования (ААС) и усовершенствованного с низкой задержкой (ELD) ААС

Кодер, декодер и методы кодирования и декодирования сегментов данных, представляющих собой поток данных временной области // 2444071

Изобретение относится к кодированию данных для случаев, когда различные характеристики данных, подлежащих кодированию, используются для кодирования скоростей, как, например, в видео- и звуковом кодировании

Эффективный способ проектирования набора фильтров для mdct/imdct в приложениях для кодирования речи и аудиосигналов // 2451998

Изобретение относится к кодирующим устройствам и декодерам

Масштабируемое кодирование речи и аудио с использованием комбинаторного кодирования mdct-спектра // 2459282

Изобретение относится к кодерам и декодерам, в частности к эффективному способу кодирования спектра модифицированного дискретного косинусного преобразования (MDCT) как части масштабируемого речевого и аудиокодека

Упрощенная индексация и деиндексация векторов // 2461079

Изобретение относится к индексации входного вектора, содержащегося в наборе векторов, входящем в множество наборов векторов

Способ обработки звукового сигнала // 2464649

Изобретение относится к способам обработки цифровых сигналов, в частности к сжатию сигнала и передаче огибающей спектра