Способ обработки аудиосигнала для улучшенного преобразования

Авторы патента:

ОРЭ Жан-Люк (FR)

РОССЕ Франк (BE)

H04S3/00 - Системы с более, чем двумя каналами, например квадрафонические (H04S 5/00,H04S 7/00 имеют преимущество)

H04S1/00 - Двухканальные системы (H04S 5/00,H04S 7/00 имеют преимущество)

Владельцы патента RU 2616161:

ОРЭ Жан-Люк (FR)
РОССЕ Франк (BE)

Настоящее изобретение относится к средствам обработки аудиосигнала. Технический результат заключается в улучшении качества звукового пространства при малом количестве регистраций за счет улучшения согласованности и динамического диапазона звука. Обрабатывают исходный аудиосигнал с N.х каналами, где N больше 1, а х больше или равно 0, включая стадию многоканальной обработки вышеупомянутого входного аудиосигнала посредством многоканальной свертки с заранее заданным образом. Вышеупомянутый образ создается путем захвата эталонного звука с помощью набора акустических экранов, расположенных в базовом пространстве. Дополнительно выбирают по меньшей мере один образ из множества образов, ранее созданных на различных звуковых фонах. 3 з.п. ф-лы, 3 ил.

Область техники

Настоящее изобретение относится к области обработки аудиосигнала с целью создания улучшенного акустического окружения, в частности, для прослушивания при помощи наушников.

Предшествующий уровень техники

Способ и система для виртуализации преобразования звуковой последовательности, описанные в международной патентной заявке WO/2006/024850, известны из предшествующего уровня техники. Согласно этому известному решению, слушатель может прослушивать звук виртуальных громкоговорителей с помощью наушников с уровнем реализма, при котором этот звук трудно отличить от реальных громкоговорителей. Наборы персонализированных пространственных импульсных характеристик (ППИХ) получают для звуковых источников громкоговорителей для ограниченного количества положений головы слушателя. Персонализированные пространственные импульсные характеристики используются при преобразовании аудиосигнала, предназначенного для громкоговорителей, на виртуализированном выходе на наушники. Основывая преобразование на положении головы слушателя, система может регулировать преобразование таким образом, что кажется, что виртуальные громкоговорители не двигаются, когда слушатель поворачивает голову.

Недостаток предшествующего уровня техники

Решение, предложенное в предшествующем уровне техники, недостаточно приемлемо, поскольку оно не позволяет персонализировать эталонное акустическое окружение, не позволяет изменять тип акустического окружения по отношению к типу последовательности, которая должна быть воспроизведена.

Кроме того, использование решения из предшествующего уровня техники приводит к значительной продолжительности захвата образа звука с использованием затратной компьютерной обработки данных, требующей больших вычислительных ресурсов. Кроме того, это известное решение не позволяет ослабить стереосигнал на N каналах и не предусматривает генерацию каналов, которые исходно не существуют.

Решение, изложенное в изобретении

Настоящее изобретение преследует цель предоставить решение этой проблемы. В частности, способ, который раскрывается в настоящем изобретении, позволяет преобразовывать 2D-звук в 3D-звук либо с использованием стереофайла, либо с использованием многоканальных файлов, позволяет генерировать звуковой 3D-стереосигнал посредством виртуализации с возможностью выбора конкретного звукового фона.

С этой целью в изобретении рассматривается, в соответствии с наиболее общим смыслом, способ обработки исходного аудиосигнала с N.x каналов, где N - больше 1, х - больше или равно 0, включающий стадию многоканальной обработки указанного входного аудиосигнала посредством многоканальной свертки с заранее заданным образом, причем вышеуказанный образ создается путем захвата эталонного звука с помощью набора громкоговорителей, расположенных в базовом пространстве, и при этом он включает дополнительную стадию выбора по меньшей мере одного из множества образов, ранее созданных на различных звуковых фонах.

Это решение, основанное на частотной фильтрации, разности между левым и правым каналом, с тем чтобы сформировать центральный канал и дифференциацию фаз, позволяет создать из стереосигнала множество стереоканалов, где каждый виртуальный громкоговоритель является стереофайлом.

Это позволяет применить другой образ для каждого из виртуальных каналов и создать путем рекомбинации каналов новый конечный стереоаудиофайл, содержащий 3D-образ каждого виртуального громкоговорителя.

Преимущественно способ согласно изобретению включает стадию создания нового образа путем обработки по меньшей мере одного ранее созданного образа.

В соответствии с одним вариантом воплощения способ дополнительно включает стадию рекомбинации М.х каналов, соответственно обрабатываемых с целью получения выходного сигнала М.у каналов, где N.x отличается от М.у, М - больше 1, у - больше или равно 0.

Изобретение поясняется фигурами, где показано: на фиг.1 - последовательность основных действий способа, на фиг.2 - используемое оборудование, на фиг.3 - сочетание громкоговорителей и их образов.

Подробное описание примерного варианта воплощения изобретения

Способ в соответствии с изобретением разбивается на последовательность стадий:

- создание нескольких последовательностей звуковых образов

- создание последовательности виртуализированных образов путем комбинирования из библиотеки образов

- объединение дорожек исходного звукового сигнала с последовательностью виртуализированных образов.

1 - Создание образа

Получение сигнала

Создание звукового образа состоит из размещения в определенной окружающей среде, например концертном зале, большом помещении или даже в природной среде (пещера, открытое пространство и т.д.) набора акустических образов, сгруппированных в N×M звуковых точках. Например, простая пара "правого-левого" громкоговорителей или наборы 5.1, 7.1, или 11.1 громкоговорителей, воспроизводящих эталонный звуковой сигнал известным способом.

Пара микрофонов размещается, например, на искусственной голове, или применяются всенаправленные HRTF микрофоны, которые улавливают звук громкоговорителей в рассматриваемой окружающей среде. Сигналы, вырабатываемые парой микрофонов, записываются после дискретизации на высокой частоте, например 192 кГц, 24 бит.

Эта цифровая запись позволяет захватить сигнал, отображающий данное звуковое окружение.

Эта стадия не ограничивается захватом звукового сигнала, вырабатываемого громкоговорителями. Захват может быть также произведен из сигнала, вырабатываемого наушниками, расположенными на искусственной голове. Этот вариант позволяет воссоздать звуковое окружение данных наушников при воспроизведении на другом наборе наушников.

2 - Вычисление образа

Этот сигнал затем подвергается обработке, состоящей из приложения разности между эталонным сигналом, подаваемым на громкоговорители, оцифрованным с теми же условиями, и сигналом, захваченным микрофонами. Эта разность создается с помощью компьютера, получающего в качестве входных данных файлы .vaw или аудиофайлы, относительно эталонного сигнала, подаваемого на каждый из громкоговорителей, с одной стороны, и захваченного сигнала, с другой стороны, для того чтобы создать сигнал "ИХ - Импульсная характеристика" для каждого из громкоговорителей, которые были использованы для создания эталонного сигнала. Эта обработка применяется к каждому из входных сигналов каждого из громкоговорителей, с которых собираются данные.

При такой обработке создается набор файлов, каждый из которых соответствует образу одного из громкоговорителей в определенной окружающей среде.

Представление семейства образов

Вышеупомянутая стадия воспроизводится для различных звуковых окружений и/или различных вариантов расположения громкоговорителей. Для каждого из новых вариантов расположения стадия получения, а затем обработки выполняется с целью создания новой последовательности образов, представляющих новую картину расстановки звука.

Таким образом, создается библиотека последовательностей звуковых образов, представляющих данные известные звуковые окружения.

Создание виртуального окружения

Вышеупомянутая библиотека используется для создания новой последовательности образов, представляющей виртуальное окружение, путем комбинирования нескольких последовательностей образов и добавления файлов, соответствующих выбранным образам с тем, чтобы уменьшить зоны, где звуковое окружение не содержало звука громкоговорителей во время вышеупомянутой стадии получения.

Эта стадия создания виртуального окружения позволяет повысить согласованность и динамический диапазон звука в результате применения к конкретной записи, в частности, благодаря лучшему трехмерному заполнению звукового пространства.

Это эквивалентно использованию искусственного окружения с очень большим числом громкоговорителей.

Результатом этой стадии является получение нового виртуализированного образа зала, который может быть применен к любой звуковой последовательности для улучшения воспроизведения.

Обработка звуковой последовательности

Далее выбирается существующая аудиопоследовательность, дискретизируемая с теми же предпочтительными условиями.

В противном случае, виртуализированный образ модифицируется так, чтобы уменьшить частоту и выполнить дискретизацию аудиосигнала, подлежащего обработке.

Известным сигналом является, например, стереосигнал. Он является объектом частотной нарезки и нарезки, основанной на разности фаз между правым и левым сигналами.

Из этого сигнала извлекаются N дорожки путем применения одного из виртуализированных образов к комбинациям этих нарезок.

Таким образом, можно создавать различное количество дорожек, комбинируя результаты нарезки и применяя один из образов к каждой из дорожек, так чтобы создать N×M треки, причем N и М не обязательно равны количеству каналов, используемых на стадии создания образа. Это возможно, например, для создания большего количества дорожек для более динамичного воспроизведения или меньшего количества, например, для воспроизведения через наушники.

Результат этой стадии представляет собой последовательность аудиосигналов, которые затем преобразуются в обычный стереосигнал для возможности воспроизведения на стандартном оборудовании.

Естественно, можно также применять и операции обработки, такие как чередование фаз сигнала.

Стадия обработки звуковой последовательности может быть выполнена в отсроченном режиме с целью получения записей, которые могут быть переданы в любой момент.

Она также может быть выполнена в реальном времени, так чтобы обрабатывать аудиопоток одновременно с его созданием. Этот вариант особенно подходит для преобразования звука в режиме реального времени, получаемого в потоковой передаче, в расширенный звуковой сигнал для воспроизведения с лучшим динамическим диапазоном.

В соответствии с вариантом воплощения такая обработка позволяет создать сигнал, производя повышение каких-либо колебаний около основного звукового сигнала, которые человеческий мозг может "представить" по ошибке сзади, в то время как это передний сигнал. Для этой цели выполняется горизонтальное движение, чтобы перенастроить мозг, а затем повторно выполнить центрирование. Эта стадия состоит из незначительного увеличения уровня или близости к центру переднего виртуального громкоговорителя.

Эта стадия применяется, когда звуковой сигнал преимущественно центрирован, что часто происходит с "голосовой" частью музыкальной записи. Это приближение-усиление обработки применяется временно, предпочтительно когда появляется центрированная аудиопоследовательность.

1. Способ обработки исходного аудиосигнала с N.x каналов, где N больше 1 и х больше или равно 0, включающий стадию многоканальной обработки входного аудиосигнала посредством многоканальной свертки с заранее заданным образом, причем вышеупомянутый образ создают путем захвата эталонного звука с использованием набора громкоговорителей, расположенных в базовом пространстве, и при этом он дополнительно включает дополнительную стадию выбора по меньшей мере одного из множества образов, ранее созданных на различных звуковых фонах посредством добавления файлов, соответствующих выбранным образам, и комбинирования нескольких последовательностей образов для создания новой последовательности образов, представляющей виртуальное окружение.

2. Способ по п. 1, отличающийся тем, что дополнительно включает стадию создания нового образа путем обработки по меньшей мере одного ранее созданного образа.

3. Способ по пп. 1 или 2, отличающийся тем, что дополнительно включает стадию рекомбинации N.x каналов, соответственно обрабатываемых с целью получения выходного сигнала М.у каналов, при этом N.x отличается от М.у, М имеет значение больше 1, у имеет значение больше или равное 0.

4. Способ по пп. 1 или 2, отличающийся тем, что дополнительно включает стадию, состоящую из временного увеличения уровня эффекта присутствия центрального переднего виртуального громкоговорителя, когда звуковой сигнал центрирован.

Изобретение относится к области обработки сигнала. Техническим результатом является уменьшение сложности алгоритмов кодирования и декодирования за счет декорреляции только вещественнозначных коэффициентов.

Улучшение воспроизведения множества аудиоканалов // 2605038

Настоящее изобретение относится к области многоканальных аудиосистем. Технический результат изобретения заключается в улучшении воспроизведения многоканального аудиосигнала.

Устройство и способ генерирования выходных звуковых сигналов посредством использования объектно-ориентированных метаданных // 2604342

Изобретение относится к обработке звуковых сигналов. Технический результат изобретения заключается в повышении скорости передачи сигналов.

Способ и устройство для разложения стереофонической записи с использованием обработки в частотной области, применяющей генератор спектральных весов // 2601189

Изобретение относится к средствам для формирования стереофонического бокового сигнала из стереофонического входного сигнала. Технический результат заключается в обеспечении возможности формирования дополнительных каналов из стереофонического входного сигнала.

Аудиосистема и способ оперирования ею // 2595943

Изобретение относится к аудиосистеме, в частности к виртуальному пространственному воспроизведению аудиосигналов. Технический результат - обеспечение полного восприятия пространственного звука на основе бинауральных сигналов.

Аудиосистема и способ для нее // 2595912

Изобретение относится к аудиосистемам. Технический результат заключается в обеспечении возможности улучшения пространственного восприятия воспроизводимого аудиосистемой аудиосигнала, расширении арсенала доступных аудиоэффектов.

Процессор аудиосигналов для обработки кодированных многоканальных аудиосигналов и способ для этого // 2595910

Изобретение относится к области одновременного воспроизведения многоканальных сигналов. Техническим результатом является обеспечение улучшенной обработки, снижение сложности и/или уменьшение вычислительной нагрузки, повышение качества звука, повышение производительности.

Система и способ для воспроизведения звука // 2589377

Изобретение относится к средствам для воспроизведения аудио сигнала. Технический результат заключается в повышении гибкости расположения громкоговорителей, увеличении уровня звукового давления и увеличении качества пространственного ощущения.

Гибридное кодирование многоканального звука // 2581782

Изобретение относится к средствам кодирования и декодирования многоканального звукового сигнала. Технический результат заключается в повышении качества кодированного сигнала.

Способ фильтрации бинауральных воздействий в аудиопотоках // 2571921

Изобретение относится к средствам фильтрации бинауральных воздействий в аудиопотоках и к средствам защиты индивидуального, группового и массового сознания граждан от скрытых вредоносных воздействий в аудиопотоках.

Устройство, способ и компьютерная программа для генерирования выходного стереосигнала для обеспечения дополнительных выходных каналов // 2595541

Изобретение относится к области генерации стереосигнала. Технический результат - обеспечение более гладкого звучания выходных каналов посредством манипулирования комбинационным сигналом.

Способ и система для генерирования передаточной функции головы путем линейного микширования передаточных функций головы // 2591179

Изобретение относится к технике связи и предназначено для обработки звукового сигнала. Технический результат - обеспечение генерирования интерполированных функций HRTF.

Дисплей и устройство вывода звука // 2559748

Изобретение относится к области видео/аудио воспроизведения. Технический результат - сохранение качества звука, который вызывает высокое ощущение реальности.

Система стереотелевидения // 2525757

Изобретение относится к технике радиосвязи и может быть использовано для цифрового телевещания. Технический результат - снижение разрядности передаваемых кодов видеосигналов и звука в 1,6 раза, введение на передающей стороне цифровых микрофонов, на приемной стороне повышение разрешения экранов в два раза, достигаемое получением трех цветовых тонов R.G.B пикселя из одной излучающей ячейки.

Стереофоническое кодирование на основе mdct с комплексным предсказанием // 2525431

Изобретение относится к средствам для стереофонического кодирования и декодирования с использованием комплексного предсказания в частотной области. Технический результат заключается в повышении скорости кодирования в диапазоне высоких скоростей передачи битов.

Носитель записи, устройство воспроизведения и интегральная схема // 2520403

Группа изобретений относится к технологии для воспроизведения стереоскопического видео и, в частности, к выделению видеопотока на носителе записи. Техническим результатом является повышение эффективности использования запоминающего устройства для устройства воспроизведения за счет уменьшения емкости буфера, необходимой для стереоскопического воспроизведения.

Усовершенствованное стереофоническое кодирование на основе комбинации адаптивно выбираемого левого/правого или среднего/побочного стереофонического кодирования и параметрического стереофонического кодирования // 2520329

Изобретение относится к средствам кодирования и декодирования звуковых сигналов. Технический результат заключается в повышении качества кодирования сигнала.

Устройство отображения с объектно-ориентированным 3-мерным представлением координат места возникновения звука // 2495539

Предметом изобретения является устройство отображения с объектно-ориентированным 3-мерным представлением координат места возникновения звука, в котором звуки передаются через динамик, расположенный в соответствии с координатами объекта в матричной акустической системе, образованной большим множеством динамиков, располагаемых позади устройства отображения, во взаимодействии с поведением объекта, изображение которого выведено на экран устройства отображения.

Улучшение звукового сигнала fm-стереофонического радиоприемника путем использования параметрического стереофонического кодирования // 2491763

Изобретение относится к устройству для улучшения стереофонического звукового сигнала FM-стереофонического радиоприемника. .

Устройство объемного цветового отображения звуковых стереосигналов // 2473182

Изобретение относится к устройствам цветомузыки и может быть использовано для перевода двухканальной стереофонии в цветовые образы. .

Устройство и способ для декодирования кодированного аудиосигнала с использованием фильтра разделения вокруг частоты перехода // 2640634

Изобретение относится к средствам для декодирования кодированного аудиосигнала. Технический результат заключается в обеспечении возможности кодирования аудиосигналов в широком диапазоне скоростей передачи битов. Устройство для декодирования кодированного аудиосигнала, содержащего кодированный базовый сигнал, содержит: базовый декодер для декодирования кодированного базового сигнала, чтобы получать декодированный базовый сигнал; модуль формирования фрагментов для формирования одного или более спектральных фрагментов, имеющих частоты, не включенные в декодированный базовый сигнал, с использованием спектральной части декодированного базового сигнала; и фильтр разделения для спектральной фильтрации для разделения декодированного базового сигнала и первого частотного фрагмента, имеющего частоты, идущие от частоты заполнения интервалов отсутствия сигнала до верхней граничной частоты, либо для спектральной фильтрации для разделения первого частотного фрагмента и второго частотного фрагмента. 3 н. и 12 з.п. ф-лы, 35 ил.