Извлечение реверберирующего звука с использованием микрофонных массивов

Изобретение относится к области акустического анализа. Технический результат – обеспечение захвата рассеянного звука, поступающего на микрофонный массив со всех направлений, путем получения лучшей диаграммы направленности фильтра рассеянного звука. Способ содержит этап, на котором оценивают пространственную когерентность между первым участком рассеянного звука в первом микрофонном сигнале и вторым участком рассеянного звука во втором микрофонном сигнале. Первый микрофонный сигнал захватывается первым микрофоном, а второй микрофонный сигнал захватывается вторым микрофоном, который расположен на расстоянии от первого микрофона. Способ дополнительно содержит этап, на котором определяют линейное ограничение для коэффициентов фильтрации фильтра рассеянного звука, причем линейное ограничение основано на пространственной когерентности. Способ также содержит этап, на котором вычисляют по меньшей мере одно из статистики сигналов и статистики шумов в отношении первого микрофонного сигнала и второго микрофонного сигнала. Способ также содержит этап, на котором определяют коэффициенты фильтрации фильтра рассеянного звука путем решения оптимизационной задачи в отношении по меньшей мере одного из статистики сигналов и статистики шумов, с учетом линейного ограничения для коэффициентов фильтрации. 3 н. и 12 з.п. ф-лы, 8 ил.

 

Нижеследующее изобретение относится к области акустического анализа, записи пространственного звука, обработке сигналов микрофонных массивов, и пространственной фильтрации. Некоторые варианты осуществления настоящего изобретения относятся к способу, который может использоваться для определения коэффициентов фильтрации фильтра рассеянного звука, т.е. фильтра для извлечения рассеянного звука (реверберирующего звука) из записей с использованием микрофонного массива. Некоторые варианты осуществления относятся к соответствующей компьютерной программе. Некоторые варианты осуществления относятся к устройству, которое может быть использовано для определения коэффициентов фильтрации фильтра рассеянного звука.

Захват звука с использованием микрофонного массива в реверберирующих средах обычно направлен на захват прямого звука от источников звука, при ослаблении шума и реверберации. Для многих применений было бы выгодным, если бы можно было также извлекать реверберирующий звук, при подавлении прямого звука и шума. Например, в пространственном воспроизведении звука [Pulkki2007, Thiergart2013, Kowalczyk2013], реверберация, присутствующая на стороне записи, должна быть воспроизведена на стороне воспроизведения для воссоздания необходимого стереофонического эффекта. Кроме того, при обеспечении оценки реверберирующего звука, мы можем вычислить параметры, такие как отношение сигнал-реверберация или мощность реверберирующего звука, которые представляют важную информацию для различных других применений.

В то время как оценка компонентов прямого звука (например, с использованием разделения источников, дереверберации, или подавления шума) хорошо освещена в литературе, существует лишь небольшое количество методик для извлечения реверберирующего звука. Обычно реверберация моделируется в виде (изменяющегося во времени) рассеянного звукового поля. Для извлечения рассеянного звука, в последнее время использовались одноканальные фильтры (например, в [Pulkki2007, Thiergart2013]), которые имеют плохую производительность, когда активно множество источников, или для сигналов, подобных сигналам переходных процессов. Лучшая производительность может быть достигнута с использованием многоканальных фильтров (например, [Kowalczyk2013, Thiergart2013b]). К сожалению, существующие в настоящее время многоканальные фильтры являются неоптимальными и не обеспечивают подходящую диаграмму направленности для захвата рассеянного звука.

Поэтому желательно обеспечить фильтр рассеянного звука, имеющий улучшенную производительность в отношении извлечения рассеянного звука и/или подавления прямого звука. Также, может быть желательным, чтобы фильтр рассеянного звука имел диаграмму направленности, которая является в высшей степени всенаправленной, за исключением направлений поступления компонентов прямого звука. В высшей степени всенаправленная характеристика направленности является желательной, поскольку рассеянный звук поступает на микрофонный массив со всех направлений.

Предложен способ, который содержит определение линейного ограничения для коэффициентов фильтрации фильтра рассеянного звука. Линейное ограничение основано на пространственной когерентности между первым участком рассеянного звука в первом микрофонном сигнале и вторым участком рассеянного звука во втором микрофонном сигнале. Первый микрофонный сигнал захвачен первым микрофоном, а второй микрофонный сигнал захвачен вторым микрофоном, расположенным на расстоянии от первого микрофона, известным способом. Способ также содержит вычисление по меньшей мере одного из направления поступления по меньшей мере одного прямого звука, статистики сигналов в отношении первого и второго микрофонных сигналов и статистики шумов в отношении первого и второго микрофонных сигналов. Способ дополнительно содержит определение коэффициентов фильтрации фильтра рассеянного звука путем решения оптимизационной задачи в отношении по меньшей мере одного из направления поступления по меньшей мере одного прямого звука, статистики сигналов и статистики шумов, с учетом линейного ограничения для коэффициентов фильтрации.

Варианты осуществления обеспечивают компьютерную программу для реализации вышеописанного способа, когда обеспечивается ее исполнение на компьютере или процессоре обработки сигналов.

Дополнительные варианты осуществления обеспечивают устройство, содержащее вычислитель линейного ограничения, выполненный с возможностью определения линейного ограничения для коэффициентов фильтрации фильтра рассеянного звука. Линейное ограничение основано на пространственной когерентности между первым участком рассеянного звука в первом микрофонном сигнале и вторым участком рассеянного звука во втором микрофонном сигнале. Первый микрофонный сигнал захвачен или был захвачен первым микрофоном, а второй микрофонный сигнал захвачен или был захвачен вторым микрофоном, расположенным на расстоянии от первого микрофона, известным способом. Устройство также содержит вычислитель статистики, выполненный с возможностью вычисления по меньшей мере одного из направления поступления по меньшей мере одного прямого звука, статистики сигналов в отношении первого и второго микрофонных сигналов и статистики шумов в отношении первого и второго микрофонных сигналов и второго микрофонного сигнала. Устройство дополнительно содержит вычислитель коэффициентов фильтрации, выполненный с возможностью определения коэффициентов фильтрации фильтра рассеянного звука, путем решения оптимизационной задачи в отношении по меньшей мере одного из направления поступления по меньшей мере одного прямого звука, статистики сигналов и статистики шумов, с учетом линейного ограничения для коэффициентов фильтрации.

Варианты осуществления основаны на понимании того, что фильтр рассеянного звука может быть определен с учетом по меньшей мере одного линейного ограничения, которое относится к участкам рассеянного звука микрофонных сигналов.

Далее варианты осуществления настоящего изобретения описаны более подробно со ссылкой на чертежи, на которых:

Фиг. 1 показывает схематичную блок-схему методики для извлечения рассеянного звука с использованием одноканального фильтра;

Фиг. 2 показывает схематичную блок-схему методики для извлечения рассеянного звука с использованием многоканального фильтра;

Фиг. 3 показывает схематичную блок-схему предлагаемого изобретения согласно первому примеру для реализации;

Фиг. 4 показывает схематичную блок-схему предлагаемого изобретения согласно второму примеру для реализации;

Фиг. 5 показывает схематичную блок-схему предлагаемого изобретения согласно третьему примеру для реализации;

Фиг. 6 показывает пример диаграммы направленности захвата, полученной в результате применения методики для извлечения рассеянного звука с использованием фильтра, согласно фиг. 2;

Фиг. 7 показывает пример диаграммы направленности захвата, полученной в результате применения методики для извлечения рассеянного звука с использованием фильтра, согласно фиг. 4; и

Фиг. 8 схематично показывает микрофонный массив и разные звуковые сигналы, которые захвачены микрофонным массивом.

Термины «прямой звук» и «рассеянный звук» определены следующим образом.

Прямой звук: звуки, которые поступают в микрофоны, главным образом, по конкретному выраженному направлению. Прямой звук может представлять собой, например, звук, поступающий прямо от источника звука к микрофону, или отдельное отражение помещения. Прямые звуки могут быть, например, плоскими волнами или сферическими волнами с конкретным направлением поступления. Когда направление поступления прямого звука известно, можно вычислить относительную передаточную функцию прямого звука между микрофонами при условии, что геометрия микрофонов известна.

Рассеянный звук: звук, который поступает в микрофоны со всех направлений. Рассеянный звук может представлять собой, например, позднюю реверберацию, присутствующую в помещении. Обычно, никакие выраженные направления поступления не могут быть связаны с рассеянным звуком (изотропное звуковое поле), т.е. звук поступает с одинаковой средней мощностью со всех направлений. Кроме того, необходимо предположить, что относительные передаточные функции рассеянного звука между микрофонами являются случайными и ненаблюдаемыми. Однако, средние относительные передаточные функции рассеянного звука между микрофонами обычно известны для конкретных расположений микрофонов и моделей рассеянного поля или могут быть измерены.

Нижеследующие подсекции являются кратким изложением существующих методик для извлечения рассеянного звука (или реверберирующего звука) из микрофонной записи. Далее, М означает количество используемых микрофонов. Мы предполагаем, что все микрофонные сигналы были преобразованы в частотно-временную область, где k является индексом частоты, а n является индексом времени (следует отметить, что обычно фильтры могут также применяться во временной области). Микрофоны захватывают L плоских волн (называемых прямым звуком), распространяющихся в рассеянном поле. DOA l-ой плоской волны представлено единичным вектором нормали . В частотно-временной области, сигнал m-го (всенаправленного) микрофона может быть представлен следующим образом:

Здесь, является звуковым давлением l-ой плоской волны, является рассеянным звуком, является стационарным шумом (например, собственным шумом или фоновым шумом), и является вектором, описывающим положение микрофона (m-го микрофона) в данной системе координат.

Целью настоящего изобретения является оценка в положении .

Одноканальные фильтры извлекают рассеянный звук из единственного микрофонного сигнала (). Такие фильтры используются, например, в Направленном звуковом кодировании [Pulkki2007] или в Виртуальном микрофоне [Thiergart2013].

Оценка рассеянного звука определяется путем умножения одного из микрофонных сигналов, например, микрофонного сигнала первого микрофона , на фильтр , например,

Обычно, фильтр является фильтром Винера, который может быть представлен в виде

где является мощностью рассеянного звука, а является мощностью плоских волн и стационарного шума. В некоторых применениях, квадратный корень из фильтра Винера (т.е. квадратный корень из H) используется вместо фильтра Винера. Следует отметить, что для вычисления , необходимо оценить мощность и . Для этой цели, мы можем рассмотреть, например, отношение сигнал-рассеяние (SDR), которое может быть оценено, как объяснено в [Thiergart2012]. В качестве альтернативы, может быть найден посредством оценки, так называемой диффузности, как описано в [Pulkki2007, Thiergart2013]. Оценка SDR или диффузности обычно требует более чем одного микрофона. Тем не менее, рассеянный звук, в конце концов, достигается посредством фильтрации единственного микрофонного сигнала.

Пример системы для извлечения рассеянного звука с использованием одноканального фильтра показан на фиг. 1. Во-первых, SDR (или, альтернативно, диффузность) оценивается на основании множества микрофонных сигналов. Во-вторых, вычисляется фильтр на основании этой информации. Наконец, фильтр умножается на единственный микрофонный сигнал для получения оценки рассеянного звука.

Многоканальные фильтры учитывают микрофонов. Такие фильтры использовались, например, в [Thiergart2013b, Kowalczyk2013]. Для вывода следующих формул, представим M микрофонных сигналов вектором . Рассеянный звук в m-ом микрофоне оценивается через линейную комбинацию M микрофонных сигналов, т.е.

где является комплексным весовым вектором длины M. Веса должны быть вычислены таким образом, чтобы была получена точная оценка рассеянного звука.

Непосредственным способом нахождения подходящего фильтра является вычисление весов таким образом, чтобы L плоских волн были подавлены, при минимизации стационарного шума , который содержится в микрофонных сигналах. В математическом выражении, веса фильтров представляются в виде

,

с учетом линейных ограничений

Здесь, является PSD-матрицей (матрицей спектральной плотности мощности) стационарного шума, т.е. , которая может быть оценена с использованием общеизвестных методик, например, когда отсутствует рассеянный звук и прямой звук. Кроме того, является так называемым вектором распространения. Его элементами являются относительные передаточные функции l-ой плоской волны от m-го микрофона к другим микрофонам. Следовательно, является вектором-столбцом длины M (следует понимать, что только рассеянный звук в m-ом микрофоне оценивается посредством wm–взвешенной линейной комбинации M микрофонных сигналов; рассеянный звук в других микрофонах является, по существу, излишним, поскольку эти сигналы связаны через относительные передаточные функции от m-го микрофона к другим микрофонам и могут быть вычислены таким образом, при необходимости). Элементы зависят от DOA l-ой плоской волны. Это означает, что является функцией DOA l-ой плоской волны, т.е. . Поскольку зависит от прямого звука (т.е. плоских волн), то далее он упоминается как ограничение прямого звука. С использованием этого пространственного фильтра мы, по существу, создаем формирователь луча, который имеет диаграмму направленности захвата с нулями в направлениях L плоских волн. В результате, все плоские волны подавляются. К сожалению, решение вышеупомянутой задачи минимизации приводит к нулевым весам , поскольку мы имеем только нулевые ограничения, т.е. рассеянный звук не может быть извлечен.

Для преодоления этой проблемы и предотвращения нулевых весов фильтра, [Thiergart2013b, Kowalczyk2013] предлагает использовать тот же фильтр, но с дополнительным ограничением, представленным в виде

где является вектором распространения, который соответствует конкретному DOA , по которому никакие плоские волны не поступают. С использованием этого ограничения, можно предотвратить нулевые веса фильтров, но, все же, нельзя захватить нежелательный прямой звук. В результате, с использованием этого фильтра, захватывается только рассеянный звук и некоторый шум, а все плоские волны затухают. В [Thiergart2013b], DOA , которому соответствует вектор , находится путем выбора направления, которое имеет наибольшее угловое расстояние до всех DOA плоских волн. Например, если единственная плоская волна поступает под углом 0 градусов, то тогда соответствует 180 градусам. К сожалению, DOA не гарантирует, что мы получаем оценку рассеянного звука с настолько малым шумом, насколько это возможно. Кроме того, полученная в результате диаграмма направленности захвата является не очень оптимальной для захвата рассеянного звука, поскольку она становится остронаправленной при более высоких частотах. Это является недостатком, если целью является захват рассеянного звука со всех направлений.

Пример полученной диаграммы направленности захвата показан на фиг. 6. Здесь, два прямых звука поступают с двух азимутальных направлений 51° и 97°. Чертеж показывает полученную диаграмму направленности захвата при частоте 2,8 кГц при использовании однородного линейного массива с 16 микрофонами с интервалами 5 см между микрофонами. Диаграмма направленности захвата имеет нули точно для 51° и 97° и высокий коэффициент усиления для 180°, что соответствует направлению . Кроме того, диаграмма направленности захвата имеет множество других пространственных нулей или низких коэффициентов усиления почти для всех других направлений. Эта диаграмма направленности захвата не подходит для захвата рассеянного звука, который поступает со всех направлений. Следует снова отметить, что ограничения прямого звука прямо связаны с DOA прямых звуков. Необходимая диаграмма направленности захвата, которая не может быть получена с использованием пространственного фильтра в этой подсекции, показана на фиг. 7. Эта диаграмма направленности захвата имеет два пространственных нуля для DOA прямых звуков, а для иных направлений является почти всенаправленной. Эта диаграмма направленности захвата обеспечена с использованием предлагаемого фильтра, который описан ниже со ссылкой на фиг. 7.

Замкнутое по форме решение для вычисления весов фильтра с учетом вышеупомянутых ограничений может быть найдено в [VanTrees2002]. Для вычисления пространственного фильтра, необходимо знать DOA L плоских волн, а именно, вычислить ограничения прямого звука и . Эта DOA-информация может быть определена с использованием общеизвестных узкополосных алгоритмов оценки DOA, таких как Root MUSIC или ESPRIT. Следует дополнительно отметить, что элементы являются обычно комплексными, и обычно должен быть пересчитан для каждого k и n, поскольку следует предположить, что DOA плоских волн являются сильно изменяющимися во времени. Сильная флуктуация может привести к слышимым шумам.

Пример системы для извлечения рассеянного звука с использованием представленного многоканального фильтра показан на фиг. 2. После преобразования микрофонных сигналов в частотно-временную область, мы оцениваем стационарный шум и DOA L плоских волн. Затем, на основании DOA-информации, достигается линейных ограничений прямого звука ( и ). На основе этой информации, могут быть вычислены веса фильтра. Применение этих весов к микрофонным сигналам дает необходимую оценку рассеянного звука. Из этого описания ясно, что полученный фильтр действительно зависит только от прямого звука (т.е. от DOA и соответствующих относительных передаточных функций плоских волн между микрофонами, соответственно), а не от рассеянного звука. Это означает, что фильтр не учитывает потенциально доступную информацию в отношении рассеянного звука, даже если его используют для оценки рассеянного звука.

В настоящем изобретении, мы предлагаем новый многоканальный фильтр для извлечения реверберирующего звука, который преодолевает ограничения вышеупомянутых фильтров. Предлагаемый пространственный фильтр характеризуется диаграммой направленности, которая приближается к всенаправленной диаграмме направленности, за исключением направлений поступления (direction-of-arrival - DOA) прямого звука, для которых она показывает пространственные нули. Это представляет в высшей степени необходимую способность захвата рассеянного звука со всех направлений с низкими искажениями.

Далее, мы предлагаем многоканальный фильтр для оценки рассеянного звука в положении с использованием микрофонов. В отношении многоканальных фильтров, описанных выше, давление рассеянного звука в m-ом микрофоне оценивается посредством выполнения линейной комбинации микрофонных сигналов, т.е.

.

Весовой вектор , который предложен далее, минимизирует конкретную целевую функцию и является линейно ограниченным, подобно многоканальным фильтрам, описанным выше.

Однако, в отличие от многоканальных фильтров, описанных выше, мы предлагаем использовать линейное ограничение, которое не зависит от прямого звука (т.е. от L плоских волн). Точнее, предлагаемое новое ограничение не является функцией DOA плоских волн или соответствующих относительных передаточных функций плоских волн между микрофонами, соответственно.

Напротив, предлагаемое новое ограничение зависит от статистической информации о рассеянном звуке, т.е. предлагаемое новое ограничение зависит от относительных передаточных функций рассеянного звука между микрофонами. Мы покажем далее, что предлагаемое новое ограничение является функцией когерентности или корреляции рассеянного звука между микрофонами. Эта когерентность соответствует средней относительной передаточной функции рассеянного звука между микрофонами.

Предлагаемый пространственный фильтр достигается минимизацией конкретной целевой функции, удовлетворяя ограничение отсутствия искажений для рассеянного звука. Это ограничение соответствует относительной передаточной функции рассеянного звука между микрофонами. В математическом выражении, фильтр вычисляется следующим образом

,

с учетом линейного ограничения

.

Здесь, J является целевой функцией, подлежащей минимизации фильтром. Целевая функция может быть, например, мощностью стационарного шума на выходе фильтра, энергией помехи на выходе фильтра, или квадратичной ошибкой оцененного рассеянного звука. Примеры для J будут обеспечены в вариантах осуществления. Вектор ограничения можно представить в виде . m'-ый элемент является относительной передаточной функцией рассеянного звука между микрофонами m и m'. Эту относительную передаточную функцию можно представить в виде

.

Следует отметить, что m-ый элемент равен 1. С использованием этого ограничения, мы захватываем рассеянный звук без искажений. Фактически, пусть является вектором, содержащим записанный рассеянный звук. С использованием уравнений, приведенных выше, этот вектор может быть записан в следующем виде

.

Рассеянный звук на выходе фильтра можно представить в виде выражения , которое идентично , поскольку . Таким образом, этот фильтр захватывает рассеянный звук без искажений. Относительные передаточные функции в обычно не могут быть оценены на практике, поскольку они являются, по существу, случайными, т.е. мы имеем разную реализацию передаточной функции для каждого k и n. Таким образом, вычисляется как средняя относительная передаточная функция между микрофонами m и m', т.е.

.

Эта средняя относительная передаточная функция соответствует так называемой пространственной когерентности рассеянного звука между микрофонами m и m', которая определяется в качестве

,

где (.)* означает комплексно сопряженную величину. Эта пространственная когерентность описывает корреляцию рассеянного звука между микрофонами m и m' в частотной области. Эта когерентность зависит от конкретного рассеянного звукового поля. Когерентность может быть измерена заранее для данного помещения. Альтернативно, когерентность известна из теории конкретных рассеянных звуковых полей [Elko2001]. Например, для сферически изотропного рассеянного звукового поля, которое часто рассматривается на практике, мы имеем

,

где sinc означает sinc-функцию, f является акустической частотой для данного частотного диапазона k, и c является скоростью звука. Кроме того, является расстоянием между микрофонами m и m'. При использовании пространственной когерентности в качестве линейного ограничения , которое представляет среднюю относительную передаточную функцию рассеянного звука между микрофонами, полученный фильтр является эквивалентным сумме многих линейно ограниченных пространственных фильтров, причем каждый из этих фильтров захватывает разную реализацию случайного рассеянного звука без искажений.

С использованием ограничения рассеянного звука, введенного выше, мы получаем пространственный фильтр, который захватывает рассеянный звук одинаково хорошо со всех направлений. Это является отличием от многоканальных фильтров, описанных выше, которые захватывают звук, главным образом, по одному направлению, а именно, по направлению, которому соответствует выбранный вектор распространения .

Следует отметить, что ограничение рассеянного звука , концептуально, сильно отличается от ограничений прямого звука и . Таким образом, новый фильтр, предложенный в этом разделе, является, концептуально, сильно отличающимся от многоканальных фильтров, описанных выше.

Блок-схема предложенного изобретения показана на фиг. 3. Во-первых, M микрофонные сигналы преобразуются в частотно-временную область (или другую подходящую область для обработки сигналов) с использованием банка (101) фильтров (filterbank - FB). Во-вторых, мы вычисляем вектор линейного ограничения рассеянного звука в блоке (102). Вектор ограничения рассеянного звука оценивается либо на основании сигнала, либо он соответствует, например, теоретической пространственной когерентности для конкретного предлагаемого рассеянного поля, как упомянуто выше. В блоке (104), мы оцениваем конкретную статистику (например, статистику шумов) на основании микрофонных сигналов. Эта информация, которая обычно представляется в виде PSD-матрицы , используется для генерации целевой функции J, которая должна быть минимизирована фильтром. Веса фильтра, который минимизирует целевую функцию с учетом ограничения рассеянного звука, вычисляются в блоке (103). Наконец, веса применяются к микрофонным сигналам, что обеспечивает в результате необходимую оценку рассеянного звука. Конкретные реализации настоящего изобретения представлены в нижеследующих вариантах осуществления.

МИНИМИЗАЦИЯ ВЫХОДНОЙ МОЩНОСТИ, УДОВЛЕТВОРЯЮЩЕЙ ОГРАНИЧЕНИЮ РАССЕЯННОГО ЗВУКА

В этом варианте осуществления, мы определяем пространственный фильтр, который минимизирует всю выходную мощность фильтра с учетом ограничения рассеянного звука. Ограничение рассеянного звука обеспечивает, то что рассеянный звук сохраняется пространственным фильтром, в то время как остальные части сигнала (нежелательный стационарный шум и плоские волны) минимизируются. Веса фильтра вычисляются следующим образом:

,

с учетом линейного ограничения

.

Замкнутое по форме решение для этого фильтра приведено в [VanTrees2002] в виде

.

Здесь, является PSD-матрицей микрофонных сигналов, которая может быть вычислена следующим образом:

,

где является вектором, содержащим микрофонные сигналы. На практике, математическое ожидание аппроксимируется, например, путем временного усреднения. Кроме того, элементы вектора ограничения соответствуют пространственной когерентности рассеянного звука между микрофонами m и m', т.е.

.

Фактически, пространственная когерентность не должна зависеть от времени (а именно, ), следовательно, пространственная когерентность может быть оценена заранее или может предполагать теоретическое значение. Пространственная когерентность может быть оценена либо на основании микрофонных сигналов (во время периодов, когда присутствует только рассеянный звук) с использованием

,

либо может быть представлена в виде априорной информации, предполагающей конкретное рассеянное звуковое поле. В последнем случае, мы используем, например, пространственную когерентность для сферически изотропного рассеянного звукового поля, т.е.

.

Следует отметить, что sinc-функция может быть заменена другими функциями, в зависимости от предполагаемого звукового поля. Для разных рассеянных звуковых полей существуют разные функции когерентности, которые априори известны. Примеры могут быть найдены в [Elko2001].

Блок-схема этого варианта осуществления показана на фиг. 3. После преобразования микрофонных сигналов с использованием банка (101) фильтров, мы вычисляем сигнальную PSD-матрицу в блоке (104) оценки статистики сигналов. Кроме того, мы вычисляем вектор линейного ограничения рассеянного звука в блоке (102), либо на основании сигнала, либо с использованием априорной информации, предполагающей конкретное рассеянное звуковое поле. Веса фильтра, затем, вычисляются в блоке (103). Умножение весов на микрофонные сигналы дает необходимую оценку рассеянного звука.

Фильтр, вычисленный в этом варианте осуществления, имеет следующие преимущества по сравнению с другим пространственным фильтром (например, фильтрами, описанными в предшествующем уровне техники):

- Поскольку мы минимизируем весь выходной сигнал, фильтр обеспечивает оптимальное соотношение между затуханием L плоских волн и стационарным шумом.

- Необходимую сигнальную PSD-матрицу , и, таким образом, фильтр, легко вычислить на практике.

- Не требуется никакой информации о DOA L плоских волн.

ЛИНЕЙНО ОГРАНИЧЕННЫЙ ФИЛЬТР С МИНИМАЛЬНОЙ ДИСПЕРСИЕЙ

Этот вариант осуществления представляет собой комбинацию новой методики и методики предшествующего уровня техники в отношении многоканальных фильтров, описанных выше в соответствии с фиг. 2. В этом варианте осуществления, мы определяем линейно ограниченный пространственный фильтр, который минимизирует стационарный шум на выходе фильтра, с учетом рассеянного ограничения и дополнительных направленных ограничений. Веса фильтра вычисляются в виде

,

с учетом линейных ограничений

и

Ясно, что фильтр минимизирует только стационарный шум на выходе. Нежелательные плоские волны подавляются с использованием вторых линейных ограничений (как объяснено выше для многоканальных фильтров, фиг. 2). Эти дополнительные ограничения, по сравнению с фильтром, минимизирующим выходную мощность, в соответствии с фиг. 3, обеспечивают еще более сильное подавление создающих помехи плоских волн. Полученный в результате фильтр, тем не менее, сохраняет рассеянный звук благодаря первому линейному ограничению. Замкнутое по форме решение для этого фильтра, которое может быть вычислено на практике, может быть представлено в виде

Здесь, вектор является матрицей ограничений, содержащей линейные ограничения, определенные выше, и (O является нулевым вектором длины L) являются соответствующими характеристиками. В отношении многоканального фильтра, показанного на фиг. 2, векторы зависят от DOA L плоских волн и могут быть вычислены общеизвестным из литературы способом [VanTrees2002]. Напротив, элементы описывают корреляцию или когерентность рассеянного звука между микрофонами. Элементы вычисляются, как объяснено в соответствии с фиг. 3. Кроме того, является PSD-матрицей стационарного шума. Эта PSD-матрица может быть оценена, например, во время речевых пауз. Если стационарные шумы в разных микрофонах являются взаимно независимыми, то мы можем просто заменить матрицей тождественности размера M на M.

Блок-схема этого варианта осуществления показана на фиг. 4. После преобразования микрофонных сигналов с использованием банка (101) фильтров, мы вычисляем PSD-матрицу стационарного шума в блоке (104) оценки статистики шумов. Кроме того, мы вычисляем вектор линейного ограничения рассеянного звука в блоке (102), либо на основании сигнала, либо с использованием априорной информации, предполагающей конкретное рассеянное звуковое поле. В блоке (105), мы оцениваем DOA L плоских волн. На основании этой информации, мы вычисляем ограничения прямого звука в блоке (106). Вычисленная информация передается в блок (103) вычисления фильтра, который вычисляет веса фильтра с использованием замкнутого по форме решения, представленного выше. Умножение весов на микрофонные сигналы дает необходимую оценку рассеянного звука.

Пример полученной диаграммы направленности захвата для этого фильтра показан на фиг. 7. Здесь, два прямых звука поступают с двух азимутальных направлений 51° и 97°. Чертеж показывает полученную диаграмму направленности захвата при частоте 2,8 кГц при использовании однородного линейного массива с 16 микрофонами с интервалами 5 см между микрофонами. Диаграмма направленности захвата имеет нули точно для 51° и 97°. В противном случае она является почти всенаправленной. Это является главным преимуществом перед пространственным фильтром предшествующего уровня техники, показанным на фиг. 2, который создает пространственный фильтр на фиг. 6.

Фильтр, вычисленный в этом варианте осуществления, имеет следующие преимущества по сравнению с другим пространственным фильтром (например, фильтрами, описанными в предшествующем уровне техники):

- Сильное затухание плоских волн благодаря ограничениям прямого звука.

- Почти всенаправленная диаграмма направленности захвата, которая необходима для захвата рассеянного звука.

КОМБИНИРОВАННАЯ МЕТОДИКА

Пространственные фильтры, показанные на фиг. 3 и 4, в общем, обеспечивают хорошую производительность на практике. Однако, они также страдают от конкретных недостатков. Например, фильтр, показанный на фиг. 3, обычно не подавляет прямой звук полностью. Оставшаяся мощность прямого звука может привести к нежелательным эффектам во время воспроизведения пространственного звука. Напротив, пространственный фильтр фиг. 4 обеспечивает сравнительно плохую устойчивость к стационарному шуму при низких частотах. Далее, мы объединяем пространственные фильтры на фиг. 3 и 4 для использования преимуществ обоих пространственных фильтров одновременно смягчая недостатки. В результате, мы получаем пространственный фильтр, который характеризуется хорошим подавлением помех (подавлением прямого звука) и высокой устойчивостью к стационарному шуму.

Методика, предлагаемая ниже, представляет собой так называемый Параметрический многоканальный фильтр Винера (parametric multi-channel Wiener filter - PMWF), который может быть масштабирован между так называемым пространственным фильтром с Минимальной среднеквадратичной погрешностью (minimum mean square error - MMSE) и пространственным фильтром на фиг. 3. Дополнительно, пространственный фильтр на фиг. 4 используется для оценки конкретных необходимых величин.

Весовой вектор предлагаемого PMWF вычисляется в виде

,

с учетом

,

где является максимальной квадратичной абсолютной погрешностью оцениваемого рассеянного звука. Решение этой оптимизационной задачи приводит к

,

где мы определяем как

Здесь, является определяемым пользователем управляющим параметром. Для , мы получаем MMSE пространственный фильтр, который минимизирует среднеквадратичную погрешность оцениваемого рассеянного звука. Для , мы получаем пространственный фильтр, предлагаемый на фиг. 3. Для промежуточных значений , мы имеем масштабирование между этими двумя пространственными фильтрами. Меньшее обеспечивает лучший шум и подавление помех, в то время как более высокое обеспечивает оценку рассеянного звука с меньшими искажениями. Следует отметить, что элементы вычисляются, как объяснено в соответствии с фиг. 3. Мощность рассеянного звука может быть вычислена с использованием пространственного фильтра, предлагаемого на фиг. 4, который обеспечивает очень хорошее подавление плоских волн. Пусть означает пространственный фильтр на фиг. 4 для оценки рассеянного звука в первом микрофоне. Учитывая мощность рассеянного звука в первом микрофоне может быть получена, например, как описано в [Thiergart2013b], т.е.

или с использованием методики с управлением по решению, как объяснено в [Kowalczyk2013]. В предшествующей формуле, является матрицей пространственной когерентности для рассеянного звука. -ый элемент является пространственной когерентностью между микрофонами m и m'. Эта пространственная когерентность уже была определена выше.

Блок-схема этого варианта осуществления показана на фиг. 5. После преобразования микрофонных сигналов с использованием банка (101) фильтров, мы вычисляем микрофонную PSD-матрицу и шумовую PSD-матрицу в блоке (104). Кроме того, мы вычисляем линейное ограничение рассеянного звука в блоке (102), либо на основании сигнала, либо с использованием априорной информации, предполагающей конкретное рассеянное звуковое поле. В блоке (105), мы оцениваем DOA L плоских волн. На основании этой информации, мы вычисляем ограничения прямого звука в блоке (106). Эти ограничения используются в (107) вместе с для вычисления весов . Мощность рассеянного звука вычисляется в (108) на основании и . Конечные веса пространственного фильтра могут быть, затем, вычислены в (103) с использованием , , и . С использованием параметра , можно масштабировать пространственный фильтр между MMSE-фильтром и PMWF. Умножение весов на микрофонные сигналы дает необходимую оценку рассеянного звука.

Фиг. 8 схематично показывает микрофонный массив, содержащий M микрофонов. Микрофонный массив подвергается воздействию звукового поля, содержащего участки прямого звука и участки рассеянного звука. Участки прямого звука представлены на фиг. 8 посредством L источников звука от Xl=1 до Xl=L, каждый из которых, как предполагается, генерирует, по существу, плоскую волну в месте расположения микрофонного массива. Направление распространения каждой плоской волны (в месте расположения микрофонного массива) указано на фиг. 8 посредством векторов n1-nL. Участки прямого звука являются обычно функцией местоположения dm. Рассеянный звук Xd(k, n, dm) может моделировать, например, реверберацию в помещении. Рассеянный звук, как предполагается, генерируется посредством бесконечной суммы плоских волн со случайными фазами, случайной амплитудой, и случайными DOA. Это означает, что рассеянный звук генерируется посредством бесконечного количества источников, случайно распределенных по звуковой сцене. Эти источники звука моделируют бесконечное количество отражений помещения, которые генерируют позднюю реверберацию.

Отдельный микрофонный сигнал, например, для m-ого микрофона, Xm(k, n), является комбинацией L участков прямого звука от Xl=1 до Xl=L, участка рассеянного звука Xd, и шума Xn, т.е.

.

Относительные передаточные функции B1,m, B2,m,..., Bm’,m,..., BM,m для рассеянного звука между другими микрофонами и m-ым микрофоном схематично показаны на фиг. 8. Относительная передаточная функция Bm,m от m-ого микрофона к самому себе (не показана на фиг. 8) является обычно равной 1.

Нижеследующий список обеспечивает краткий обзор некоторых аспектов, которые были описаны выше:

- Прием по меньшей мере двух микрофонных сигналов.

- Преобразование микрофонных сигналов в частотно-временную область или другую подходящую область.

- Вычисление линейного ограничения рассеянного звука в виде функции корреляции или когерентности рассеянного звука между микрофонами.

- Вычисление статистики сигналов/шумов.

- В некоторых вариантах осуществления: оценка DOA прямых звуков и вычисление ограничений прямого звука, которые представляют собой относительные передаточные функции прямых звуков между микрофонами.

- В некоторых вариантах осуществления: вычисление вспомогательного фильтра и оценка мощности рассеянного звука.

- Вычисление весов пространственного фильтра для извлечения рассеянного звука с использованием полученной статистики сигналов/шумов и необязательной информации о мощности рассеянного звука, с учетом ограничения рассеянного звука.

- Выполнение линейной комбинации микрофонных сигналов с использованием вычисленных весов пространственного фильтра.

Хотя некоторые аспекты были описаны в контексте устройства, должно быть ясно, что эти аспекты также представляют собой описание соответствующего способа, где блок или устройство соответствует этапу способа или признаку этапа способа. Аналогично, аспекты, описанные в контексте способа, также представляют собой описание соответствующего блока или элемента или признака соответствующего устройства.

В зависимости от конкретных требований к реализации, варианты осуществления настоящего изобретения могут быть реализованы в аппаратном обеспечении или программном обеспечении. Реализация может быть выполнена с использованием цифровой запоминающей среды, например, гибкого диска, DVD, CD, ROM, PROM, EPROM, EEPROM или FLASH-памяти, на которой сохранены электронным способом считываемые управляющие сигналы, которые взаимодействуют (или способны взаимодействовать) с программируемой вычислительной системой таким образом, чтобы соответствующий способ выполнялся.

Некоторые варианты осуществления согласно настоящему изобретению содержат постоянный носитель данных, на котором находятся считываемые электронными средствами управляющие сигналы, которые способны взаимодействовать с программируемой вычислительной системой таким образом, чтобы один из способов, описанных здесь, выполнялся.

В общем, варианты осуществления настоящего изобретения могут быть реализованы в виде компьютерного программного продукта с использованием программного кода, причем программный код действует для выполнения одного из способов, когда компьютерный программный продукт выполняется на компьютере. Программный код может, например, храниться на машиночитаемом носителе.

Другие варианты осуществления содержат компьютерную программу для выполнения одного или более способов, описанных в материалах настоящей заявки, хранящуюся на машиночитаемом носителе.

Другими словами, вариант осуществления способа согласно изобретению является, таким образом, компьютерной программой, имеющей программный код для выполнения одного из способов, описанных в материалах настоящей заявки, когда компьютерная программа выполняется на компьютере.

Дополнительный вариант осуществления способов согласно изобретению является, таким образом, носителем данных (или цифровым запоминающим носителем, или машиночитаемым носителем), содержащим записанную на нем компьютерную программу для выполнения одного из способов, описанных в материалах настоящей заявки.

Дополнительный вариант осуществления способов согласно изобретению является, таким образом, потоком данных или последовательностью сигналов, представляющими компьютерную программу для выполнения одного из способов, описанных в материалах настоящей заявки. Поток данных или последовательность сигналов могут быть, например, выполнены с возможностью их переноса через соединение для передачи данных, например, через интернет.

Дополнительный вариант осуществления содержит средство обработки, например, компьютер или программируемое логическое устройство, выполненное с возможностью или адаптированное для выполнения одного из способов, описанных в материалах настоящей заявки.

Дополнительный вариант осуществления содержит компьютер, на котором установлена компьютерная программа для выполнения одного из способов, описанных в материалах настоящей заявки.

В некоторых вариантах осуществления может быть использовано программируемое логическое устройство (например, массив программируемых логических вентилей) для выполнения некоторых или всех функциональностей способов, описанных в материалах настоящей заявки. В некоторых вариантах осуществления, массив программируемых логических вентилей может взаимодействовать с микропроцессором для выполнения одного или более способов, описанных в материалах настоящей заявки. В общем, данные способы предпочтительно выполняются любым устройством, относящимся к аппаратному обеспечению.

Описанные выше варианты осуществления являются лишь иллюстрацией принципов настоящего изобретения. Следует понимать, что модификации и варианты схем и элементов, описанных в материалах настоящей заявки, будут понятны специалистам в данной области техники. Таким образом, предполагается, что объем данного изобретения ограничен только объемом нижеследующих пунктов формулы изобретения, а не конкретными подробностями, представленными для описания и объяснения вариантов осуществления в материалах настоящей заявки.

СПИСОК ЛИТЕРАТУРЫ

[Pulkki2007] - V. Pulkki, «Spatial sound reproduction with directional audio coding», J. Audio Eng. Soc, Том 55, № 6, страницы 503-516, июнь 2007.

[Thiergart2013] - O. Thiergart, G. Del Galdo, M. Taseska, and E. Habets, «Geometry-based spatial sound acquisition using distributed microphone arrays», Audio, Speech, and Language Processing, IEEE Transactions on, Том 21, № 12, страницы 2583-2594, декабрь 2013.

[Kowalczyk2013] - K. Kowalczyk, O. Thiergart, A. Craciun, and E. A. P. Habets, «Sound acquisition in noisy and reverberant environments using virtual», in Applications of Signal Processing to Audio and Acoustics (WASPAA), 2013 IEEE Workshop on, октябрь 2013.

[Thiergart2013b] - O. Thiergart and E. A. P. Habets, «An informed LCMV filter based on multiple instantaneous direction-of-arrival estimates», in Acoustics Speech and Signal Processing (ICASSP), 2013 IEEE International Conference on, 2013, страницы 659-663.

[Thiergart2012] - O. Thiergart, G. D. Galdo, and E. A. P. Habets, «On the spatial coherence in mixed sound fields and its application to signal-to-diffuse ratio estimation», The Journal of the Acoustical Society of America, Том 132, № 4, страницы. 2337– 2346, 2012.

[VanTrees2002] - H. L. Van Trees, Detection, Estimation, and Modulation Theory: Part IV: Array Processing. John Wiley & Sons, апрель 2002, том 1.

[Elko2001] - G. W. Elko, «Spatial coherence functions for differential micro- phones in isotropic noise fields», in Microphone Arrays: Signal Processing Techniques and Applications, под редакцией M. Brandstein и D. Ward, глава 4, 61–85 (Springer, Berlin) (2001).

1. Способ получения коэффициентов фильтрации для фильтра рассеянного звука, причём способ содержит этапы, на которых:

определяют линейное ограничение для коэффициентов фильтрации фильтра рассеянного звука, причем линейное ограничение основано на пространственной когерентности между первым участком рассеянного звука в первом микрофонном сигнале и вторым участком рассеянного звука во втором микрофонном сигнале, причем первый микрофонный сигнал захвачен первым микрофоном, а второй микрофонный сигнал захвачен вторым микрофоном, расположенным на расстоянии от первого микрофона, известным способом;

вычисляют по меньшей мере одно из направления поступления по меньшей мере одного прямого звука, статистику сигналов в отношении первого и второго микрофонных сигналов и статистику шумов в отношении первого и второго микрофонных сигналов; и

определяют коэффициенты фильтрации фильтра рассеянного звука путем решения оптимизационной задачи в отношении по меньшей мере одного из направления поступления по меньшей мере одного прямого звука, статистики сигналов и статистики шумов, с учетом линейного ограничения для коэффициентов фильтрации.

2. Способ по п. 1, дополнительно содержащий этап, на котором

обеспечивают пространственную когерентность на основании относительной передаточной функции или корреляции рассеянного звука между первым микрофоном и вторым микрофоном.

3. Способ по п. 1,

в котором пространственная когерентность основана на предшествующем измерении относительной передаточной функции или корреляции рассеянного звука для данной среды в течение периодов времени, когда никакой прямой звук не присутствует в среде.

4. Способ по п. 1,

в котором пространственная когерентность основана на теоретическом соотношении для рассеянного звука, причем соответствующее предполагаемое рассеянное звуковое поле предполагает теоретические характеристики, относящиеся к корреляции рассеянного звука между первым микрофоном и вторым микрофоном.

5. Способ по п. 1, в котором оптимизационная задача выражена посредством

,

с учетом линейного ограничения

,

где

w(k,n) является вектором коэффициентов фильтрации фильтра рассеянного звука;

w m(k,n) является решением оптимизационной задачи на основе оценки микрофонного сигнала в m-ом микрофоне;

J(w) является целевой функцией;

b m(k,n) является вектором оцененных пространственных когерентностей, причем m´-ый элемент этого вектора является оцененной пространственной когерентностью рассеянного звука между m-ым микрофоном и m´-ым микрофоном;

k является индексом частотной области; и

n является индексом временной области.

6. Способ по п. 5, в котором целевая функция J(w) основана на одном из статистики шумов, матрицы спектральной плотности мощности (PSD) шумов, статистики сигналов, или матрицы спектральной плотности мощности (PSD) микрофона.

7. Способ по п. 1, дополнительно содержащий этапы, на которых:

оценивают по меньшей мере одно из направления поступления по меньшей мере одного прямого звука или относительной передаточной функции по меньшей мере одного прямого звука между первым микрофоном и вторым микрофоном;

вычисляют по меньшей мере одно ограничение прямого звука с использованием направления поступления или относительной передаточной функции по меньшей мере одного прямого звука, причем по меньшей мере одно ограничение прямого звука приводит к подавлению по меньшей мере одного прямого звука.

8. Способ по п. 1, в котором решением оптимизационной задачи является

,

где

,

причем

w m(k,n) является решением оптимизационной задачи на основании оценки микрофонного сигнала в m-ом микрофоне;

b m(k,n) является вектором оцененных пространственных когерентностей, причем m’-ый элемент вектора является оцененной пространственной когерентностью рассеянного звука между m-ым микрофоном и m’-ым микрофоном;

является определяемым пользователем управляющим параметром, посредством которого фильтр рассеянного звука может масштабироваться между пространственным фильтром с минимальной среднеквадратичной погрешностью и фильтром, который минимизирует выходную мощность, удовлетворяя ограничению рассеянного звука;

является мощностью рассеянного звука;

является матрицей спектральной плотности мощности микрофонных сигналов.

9. Способ по п. 8, дополнительно содержащий этап, на котором

оценивают мощность рассеянного звука на основании вспомогательного фильтра рассеянного звука.

10. Способ по п. 9, в котором оценку мощности рассеянного звука выполняют на основании

,

причем

является оцененной мощностью рассеянного звука, которая обеспечивает оценку для мощности рассеянного звука ;

w 1 является вектором коэффициентов фильтрации вспомогательного фильтра рассеянного звука;

является матрицей спектральной плотности мощности микрофонных сигналов;

является матрицей спектральной плотности мощности шума в пределах микрофонных сигналов; и

является матрицей пространственной когерентности для рассеянного звука, причем -ый элемент является пространственной когерентностью между микрофонами m и m'.

11. Способ по п. 1, дополнительно содержащий этап, на котором

выполняют линейную комбинацию первого микрофонного сигнала и второго микрофонного сигнала с использованием коэффициентов фильтрации фильтра рассеянного звука.

12. Машиночитаемый носитель, на котором сохранена компьютерная программа для реализации способа по п. 1 при ее исполнении на компьютере или в процессоре обработки сигналов.

13. Устройство для получения коэффициентов фильтрации для фильтра рассеянного звука, причём устройство содержит:

вычислитель линейного ограничения, выполненный с возможностью определения линейного ограничения для коэффициентов фильтрации фильтра рассеянного звука, причем линейное ограничение основано на пространственной когерентности между первым участком рассеянного звука в первом микрофонном сигнале и вторым участком рассеянного звука во втором микрофонном сигнале, причем первый микрофонный сигнал захвачен первым микрофоном, а второй микрофонный сигнал захвачен вторым микрофоном, расположенным на расстоянии от первого микрофона, известным способом;

вычислитель, выполненный с возможностью вычисления по меньшей мере одного из направления поступления по меньшей мере одного прямого звука, статистики сигналов в отношении первого и второго микрофонных сигналов и статистики шумов в отношении первого и второго микрофонных сигналов; и

вычислитель коэффициентов фильтрации, выполненный с возможностью определения коэффициентов фильтрации фильтра рассеянного звука, путем решения оптимизационной задачи в отношении по меньшей мере одного из направления поступления по меньшей мере одного прямого звука, статистики сигналов и статистики шумов, с учетом линейного ограничения для коэффициентов фильтрации.

14. Устройство по п. 13, в котором пространственная когерентность основана на относительной передаточной функции рассеянного звука между первым микрофоном и вторым микрофоном.

15. Устройство по п. 13, дополнительно содержащее:

вспомогательный вычислитель коэффициентов фильтрации, выполненный с возможностью определения вспомогательных коэффициентов фильтрации вспомогательного фильтра рассеянного звука, путем решения другой оптимизационной задачи, с учетом другого линейного ограничения для вспомогательных коэффициентов фильтрации, отличного от линейного ограничения, учитываемого вычислителем коэффициентов фильтрации;

вспомогательный фильтр рассеянного звука, выполненный с возможностью оценки оцененной мощности рассеянного звука;

причем вычислитель коэффициентов фильтрации выполнен с возможностью учета оцененной мощности рассеянного звука при определении коэффициентов фильтрации фильтра рассеянного звука.



 

Похожие патенты:

Изобретение относится к средствам для гибридного усиления речи. Технический результат заключается в повышении слышимости речевого содержимого звукового сигнала относительно неречевого звукового содержимого.

Изобретение относится к системам звукового кодирования, которые используют способ гармонического преобразования для высокочастотной реконструкции (HFR). Технический результат заключается в повышении качества кодируемого аудиосигнала.

Изобретение относится к средствам для уменьшения шума квантования в сигнале, содержащемся в возбуждении во временной области, декодируемом декодером временной области.

Изобретение относится к электронной аппаратуре и предназначено для записи объектного аудиосигнала. Технический результат – возможность осуществления прямой записи объектного аудиосигнала.

Изобретение относится к области обработки речевого сигнала. Технический результат – улучшение результата улавливания звукового сигнала терминалом.

Изобретение относится к области кодирования и декодирования. Техническим результатом является способ декодирования и устройство декодирования, которые позволяют предотвращать или уменьшать явление шума во время обработки потерь кадров, за счет этого повышая качество речи.

Изобретение относится к области микширования звука, передаваемого в потоковом режиме мобильным устройством. Технический результат заключается в обеспечении приглушения аудиоданных транспортного средства для звуковых указаний от мобильных приложений.

Изобретение относится к передаче цифровых звуковых сигналов по телекоммуникационным сетям и предназначено для обработки ослабления опережающего эха при декодировании цифрового звукового сигнала.

Изобретение относится к средствам оценки фонового шума звуковых сигналов. Технический результат заключается в повышении точности детектирования в аудиосигнале речи или музыки.

Изобретение относится к средствам для обработки аудиоданных и к области техники связи. Технический результат заключается в повышении эффективности кодирования.

Настоящее изобретение относится к системе звукового кодирования и декодирования. Технический результат заключается в повышении гибкости в отношении допущения разных скоростей передачи данных и разных уровней искажений.

Изобретение относится к области обработки и декодирования аудио сигнала, содержащего переходные процессы. Технический результат заключается в повышении скорости передачи данных за счет различной обработки сигнала переходного процесса и сигнала, не содержащего переходный процесс.

Изобретение относится к области кодирования аудиосигналов и предназначено для преобразования первого и второго входных каналов в один выходной канал, и в частности, предназначено для использования при преобразовании формата между различными конфигурациями каналов громкоговорителей.

Изобретение относится к средствам для декодирования кодированного аудиосигнала. Технический результат заключается в обеспечении возможности кодирования аудиосигналов в широком диапазоне скоростей передачи битов.

Изобретение относится к средствам для гибридного усиления речи. Технический результат заключается в повышении слышимости речевого содержимого звукового сигнала относительно неречевого звукового содержимого.

Изобретение относится к управлению громкостью аудио, видео и мультимедийного контента. Технический результат – обеспечение возможности нормализации громкости проигрывания как контента, содержащего метаданные громкости, так и контента, не содержащего метаданные громкости.

Изобретение относится к декодированию аудиосигнала. Технический результат изобретения заключается в расширении возможностей многоканального воспроизведения индивидуального аудиоконтента с целью улучшения слухового ощущения.

Изобретение относится к области кодирования аудио и речи. Технический результат – обеспечение эффективного сокращения объема вычислений при преобразовании коэффициентов линейного предсказания.

Изобретение относится к области обработки сигналов. Технический результат заключается в расширении арсенала технических средств для кодирования сигналов.

Изобретение относится к средствам для уменьшения шума квантования в сигнале, содержащемся в возбуждении во временной области, декодируемом декодером временной области.

Изобретение относится к средствам для маскирования ошибок при кодировании/декодировании аудио. Технический результат заключается в восстановлении качества звучания без увеличения алгоритмической задержки, когда происходит потеря пакета при кодировании аудио. Устройство передачи аудиосигнала для кодирования аудиосигнала включает в себя блок кодирования аудио, который кодирует аудиосигнал, и блок кодирования побочной информации, который вычисляет и кодирует побочную информацию из прогнозного сигнала. Устройство приема аудиосигнала для декодирования аудиокода и вывода аудиосигнала включает в себя буфер аудиокода, который обнаруживает потерю пакета на основе состояния приема аудиопакета, блок декодирования аудиопараметров, который декодирует аудиокод, когда аудиопакет принят корректно, блок декодирования побочной информации, который декодирует код побочной информации, когда аудиопакет принят корректно, блок сбора побочной информации, который собирает побочную информацию, получаемую посредством декодирования кода побочной информации, блок обработки отсутствующих аудиопараметров и блок синтеза аудио. 43 ил.

Изобретение относится к области акустического анализа. Технический результат – обеспечение захвата рассеянного звука, поступающего на микрофонный массив со всех направлений, путем получения лучшей диаграммы направленности фильтра рассеянного звука. Способ содержит этап, на котором оценивают пространственную когерентность между первым участком рассеянного звука в первом микрофонном сигнале и вторым участком рассеянного звука во втором микрофонном сигнале. Первый микрофонный сигнал захватывается первым микрофоном, а второй микрофонный сигнал захватывается вторым микрофоном, который расположен на расстоянии от первого микрофона. Способ дополнительно содержит этап, на котором определяют линейное ограничение для коэффициентов фильтрации фильтра рассеянного звука, причем линейное ограничение основано на пространственной когерентности. Способ также содержит этап, на котором вычисляют по меньшей мере одно из статистики сигналов и статистики шумов в отношении первого микрофонного сигнала и второго микрофонного сигнала. Способ также содержит этап, на котором определяют коэффициенты фильтрации фильтра рассеянного звука путем решения оптимизационной задачи в отношении по меньшей мере одного из статистики сигналов и статистики шумов, с учетом линейного ограничения для коэффициентов фильтрации. 3 н. и 12 з.п. ф-лы, 8 ил.

Наверх