Многоканальное акустическое эхоподавление



Многоканальное акустическое эхоподавление
Многоканальное акустическое эхоподавление

 


Владельцы патента RU 2546717:

КОНИНКЛЕЙКЕ ФИЛИПС ЭЛЕКТРОНИКС Н.В. (NL)

Изобретение относится к области акустики, в частности, к системам эхоподавления. Устройство многоканального акустического эхокомпенсатора содержит микрофон, принимающий сигнал, содержащий составляющие по меньшей мере от двух источников звука, которые нужно подавить. Схема эхоподавления выполняет эхоподавление на основе оценок канала для каналов каждого из источников звука. Схема оценки формирует каждую из оценок канала в виде объединения предыдущей оценки канала и обновления оценки канала. При этом схема оценки осуществляет применение относительного веса к обновлению оценки канала относительно предыдущей оценки канала. Процессор весовых коэффициентов меняет относительный вес в ответ на значение времени. Устройство также содержит нестационарный фильтр, а схема вычисления веса выполнена с возможностью формирования масштабного коэффициента для номинального значения веса и определения относительного веса в ответ на масшитабный коэффициент для номинального веса, причем масштабный коэффициент зависит от продолжительности времени. Технический результат - улучшение эхоподавления. 2 н. и 13 з.п. ф-лы, 2 ил.

 

МНОГОКАНАЛЬНОЕ АКУСТИЧЕСКОЕ ЭХОПОДАВЛЕНИЕ

ОБЛАСТЬ ТЕХНИКИ, К КОТОРОЙ ОТНОСИТСЯ ИЗОБРЕТЕНИЕ

Изобретение относится к акустическому эхоподавлению, и, в частности, но не исключительно, к акустическому эхоподавлению для применений в дистанционной передаче данных.

УРОВЕНЬ ТЕХНИКИ ИЗОБРЕТЕНИЯ

Акустические эхокомпенсаторы (AEC) используются в системах связи, например в системах конференц-связи, чтобы уменьшить эхо, которое возникает из-за связи между громкоговорителем (громкоговорителями) и микрофоном (микрофонами) на одном конце двусторонней связи. Например, во многих системах конференц-связи громкоговорители, представляющие сигнал, принятый от дальнего конца, располагаются близко к микрофону для регистрации звука на ближнем конце. Соответственно, звук, созданный громкоговорителями, также воспринимается микрофоном и может поэтому вернуться на дальний конец, приводя к различимому эху на дальнем конце. AEC используются для ослабления и предпочтительно устранения любой составляющей от громкоговорителей в сигнал от микрофона.

AEC часто снабжаются сигналами для громкоговорителей, и затем стараются оценить результирующий сигнал, зарегистрированный микрофоном. Этот предсказанный сигнал затем вычитается из сигнала микрофона. Как правило, одноканальная (монофоническая) система пытается оценить характеристику акустического тракта для акустического тракта от громкоговорителя к микрофону и использовать эту оценку для формирования предсказанного сигнала. Таким образом, такой AEC одновременно уменьшает эхо и распознает акустический тракт, посредством этого гарантируя, что эхо остается подавленным, что бы ни случилось на удаленном конце.

Дополнительно предложены многоканальные (например, стереофонические) системы конференц-связи, где пространственная информация регистрируется на удаленном конце с использованием, например, двух или более микрофонов. Такая система стремится обеспечить более реалистичное ощущение присутствия, чем монофоническая система, поскольку слушатели могут использовать дополнительную пространственную информацию для облегчения, например, анализа звуковой сцены, который является процессом, с помощью которого мозг сокращает выборку из одновременных аудиопотоков до отдельных составляющих звуков. Пространственная информация стремится привести к повышенной разборчивости речевых сигналов в шумных окружениях и во время одновременного разговора. Также обнаружено, что это уменьшает утомление слушателя.

Одной из основных проблем в многоканальном акустическом эхоподавлении является сильная когерентность, которая существует между входными сигналами, затрудняющая или даже делающая невозможной правильную оценку акустических трактов. Например, если зарегистрированный звук на дальнем конце преимущественно исходит из одиночного динамика, расположенного равноудаленно от двух микрофонов, то два результирующих сигнала, принятые на ближнем конце, могут быть практически одинаковыми. Поэтому нельзя просто выделить индивидуальную составляющую от каждого громкоговорителя, который регистрируется микрофоном, и поэтому нельзя оценить точно индивидуальную характеристику акустического тракта у акустического тракта от каждого из громкоговорителей. Другими словами, нереально выявить индивидуальную составляющую от двух громкоговорителей.

Чтобы повысить эффективность многоканального акустического эхокомпенсатора, предложено уменьшить когерентность между принятыми сигналами путем применения разных нестационарных всечастотных фильтров для разных каналов. Таким образом, предложено, чтобы каждый принятый сигнал от дальнего конца сначала фильтровался нестационарным фильтром с разными фильтрами, меняющимися по-разному. Это вносит декорреляцию сигналов, излученных каждым громкоговорителем, посредством этого позволяя оценивать отдельные акустические тракты.

Предложено несколько подходов для задания и обновления нестационарных фильтров , например, использующих всечастотный фильтр с изменяющимися характеристиками. Фильтры выбираются для обеспечения эффективной входной декорреляции для приемлемого ухудшения звука в результате внесенных звуковых артефактов. Конкретные примеры описываются в статьях M. Ali "Stereophonic Acoustic Echo Cancellation System Using Time-Varying All-Pass Filtering for Signal Decorrelation", In Proc. of IEEE Int. Conf. on Acoustics, Speech, and Signal Processing (ICASSP), том 6, стр. 3689-3692, май 1998 г.; N. Tangsangiumvisai, J.A. Chambers и A.G. Constantinides "Time-Varying Allpass Filters Using Spectral-Shaped Noise for Signal Decorrelation in Stereophonic Acoustic Echo Cancellation", In Proc. of IEEE Asia Pacific Conf. on Circuits & Systems (APCCAS), том 1, стр. 87-92, октябрь 2002 г.; и J.M. Valin "Perceptually-Motivated Nonlinear Channel Decorrelation For Stereo Acoustic Echo Cancellation", In Proc. of Joint Workshop on Hands­free Speech Communication and Microphone Arrays (HSCMA), май 2008 г.

Однако, хотя и обнаружено, что такая декорреляция улучшает точность оценки канала, эхоподавление во многих сценариях является субоптимальным.

Поэтому был бы полезным улучшенный подход к акустическому эхоподавлению, и, в частности, был бы полезным подход, допускающий повышенную гибкость, увеличенное подавление, упрощенную реализацию и/или повышенную эффективность.

СУЩНОСТЬ ИЗОБРЕТЕНИЯ

Соответственно, изобретение стремится предпочтительно смягчить, ослабить или устранить один или несколько вышеупомянутых недостатков, поодиночке или в любом сочетании.

В соответствии с одним аспектом изобретения обеспечивается устройство многоканального акустического эхокомпенсатора, содержащее: схему для приема сигнала микрофона от микрофона, причем сигнал микрофона содержит составляющие по меньшей мере от двух источников звука, которые нужно подавить; схему эхоподавления, соединенную с микрофоном, причем схема эхоподавления выполнена с возможностью выполнения эхоподавления у двух источников звука на основе оценок канала для каналов от каждого из источников звука в микрофон; схему оценки для формирования каждой из оценок канала в виде объединения предыдущей оценки канала и обновления оценки канала, при этом объединение содержит применение относительного веса к обновлению оценки канала относительно предыдущей оценки канала; и схему взвешивания, выполненную с возможностью изменения относительного веса в ответ на значение времени.

Изобретение может обеспечить улучшенное эхоподавление во многих вариантах осуществления. В частности, во многих сценариях подход можно с успехом приспособить, в частности, к подавлению множества источников звука на основе оценок канала акустического тракта для индивидуальных трактов. Подход может обеспечить низкую сложность и/или упрощенную реализацию. Часто можно добиться упрощенной работы, и в частности, подход можно реализовать с низким требованием к вычислительным ресурсам.

Изменение может зависеть от значения времени посредством относительного веса, определяемого в зависимости от значения времени. Функция дополнительно может зависеть от других параметров. Однако зависимость от значения времени может быть такой, что относительный вес будет меняться, даже если все остальные значения параметра являются постоянными.

В соответствии с необязательным признаком изобретения, устройство многоканального акустического эхокомпенсатора дополнительно содержит нестационарный фильтр для каждого из двух источников звука, причем каждый нестационарный фильтр выполнен с возможностью фильтрации сигнала для одного из двух источников звука.

Это может обеспечить улучшенное эхоподавление множества источников звука во многих сценариях. В частности, это может обеспечить улучшенную оценку канала. Использование нестационарных фильтров для внесения декорреляции между источниками звука вместе с зависящим от времени взвешиванием обновлений для оценок канала, в частности, объединяют для обеспечения существенного улучшения во многих сценариях.

В соответствии с необязательным признаком изобретения, значение времени является продолжительностью времени с последнего обновления по меньшей мере одного из нестационарных фильтров.

Это может обеспечить особенно выгодную эффективность. Часто можно добиться улучшенного эхоподавления. Взвешивание обновления оценки канала для источника звука может определяться в зависимости от времени с последнего момента, когда нестационарный фильтр изменялся для этого источника звука.

В соответствии с необязательным признаком изобретения, схема взвешивания выполнена с возможностью увеличения относительного веса обновления оценки канала для увеличивающихся продолжительностей времени.

Это может обеспечить повышенную эффективность. Относительный вес может быть, в частности, монотонно возрастающей (или неубывающей) функцией продолжительности времени с последнего изменения нестационарного фильтра. Более того, относительный вес может определяться с помощью функции, удовлетворяющей требованию f(a)≤f(b) для всех a<b. Относительный вес для обновления оценки канала может быть, в частности, ступенчатой функцией, которая является монотонно неубывающей.

В соответствии с необязательным признаком изобретения, схема взвешивания выполнена с возможностью формирования масштабного коэффициента для номинального значения веса и определения относительного веса в ответ на масштабный коэффициент для номинального значения веса, причем масштабный коэффициент зависит от продолжительности времени.

Это может обеспечить эффективное и несложное эхоподавление во многих сценариях. Относительный вес для обновления оценки канала может определяться, в частности, как номинальное значение веса, умноженное на масштабный коэффициент. Номинальное значение веса может быть фиксированным значением и может, в частности, не зависеть от времени (хотя в таких случаях оно может зависеть от других параметров).

В соответствии с необязательным признаком изобретения, по меньшей мере один нестационарный фильтр выполнен с возможностью обновляться в дискретные моменты времени, посредством этого предоставляя кадры фильтра, в которых нестационарный фильтр является постоянным; и схема взвешивания выполнена с возможностью изменения относительного веса в кадре фильтра в зависимости от текущей продолжительности времени с начала кадра фильтра.

Это может обеспечить повышенную эффективность и/или может обеспечить упрощенную работу и/или реализацию. Относительный вес может демонстрировать один и тот же шаблон для каждого кадра фильтра. В частности, для кадров фильтра с постоянной длительностью (соответствующих обновлению периодического фильтра) относительный вес может демонстрировать цикличность с периодом, соответствующим длительности кадра фильтра.

В соответствии с необязательным признаком изобретения, схема эхоподавления выполнена с возможностью выполнения кадрового эхоподавления; и схема взвешивания выполнена с возможностью изменения относительного веса между последовательными кадрами эхоподавления.

Это может обеспечить повышенную эффективность и/или может обеспечить упрощенную работу и/или реализацию. Относительный вес может быть постоянным в каждом кадре эхоподавления.

В соответствии с необязательным признаком изобретения, схема взвешивания выполнена с возможностью определения относительного веса в зависимости от номера кадра эхоподавления в кадре фильтра.

Это может обеспечить несложную работу и реализацию наряду с обеспечением эффективного эхоподавления. Относительный вес может определяться, в частности, путем масштабирования номинального веса с помощью масштабного коэффициента, соответствующего текущему номеру кадра, деленному на общее количество кадров эхоподавления в кадре фильтра.

В соответствии с необязательным признаком изобретения, схема взвешивания выполнена с возможностью определения значения веса для обновления оценки канала как, по существу, пропорционального:

где k - номер кадра эхоподавления, K - количество кадров эхоподавления в кадре фильтра, и mod представляет функцию взятия модуля.

Это может обеспечить несложную работу и реализацию наряду с обеспечением эффективного эхоподавления.

В соответствии с необязательным признаком изобретения, имеется, по существу, целочисленное отношение между длительностью кадров фильтра и длительностью кадров эхоподавления.

Это может обеспечить несложную работу и реализацию наряду с обеспечением эффективного эхоподавления.

В соответствии с необязательным признаком изобретения, устройство многоканального акустического эхокомпенсатора дополнительно содержит схему изменения для обнаружения, что изменение по меньшей мере в первом канале среди каналов от каждого из источников звука к микрофону удовлетворяет некоторому критерию; и схему для определения значения времени в виде продолжительности времени от изменения.

Это может обеспечить улучшенное эхоподавление во многих вариантах осуществления и может, в частности, обеспечить улучшенную адаптацию многоканального эхоподавления к изменениям в акустических трактах, возникающим, например, от перемещения микрофона или источника звука.

В соответствии с необязательным признаком изобретения, схема изменения выполнена с возможностью задания начального значения для относительного веса после изменения; и схема взвешивания выполнена с возможностью увеличения относительного веса для увеличения продолжительностей времени с момента изменения.

Это может обеспечить улучшенную и/или упрощенную работу во многих вариантах осуществления. В частности, схема взвешивания может быть выполнена с возможностью увеличения относительного веса, пока он не достигнет максимального значения.

В соответствии с необязательным признаком изобретения, схема взвешивания выполнена с возможностью определения относительного веса в зависимости от интервала усреднения эхоподавления.

Это может обеспечить улучшенную и/или упрощенную работу во многих вариантах осуществления.

В соответствии с необязательным признаком изобретения, относительный вес является функцией только номинального значения веса и значения времени.

Это может обеспечить несложную работу и реализацию наряду с обеспечением эффективного эхоподавления. Относительный вес для обновления оценки канала может определяться, в частности, как номинальное значение веса, умноженное на масштабный коэффициент. Номинальное значение веса может быть фиксированным значением и может, в частности, не зависеть от времени (хотя в таких случаях оно может зависеть от других параметров).

В соответствии с одним аспектом изобретения, обеспечивается способ многоканального эхоподавления с использованием схемы эхоподавления, соединенной с микрофоном, при этом способ содержит: прием сигнала микрофона от микрофона, причем сигнал микрофона содержит составляющие по меньшей мере от двух источников звука, которые нужно подавить; выполнение эхоподавления у двух источников звука на основе оценок канала для каналов от каждого из двух источников звука в микрофон; формирование каждой из оценок канала в виде объединения предыдущей оценки канала и обновления оценки канала, при этом объединение содержит применение относительного веса к обновлению оценки канала относительно предыдущей оценки канала; и изменение относительного веса в ответ на значение времени.

Эти и другие аспекты, признаки и преимущества изобретения станут очевидными и будут разъяснены со ссылкой на вариант (варианты) осуществления, описываемые ниже.

КРАТКОЕ ОПИСАНИЕ ЧЕРТЕЖЕЙ

Варианты осуществления изобретения будут описываться только в качестве примера со ссылкой на чертежи, на которых

Фиг.1 иллюстрирует пример блока конференц-связи для системы конференц-связи, содержащего многоканальный акустический эхокомпенсатор в соответствии с некоторыми вариантами осуществления изобретения; и

Фиг.2 иллюстрирует пример изменяющегося во времени относительного веса для обновления оценки канала.

ПОДРОБНОЕ ОПИСАНИЕ НЕКОТОРЫХ ВАРИАНТОВ ОСУЩЕСТВЛЕНИЯ ИЗОБРЕТЕНИЯ

Нижеследующее описание сосредоточено на вариантах осуществления изобретения, применимых к устройству многоканального акустического эхокомпенсатора для системы конференц-связи.

Фиг.1 иллюстрирует пример блока конференц-связи для системы конференц-связи, содержащего устройство многоканального акустического эхокомпенсатора в соответствии с некоторыми вариантами осуществления изобретения. Блок конференц-связи содержит связной приемопередатчик 101, который выполнен с возможностью взаимодействия по меньшей мере с одним удаленным блоком конференц-связи. В зависимости от конкретного варианта осуществления, связной приемопередатчик 101 может содержать, например, функциональные возможности для связи с блоком конференц-связи на дальнем конце посредством, например, традиционной телефонной сети, системы сотовой связи, Интернета или любого другого подходящего средства связи.

В примере блок конференц-связи на дальнем конце является многоканальным блоком конференц-связи, который предоставляет множество сигналов. Таким образом, блок конференц-связи на дальнем конце содержит множество микрофонов, каждый из которых дает сигнал, передаваемый блоку конференц-связи на ближнем конце на фиг.1. Нижеследующее описание для краткости и ясности будет сосредоточено на стереофонической системе конференц-связи, в которой дальний конец содержит два микрофона и предоставляет два сигнала блоку конференц-связи на ближнем конце. Однако нужно будет принять во внимание, что описанные подходы и принципы могут применяться к системам с большим количеством каналов.

Связной приемопередатчик 101 выполнен с возможностью приема двух сигналов s1(n) и s2(n) от блока конференц-связи на дальнем конце. В примере связной приемопередатчик 101 соединяется с первым и вторым нестационарным фильтром 103, 105, каждый из которых выполнен с возможностью фильтрации одного из принятых сигналов s1(n), s2(n) для формирования фильтрованных сигналов x1(n) и x2(n). Каждый из нестационарных фильтров 103, 105 соединяется с громкоговорителем 107, 109, который излучает соответствующий звук в аудиосреду. Нужно будет принять во внимание, что описанные тракты сигнала обычно будут содержать другие подходящие функциональные возможности по обработке сигналов, например усилитель мощности для громкоговорителей 107, 109. Однако для ясности и краткости такие функциональные возможности явно не проиллюстрированы на фиг.1 и могут считаться частью громкоговорителей 107, 109 и/или нестационарных фильтров 103, 105.

Блок конференц-связи, кроме того, содержит микрофон 111, который регистрирует звук в аудиосреде. Микрофон, в частности, регистрирует звук, который нужно передать блоку конференц-связи на дальнем конце (например, звук от локального динамика). Однако из-за того, что громкоговорители 107, 109 расположены в одной и той же аудиосреде, микрофон 111 также будет воспринимать звук, излученный от двух источников звука, соответствующих двум громкоговорителям 107, 109. Если зарегистрированный сигнал непосредственно отправляется в блок конференц-связи на дальнем конце, то это приведет к эху, и поэтому блок конференц-связи содержит устройство многоканального акустического эхокомпенсатора, которое пытается как можно больше ослабить составляющую сигнала от громкоговорителей 107, 109.

В частности, система включает в себя схему эхоподавления, которая содержит адаптивный фильтр 113 и блок 115 вычитания. Адаптивный фильтр 113 принимает сигналы x1(n), x2(n), поданные в громкоговорители 107, 109, и фильтрует эти сигналы для формирования оценки z(n) составляющей сигнала в сигнале микрофона y(n), который исходит из громкоговорителей 107, 109. Блок 115 вычитания принимает сигнал микрофона y(n) и вычитает предполагаемый сигнал z(n) для формирования результирующего сигнала с подавленным эхо e(n). В идеале эхоподавление полностью подавляет составляющую от громкоговорителей 107, 109 так, что e(n) включает в себя только составляющую от локально сформированных источников.

Результирующий сигнал e(n) затем подается в связной приемопередатчик 101, который передает его блоку конференц-связи на дальнем конце. Нужно будет принять во внимание, что описанный тракт сигнала для микрофона 111 обычно будет содержать другие подходящие функциональные возможности по обработке сигналов, например малошумящий звуковой усилитель для микрофона или фильтры для сигнала с подавленным эхо e(n). Однако для ясности и краткости такие функциональные возможности явно не проиллюстрированы на фиг.1 и могут считаться частью микрофона 111 и/или связного приемопередатчика 101.

Предполагаемый сигнал e(n) основывается на оценках характеристик канала h1(n), h2(n) для трактов от громкоговорителей 107, 109 к микрофону 111. Эти оценки могут включать в себя характеристики любых функциональных возможностей, являющихся частью микрофона 111 и громкоговорителей 107, 109. Однако обычно над оценками канала преобладают характеристики акустических трактов. Блок конференц-связи из фиг.1 включает в себя устройство 117 оценки канала, которое выполнено с возможностью формирования оценки канала для каждого из каналов от одного из громкоговорителей 107, 109 в микрофон 111.

Адаптивный фильтр затем может отфильтровать сигнал первого громкоговорителя x1(n) с помощью первой оценки h1(n) и сигнал второго громкоговорителя x2(n) с помощью второй оценки h2(n). Результирующие отфильтрованные сигналы складываются для предоставления оценки z(n) канала от громкоговорителей 107, 109 в микрофон 111.

Соответственно, чтобы обеспечить эффективное эхоподавление, определение оценок канала является важным. В традиционном эхоподавлении в одиночном канале оценка канала часто вычисляется путем формирования текущей оценки канала (например, для текущего кадра) и использования этой оценки для изменения существующей оценки канала (определенной, например, на основе предыдущих кадров). Может задаваться взвешивание для обновления относительно существующей оценки, чтобы обеспечить нужный компромисс между скоростью адаптации, стабильностью и шумом.

В примере, где подавляется более одного источника звука (громкоговоритель 107, 109), оценка канала может выполняться, для каждой отдельной оценки канала, путем определения текущего обновления оценки канала и использования его для обновления существующей оценки канала. Таким образом, подход для одиночного канала можно распространить на множество каналов. В системе из фиг.1 устройство 117 оценки канала соответственно формирует первую и вторую оценку канала для первого и второго динамика 107, 109 соответственно. Оценки формируются путем объединения предыдущей оценки канала для канала и обновления оценки канала.

Однако авторы изобретения поняли, что такого подхода как такового обычно бывает недостаточно для обеспечения оптимальной эффективности в сценарии, где подавляется несколько источников звука, и изменяющиеся во времени характеристики являются значимыми (например, возникающие от нестационарных фильтров). Фактически, авторы изобретения поняли, что относительный вес между обновлением оценки канала и предыдущей оценкой канала должен зависеть от времени и, в частности, должен меняться со временем, даже если все остальные параметры постоянны.

Это понимание основывается на подробном анализе, который будет представлен ниже. В анализе используется нотация, в которой буквы с жирным шрифтом верхнего и нижнего регистра обозначают матрицы и векторы соответственно. Обычные буквы верхнего и нижнего регистра представляют скалярные постоянные и процессы соответственно. и в виде либо нижнего индекса, верхнего индекса либо аргумента относятся ко времени и индексам кадра соответственно.

Сигналы и , принятые от дальнего конца, предполагаются стационарно свернутыми сигналами (как правило, они исходят из одного и того же источника). Чтобы уменьшить когерентность входных сигналов, эти сигналы проходят через разные нестационарные фильтры 103, 105 с соответствующими передаточными функциями и .

В частности, нестационарные фильтры 103, 105 спроектированы как всечастотные фильтры, например фильтры с конечной импульсной характеристикой (FIR):

Фильтры меняются кусочно-постоянным образом, то есть они постоянны в заданном периоде, впредь называемом кадром фильтра. В примере каждый кадр фильтра имеет одинаковую длительность/длину .

Декоррелированные сигналы и изменяются с помощью импульсных характеристик канала в помещении, представленных импульсными характеристиками FIR

.

Результирующие сигналы регистрируются микрофоном 111 вместе с нужным сигналом (например, локальным динамиком) и обычно некоторым аддитивным шумом. Схема 113, 115 многоканального эхоподавления стремится убрать составляющую от громкоговорителей 107, 109 в зарегистрированный сигнал y(n).

Это выполняется, в частности, путем фильтрации декоррелированных сигналов и в адаптивном фильтре 113 на основе оценок канала (импульсных характеристик канала). В зарегистрированном сигнале y(n) затем компенсируется нежелательная составляющая z(n). В частности:

,

где обозначает оператор свертки.

Используя матричное представление, эхоподавление можно сформулировать в виде:

где содержит оценку импульсной характеристики канала между громкоговорителем 107, 109 и микрофоном 111, представляет выход громкоговорителя, - предполагаемая длина импульсной характеристики канала (или заданная верхняя граница); и обозначает оператор переноса.

Можно показать, что поскольку шум и нужные сигналы независимы от сигналов от громкоговорителей 107, 109, эхо можно эффективно подавить путем минимизации мощности разностного сигнала . Минимизация обычно реализуется адаптивным образом, используя, например, схему RLS (рекурсивный метод наименьших квадратов) или, например, эффективные реализации в частотной области, например алгоритм адаптивного фильтра с несколькими входами в частотной области (MFDAF).

Для вычислительной эффективности часто используется покадровый анализ. В таких подходах входной сигнал сначала сегментируется на кадры, и оценка канала обновляется на покадровой основе. В примере из фиг.2 эхоподавление выполняется на кадровой основе, причем оценки канала обновляются между последовательными кадрами эхоподавления, но сохраняются постоянными в каждом кадре.

В традиционном процессе эхоподавления в одиночном канале оценка канала может обновляться для каждого нового кадра путем вычисления обновления оценки канала и изменения предыдущей оценки канала на основе обновленной.

В частности, оценка канала для кадра k может вычисляться в виде:

где - обновление оценки канала для кадра k, а μ - вес обновления, указывающий размер шага для обновления оценки канала. В частности, для обновления RLS может использоваться следующее:

где обозначает длительность кадра подавления эха, а Rx является автокорреляцией x, вычисленной в виде:

где M·TH представляет (среднюю) память в адаптивном фильтре.

Таким образом, в этом примере обновление оценки канала в основном зависит от корреляции сигнала, поданного в соответствующий громкоговоритель 107, 109, и сигнала с подавленным эхо e(n) (и с компенсированной автокорреляцией входного сигнала). По существу, подход стремится выявить остаточный компонент, который не подавлен эхоподавлением, и обновить оценку канала так, чтобы обновленная оценка канала привела бы к полному подавлению.

Большинство традиционных многоканальных акустических эхокомпенсаторов сосредоточены на минимизации разности между отдельными оценками каналов и индивидуальными трактами от громкоговорителей к микрофону. Однако авторы изобретения поняли, что это не обязательно приводит к оптимальной производительности для многоканальных акустических эхокомпенсаторов, и что на самом деле улучшенного эхоподавления часто можно добиться на практике, обращая внимание на оптимизацию объединенного эхоподавления в нескольких источниках, а не концентрируясь только на сходимости отдельных оценок каналов. Например, улучшенной производительности можно достичь, если вместо концентрации на сходимости отдельных каналов рассматривается сходимость объединенного показателя, такого как, в частности

Если нестационарные фильтры 103, 105 являются постоянными или не реализуются, то есть , то входную автокорреляционную матрицу можно было бы приблизительно выразить как

где I обозначает единичную матрицу LxL, а Rs обозначает автокорреляционную матрицу сигнала s(n) дальнего конца.

Таким образом, объединенная оценка канала, соответствующая ранее упомянутому подходу RLS, может быть показана соответствующей (путем разложения предыдущих уравнений):

Таким образом, в этом случае сходимость эхоподавления (характер изменения ) эквивалентна (и в частности, практически соответствует) моноканальному AEC.

В вышеприведенном уравнении первый член представляет предыдущую объединенную оценку канала, а второй член представляет текущее обновление оценки канала. Относительный вес μ определяет сколько весит обновление относительно существующей оценки. Уравнение может считаться соответствующим фильтру IIR и соответственно обеспечивает фильтрацию нижних частот оценок канала, сформированных в отдельном кадре. Значение относительного веса μ определяет результат фильтрации нижних частот и соответственно регулирует как быстроту сходимости, так и шумовую характеристику.

Для глобальное решение можно интерпретировать как выпуклую комбинацию предыдущего и локального решений. Чтобы иметь быструю сходимость, относительный вес μ может выбираться близким к единице (). Однако, чтобы иметь лучшую устойчивость к шуму, относительный вес μ может выбираться близким к нулю (). Таким образом, значение μ может устанавливаться обеспечивающим нужный компромисс между шумовой характеристикой и быстротой сходимости.

Введение нестационарных фильтров 103, 105 приводит к тому, что сигналы громкоговорителей и уже не являются стационарными. Это используется для упрощения оценки канала, и, в частности, для обеспечения дифференциации между сигналами, принятыми в микрофоне 111 из двух разных трактов.

В системе из фиг.1 длительность обновления (длина кадра фильтра) для нестационарных фильтров 103, 105 устанавливается в целое число, кратное длительности кадра эхоподавления. Таким образом, нестационарные фильтры 103, 105 остаются постоянными для заданного числа K кадров эхоподавления, и каждый из этих кадров фильтра может обладать длительностью . Такой подход обеспечивает упрощенную работу и реализацию.

В таком сценарии автокорреляционная матрица обычно оценивается за длительность, которая существенно больше кадра эхоподавления. Можно показать (предполагая K ≤ M и стационарность сигнала в каждом кадре фильтра), что долгопериодическая автокорреляционная матрица может быть приблизительно выражена с помощью

,

где

;

mod обозначает оператор взятия модуля, а - ковариационная матрица сигнала с удаленного конца.

Подставляя это в предыдущее уравнение и после некоторых манипуляций можно показать, что:

.

Таким образом, как указано вышеприведенным уравнением, подход с установкой фиксированного веса для обновления двух отдельных оценок каналов, то есть для обновления двух оценок каналов в соответствии с:

вместе с использованием нестационарных сигналов громкоговорителей (например, из-за нестационарных фильтров 103, 105) приводит к эффективному размеру шага для объединенного эхоподавления двух источников звука, который имеет вид

.

Таким образом, результатом этого подхода к обновлению является то, что эффективный вес обновления эхоподавления изменяется во времени. Конечно, в конкретном примере он будет меняться от μ до бесконечности для разных значений k, то есть для разных номеров кадров в кадре фильтра.

Конечно, подход может привести к изменчивой и нестабильной производительности. Например, если , то получается нежелательный характер изменения адаптации, где текущее обновление оценки канала избыточно усиливается , и обязательно вычитается предыдущая оценка канала . Также, если вес обновления ограничивается областью устойчивости (то есть ), то отдельные оценки каналов будут иметь плохую характеристику сходимости, так как это требует очень низкого веса для этих оценок ().

В системе из фиг.1 устройство 117 оценки канала выполнено с возможностью использования веса, который меняется в зависимости от временного параметра. В частности, система содержит процессор 119 весов, который постоянно вычисляет относительный вес, который нужно применить к обновлению оценки канала относительно предыдущей оценки канала. В примере процессор 119 весов соединяется с устройством 117 оценки канала и снабжает его текущим весом, который нужно использовать. Кроме того, в конкретном примере процессор 119 весов также может быть выполнен с возможностью управления обновлениями нестационарных фильтров 103, 105 и может, в частности, предоставить новые коэффициенты для применения, когда инициируется новый кадр обновления фильтра.

Таким образом, в системе из фиг.1 процессор 119 весов вычисляет относительный вес, который зависит от значения времени. Нужно будет принять во внимание, что вес может зависеть от других параметров, нежели только от значения времени. Однако в данной системе вес будет меняться со временем, даже если все такие параметры постоянны.

Эффект задания меняющегося во времени относительного веса для обновления состоит в том, что можно достичь улучшенного компромисса между обновлением индивидуальных каналов и поведением эхоподавления в целом. В частности, изменяющуюся во времени характеристику эффективного размера шага для объединенного эхоподавления

можно компенсировать или даже устранить для обеспечения улучшенного эхоподавления.

Например, процессор 119 весов может быть выполнен с возможностью изменения размера шага для обновления индивидуальных весов в каждом кадре фильтра в зависимости от продолжительности времени от начала кадра фильтра. В конкретной системе, в которой обновление фильтра и эхоподавление выполняется в кадрах, относительный вес может меняться, в частности, между последовательными кадрами эхоподавления, но оставаться постоянным в каждом кадре эхоподавления. Таким образом, в таких вариантах осуществления вес для текущего кадра эхоподавления может определяться просто в зависимости от текущего номера кадра в текущем кадре фильтра (соответствующем эффективному размеру шага в объединенном эхоподавлении, зависящему только от номера кадра).

Таким образом, в таких вариантах осуществления шаблон веса может повторяться между последовательными кадрами фильтра, приводя к периодическому и повторяющемуся шаблону.

В качестве конкретного примера вес для обновлений оценки канала может устанавливаться, чтобы отражать влияние на обновление эхоподавления, и может, в частности, устанавливаться практически постоянным. В конкретном примере параметр известен, так как он зависит только от известных величин текущего номера кадра эхоподавления в кадре фильтра и общего количества кадров эхоподавления в каждом кадре фильтра.

В частности, относительный вес обновления для обновления оценки канала для каждого канала может устанавливаться в

где - номинальный вес. Номинальный вес может быть, например, заранее установленным фиксированным значением, может быть постоянным, например, для каждого кадра фильтра или может зависеть, например, от других невременных параметров. Нормальный вес , по существу, управляет сходимостью подавления шума, тогда как изменяющийся во времени вес отражает вес, который применяется при обновлении весов, и соответственно управляет сходимостью отдельных оценок каналов.

Таким образом, в примере процессор 119 весов формирует масштабный коэффициент для номинального значения веса, а затем определяет относительный вес как пропорциональный их произведению. Изменяющийся во времени относительный вес затем используется при обновлении отдельных оценок каналов в соответствии с:

,

приводя к сходимости эхоподавления:

Номинальный вес затем может выбираться () для обеспечения нужного компромисса между сходимостью и постоянной производительностью шумоподавления в системе.

В конкретной системе процессор 119 весов соответственно выполнен с возможностью формирования относительного веса для обновления оценки канала, которая увеличивается (или не уменьшается) за увеличивающееся время с последнего обновления фильтра. Конечно, в конкретном примере относительный вес является ступенчатой функцией, которая увеличивается от 0 для k=0 до для k=K-1. Пример такой функции показан на фиг.2.

В примере вес для обновления оценки канала является монотонной неубывающей функцией времени с последнего обновления нестационарных фильтров 103, 105. Следует отметить, что такое изменение противоречит общим подходам к системе обратной связи и может казаться нелогичным. Конечно, в типичных системах обратной связи существенное изменение в характеристиках системы потребует процесс обратной связи для схождения к новым настройкам, и поэтому может казаться привлекательным большое исходное взвешивание значения обновления для обеспечения быстрой сходимости. Когда система прошла схождение, взвешивание значения обновления можно уменьшить. Однако, как продемонстрировано вышеприведенным анализом, система из фиг.1 фактически выполнена с возможностью работы прямо противоположным образом, а именно путем наличия низкого веса обновления в начале, и затем увеличения его со временем.

Также следует отметить, что подход фиг.1 не только обеспечивает улучшенное эхоподавление, но также является простым в реализации и даже может быть без труда введен в существующие акустические эхокомпенсаторы.

В вышеприведенном примере изменение во времени введено намеренно путем использования нестационарных фильтров. Однако нужно будет принять во внимание, что описанный подход не ограничивается такими сценариями. Конечно, описанный подход применим для любого использования, в котором воспроизведение сигналов, которые нужно подавить, изменяется во времени. На самом деле такое изменение во времени может быть намеренным или может быть, например, неумышленным или неуправляемым изменением во времени, например может быть случаем, когда микрофон или один из динамиков перемещается.

Например, в системе из фиг.1 фильтры 103, 105 могут быть постоянными или несуществующими, то есть . Однако, когда перемещается один из динамиков 107, 109 или микрофон 111, это может быть обнаружено, и процессор 119 весов может перейти к формированию изменяющегося во времени веса для обновления оценки канала.

В частности, устройство 117 оценки канала может быть выполнено с возможностью обнаружения, что один из каналов от громкоговорителя 107, 109 в микрофон 111 изменился более чем на определенную величину за определенное время. Таким образом, устройство 117 оценки канала обнаруживает, претерпел ли один или оба канала изменение, которое удовлетворяет подходящему критерию.

Изменение может обнаруживаться напрямую путем, например, оценивания величины обновления оценки канала для канала и обнаружения, превышает ли она заданную пороговую величину. В других вариантах осуществления может использоваться косвенное обнаружение, например, путем обнаружения, превышает ли заданный уровень результирующий сигнал e(n) в периодах относительной тишины (например, соответствующих сигналу микрофона, который обладает энергией сигнала ниже заданной пороговой величины).

Если устройство 117 оценки канала обнаруживает такое значительное ступенчатое изменение в оценках канала, оно переходит к указанию этого процессору 119 весов. Процессор 119 весов затем переходит к инициированию изменения во времени у относительного веса. Например, процессор 119 весов может перейти к изменению веса с таким же шаблоном, как на фиг.2. Таким образом, значение может определяться в зависимости от продолжительности времени с момента, когда было обнаружено изменение. В частности, процессор 119 весов может установить начальное значение для относительного веса в подходяще низкое значение (например, ноль) непосредственно после изменения, а затем перейти к его увеличению в виде монотонной неубывающей функции длительности с момента изменения. Он может переходить к выполнению этого, пока не достигнет максимального значения, которое может быть заранее установленным значением.

В первом описанном примере с нестационарными фильтрами 103, 105 относительный вес был функцией текущего времени относительно длительности интервала фильтра. Однако в примере, где отсутствуют нестационарные фильтры, относительный вес может определяться в зависимости от интервала усреднения эхоподавления.

Например, если динамик на дальнем конце меняет свое положение так, что канал дальнего конца меняется с h(1)(q) на h(2)(q)), то это эквивалентно ситуации, где положение динамика остается неизменным при замене нестационарного фильтра с 1 на h(2)(q)/h(1)(q). Таким образом, смена динамика на дальнем конце приводит к сценарию, который эквивалентен сценарию, когда меняется нестационарный фильтр. Однако значение K очень большое, так как оно в принципе будет включать в себя все прошлое. Однако, поскольку обновление адаптивного фильтра имеет (максимальную) память в M кадров, K может устанавливаться соответствующим емкости памяти M у фильтра. Таким образом, изменяющийся во времени вес может обновляться точно так же, как описано для изменения в нестационарных фильтрах, но с использованием значения K=M.

Нужно будет принять во внимание, что вышеприведенное описание для ясности описало варианты осуществления изобретения со ссылкой на разные функциональные схемы, блоки и процессоры. Однако станет очевидно, что может использоваться любое подходящее распределение функциональных возможностей между разными функциональными схемами, блоками или процессорами без преуменьшения изобретения. Например, функциональные возможности, проиллюстрированные как выполняемые отдельными процессорами или контроллерами, могут выполняться одним процессором или контроллером. Поэтому ссылки на конкретные функциональные блоки или схемы нужно рассматривать только в качестве ссылок на подходящее средство для обеспечения описанных функциональных возможностей, а не указания на строгую логическую или физическую структуру или организацию.

Изобретение может быть реализовано в любой подходящей форме, включая аппаратные средства, программное обеспечение, микропрограммное обеспечение или любое их сочетание. Изобретение при желании может быть реализовано, по меньшей мере частично, в виде компьютерного программного обеспечения, выполняемого на одном или нескольких процессорах данных и/или цифровых процессорах сигналов. Элементы и компоненты из варианта осуществления изобретения могут быть физически, функционально и логически реализованы любым подходящим способом. В действительности функциональные возможности могут быть реализованы в одном блоке, в множестве блоков или как часть других функциональных блоков. По существу, изобретение может быть реализовано в одном блоке, или может быть физически и функционально распределено между разными блоками, схемами и процессорами.

Хотя настоящее изобретение описано применительно к некоторым вариантам осуществления, оно не предназначено, чтобы ограничиваться конкретной формой, изложенной в этом документе. Наоборот, объем настоящего изобретения ограничивается только прилагаемой формулой изобретения. Более того, хотя признак может казаться описанным по отношению к конкретным вариантам осуществления, специалист в данной области техники признал бы, что различные признаки описанных вариантов осуществления могут объединяться в соответствии с изобретением. В формуле изобретения термин "содержащий" не исключает наличия других элементов или этапов.

Кроме того, хотя и не перечислено отдельно, множество средств, элементов, схем или этапов способа могут быть реализованы, например, одиночной схемой, блоком или процессором. Более того, хотя отдельные признаки могут включаться в разные пункты формулы изобретения, они могут по возможности выгодно объединяться, и включение в разные пункты формулы не подразумевает, что сочетание признаков не является осуществимым и/или выгодным. Также включение признака в одну категорию пунктов формулы не подразумевает ограничение этой категорией, а скорее указывает, что при необходимости признак в равной степени применим к другим категориям пунктов формулы. Кроме того, порядок признаков в формуле изобретения не подразумевает никакого конкретного порядка, в котором должны обрабатываться признаки, и в частности, порядок отдельных этапов в пункте формулы изобретения на способ не подразумевает, что этапы должны выполняться в этом порядке. Скорее, этапы могут выполняться в любом подходящем порядке. К тому же единичные ссылки не исключают множества. Таким образом, ссылки на единственность, на "первый", "второй" и т.д. не препятствуют множественности. Ссылочные позиции в формуле изобретения предоставляются лишь в качестве поясняющего примера и не должны толковаться как ограничивающие объем формулы изобретения каким-либо образом.

1. Устройство многоканального акустического эхокомпенсатора, содержащее:
- схему для приема сигнала микрофона от микрофона (111), причем сигнал микрофона содержит составляющие по меньшей мере от двух источников звука (107, 109), которые нужно подавить;
- схему эхоподавления (113, 115), соединенную с микрофоном (111), причем схема эхоподавления (113, 115) выполнена с возможностью выполнения эхоподавления у двух источников звука (107, 109) на основе оценок канала для каналов от каждого из источников звука (107, 109) в микрофон (111);
- схему оценки (117) для формирования каждой из оценок канала в виде объединения предыдущей оценки канала и обновления оценки канала, при этом объединение содержит применение относительного веса к обновлению оценки канала относительно предыдущей оценки канала; и
- схему взвешивания (119), выполненную с возможностью изменения относительного веса в ответ на значение времени.

2. Устройство многоканального акустического эхокомпенсатора по п.1, дополнительно содержащее нестационарный фильтр (103, 105) для каждого из двух источников звука (107, 109), причем каждый нестационарный фильтр (103, 105) выполнен с возможностью фильтрации сигнала для одного из двух источников звука (107, 109).

3. Устройство многоканального акустического эхокомпенсатора по п.2, причем значение времени является продолжительностью времени с последнего обновления по меньшей мере одного из нестационарных фильтров (103, 105).

4. Устройство многоканального акустического эхокомпенсатора по п.3, в котором схема взвешивания (119) выполнена с возможностью увеличения относительного веса обновления оценки канала для увеличивающихся продолжительностей времени.

5. Устройство многоканального акустического эхокомпенсатора по п.3, в котором схема взвешивания (119) выполнена с возможностью формирования масштабного коэффициента для номинального значения веса и определения относительного веса в ответ на масштабный коэффициент для номинального значения веса, причем масштабный коэффициент зависит от продолжительности времени.

6. Устройство многоканального акустического эхокомпенсатора по п.2, в котором по меньшей мере один нестационарный фильтр (103, 105) выполнен с возможностью обновляться в дискретные моменты времени, посредством этого предоставляя кадры фильтра, в которых нестационарный фильтр (103, 105) является постоянным; и схема взвешивания (119) выполнена с возможностью изменения относительного веса в кадре фильтра в зависимости от текущей продолжительности времени с начала кадра фильтра.

7. Устройство многоканального акустического эхокомпенсатора по п.6, в котором схема эхоподавления выполнена с возможностью выполнения кадрового эхоподавления; и схема взвешивания (119) выполнена с возможностью изменения относительного веса между последовательными кадрами эхоподавления.

8. Устройство многоканального акустического эхокомпенсатора по п.7, в котором схема взвешивания (119) выполнена с возможностью определения относительного веса в зависимости от номера кадра эхоподавления в кадре фильтра.

9. Устройство многоканального акустического эхокомпенсатора по п.8, в котором схема взвешивания (119) выполнена с возможностью определения значения веса для обновления оценки канала как, по существу, пропорционального:

где k - номер кадра эхоподавления, K - количество кадров эхоподавления в кадре фильтра, и mod представляет функцию взятия модуля.

10. Устройство многоканального акустического эхокомпенсатора по п.7, причем имеется, по существу, целочисленное отношение между длительностью кадров фильтра и длительностью кадров эхоподавления.

11. Устройство многоканального акустического эхокомпенсатора по п.1, дополнительно содержащее схему изменения для обнаружения того, что изменение по меньшей мере в первом канале среди каналов от каждого из источников звука (107, 109) для микрофона (111) удовлетворяет некоторому критерию; и схему для определения значения времени в виде продолжительности времени от изменения.

12. Устройство многоканального акустического эхокомпенсатора по п.11, в котором схема изменения выполнена с возможностью задания начального значения для относительного веса после изменения; и схема взвешивания (119) выполнена с возможностью увеличения относительного веса для увеличения продолжительностей времени с момента изменения.

13. Устройство многоканального акустического эхокомпенсатора по п.11, в котором схема взвешивания (119) выполнена с возможностью определения относительного веса в зависимости от интервала усреднения эхоподавления.

14. Устройство многоканального акустического эхокомпенсатора по п.1, причем относительный вес является функцией только номинального значения веса и значения времени.

15. Способ многоканального акустического эхоподавления с использованием схемы эхоподавления (113, 115), соединенной с микрофоном (111), при этом способ содержит этапы, на которых:
- принимают сигнал микрофона от микрофона (111), причем сигнал микрофона содержит составляющие по меньшей мере от двух источников звука (107, 109), которые нужно подавить;
- выполняют эхоподавление у двух источников звука (107, 109) на основе оценок канала для каналов от каждого из двух источников звука (107, 109) для микрофона;
- формируют каждую из оценок канала в виде объединения предыдущей оценки канала и обновления оценки канала, при этом объединение содержит применение относительного веса к обновлению оценки канала относительно предыдущей оценки канала; и
- изменяют относительный вес в ответ на значение времени.



 

Похожие патенты:

Изобретение относится к электроакустике и звукоусилительной технике и может быть использовано для усиления звуковых сигналов. .

Изобретение относится к технике электрической связи и звукоусиления. .

Изобретение относится к области приборостроения, а именно к устройствам для усиления звука. .

Изобретение относится к электроакустике и звуковещательной технике. .

Изобретение относится к электроакустике и звуковещательной технике. .

Изобретение относится к электроакустике и звуковещательной технике. .
Наверх