Устройство и способ расчета коэффициентов фильтра эхоподавления

Изобретение относится к устройствам и способам расчета коэффициентов пропускания адаптивного фильтра, предназначенного для подавления эха микрофонного сигнала, возбуждаемого сигналом громкоговорителя. Техническим результатом является улучшение качества звука в системах подавления или компенсации эхосигнала. Реализация вычислительного устройства (200), рассчитывающего коэффициенты пропускания адаптивного фильтра (210), обрабатывающего микрофонный сигнал с целью подавления эхосигнала, возбуждаемого сигналом громкоговорителя, которое включает в себя экстрактор (250) стационарной или нестационарной компоненты сигнала громкоговорителя или сигнала, производного от него, и вычислитель (270) коэффициентов пропускания адаптивного фильтра (210), использующий экстрагируемые стационарную или нестационарную компоненты сигнала. 3 н. и 21 з.п. ф-лы, 22 ил.

 

Конструктивные решения предлагаемого изобретения относятся к устройству и способам расчета коэффициентов пропускания адаптивного фильтра, предназначенного для подавления эха микрофонного сигнала, возбуждаемого сигналом громкоговорителя, и могут быть применены, например, в системах конференцсвязи. К системам конференцсвязи здесь отнесены телефонные, видео- и другие разновидности сетей интерактивной дуплексной связи.

Акустическое эхо возникает, когда тональные сигналы, звуки и шумы от громкоговорителя улавливаются микрофоном, установленным в том же помещении или в той же акустической среде. В телекоммуникационных сетях такой акустический сигнал возвращается абоненту на дальнем конце линии в виде его собственной речи, звучащей с запозданием. В подобных ситуациях отраженные сигналы являются отвлекающим и раздражающим фактором и могут быть причиной нарушения полноценной интерактивной дуплексной связи. Кроме того, акустическое эхо может генерировать паразитный гул и другие проявления нестабильных состояний акустического контура обратной связи.

В публикации WO 2006/111370 А1 авторы описывают устройство и способ устранения эха многоканального аудиосигнала. Контроль над акустическим эхо-сигналом и подавление помех является существенной частью любой управляемой „без рук" сети дальней связи, например, системы телефонной или аудио- и видеоконференции. Описанный в издании способ обработки многоканальных звуковых сигналов громкоговорителя и, по меньшей мере, одного микрофонного сигнала включает в себя операции преобразования входного сигнала микрофона в его крактовременные спектры, расчета на основе сигналов громкоговорителя кратковременного спектра комбинированного сигнала громкоговорителя, расчета на основе входного сигнала микрофона кратковременного спектра комбинированного сигнала микрофона, оценки спектра амплитуды или спектра мощности эхо-сигнала в комбинированном кратковременном спектре сигнала микрофона, расчета фильтра усиления для коррекции амплитуды кратковременного спектра входного сигнала микрофона, применения фильтра усиления, по крайней мере, к одному спектру входного сигнала микрофона и преобразования отфильтрованного входного спектра микрофона во временную область.

Применяемые сегодня системы эхоподавления и эхокомпенсации, называемые также системами устранения эха, часто бывают неэффективными для многих видов

звуков, тонов и шумов, несмотря на используемые в них адаптивные фильтры. Например, в коммуникационной системе преобладание одного элемента над другим может привести к неоптимальной компенсации эхо-сигнала громкоговорителя в составе сигнала микрофона. С другой стороны, в случае искажений при совмещении компонент из разных источников вследствие использования средств подавления или компенсации эха могут возникать тональные артефакты, которые также воспринимаются как крайне раздражающий фактор.

Таким образом, на базе известного уровня техники в настоящем изобретении ставится задача улучшить качество звука в системах подавления или компенсации эхо-сигнала.

Эта задача решается с использованием устройства по пункту 1, способа по п.23, 25 или программы по п.26 патентной формулы.

В техническом исполнении вычислитель коэффициентов пропускания адаптивного фильтра сигнала микрофона, предназначенного для подавления эха, возбуждаемого сигналом громкоговорителя, включает в себя экстрактор стационарной или нестационарной составляющей сигнала громкоговорителя или производной сигнала громкоговорителя. Кроме того, в конструкцию включен вычислитель коэффициентов пропускания адаптивного фильтра на базе экстрагированных стационарных или нестационарных компонент сигнала.

При данной конфигурации осуществление способа расчета коэффициентов пропускания адаптивного фильтра микрофонного сигнала для подавления эха, возбуждаемого сигналом громкоговорителя, состоит в выборе стационарной или нестационарной составляющей сигнала громкоговорителя или производной сигнала громкоговорителя и вычислении коэффициентов пропускания адаптивного фильтра на основе селектированной стационарной или нестационарной компоненты сигнала.

Реализация предлагаемого изобретения основана на заключении, что улучшение качества звука может быть достигнуто за счет улучшения статистических свойств сигнала громкоговорителя или производной сигнала громкоговорителя, анализ которых выполняется при вычислении коэффициентов адаптивной фильтрации для подавления эха. С этой целью сигнал громкоговорителя или производную от сигнала громкоговорителя анализируют для выделения одной или нескольких соответствующих стационарных и/или нестационарных составляющих сигнала. Затем, на базе выявленной стационарной или нестационарной компоненты сигнала выполняют расчет коэффициентов пропускания адаптивного фильтра.

Стационарная компонента сигнала или производной сигнала, например громкоговорителя, может отображать, скажем, в частотной области, значение энергии, которое только незначительно изменяется во времени, или может образовывать соответствующую стационарную составляющую. Таким образом, стационарная составляющая подобного сигнала может быть определена, например, в частотной области при одновременном определении энергопоказателя для соответствующего полосового сигнала и усреднении во времени. Усреднение может быть плавающим и выполняться с различными расчетными характеристиками. Такое вычисление может быть выполнено рекурсивно с использованием конструкции типа фильтра с БИХ (БИХ = бесконечная импульсная характеристика). Аналогично, соответствующее усреднение может быть выполнено с использованием конструкции типа фильтра с КИХ (КИХ = конечная импульсная характеристика).

Следовательно, нестационарная компонента сигнала или производного сигнала громкоговорителя может быть определена на базе соответствующего полосового сигнала. В реализациях настоящего изобретения соотносимая нестационарная компонента может быть определена с помощью стационарной компоненты сигнала и фильтра усиления. Фильтр усиления может зависеть, по меньшей мере, от одного управляющего параметра, который при осуществлении настоящего изобретения определяют, например, на базе функции когерентности, которая учитывает сигнал громкоговорителя и сигнал микрофона или сигналы, производные от них.

Согласно данному изобретению коэффициенты пропускания первого фильтра вычисляют, исходя из стационарной составляющей сигнала, коэффициенты пропускания второго фильтра, на базе которых в итоге определяются коэффициенты пропускания для адаптивного фильтра, вычисляют, исходя из нестационарной компоненты. При этом коэффициенты пропускания адаптивного фильтра могут соответствовать последовательному соединению первого фильтра, который базируется на коэффициентах пропускания первого фильтра, со вторым фильтром, который базируется на коэффициентах пропускания второго фильтра. Реализация данного изобретения позволяет также определять коэффициенты фильтрации как на основе коэффициентов пропускания первого фильтра, так и на основе коэффициентов пропускания второго фильтра.

Далее будут описаны варианты конструктивных решений и функциональные возможности предлагаемого изобретения. В зависимости от версии исполнения как стационарные, так и нестационарные составляющие могут оцениваться, исходя из соответствующих сигналов. Далее, конструкция, реализуемая в соответствии с настоящим изобретением, может включать в себя устройство фильтрации шумов микрофонного сигнала, выполненное на основе коэффициентов фильтрации.

Варианты осуществления предлагаемого изобретения будут более подробно рассмотрены и графически проиллюстрированы ниже. Таким образом, более предметным обсуждение настоящего изобретения будет в сопровождении следующих фигур:

на фиг.1 показана типичная ситуация, при которой требуется устранение акустического эха;

на фиг.2 дана принципиальная блочная схема вычислителя коэффициентов фильтрации согласно подходу настоящего изобретения;

на фиг. с 3A по 3С даны принципиальные блочные схемы вариантов экстрактора согласно подходу настоящего изобретения;

на фиг.4А и 4B даны принципиальные блочные схемы дополнительного фильтра предварительного анализа эхо-сигнала согласно подходу настоящего изобретения;

на фиг. с 5А по 5Е даны принципиальные блочные схемы вариантов вычислителя в реализациях настоящего изобретения;

на фиг.6 дана принципиальная блочная схема модификации предлагаемого изобретения;

на фиг.7 дана принципиальная блочная схема осуществления изобретения в конфигурации вычислителя коэффициентов фильтрации;

фиг. с 8а по 8с графически отображают разделение стационарной и нестационарной компонент сигнала громкоговорителя;

на фиг.9а графически отображает функцию фильтра эхоподавления для нестационарной компоненты сигнала на частоте 1 кГц;

на фиг.9b графически отображает функцию коррелирующего фильтра эхоподавления для нестационарной компоненты этого сигнала;

на фиг. с 10а по 10с показано соотношение уровней стационарной и нестационарной составляющих, усиления предсказания и речевой активности канала громкоговорителя;

на фиг.11 дана принципиальная блочная схема варианта реализации предлагаемого изобретения;

на фиг.12 дана принципиальная блочная схема варианта реализации предлагаемого изобретения;

на фиг.13 представлена принципиальная блочная схема многоканального решения данного изобретения;

на фиг.14 приведен пример группирования спектра равномерного кратковременного преобразования Фурье для моделирования неравномерного частотного разрешения слуха человека;

на фиг.15а показан график применения интерполирующих фильтров Ханна для частотного сглаживания фильтра усиления;

на фиг.15b показана кривая интерполяции коэффициентов фильтра усиления.

В начале подробного описания на базе фигур со 2 по 15 вариантов реализации настоящего изобретения, решающих задачу подавления акустического эха за счет разделения стационарных и нестационарных составляющих сигнала, на фиг.1 проиллюстрирована типичная ситуация, в которой требуется устранение акустического эха.

На чертежах приняты следующие обозначения:

100 громкоговоритель;

110 микрофон;

120 акустическая среда;

130 сигнал громкоговорителя;

140 сигнал микрофона;

150 блок устранения эха;

160 сигнал с блокированным эхом;

170 прямой путь;

180 непрямой путь;

200 устройство (расчета коэффициентов фильтрации);

210 адаптивный фильтр;

220 вход;

230 времячастотный преобразователь (ВЧП);

240 фильтр предварительного анализа эхо-сигнала;

250 экстрактор;

260 фильтр предварительного анализа эхо-сигнала;

270 вычислитель;

280 вход;

290 времячастотный преобразователь (ВЧП);

300 частотно-временной преобразователь (ЧВП);

310 выход;

320 усреднитель;

330 фильтр усиления;

340 вычислитель параметров;

350 распределитель;

360 звено фильтра;

370 вычислитель параметров фильтрации;

380 комбинатор;

390 селектор;

400 определитель параметров;

410 распределитель;

420 кривая графика;

430 кривая графика;

440 фигурная скобка;

450 фигурная скобка;

460 стрелка;

470 фильтр предварительного анализа эхо-сигнала;

480 устройство задержки;

490 вычислитель величины энергии;

500 вычислитель величины энергии;

510 вычислитель величины энергии;

520 дополнительный вычислитель;

530 группиратор;

540 дополнительный группиратор.

Акустическое эхо возникает, когда микрофон улавливает тоны, звуки или шумы, исходящие от громкоговорителя, расположенного в том же помещении или в той же акустической среде. В телекоммуникационных системах акустические сигналы обратной связи ретранслируются собеседнику на дальнем конце линии, который воспринимает их как эхо собственной речи. В подобной ситуации эхо-сигналы могут быть сильным отвлекающим фактором и даже нарушать ход интерактивной полнодуплексной связи. Кроме того, акустическое эхо может генерировать паразитный свист и другие нестабильные состояния акустического контура обратной связи. Естественно, что системы дистанционной связи с управлением без использования рук, обеспечивающие полноценную двухстороннюю коммуникацию, требуют контроля за эхо-сигналом для устранения взаимодействия между громкоговорителем и микрофоном. Фиг.1 иллюстрирует ситуацию возникновения акустического эха.

На фиг.1 показаны громкоговоритель 100 и микрофон 110, расположенные в одной акустической среде 120, которая может, например, сформироваться в помещении. Аналогично акустическая среда 120 может быть образована внутренним объемом салона автомобиля.

На фиг.1 сигнал громкоговорителя 130, или x[n], где временной показатель n - целое число, поступает на громкоговоритель 100. Микрофон 110 ловит шумы, звуки и тональные сигналы общего звукового окружения 120 и генерирует микрофонный сигнал 140 или y[n]. Согласно фиг.1 сигнал громкоговорителя 130 и сигнал микрофона 140 в виде входных сигналов поступают в эхокомпенсатор 150, который на выходе формирует из микрофонного сигнала 140 очищенный от эха сигнал 160, или e[n].

Таким образом, фиг.1 иллюстрирует проблему возникновения и борьбы с акустическим эхом в системах двухсторонней связи. Сигнал с дальнего конца телекоммуникационной линии, преобразованный громкоговорителем в звук, поступает в микрофон прямым путем 170 и по отраженным траекториям 180-1, 180-2, которые называют также косвенными каналами. Вследствие этого микрофон 110 воспринимает не только голос, звучащий локально на передающем конце линии, но улавливает также и эхо, которое сразу же ретранслируется обратно на принимающий конец линии.

Иначе говоря, сигнал громкоговорителя x[n] вновь смешивается с сигналом микрофона y[n]. В идеале, с помощью блока эхокомпенсации 150 такое эхо должно быть полностью устранено, в то время как исходящий голосовой сигнал на ближнем конце телекоммуникационной системы должен быть пропущен.

Стандартным способом борьбы с отраженным сигналом является параллельное включение в канал распространения эхо-сигнала акустического эхоподавителя (АЭП), как описано в [1]. Такой акустический эхоподавитель анализирует цифровую реплику эхо-сигнала, вычитая ее впоследствии из измеренного или фактического микрофонного сигнала. Стандартные подходы к проблеме удаления акустического эха базируются на заключении, что прохождение эхо-сигнала может быть смоделировано с помощью фильтра с КИХ (с конечной импульсной характеристикой), после чего применяются соответствующие подавители акустического эха, что также описано в [С.Breining, P.Dreiseitel, E.Hänsler, A.Mader, В.Nitsch, H.Puder, Т.Schertler, G.Schmidt, and J. Tilp. Acoustic echo control. IEEE Signal Processing Magazine, 16(4): 42-69, July 1999]. В силу того, что путь формирования эха, как правило, неизвестен и, более того, может изменяться в ходе рабочего процесса, линейный фильтр такого акустического эхозаградителя обычно реализуется как адаптивный. Для моделирования типичных путей формирования эха применяются КИХ-фильтры с длительностью, не превышающей несколько сотен миллисекунд, что соответствует частоте дискретизации, что, в свою очередь, предполагает высокий уровень вычислительной сложности.

Уровни затухания эха, достигаемые при практическом использовании традиционных подходов, по различным причинам часто бывают недостаточными. Такими причинами могут быть, в частности, слишком продолжительная реверберация (эффект хвоста эха), которая приводит к погрешностям моделирования путей прохождения эхо-сигнала, нелинейные составляющие эхо-сигнала, вызванные, например, вибрациями или нелинейными отклонениями в недорогом аудиооборудовании, и конвергенция в случае высокой нестабильности каналов прохождения эха, что рассмотрено в [А.N.Birkett and R.A.Goubran. Limitations of handsfree acoustic echo cancellers due to nonlinear loudspeaker distortion and enclosure vibration effects. In Proc. IEEE Workshop on Applications of Signal Processing to Audio and Acoustics, p.13 - 16, New Paltz, Oct. 1995]. Поэтому для ликвидации остаточного эха и его составляющих, которые не были устранены с помощью компенсатора акустического эха, эхокомпенсаторы комбинируют с нелинейными постпроцессорами, как описано в [G.Schmidt and E.Hänsler. Acoustic echo and noise control: a practical approach. Hoboken: Wiley, 2004]. В большинстве случаев остаточное эхо гасят частотно-избирательным способом, как описывается в [W.L.В.Jeannes, P.Scalart, G.Faucon, and С.Beaugeant. Combined noise and echo reduction in hands-free systems: a survey. IEEE Transactions on Speech and Audio Processing, 9(8): 808-820, Nov. 2001]. Фактически, все акустические эхокомпенсаторы дооснащают постпроцессорами, поскольку слишком часто они не глушат эхо полностью, чтобы его не было слышно.

Недавно в [С.Faller and J.Chen. Suppressing acoustic echo in a sampled auditory envelope space. IEEE Trans. on Speech and Audio Proc., 13(5): 1.048-1.062, Sept. 20055, и С.Faller and С.Toumery. Estimating the delay and coloration effect of the acoustic echo path for low complexity echo suppression. In Proc. Intl. Works, on Acoust. Echo and Noise Control (IWAENC), Sept. 2005] было предложено несколько устройств подавления акустических эхо-сигналов в подполосовой области, которые сходны с вышеупомянутыми нелинейными постпроцессорами, но не нуждаются в компенсаторе акустического эха и в оценке импульсной характеристики траектории эха. В публикациях сообщается, что эти системы характеризуются низкой вычислительной сложностью, надежностью и высокими дуплексными характеристиками.

В разработке [С.Faller and С.Toumery. Estimating the delay and coloration effect of the acoustic echo path for low complexity echo suppression. In Proc. Intl. Works, on Acoust. Echo and Noise Control (IWAENC), Sept. 2005] устройства подавления акустического эха для вычисления спектров сигналов громкоговорителя и микрофона предлагается алгоритм с использованием оконного (кратковременного) преобразования Фурье (ОПФ). К соответствующему сигналу громкоговорителя применяют величину задержки d между двумя сигналами, преобразованными с помощью ОПФ, которую выбирают учитывая наибольшее воздействие импульсной характеристики канала прохождения эха.

Затем оценивают фильтр анализа действительного эхо-сигнала, который имитирует начальный путь прохождения эха. Для получения амплитудной спектральной характеристики эхо-сигнала к спектру сигнала громкоговорителя применяется расчетная величина задержки и фильтр предварительного анализа эхо-сигнала. С использованием полученной амплитудной спектральной характеристики эхо-сигнала рассчитывается действительный фильтр эхоподавления и применяется к спектру микрофонного сигнала для гашения эха.

Недостаток вышеупомянутых систем подавления акустического эхо-сигнала состоит в том, что они не в полной мере выполняют свои функции в отношении смешанных сигналов громкоговорителя, содержащих как стационарные, так и нестационарные составляющие. Это может иметь место, например, когда речь на дальнем конце линии звучит в условиях высокого уровня шума. В такой ситуации сигнал громкоговорителя и эхо-сигнал содержат нестационарную составляющую в форме речи на дальнем конце и стационарную составляющую в виде шумового фона на том же дальнем конце линии связи.

Действующие системы акустического эхоподавления задают только один эхогасящий фильтр для сигнала громкоговорителя. Отсюда следует, что в указанных подходах не учитывается, что компоненты эха с различными характеристиками возбуждают в сигналах передающего конца различные типы искажений, которые впоследствии требуют разных видов обработки.

На фиг.2 показан первый из вариантов реализации устройства 200 для расчета коэффициентов пропускания адаптивного фильтра 210, в котором, как и в сопутствующем способе, применено разделение стационарного и нестационарного сигналов для совершенствования эхоподавления и, следовательно, для улучшения качества воспринимаемого звука. Таким образом, технические решения по настоящему изобретению предполагают применение разнообразных методов компенсации сигналов в зависимости от их статистических свойств и особенностей, что обеспечивает более эффективное эхоподавление, в меньшей степени подверженное проявлению артефактов.

Подробное описание вариантов исполнения данного изобретения, представленных на фиг.3-5, предваряет рассмотрение принципиальной блочной схемы устройства 200. Здесь необходимо обратить внимание на то, что иллюстрации и описания принципиальных схем устройств, предлагаемых в изобретении, являются одновременно блок-схемами соответствующих способов. Иначе говоря, принципиальные блочные схемы рассматриваемых конструкций устройства соответствуют блок-схемам алгоритмов предлагаемого способа, где отображена последовательность операций, выполняемых компонентами оборудования.

При этом следует учитывать, что в рамках данного описания для устройств, блоков и схем, одинаковых или сходных по своим функциям, используются одинаковые или похожие номера ссылок. Одновременно, устройства, блоки и схемы, обозначенные совпадающими или похожими номерами ссылок, содержат идентичные или подобные структурные и функциональные характеристики. Другими словами, в предлагаемом описании одинаковые номера ссылок служат для обозначения устройств, блоков и схем, имеющих одинаковые или сходные функции, назначение или конструкцию. Это позволяет сжато изложить материалы представляемого изобретения, используя описание одного технического решения для пояснения другого варианта реализации, если однозначно не определено иное.

Кроме того, при описании изобретения для неоднократного обозначения устройств, блоков и схем на одной фигуре используются номера обобщающих ссылок. В частности, для двух непрямых траекторий 180-1, 180-2 на фиг.1 определены разные номера ссылок, но, если непрямые траектории упоминаются как таковые или если рассматриваются их общие отличительные свойства, применяется только номер обобщающей ссылки 180. Это также способствует краткости изложения и лучшему пониманию предлагаемого описания. Устройство 200 на фиг.2 имеет входной терминал 220 для ввода сигнала громкоговорителя, не показанного на фиг.2. Через входной терминал 220 сигнал вводится во времячастотный преобразователь 230, показанный на фиг.2 пунктиром как опция устройства 200. Из времячастотного преобразователя 230 сигнал может быть подан на первый фильтр анализа эхо-сигнала 240, который как опция тоже не обязателен в конструкции устройства 200. Выход фильтра предварительного анализа эхо-сигнала 240 соединен с входом 250а экстрактора 250, который, в свою очередь, через первый выход 250с и второй выход 250d может быть подключен к произвольно устанавливаемому второму фильтру предварительного анализа эхо-сигнала 260 через его первый вход 260а и второй вход 260b. Наличие этого фильтра преданализа эхо-сигнала также необязательно и зависит от конкретной реализации. Скажем, устройство 200, предлагаемое в настоящем изобретении, может быть конструктивно решено как с введением первого 240 и второго 260 фильтра предварительного анализа эхо-сигнала вместе или по отдельности, так и без любого из них или обоих. Безусловно, возможен вариант, где используется только один из двух фильтров предварительного анализа эхо-сигнала 240, 260. Осуществимы также технические решения с задействованием других элементов схемы.

При наличии второго фильтра предварительного анализа эхо-сигнала 260 его первый выход 260с и второй выход 260d подсоединяются к первому входу 270а и второму входу 270b вычислителя 270 коэффициентов пропускания адаптивного фильтра 210. Вычислитель 270 через выход 270d соединен с входом адаптивного фильтра 210.

На другой вход адаптивного фильтра 210 через дополнительный времячастотный преобразователь 290 от входного терминала 280 может подаваться сигнал микрофона. Выход адаптивного фильтра 210 может быть соединен через дополнительный частотно-временной преобразователь 300 с терминалом вывода микрофонного сигнала 310. Одновременно входной терминал 280 произвольно подключается через времячастотный преобразователь 290 к второму входу 250b экстрактора 250 и к третьему входу 270 с вычислителя 270. При этом оба ввода - 250b экстрактора 250 и 270с вычислителя 270 - играют роль вспомогательных и могут быть введены независимо друг от друга в различные аппаратные версии настоящего изобретения.

Например, устройство 200 может быть включено в блок устранения эха 150, показанный на фиг.1.

Перед более детальным рассмотрением функций устройства 200 в варианте на фиг.2 следует отметить, что, в целом, конструкция предлагаемого изобретения может быть решена на базе как дискретных, так и интегральных, или иных, более сложных, схем. В частности, данное изобретение может быть встроено в средства обработки данных, такие как процессоры, интегрированные системы (SOC = системы на кристалле), прикладные интегральные схемы (ASIC) или иные интегральные микросхемы и специализированные процессоры. В таких конфигурациях идентичные элементы контуров обработки данных могут задействоваться поочередно для различных устройств. Например, один и тот же логический вентиль арифметического логического устройства (АЛУ) микропроцессора может быть использован, во-первых, для управления экстрактором 250, и, во-вторых, вычислителем 270. Тем не менее, устройства могут значительно отличаться друг от друга, как, например, в вышеупомянутом случае они требуют разные управляющие команды, в совокупности определяющие каждое из устройств. В силу этого допустимо частичное или полное перекрывание элементов схемотехники, реализуемых в различных версиях устройств.

Во многом по этой причине здесь в описании сопряженные устройства, блоки и схемы понимаются как прямо или опосредованно взаимосвязанные. К примеру, если реализация базируется на средствах обработки данных, взаимодействие может осуществляться через ячейку памяти, содержащую промежуточный результат в форме защелкнутого в ней сигнала.

Более того, однако, конструктивные решения настоящего изобретения не ограничиваются цифровыми устройствами, хотя, в дальнейшем будут описываться преимущественно цифровые средства. Изобретение принципиально предусматривает возможность его аналогового и смешанного аналого-цифрового исполнения. В такие конфигурации дополнительно вводятся АЦП или ЦАП (аналого-цифровые или цифроаналоговые преобразователи) для трансформации одного вида сигналов в другой.

В зависимости от назначения устройства 200, изображенного на фиг.2, сигнал громкоговорителя, поступающий на вход 220, может быть преобразован в частотную область с помощью времячастотного преобразователя 230, который показан как опция. Времячастотный преобразователь 230 обеспечивает на выходе адекватное спектральное представление блоков данных (фреймов) из временной области. В зависимости от конкретной реализации изобретения в конфигурацию времячастотного преобразователя 230 могут быть введены преобразователь Фурье, подполосный преобразователь или КЗФ-преобразователь (на базе КЗФ = квадратурно-зеркального фильтра). Независимо от конкретного приложения времячастотный преобразователь 230 трансформирует принимаемый им сигнал (из временной области) в множество полосовых сигналов. Каждый полосовой сигнал имеет характеристическую частоту, которая может быть средней частотой, нижней частотой среза или верхней частотой среза соответствующей полосы. В зависимости от особенностей технического решения разные полосовые сигналы могут иметь больше одной характеристической частоты или характеризоваться другими параметрами.

Первый фильтр предварительного анализа эхо-сигнала 240 дает возможность модуляции акустической среды 120 (на фиг.1), которая обеспечила бы на его выходе сигнал, содержащий расчетную амплитудную спектральную характеристику, соответствующую сигналу, который будет сформирован наложением на сигнал микрофона сигнала громкоговорителя. Тем не менее, как уже пояснялось выше, первый фильтр предварительного анализа эхо-сигнала 240 является вспомогательным и не обязателен к монтажу.

Далее, сигнал громкоговорителя или сигнал, производный от него, полученный в результате преобразования и фильтрации соответствующими дополнительными инструментами 230 и 240, поступает на первый вход экстрактора 250. Экстрактор 250 селектирует из сигнала громкоговорителя или из его деривата стационарную и нестационарную компоненты. В частности, стационарная компонента может быть рассчитана через усреднение входного сигнала, что описано ниже.

В зависимости от выбранного технического решения сигнал может представлять собой вычисленный сигнал, имеющий отклонения от „реальной" стационарной составляющей. Соответственно, нестационарная составляющая может быть определена из стационарной составляющей сигнала, например, при задействовании фильтра усиления, который не показан на фиг.2.

В других реализациях экстрактор 250 может использовать другой метод оценки устойчивости.

Нестационарная компонента также может быть определена, например, путем сравнения временного изменения во входном сигнале. Кроме того, в случае встраивания в конфигурацию или в среду устройства 200 голосового кодека можно прибегнуть к методу предсказания с использованием экстрактора 250 для экстракции, по меньшей мере, одного из двух упомянутых сигналов. Подобный метод предсказания может представить, например, сигнал ошибки кодека LPC (LPC = кодирование с линейным предсказанием).

Экстрактор 250 имеет два выхода, обозначенных выше, на которые в зависимости от требований могут подаваться различные сигналы. В частности, как правило, по меньшей мере, стационарная или нестационарная компонента поступает на первый выход экстрактора 250. На второй выход поступает вторая из двух компонент или сигнал, содержащий информацию о выходном сигнале на первом выходе. Это могут быть, предположительно, параметры дальнейшей обработки вычислителем 270 соответствующего сигнала, или это может быть простой управляющий сигнал, указывающий, какая из двух составляющих передается.

По выполняемым функциям произвольный второй фильтр предварительного анализа эхо-сигнала 260, как правило, соответствует первому фильтру предварительного анализа эхо-сигнала 240. Обычно второй фильтр предварительного анализа эхо-сигнала 260, если он рассчитан на выполнение подобной оценки эха, может оценивать сигнал громкоговорителя на входном терминале 220, чтобы в результате получить сигнал, который соответствовал бы сигналу, воспринимаемому микрофоном при условии отсутствия других источников шума. Первый фильтр предварительного анализа эхо-сигнала 240, как и второй фильтр предварительного анализа эхо-сигнала 260, может факультативно включать в себя устройство задержки, учитывающее задержку эха громкоговорителя, улавливаемого микрофоном. Говоря иначе, фильтры 240, 260 могут быть применены также для задержки сигнала громкоговорителя, или производного от него, как с помощью дополнительно смонтированного устройства задержки, так и за счет внутренней схемотехники. В большинстве случаев разделение функций оценки эха, с одной стороны, и задержки, с другой, также возможно, если, например, первый фильтр предварительного анализа эхо-сигнала 240 будет использован только для задержки соответствующего сигнала, а второй фильтр предварительного анализа эхо-сигнала 260 - для анализа реального эха.

Затем сигналы от второго фильтра предварительного анализа эха 260 поступают на вычислитель 270, который, в свою очередь, вычисляет или определяет коэффициенты пропускания адаптивного фильтра 210, исходя из экстрагированной стационарной или нестационарной компоненты. В зависимости от конкретного приложения вычислитель 270 может, кроме того, обращаться к сигналу микрофона, поступающему на входной терминал 280, или к микрофонным сигналам, преобразуемым в частотную область. Этот сигнал доступен также для экстрактора 250, о чем подробнее говорится ниже.

Далее, адаптивный фильтр 210, получающий от вычислителя 270 коэффициенты фильтрации, корректирует спектр микрофонного сигнала с формированием на выходе, по меньшей мере, частично эхокомпенсированного варианта этого сигнала, который пересылается для последующей обработки. В зависимости от специфики технического исполнения микрофонный сигнал, прошедший эхокомпенсацию или описанную выше модификацию спектра, может быть реконвертирован во временную область с помощью частотно-временного преобразователя 300 или выведен напрямую на выходной терминал 310. Однако необходимости в обратном преобразовании во временную область с помощью преобразователя 300 может не быть, если, например, микрофонный сигнал закодирован в частотной или связанной с ней области.

Здесь, перед тем, как приступить к подробному рассмотрению в сопровождении фиг.3А-5Е элементов принципиальной схемы устройства 200 на фиг.2, следует обратить внимание на то, что преобразование сигнала громкоговорителя или его производного может большей частью выполняться в частотной области, причем обработке подлежат, соответственно, одиночный ассоциированный полосовой сигнал, совокупность полосовых сигналов, множество полосовых сигналов или все полосовые сигналы.

Также следует отметить, что отдельные устройства и фильтры могут работать, например, используя энергопоказатели, что зависит от индивидуального конструктивного решения. Энергетический показатель представляет собой результат возведения действительной величины-основания в степень с четным показателем или результат возведения модуля (абсолютной величины) в степень с любым показателем. Например, обрабабываемые с помощью отдельных фильтров или отдельных устройств кратковременные спектры могут использовать энергопоказатели, в частности, - значения энергии, образованные как квадраты модулей соответствующих спектральных коэффициентов. Аналогично этому модульные спектры, то есть абсолютные величины соответствующих спектральных коэффициентов, могут быть использованы с показателем 1. Формулируя иначе, величины, пропорциональные SzSm, где m - положительное, скажем, натуральное, число, могут быть использованы в качестве энергетических показателей, начиная с любого значения z, являющегося действительной или комплексной величиной. При z, являющемся действительной величиной, величины, пропорциональные z2m, могут дополнительно использоваться как энергопоказатели.

На фиг.3A дана принципиальная схема экстрактора 250, реализованного в соответствии с настоящим изобретением как возможный компонент устройства 200. Экстрактор 250 имеет только один первый вход 250а, произвольно соединенный с выходом первого фильтра предварительного анализа эхо-сигнала 240, показанного на фиг.2 как опция. Экстрактор 250 на фиг.3A не имеет второй вход (вход 250b на фиг.2).

К первому входу 250а экстрактора 250 подсоединен усреднитель 320, предназначенный для определения среднего значения сигнала на входе 250а. Термин „сигнал” обозначает здесь не только сигналы во временной области (временные сигналы), но и сигналы в частотной области, где соответствующие сигналы являются спектральным представлением сигналов временной области. Аналогично, сигналы могут включать в себя и транслировать информацию, полученную из вышеназванных сигналов, такую как величина амплитуды в частотной области (энергетический спектр), величины энергии (квадраты амплитуды), спектры и другие выведенные значения и показатели.

Внутри контура экстрактора 250 на фиг.3A сигнал, поступивший от входа 250а на усреднитель 320, выводится из него в виде стационарной составляющей сигнала через первый выход 250с. Как показано на фиг.2, первый выход 250с соединен с произвольным вторым фильтром предварительного анализа эхо-сигнала 260 и/или с вычислителем 270.

В рамках контура экстрактора 250 сигнал, принятый на первом входе 250а, далее поступает вместе со стационарной составляющей сигнала от усреднителя 320 на фильтр усиления 330, который формирует нестационарную составляющую сигнала и подает ее на второй выход 250d. Фильтр усиления 330 определяет нестационарную составляющую сигнала на базе принимаемого на первый вход 250а сигнала громкоговорителя или производного от него и на базе стационарной составляющей сигнала. Более подробно функции усреднителя 320 и фильтра усиления 330 будут рассмотрены далее в контексте описания фиг.2.

На фиг.3B показана возможная модификация экстрактора 250 в составе устройства 200. Экстрактор 250 на фиг.3B отличается от экстрактора на фиг.3A наличием вычислителя параметров 340, вход которого тоже соединен с первым входом 250а. С выхода вычислителя параметров 340 сгенерированные им параметры управления выводятся на фильтр усиления 330 для расчета нестационарной компоненты сигнала. Особенности функционирования рассматриваются далее.

Являющийся опцией экстрактор 250, изображенный на фиг.3B, имеет второй вход 250b, уже показанный на фиг.2, который может быть не напрямую соединен, с одной стороны, с дополнительным входом вычислителя параметров 340 и, с другой стороны, с входным терминалом 280 для микрофонного сигнала, что также показано на фиг.2. В данном случае непрямое соединение может быть установлено через времячастотный преобразователь 290. Ниже также рассматриваются особенности работы вычислителя параметров 340.

На фиг.3С показан возможный вариант встраивания экстрактора 250 в конфигурацию устройства 200 на фиг.2. Компоновка экстрактора 250 на фиг.3С базируется на конструкции фиг.3B с привязкой вычислителя параметров 340 в качестве опции с соответствующими соединениями. В отличие от экстрактора 250 на фиг.3B экстрактор 250 на фиг.3С содержит распределитель 350, имеющий два входа, один из которых соединен с выходом усреднителя, а второй - с выходом фильтра усиления 330. Распределитель 350 принимает стационарную компоненту от усреднителя 320 и нестационарную компоненту от фильтра усиления 330.

Два выхода распределителя 350 соединены с первым выходом 250с и со вторым выходом 250d экстрактора 250. Распределитель 350 определяет, какая из двух принятых им компонент будет передана через выход 250 с для последующей обработки. В зависимости от выбора одной из двух компонент распределитель 350 генерирует и выводит на второй выход 250d экстрактора 250 управляющий сигнал, который может содержать, например, информацию о том, которая из двух компонент сигнала поступила на первый выход 250с, или параметры, необходимые для дальнейшей обработки компоненты. Далее будут рассмотрены параметры, которые могут содержаться в выходном управляющем сигнале.

В зависимости от индивидуального конструктивного решения распределитель 350 может передавать компонентный сигнал на первый выход 250с, что подразумевает более высокий уровень громкости, более высокий уровень энергии или большую величину энергии по сравнению с другим компонентным сигналом. При необходимости разные компоненты могут выводиться для разных полосовых сигналов.

Следовательно, экстрактор 250 на фиг.3С отличается от версий, представленных на фиг.3A и 3B, в основном, тем, что формирует на первом выходе 250с только один из двух компонентных сигналов. Как уже пояснялось в связи с фиг.2, экстрактор 250 на фиг.3С генерирует на выходе только управляющий сигнал, который содержит информацию о компонентном сигнале на первом выходе 250с.

На фиг.4А показан первый вариант реализации второго фильтра предварительного анализа эхо-сигнала 260, представленного на фиг.2 также в виде опции. Произвольно устанавливаемый второй фильтр предварительного анализа эхо-сигнала 260 включает в себя два звена фильтра 360-1, 360-2, вход каждого из которых раздельно соединен с входами 260а, 260b соответственно. Оба звена фильтра 360-1, 360-2 выведены раздельно на два выхода 260с, 260d, соответственно, второго фильтра предварительного анализа эхо-сигнала 260.

Второй фильтр предварительного анализа эхо-сигнала 260, показанный как опция на фиг.4А, может использоваться в сочетании с экстрактором 250, изображенном на фиг.3A и 3B. Говоря конкретнее, на фиг.4А второй фильтр предварительного анализа эхо-сигнала 260 обеспечивает одновременную обработку стационарной составляющей сигнала с помощью подфильтра 360-1 и нестационарной составляющей сигнала с помощью подфильтра 360-2. Конструкция двух звеньев фильтра 360-1, 360-2 может быть одинаковой или разной в зависимости от идентичности или различия фильтров анализа эхо-сигнала, используемых при модуляции акустической среды 120 (на фиг.1) для стационарных и нестационарных компонент сигнала. Оба звена фильтра 360-1, 360-2 могут быть реализованы на идентичной элементной базе для выполнения защелкивания или буферизации одного сигнала.

При обсуждении фиг.2 уже говорилось о возможности двоякого применения фильтров анализа эхо-сигнала 240, 260, аналогично этому звенья фильтра 360 могут использоваться, например, только для обеспечения задержки. Естественно, что при реализации второго фильтра предварительного анализа эхо-сигнала 260 предусматривается задействование звеньев фильтрации, отличных от описанных ранее. Например, в звене фильтра 360 предусмотрен дополнительный ввод сигнала управляющего воздействия на процесс фильтрации,

На фиг.4B изображен вариант конструктивного решения второго фильтра анализа эхо-сигнала 260, отличающийся от версии на фиг.4А тем, что в нем реализовано только одно звено фильтра 360, смонтированное между первым входом 260а и первым выходом 260с. В техническом исполнении, представленном на фиг.4, сигнал, принятый на втором входе 260b, поступает на второй выход 260d.

Таким образом, второй фильтр предварительного анализа эхо-сигнала 260, показанный на фиг.4b, может быть функционально встроен, например, в конструкцию экстрактора 250, как представлено на фиг.3С. В этом случае управляющий сигнал, который содержит информацию о компоненте сигнала на первом входе 260а, не модифицируется фильтром анализа эхо-сигнала 260.

Естественно, предусматривается вариант интегрирования фильтра предварительного анализа эхо-сигнала на фиг.4B с экстрактором 250 на фиг.3a и 3B, когда, к примеру, на стадии фильтрации 360 должен быть модифицирован только один из двух компонентных сигналов. Здесь может быть использован зеркальный вариант фильтра анализа эхо-сигнала 260, фильтрующего входной сигнал на втором входе 260b.

На фиг.5А изображен вьяислитель 270, реализованный согласно данному изобретению в комбинации с устройством 200 на фиг.2. В данном случае вычислитель 270 также имеет первый вход 270а и второй вход 270b. Вычислитель 270 далее включает в себя первый и второй вычислители параметров фильтрации 370-1, 370-2, входы которых подключены, соответственно, к входам 270а, 270b. Говоря конкретнее, вход вычислителя фильтра 370-1 соединен с первым входом 270а, чтобы принимать, предположим, стационарную составляющую сигнала. Соответственно, второй вычислитель фильтра 370-2 сопряжен со вторым входом 270b, чтобы принимать нестационарную составляющую сигнала, например, от экстрактора 250, как изображено на фиг.3A или 3b. В случае, если второй фильтр анализа эхо-сигнала 260 смонтирован между экстрактором 250 и вычислителем 270, сигнал, производный от соответствующих компонентных сигналов, передается на оба вычислителя параметров фильтрации 370.

Выходы обоих вычислителей параметров фильтрации 370 подключены к комбинатору 380, чей выход, в свою очередь, соединен с выходом 270d. Вычислитель 270, показанный на фиг.5А как произвольный компонент, имеет третий вход 270с, который внутри контура вычислителя 270 соединен с обоими вычислителями параметров фильтрации 370, и, как также показано на фиг.2, прямо или опосредованно соединен с входным терминалом 280 для микрофонного сигнала.

Принимая во внимание режим работы вычислителя 270, оба вычислителя характеристик фильтра 370 предназначаются для вычисления на базе полученных компонентных сигналов и, возможно, с учетом снятого с входного терминала 280 сигнала микрофона, соответствующих коэффициентов фильтрации, которые позже передаются на комбинатор 380. Оба вычислителя параметров фильтрации 370 производят соответствующие расчеты на основе принятых производных от соответствующих компонентных сигналов, которые могли быть скорректированы вторым фильтром предварительного анализа эхо-сигнала 260. Тем не менее, независимо от этого вычислители характеристик фильтра 370 предназначены для расчета коэффициентов пропускания первого и второго фильтров, соответственно, на базе составляющих сигналов, принятых от экстрактора 250.

Затем, рассчитанные подобным образом коэффициенты пропускания первого и второго фильтров объединяются с помощью комбинатора 380 в набор коэффициентов фильтрации, после чего в качестве входных данных вводятся в адаптивный фильтр 210 через выход 270d вычислителя 270. Такое комбинирование может выполняться с помощью последовательности различных операций. От индивидуального технического решения фильтра, а также, в значительной степени, от задействованных времячастотных преобразователей 230, 290 и взаимодействующего с ними частотно-временного преобразователя 300 зависит комбинаторность коэффициентов пропускания первого и второго фильтров, благодаря чему возможен расчет коэффициентов пропускания адаптивного фильтра 210. Далее будут приведены соответствующие примеры.

На фиг.5B изображен второй вычислитель 270, аналогичный вычислителю на фиг.5A. Он отличается от вычислителя 270 на фиг.5А тем, что комбинатор 380 на фиг.5А замещен селектором 390, который предназначен для вывода на выход 270d набора коэффициентов фильтрации, сформированного на базе коэффициентов пропускания первого и второго фильтров, который основывается или на коэффициентах пропускания первого фильтра первого вычислителя фильтра 370-1 или на коэффициентах пропускания второго фильтра второго вычислителя фильтра 370-2. Формулируя иначе, селектор 390 предназначен для определения коэффициентов пропускания адаптивного фильтра 210 на базе или стационарного, или нестационарного компонентного сигнала.

При такой архитектуре селектор 390 может реализовывать более сложные математические зависимости, основываясь на соответствующем наборе коэффициентов фильтрации вычислителя 370. Однако он отличается от комбинатора 380 в составе вычислителя 270 на фиг.5А тем, что учитывает совокупность из двух наборов коэффициентов фильтрации, выдаваемых вычислителем параметров фильтра 370.

На фиг.5C показан еще один вариант вычислителя 270, который отличается от вычислителя 270 на фиг.5А тем, что в нем вычислитель параметров фильтрации 370 соединен только с первым входом 270а. Дополнительно вычислитель параметров фильтра 370 в структуре вычислителя 270 на фиг.5С подключен ко второму входу 270b для получения через него параметров, необходимых для определения коэффициентов фильтрации. Кроме того, в качестве опции вычислитель параметров фильтра 370 на фиг.5C может быть соединен с третьим входом 270 с для обеспечения возможности расчета коэффициентов фильтрации с учетом микрофонного сигнала.

Таким образом, вычислитель 270 на фиг.5C может работать в сочетании с экстрактором 250, показанным на фиг.3С, и вторым фильтром предварительного анализа эхо-сигнала 260, показанным на фиг.4B. Через второй выход 250d экстрактора 250 параметры, необходимые для расчетов соответствующего вычислителя характеристик фильтра 370, передаются на него непосредственно через второй вход 270b вычислителя 270. Для этого второй вход 270b соединен с терминалом ввода параметров вычислителя характеристик фильтрации 370, через который могут вводиться вспомогательные параметры для вычисления коэффициентов фильтрации.

В силу того, что в контур вычислителя 270 включен только одиночный вычислитель параметров фильтрации 370, комбинатор и селектор могут не использоваться.

На фиг.5D изображена версия вычислителя 270, по конфигурации и выполняемым функциям сходная с аналогом на фиг.5C. В отличие от вычислителя 270 на фиг.5C конструкция вычислителя на фиг.5D дополнена определителем параметров 400, смонтированным между вторым входом 270b и соответствующим разъемом для ввода параметров вычислителя характеристик фильтра 370.

В отличие от вычислителя 270 на фиг.5C вычислитель 270 на фиг.5D может функционировать в составе устройства 200, где экстрактор 250 выдает через второй выход 250d управляющий сигнал, который содержит сведения о том, какой из двух компонентных сигналов он передает через соответствующий первый выход 250с. При расхождении параметров, требуемых вычислителю параметров фильтра 370 для расчета коэффициентов фильтрации для указанных двух компонент сигнала, или при различии сгенерированных на их основании сигналов, соответствующие параметры могут быть рассчитаны с учетом переданного определителем параметров 400 компонентного сигнала при одновременном использовании вычислителя 270, как показано на фиг.5D. В силу этого определитель параметров 400 может быть выполнен, например, в виде блока памяти или вычислительного устройства. Реализация как средства хранения информации возможна в форме постоянного запоминающего устройства (ROM/ПЗУ), энергонезависимого запоминающего устройства (NVM/ЭНЗУ) или оперативного запоминающего устройства (RAM/ОЗУ).

На фиг.5E представлен очередной вариант осуществления вычислителя 270, который имеет в своем составе два вычислителя параметров фильтрации 370-1 и 370-2, чье функционирование зависит от компонентного сигнала, на основе которого должны быть рассчитаны коэффициенты пропускания адаптивного фильтра 210. Здесь входы обоих вычислителей параметров фильтрации 370 подключены к первому входу 270а. Кроме этого, каждый из обоих вычислителей параметров фильтрации 370 может быть произвольно подсоединен к третьему входу 270с, а также - на вход распределителя 410, выход которого сопряжен с выходом вычислителя 270. Распределительный блок 410 имеет дополнительный ввод для управляющего сигнала, соединенный с вторым входом 270b вычислителя 270.

Таким образом, вычислитель 270 на фиг.5E позволяет рассчитывать первый набор коэффициентов фильтрации, используя вычислитель параметров фильтрации 370-1, и второй набор коэффициентов фильтрации, используя второй вычислитель параметров фильтрации 370-2 на основе сигналов, принятых на первом входе 270а. Выбор одного из двух коэффициентов фильтрации, рассчитанных вычислителем параметров фильтрации 370, который в конечном счете должен быть отправлен на выходу 270d, зависит от управляющего сигнала, принятого на входе для команд задающего воздействия распределителя 410 через второй вход 270b. В зависимости от управляющего сигнала, полученного на входе для сигналов управления, распределитель 410 соединяет один из двух входов с выходом 270d.

Таким образом, вычислитель 270 на фиг.5E может действовать, например, в сочетании с экстрактором 250, как показано на фиг.3С, где через второй выход 250d подается управляющая команда, содержащая данные компонентного сигнала, переданного через первый выход 250с. Следовательно, конструкция вычислителя 270, представленная на фиг.5C, может быть применена, например, в тех случаях, когда исходные данные для двух составляющих сигналов, рассчитываемых с помощью вычислителя параметров фильтрации 370, имеют такие расхождения, что не могут быть эффективно преобразованы внесением в параметры простых изменений.

Здесь логично было бы отметить, что разновидности экстрактора 250, показанные на фиг.3А-3С, варианты фильтра предварительного анализа эхо-сигнала 260, представленные на фиг.4A-4B, и модификации вычислителя 270, приведенные на фиг.5A-5E, могут быть взаимно интегрированы в соответствии с конкретным приложением. Предположим, если устройство выбора вычислителя параметров фильтрации 370 с последующим выводом на выход 270d выполняет дальнейшие манипуляции, скажем, вычисления, с опорой на коэффициенты фильтрации, то оно может быть задействовано, к примеру, в модели вычислителя на фиг.5E вместо распределителя 410.

Конструктивные решения по предлагаемому изобретению, представленные выше в описании и на фиг. с 2 по 5, являются новейшими разработками, обеспечивающими раздельное подавление стационарных и нестационарных компонент акустического эха. Это достигается благодаря оценке эхо-сигнала отдельно от неустойчивых и устойчивых составляющих сигнала громкоговорителя. Далее, конструкция согласно данной разработке предусматривает расчет характеристик двух соответствующих фильтров эхокомпенсации для сигналов обоих типов. Эхокомпенсирующие фильтры могут быть оптимизированы индивидуально для максимального улучшения эхоподавления и минимизации артефактов и искажений сигнала на передающем конце.

Дальнейший процесс построен следующим образом. Сначала моделируют сигнал громкоговорителя. Затем, в соответствии с этой моделью разделяют стационарные и нестационарные составляющие, что может быть выполнено на основе оценки стационарных составляющих. После этого спектры мощности стационарных и нестационарных составляющих эха оценивают с помощью фильтров предварительного анализа эхо-сигнала. В силу этого, в некоторых реализациях данного изобретения предусматривается расчет параметров двух эхокомпенсирующих фильтров. Впоследствии процесс разделения стационарных и нестационарных компонент может быть отрегулирован, исходя из практики применения фильтров эхокомпенсации.

Говоря о моделировании сигнала, следует учитывать, что оценка спектра вносимого эха или спектра плотности мощности эхо-сигнала с помощью фильтра предварительного анализа эхо-сигнала на практике, как правило, не очень точна, поскольку для рассмотрения доступна только часть истинной длины траектории эха. С целью предупреждения остаточного эха из-за высокой степени погрешности фильтры эхокомпенсации настраивают на агрессивный режим подавления эхо-сигналов, при котором остаточное эхо полностью удаляется. Такая настройка достигается путем завышения оценки спектра плотности мощности эхо-сигнала и сглаживания по времени, что способствует поддержанию низких значений фильтра усиления.

Когда сигнал громкоговорителя содержит стационарный шум, эхозаградитель пытается блокировать эхо. Применение названных выше фильтров агрессивного эхоподавления часто ведет к глушению не только стационарных эхошумов, но и к ослаблению стационарного шума и речи на ближнем конце.

Здесь предлагается смягчить проблему посредством двух разных путей подавления эха стационарных и нестационарных сигналов, что проиллюстрировано на фиг.6.

На фиг.6 дана принципиальная блочная схема устройства 200 в соответствии с настоящим изобретением, в состав которого входят громкоговоритель 100 и микрофон 110. На громкоговоритель 100 поступает сигнал x[n], который поступает также на экстрактор 250. Другое название экстрактора 250 - дискриминатор устойчивого состояния (селектор стабильности). Как пояснялось в связи с фиг.2, экстрактор 250 снабжен двумя выходами, соединенными с вычислителем 270. В дополнение к этому на вычислитель 270 поступает сигнал y[n] микрофона 110.

В контексте фиг.5А уже был показан вычислитель 270, который включает в себя первый вычислитель параметров фильтрации 370-1 для стационарной составляющей сигнала и второй вычислитель параметров фильтрации 370-2 для нестационарной составляющей сигнала, которые формируются на выходе экстрактора 250. Дополнительно оба вычислителя параметров фильтрации 370 принимают сигнал микрофона.

На основании принятых сигналов вычислитель параметров фильтрации 370 рассчитывает коэффициенты фильтрации Hw и Hs, которые передаются на комбинатор 380. С этой целью выход каждого из обоих вычислителей параметров фильтрации 370 соединен с комбинатором 380. Комбинатор 380, в свою очередь, выводит на адаптивный фильтр 210 коэффициенты фильтрации, рассчитанные или заданные на базе двух наборов коэффициентов фильтрации Hw и Hs.

Чтобы в результате из микрофонного сигнала y[n] получить сигнал с блокированным эхом e[n], на вход адаптивного фильтра 210 дополнительно напрямую поступает сигнал микрофона. На выходе адаптивного фильтра 210 формируется сигнал с блокированным эхом e[n].

Таким образом, адаптивный фильтр 210 осуществляет эхоподавление, в котором участвуют два вычислителя параметров фильтрации 370, каждый из которых рассчитывает фильтры эхокомпенсации в виде соответствующих коэффициентов пропускания фильтра, которые затем комбинатора 380 интегрирует в эффективный фильтр эхокомпенсации.

Обращаясь к фиг.6, следует иметь в виду, что представленная на ней принципиальная схема является упрощенной блочной схемой, где не показаны, например, реализованные времячастотный преобразователь или фильтры предварительного анализа эхо-сигнала.

Подавление нестационарного (речевого) эхо-сигнала должно выполняться в агрессивном режиме во избежание остаточного эха, являющегося раздражающим фактором. Однако стационарные эхо-сигналы, которые могут являться следствием стационарных помех в сигналах громкоговорителя, обычно подавляют менее агрессивно, чтобы предупредить возникновение таких артефактов, как, например, тональные искажения. Чтобы сгенерировать надлежащую модель, сигнал x[n], исходящий от громкоговорителя, может быть разбит на составляющие в соответствии с выражением

где xs[n] моделирует нестационарную составляющую речевого сигнала, a xw[n] имитирует стационарные помехи. Дискретное время обозначено переменным показателем n.

Сначала над обеими частями модели, выраженной уравнением (1), выполняется кратковременное преобразование Фурье с учетом разделения стационарных и нестационарных составляющих, из чего получаем

где m, показатель частоты, и k, временной показатель блока данных, - целые числа. В уравнении (2) нестационарные и стационарные составляющие спектральной плотности мощности сигнала громкоговорителя |X[k,m]|2 выражены как

|Xs[k,m]|2 и |Xw[k,m]|2.

Логично допустить, что xs[n] и xw[n] не коррелируют и имеют среднее значение, приближающееся к нулю. Из этого следует, что |X[k,m]|2 выводится из

В силу этого мгновенная спектральная плотность мощности нестационарной составляющей сигнала громкоговорителя xs[n] может быть восстановлена путем вычитания оценочного спектра мощности стационарной компоненты сигнала из спектра мощности сигнала громкоговорителя |X[k,m]|2 согласно уравнению

В действительности оценивается посредством фильтрации спектральной плотности мощности сигнала громкоговорителя |X[k,m]|2, следуя выражению

Фильтр Fx[k,m], называемый также фильтром усиления, может быть записан в своей исходной форме согласно [W.Etter and G.S.Moschytz. Noise reduction by noise-adaptive spectral magnitude expansion. J. Audio Eng. Soc., 42: 341-349, May 1994] в следующем виде:

где γх - экспонент, а βx - управляющий параметр или параметр настройки интенсивности подавления составляющих стационарного сигнала на случай, если ожидаемое значение этой характеристики было занижено или завышено. Разделение стационарных и нестационарных компонент будет продемонстрировано в контексте фиг.8 при показателе частоты 1 кГц.

Уравнения (5) и (6) описывают функциональные возможности фильтра усиления 330 в составе экстрактора 250, представленные в контексте фиг.2-6.

Оценка стационарных помех может быть выполнена путем корректировки ожидаемой кратковременной спектральной плотность мощности шума времени. В каждом блоке данных (фрейме) k энергетический спектр шума корректируется путем однополюсного усреднения при двух постоянных времени с целью дискриминации речи и шума. Короткий период атаки показывает, что текущий блок данных содержит шум.

Продолжительная постоянная времени ослабления показывает, что текущий блок данных содержит речь.

Практически это реализуется в соответствии с

где µ1 - постоянная времени атаки и µ2 - постоянная времени спада. Следует пояснить, что µ1 и µ2 в уравнении (7) являются безразмерными параметрами, для которых действует условие µ12. Однако, принимая во внимание частоту дискретизации, эти параметры можно интерпретировать и воспринимать как, например, вышеозначенные временные константы. Как в дальнейшем подтвердит отношение пропорциональности (16), фактические постоянные времени и эти параметры обратно пропорциональны друг другу. Постоянная времени атаки µ1 может иметь, например, величину 10000 мс=10 сек., тогда как постоянная времени ослабления, учитывая период дискретизации, может составлять величину 10 мс.

При реализации настоящего изобретения, отображенной на фиг.2-6, функции, описываемые уравнением (7), выполняет усреднитель 320 в составе экстрактора 250.

При определении мощности эхо-сигнала оценку спектра эха можно выполнить применив фильтр предварительного анализа эхо-сигнала G[k,m] к отсроченному по времени спектру мощности сигнала громкоговорителя согласно уравнению:

где |Ŷ[k, m]|2 выражает оценку спектральной плотности мощности эха в сигнале микрофона. Из примененного уравнения (3) следует, что эхо, образующееся из нестационарной составляющей сигнала громкоговорителя, определяется из

а эхо, формирующееся из стационарной составляющей сигнала громкоговорителя, определяется из

В зависимости от одного из конструктивных решений по настоящему изобретению, варианты которых показаны, к примеру, в контексте фиг.2-5, рабочие функции, описываемые уравнением (8), могут быть выполнены, скажем, первым фильтром предварительного анализа эхо-сигнала 240. Техническими возможностями, выраженными уравнениями (9) и (10), может обладать второй фильтр предварительного анализа эхо-сигнала 260, содержащий в себе два звена фильтра 360-1 и 360-2.

Как уже говорилось выше, реализовывать задержку сигналов на величину d, используемую в уравнениях (8)-(10), также могут фильтры предварительного анализа эхо-сигнала 240, 260. Вместо них задержку может обеспечивать времячастотный преобразователь 230, если эта функция не возложена на другое целевое автономное устройство.

Для компенсации эха рассчитываются взаимодействующие фильтры эхоподавления Hs[k,m] и Hw[k,m] и применяются для устранения эха микрофонного сигнала на основании оценок нестационарных и стационарных эхо-сигналов и .

Конструкция, включающая в себя вычислитель 270, показанный, в частности, на фиг.5A, практически может быть осуществлена в соответствии с

В этом случае умножение соответствующих коэффициентов пропускания эхокомпенсирующих фильтров Hs[k,m] и Hw[k,m] выполняет комбинатор 380, замещающий последовательное соединение соответствующих фильтров эхокомпенсации. Умножение нужных коэффициентов фильтрации в частотной области соответствует свертке соответствующих импульсных характеристик во временной области.

Реализуя фильтры эхокомпенсации путем разложения на множители согласно уравнению (II), можно вводить разные коэффициенты усиления в качестве параметров различных составляющих эха. Компоненты нестационарного фильтра эхокомпенсации можно вычислить, например, следуя уравнению:

а составляющие стационарного эхокомпенсирующего фильтра могут быть вычислены в соответствии с

Расчетные показатели βs, γs, βw и γw могут быть использованы для управления планируемым режимом работы каждого из эхокомпенсирующих фильтров. В зависимости от специфики осуществления предлагаемой разработки названные расчетные показатели могут быть отобраны и зафиксированы, предварительно заданы в любой требуемой адаптируемой, программируемой или модифицируемой форме. Стандартным набором экспоненциальных параметров является, в частности, γsw=2.

Так называемые коэффициенты избыточности оценки βs и βw служат для контроля степени агрессивности глушения эха. Скажем, интенсивность некоторого эхокомпенсирующего фильтра может быть усилена за счет увеличения коэффициента избыточности оценки. Поэтому обычно фильтр компенсации стационарного эхо-сигнала Hw[k,m] подбирается с учетом показателя βw=2, благодаря чему достигается умеренное ослабление эха.

С другой стороны, эхокомпенсирующий фильтр, отвечающий за подавление нестационарных составляющих эха, подразумевает агрессивный режим подавления для эффективного ослабления шумовых составляющих речи в эхо-сигнале. В силу этого, расчетный коэффициент избыточности оценки βs часто превышает βw, и, соответственно, βsw. Например, при выборе βw=2, βs может иметь значения в диапазоне 20>βs>2=βw, (предположим, βs=4). В большинстве случаев βw и βs относятся к одному порядку величины.

Пороговые величины Ls и Lw устанавливают максимальный предел затухания эха в децибелах (дБ). Номинальным значением для фильтра компенсации стационарного эхо-сигнала является Lw=-10 дБ или -15 дБ, которое оптимально ограничивает ослабление стационарных эхо-сигналов, снижая вероятность возникновения случайных артефактов. При наличии нестационарного голосового сигнала на дальнем конце линии связи помеховые эхокомпоненты должны быть полностью устранены, что осуществляется за счет установления предельного значения Ls около -60 дБ для нестационарного компонентного сигнала.

Конструктивные возможности, описанные уравнениями (12) и (13), могут быть реализованы в вычислителе параметров фильтрации 370, входящем в конструкции, описанные с помощью фиг.2-6.

Иногда практическое назначение предлагаемой разработки требует не прямого эхоподавления с помощью эхокомпенсирующих фильтров, как описывают уравнения (12) и (13), а, скорее - компенсации эхо-сигнала на базе сопоставимой сглаженной по времени интерпретации. Как и рассмотренные выше расчетные параметры, параметры временного сглаживания обычно требуют подстройки вручную и оптимизации подавления отдельно нестационарного и стационарного эха. Благодаря этому повышается качество воспринимаемого звука, так как специфика подавления стационарных шумовых компонент отличается от особенностей компенсации нестационарных составляющих голосового сигнала.

Эти функциональные возможности могут быть реализованы, например, собственно вычислителем параметров фильтрации 370 или любым устройством с питающей стороны от них, например, комбинатором 380, селектором 390 или распределителем 410. В случае необходимости такое сглаживание по времени может выполняться напрямую с помощью адаптивного фильтра 210.

Говоря об улучшении качества звучания, следует вспомнить, например, что сглаживание должно усиливаться при глушении стационарных составляющих сигнала во избежание так называемых тональных искажений, что описано в [О.Capp'e. Elimination of the musical noise phenomenon with the ephrain and malah noise suppressor. IEEE Trans. Speech and Audio Processing, 2(2): 345-349, April 1994.]. Вместе с тем, при аттенюации следует обеспечить низкие пропускные характеристики фильтров компенсации нестационарного эха, чтобы поддерживать достаточно высокую степень ослабления эхо-сигнала, поскольку названной аттенюации способствует отражение траектории эха. Тем не менее, это не должно снижать адаптируемость адаптивного фильтра 210 в случаях быстрого изменения уровней эхо-сигнала. Обсуждение аспектов качества ясно показывает необходимость индивидуального подхода к отладке и оптимизации эхокомпенсирующих фильтров, определяемых уравнениями (12) и (13).

На фиг.7 представлена расширенная, более полная, принципиальная схема процесса или блок-схема алгоритма аттенюации акустического эха, которая рассматривается дальше. Отображенное на фиг.7 конструктивное решение во многом аналогично варианту исполнения на фиг.2. Здесь также в устройство 200 введен времячастотный преобразователь 230 в конфигурации оконного преобразователя Фурье (ОПФ), принимающий сигнал громкоговорителя x[n].

В верхней части фиг.7 в качестве примера показана кривая 420 сигнала громкоговорителя x[n] как функции времени, проходящая по значениям времени n.

Кроме конвертации сигнала x[n] из временной области в частотную область время-частотный преобразователь 230 выполняет задержку на величину d, о которой говорилось выше. В результате, на выходе времячастотного преобразователя 230 формируется спектр X[k-d,m], являющийся, как правило, комплекснозначным. Данный спектр X[k-d,m] передается на экстрактор 250, обозначенный на фиг.7 буквами SD [ДС] (stationary discrimination [=дискриминатор по стабильности]). В отношении технических решений по изобретению, представленных на фиг.2-5, уже пояснялось, что экстрактор 250 способен также формировать, как показано на фиг.7, в частотной области стационарный компонентный сигнал Xw[k,m,] и нестационарный компонентный сигнал Xs[k,m]. Эти компонентные сигналы поступают на вычислитель 270.

В дополнение к этому, конструкция устройства 200 на фиг.7 имеет в своем составе времячастотный преобразователь 290, также реализованный в форме оконного преобразователя Фурье (ОПФ). В верхней части фиг.7 в качестве примера показано, что времячастотный преобразователь 290 принимает на входе микрофонный сигнал y[n], отображенный кривой 430. Времячастотный преобразователь 290, кроме того, преобразует сигнал микрофона Y[k,m] в соответствующее частотное представление, при этом показатель k по-прежнему обозначает блок данных, а показатель m обозначает полосу частот или значение частоты или коэффициент трансформанты. Указанный спектр Y[k,m] также обычно является комплекснозначным.

Тем не менее, в отличие от времячастотного преобразователя 230 времячастотный преобразователь 290 не выполняет дополнительную функцию задержки. В основном - в силу того, что в этом нет необходимости, так как скорость распространения звуковых волн (скорость звука) заметно ниже скорости прохождения электрических сигналов в цепях и схемотехнических элементах, что вызывает запаздывание улавливаемого микрофоном сигнала y[n] относительно соотнесенного сигнала громкоговорителя x[n].

Для наглядности этот аспект выделен первой фигурной скобой 440 как фрагмент сигнала громкоговорителя x[n] при сопоставлении кривых графиков 420 и 430 в верху фиг.7. В той же части фиг.7 в сигнале микрофона y[n] участок, соответствующий фрагменту сигнала громкоговорителя x[n], обозначенного скобой 440, показан второй фигурной скобой 450. Таким образом, сигнал громкоговорителя x[n] и микрофонный сигнал y[n] смещены относительно друг друга на величину задержки d, что на фиг.7 обозначено стрелкой 460.

В соответствии с алгоритмом на фиг.7 спектры сигналов громкоговорителя и микрофона поступают на фильтр предварительного анализа эхо-сигнала 470, который на базе получаемых сигналов определяет параметры фильтра предварительного анализа эхо-сигнала или его элементов . Эти коэффициенты фильтрации также передаются на вычислитель 270.

Вычислитель 270 на фиг.7, в свою очередь, состоит из двух вычислителей параметров фильтрации стационарной и нестационарной компонент сигнала, 370-1 и 370-2, каждый из которых получает на своем входе спектр сигнала микрофона и

коэффициенты пропускания фильтра предварительного анализа эхо-сигнала . Таким образом, функциональные возможности, заложенные в обоих вычислителях параметров фильтрации 370, предусматривают не только расчет параметров фильтрации, о чем говорилось в описании к фиг.2-5, но и выполнение операций второго фильтра предварительного анализа эхо-сигнала 260.

Оба вычислителя параметров фильтрации 370, обозначенные на фиг.7 как ERF (фильтр эхокомпенсации), как и на фиг.5A, соединены с комбинатором 380, который обозначен на фиг.7 как FC (комбинация параметров фильтрации). Комбинатор 380 комбинирует коэффициенты фильтрации, полученные от обоих вычислителей параметров фильтрации, для выработки коэффициентов пропускания адаптивного фильтра 210.

Далее, как уже говорилось в описании к Фиг.2 и 5, комбинатор 380 соединен с адаптивным фильтром 210, который на фиг.7 обозначен как SM (спектральная модификация). Адаптивный фильтр 210 осуществляет корректировку спектра на базе принятого им спектрального представления Y[k,m] сигнала микрофона y[n] для ослабления или подавления эхокомпоненты микрофонного сигнала.

Наконец, адаптивный фильтр 210 сопряжен с частотно-временным преобразователем 300, который представляет собой обратный оконный преобразователь Фурье (ООПФ). Этот преобразователь формирует на выходе сигнал е[n] во временной области, очищенный от эха. Варианты реализации настоящего изобретения в форме соответствующих способов или устройств 200, как показано, например, на фиг.7, позволяют устранять артефакты, вносимые при модификации спектра адаптивным фильтром 210. Определяя иначе, предлагаемые конструктивные решения в соответствии с изобретением обеспечивают адаптивное регулирование мощности. При наличии речи только на дальнем конце процесс эхоподавления должен протекать в достаточно агрессивном режиме, чтобы не допускать прохождение любого сигнала, поскольку в такой ситуации может быть не желательно разделение нестационарных и стационарных сигналов и составляющих сигналов. По этой причине при распознании такой ситуации может потребоваться адаптация управляющего параметра βx из уравнения (6), который регулирует или, по меньшей мере, воздействует именно на амплитуду стационарного компонентного сигнала, вычтенного из сигнала громкоговорителя.

Для распознавания ситуации, в которой выходной сигнал громкоговорителя содержит только речь дальнего конца линии связи, вычисляют два разных параметра. Первый из них - это значение так называемого выигрыша от предсказания (усиления предсказания), соответствующее полнополосному усреднению функций когерентности между каналом громкоговорителя и каналом микрофона. В качестве второго параметра используют показатель речевой активности канала громкоговорителя, который может быть получен, например, при сравнении разных по времени уровней сигнала громкоговорителя или выбран из специальных параметров голосового кодека, используемого в передаче речи. Слово „кодек" составлено из двух сокращенных английских слов - кодер и декодер, и такие кодеки могут строиться, например, на основе LPC (кодирования с линейным предсказанием) или CELP (линейного предсказания с мультикодовым управлением).

Показатель выигрыша от предсказания или усиление предсказания эха ω[k], описывает уровень сходства между сигналом микрофона и задержанным сигналом громкоговорителя. Выигрыш от предсказания ω[k] рассчитывается на базе квадратичной функции когерентности между задержанным спектром мощности сигнала громкоговорителя |Xd[k,m]|2 и спектром мощности сигнала микрофона в соответствии с уравнением

где Е{…} обозначает математическое ожидание. Названное ожидаемое математическое значение может быть получено с помощью кратковременной оценки функции когерентности Гd[k,m] путем вычисления или аппроксимации ожидаемого значения согласно уравнению

Показатель α определяет степень сглаживания оценки во времени. Этот показатель связан с временной константой, так как равенство (15) приблизительно соответствует экспоненциальному затуханию.

Постоянная времени Тα экспоненциального затухания в секундах представляет собой приблизительно

где fs обозначает частоту дискретизации. Другими словами, отношение пропорциональности (16) показывает, как коэффициенты, фактически являющиеся безразмерными (здесь - α), относящиеся к частоте дискретизации fs, могут быть представлены в виде постоянной времени (здесь - Тα).

После этого выигрыш от предсказания ω[k] рассчитывают как среднее значение функций когерентности Гd[k,m] по частотам, обозначенным индексами m=0,…, М-1, в соответствии с

где М показывает количество частотных полос. Коэффициент усиления эхо-сигнала, близкий к 1, показывает, что микрофонный сигнал может быть (почти) полностью предсказан, исходя из задержанного сигнала громкоговорителя. Вследствие этого вероятность того, что микрофонный сигнал содержит только речь на приемном конце, стремится к 1. Задающий параметр βx при этом можно настраивать в зависимости от значения выигрыша от предсказания ω. Высокое значение выигрыша от предсказания служит показателем наличия голосового сигнала только на дальнем конце, и аттенюация эха должна быть достаточно агрессивной, чтобы устранить все (эхо-)сигналы. Таким образом, помехи удерживаются в пределах нестационарного тракта и устраняются при низшем предельном значении Ls в децибелах (дБ), поскольку задающий параметр выбран как βxw=0. Низкое значение выигрыша от предсказания указывает на возможное наличие речевого сигнала как на ближнем, так и на дальнем конце, и эхоподавление должно быть менее агрессивным во избежание артефактов. В этом случае помехи компенсируют по стационарному тракту и устраняют при предельном значении Lw в децибелах (дБ). Здесь применяется параметр βxw.

При этом, однако, необходимо отметить, что выигрыш от предсказания также может быть высоким, если сигнал громкоговорителя содержит только шум, улавливаемый микрофоном в отсутствии голосового сигнала. Во избежание выбора завышенного значения управляющего параметра βx, что может привести к избыточному подавлению, применяют второй управляющий параметр - показатель активности речи в канале громкоговорителя. В силу этого, приведенные выше правила вычисления управляющего параметра βx как функции усиления предсказания ω на практике применяют только при наличии в канале громкоговорителя речевой активности.

В варианте конструкции на фиг.7 технологические операции, описываемые уравнениями с (14) по (17), выполняются вычислителем 270, включая два вычислителя параметров фильтрации 370, и комбинатором 380. Различные варианты конструкции, отображенные на фиг.2-5, предусматривают возможность использования вычислителем 270 не только принимаемого им через вход 280 микрофонного сигнала, который в виде опции показан на фиг.2, но и немодифицированного сигнала громкоговорителя, поступающего через вход 220.

Далее будет графически детально проиллюстрирован принцип обработки сигналов с помощью конструкций, реализованных в соответствии с настоящим изобретением и представленных на фигурах с 8 по 10.

На фиг.8 показан процесс разделения или экстракции стационарной и нестационарной составляющих сигнала громкоговорителя. В разделе (а) фиг.8 дан график спектральной плотности мощности сигнала громкоговорителя на частоте 1 кГц как функции времени в диапазоне приблизительно от 5 до 7,5 сек. Абсцисса графика в разделе (с) фигуры 8 относится ко всем трем разделам (а)-(с). На графике (b) дан график спектральной плотности мощности нестационарной составляющей, а на графике (с) отражена соответствующая спектральная плотность мощности стационарной составляющей сигнала.

Нестационарная составляющая или сопряженный нестационарный компонентный сигнал, отображенный на графике 8(b), содержит верхние значения, соответствующие каждому случаю роста величины спектральной плотности мощности на графике 8(а). Следует обратить внимание, что в промежутках между этими диапазонами нестационарная компонента почти полностью исчезает.

В противоположность нестационарной составляющей на фиг.8(b) стационарная составляющая на фиг.8(с), определяемая с помощью плавающего рекурсивного усреднения по уравнению (7), графически отображает очевидно меньшие амплитуды и в силу плавающего усреднения представляет собой очевидно более пологую кривую. В частности, стационарная составляющая на фиг.8(с), и/или соответствующий стационарный компонентный сигнал в период времени около 6,4 сек имеют экспоненциальное или подобное экспоненциальному понижение, о чем упоминалось в связи с отношением пропорциональности (16). Такой спад является следствием отсутствия в спектре мощности в этом диапазоне на фиг.8(а) больших величин, которые соответствуют голосовым сигналам. Спектральные составляющие, выходящие за пределы стационарной составляющей, соответственно, удаляются.

Основываясь на данных фиг.8, фиг.9 отображает соответствующие эхокомпенсирующие фильтры. Говоря конкретнее, на фиг.9 даны две соотносящиеся кривые двух взаимосвязанных фильтров эхокомпенсации Hs и Hw на частоте 1 кГц, рассчитанные на базе уравнений (12) и (13). Так, на фиг.9(а) отображена функция фильтра эхокомпенсации Hs, рассчитанного по уравнению (12), для нестационарной составляющей на частоте 1 кГц. В разделе (b) дан график функции соответствующего эхокомпенсирующего фильтра Hw для стационарной составляющей, построенный в соответствии с уравнением (13).

Фиг.10 графически представляет идентичные параметры в расширенном масштабе времени, отображенном на абсциссе графика 10(с) и относящемся одновременно к фигурам 10(а) и 10(b). На фиг.10 показана зависимость от величины управляющего параметра βx - на графике 10(а) - процесса сепарации стационарной/нестационарной составляющих и - на графике 10(b) - выигрыша от предсказания ω на фоне речевой активности канала громкоговорителя, отображенной на графике 10(с).

Определяя точнее, фиг.10 наглядно демонстрирует взаимозависимость между управляющим параметром βx и двумя другими параметрами управления - ω и речевой активности, введенными и описанными ранее. Первая треть процесса, смоделированного на фиг.10, протекает в условиях, характеризуемых наличием речевого сигнала только на дальнем конце и высоким выигрышем от предсказания. В этом случае управляющему параметру βx задано значение βxw=0, соответствующее агрессивному режиму подавления нестационарной составляющей и полному подавлению стационарной составляющей.

Вторая треть модели отображает ситуацию, характеризуемую наличием речевого сигнала только на дальнем конце и возможностью его распознания при низком коэффициенте усиления предсказания ω и отсутствием речевой активности в сигнале громкоговорителя. При этом величина управляющего параметра βx задается так, чтобы обеспечить прохождение всех стационарных составляющих по стационарному тракту и их устранение на низком уровне агрессивности, предупреждающем внесение артефактов. Последняя треть модели воспроизводит режим диалога, при котором управляющий параметр βx варьируется между низкими значениями при наличии речевой активности в канале громкоговорителя и более высокими значениями, когда речевая активность не распознается.

В описанных выше вариантах реализации предлагаемого изобретения, включая фиг.6, также представляющую собой общую блок-схему соответствующего алгоритма, раздельное подавление стационарных и нестационарных составляющих эха осуществляется не за счет разделения соответствующих сигналов громкоговорителя, а за счет оценки эхо-сигнала в целом.

Во всех рассмотренных версиях осуществления изобретения оценка спектральной плотности мощности эхо-сигнала выполнялась посредством применения фильтра предварительного анализа эхо-сигнала G[k,m] или G[k,m]2 к задержанному варианту спектра мощности сигнала громкоговорителя согласно уравнению (8), где

оценка спектра мощности эха, содержащаяся в сигнале микрофона. В результате разделения спектра мощности сигнала громкоговорителя в соответствии с уравнением (3) на стационарные |Xw[k,m]|2 и нестационарные |Xs[k,m]|2 составляющие эхо-сигнал, возникающий из нестационарной компоненты сигнала громкоговорителя, рассчитывается с помощью уравнения (10), а эхо-сигнал, возникающий из стационарных компонент сигнала громкоговорителя, получается из уравнения (9).

Используя оценки нестационарных

и стационарных

эхо-сигналов, можно рассчитать соответствующие фильтры эхокомпенсации Hs[k,m] и Hw[k,m]. Затем эти фильтры эхокомпенсации объединяются и используются для подавления эха в сигнале микрофона в соответствии с уравнением

где H[k,m] выводится из

Один из возможных способов объединения разных эхокомпенсирующих фильтров Hs[k,m] и Hw[k,m] состоит в использовании их выходных данных в соответствии с уравнением (11), что аналогично последовательному соединению двух фильтров.

Другой возможный способ заключается в использовании соответствующего минимума эхокомпенсирующих фильтров согласно

где функция min(…) представляет минимум соответствующих величин. Другими словами, в данном случае применено соответствие (…)=min(…).

Как пояснялось выше, эти вычисления могут быть выполнены, в частности, комбинатором 380, а кроме того, селектором 390 или распределителем 410. В дополнение к этому отдельные устройства способны осуществлять более сложные операции комбинирования и расчета индивидуальных заграждающих фильтров, базирующихся, например, на линейных построениях или нелинейных уравнениях. Также, предусмотрена возможность комбинирования не только полосовых сигналов, но и групп полосовых сигналов или всей совокупности полосовых сигналов.

Благодаря комбинированию эхокомпенсирующих фильтров для разных составляющих эха могут быть введены различные коэффициенты усиления. Фильтр компенсации нестационарного эха рассчитывается по уравнению (12), а фильтр компенсации стационарного эхо-сигнала вычисляется согласно уравнению (13).

Часто на практике эхоподавление осуществляется не на базе прямого приложения фильтров эхокомпенсации в соответствии с уравнениями (12) и (13), а на базе соответствующих сглаженных по времени версий. Подобно вышеописанным расчетным параметрам параметры временного сглаживания также могут быть откорректированы вручную отдельно для подавления нестационарного и стационарного эхо-сигналов. Таким образом, качество воспринимаемого звука может быть улучшено, поскольку требования к подавлению стационарных шумовых составляющих отличаются от требований к компенсации нестационарных составляющих голосового сигнала.

Скажем, хорошо известно, что для подавления стационарных составляющих сигнала требуется более интенсивное сглаживание во избежание так называемых музыкальных тонов. С другой стороны, сглаживание, задаваемое фильтрам компенсации нестационарного эха, должно поддерживать более низкие значения, чтобы в достаточной мере подавлять эхо-сигналы, вносимые длительными составляющими пути эха, или длинными хвостами пути эха. Тем не менее, при этом не должен нарушаться порядок прохождения быстро изменяющихся уровней эха. Обсуждение качества восприятия ясно показывает необходимость индивидуальной адаптации и оптимизации двух разновидностей фильтров эхокомпенсации в соответствии с уравнениями (12) и (13).

Описываемый далее подход к реализации предлагаемого способа и/или устройства заключается в раздельном применении эхокомпенсирующих фильтров к стационарным и нестационарным составляющим сигнала.

На фиг.11 дана принципиальная блочная схема устройства 200, включающего в себя адаптивный фильтр 210. Однотипность конструкций позволяет в дальнейшем ссылаться на конструктивные решения, представленные на фиг.2-5, 6 и 7.

Устройство 200 согласно изобретению включает в себя громкоговоритель 100 или терминал для подключения громкоговорителя 100, или вход для сигнала громкоговорителя x[n]. Времячастотный преобразователь (ВЧП) 230, обозначенный на схеме как ДПФ (дискретное преобразование Фурье), конвертирует сигнал громкоговорителя x[n] в трансформанту в виде X[k,m]. Затем, сигнал громкоговорителя поступает на устройство задержки 480, которое формирует задержанный сигнал X[k-d(k,m),m] с величиной задержки d(k,m).

От устройства задержки 480 задержанный сигнал передается на первый фильтр предварительного анализа эхо-сигнала 240, который на базе коэффициентов фильтрации

G[k,m] генерирует оценочный сигнал эха

Оценочный сигнал эха

посылается на экстрактор 250, который, исходя из спектральных коэффициентов такого оцененного эхо-сигнала, генерирует нестационарные и стационарные спектры мощности этого сигнала как (производные) составляющие сигнала громкоговорителя.

После этого сигналы

и

выводятся из экстрактора 250 на вычислитель 270.

Сигнал y[n] микрофона 110 вводится во времячастотный преобразователь (ВЧП) 290, сокращенно обозначенный ДПФ, который преобразует его из временной области в спектральное представление Y[k,m]. Преобразованный сигнал поступает в вычислитель уровня энергии 490, который, учитывая спектральные компоненты сигнала микрофона, рассчитывает их спектральную плотность мощности путем возведения в квадрат (абсолютной) величины каждого показателя. Полученный таким образом спектр мощности также вводится в вычислитель 270, который параллельно с вышеописанными спектрами мощности рассчитывает два фильтра эхокомпенсации Hs[k,m] и Hw[k,m], коэффициенты пропускания действующего адаптивного фильтра H[k,m] и передает их на адаптивный фильтр 210.

Адаптивный фильтр 210 одновременно сопряжен с выходом времячастотного преобразователя 290 и, следовательно, тоже получает спектральные компоненты Y[k,m] микрофонного сигнала y[n], из которого он вырабатывает сигнал с блокированным эхом в частотной области H[k,m], учитывая коэффициенты фильтрации H[k,m]. Затем данный сигнал с компенсированным эхом передается на частотно-временной преобразователь (ЧВП) 300, обозначенный на схеме как ОДПФ (обратное ДПФ), который в завершение преобразует этот сигнал назад во временную область.

С целью установления величины задержки d(k, m) для устройства задержки 480 и для определения коэффициентов фильтра предварительного анализа эхо-сигнала 240 представления в области спектра сигнала громкоговорителя X[k,m] и сигнала микрофона Y[k,m] вводятся в соответствующий вычислитель энергии 500, 510, каждый из которых соединен с выходом времячастотного преобразователя 230, 290, соответственно. Вычислитель уровня энергии 500 соединен с выходом времячастотного преобразователя 230, вычислитель уровня энергии 510 соединен с выходом частотно-временного преобразователя 300.

Каждый из двух вычислителей величины энергии 500 и 510 вычисляет, как и вычислитель уровня энергии 490, спектральные плотности мощности, возводя в квадрат величины соответствующих спектральных компонент, и выводит на следующий вычислитель 520. На основе введенных в него величин вычислитель 520 оценивает величину задержки d(k,m) и коэффициенты пропускания G[k,m] фильтра предварительного анализа эхо-сигнала 240. Параллельно вычислитель 520 сопряжен с устройством задержки 480 и с фильтром предварительного анализа эхо-сигнала 240, на которые пересылаются полученные им соответствующие показатели.

Как следует из варианта решения на фиг.11, соответствующие компонентные сигналы

( и ),

таким образом, могут быть разделены на базе оценки спектра эхо-сигнала

которая делается в соответствии с уравнением

Указанное вычисление выполняется фильтром предварительного анализа эхо-сигнала 240.

Определение двух фильтров эхокомпенсации Hs[k,m] и Hw[k,m] согласно уравнениям (12) и (13) остается неизменным. То же применимо к определению объединенного эхокомпенсирующего фильтра H[k,m]. Следовательно, дополнительный способ и соотнесенное с ним устройство 200, представленные на фиг.11, основаны на заключении, что стационарные и нестационарные составляющие эха спрогнозированных эхо-сигналов некоррелированы, так что

Тогда, оценочные спектры мощности стационарных составляющих эха могут быть определены путем вычитания оценки стационарной составляющей эха из спектральной плотности мощности оценочного эхо-сигнала.

Таким образом,

На практике сигнал |Ŷs[k,m]|2 оценивается путем фильтрации спектра мощности эхо-сигнала, рассчитенного, следуя

Поскольку используемый фильтр усиления Fy[k,m] или квадрат его значения Fy[k,m]2 определяется по аналогии с фильтром усиления Fx[k,m] или Fx[k,m]2, этот компонент здесь подробно не истолковывается. Подобные функции выполняет также экстрактор 250, используя полученные сигналы.

Здесь следует отметить, что конструктивное решение, показанное на фиг.11, относится к тому случаю, когда оцененный спектр эхо-сигнала уже известен. Безусловно, подобный способ применим также, когда известен только сигнал расчетной мощности эхо-сигнала , оцененного с применением уравнения (8). Подобный вариант рассмотрен подробно при описании технического решения, отображенного на фиг.12.

Блок-схема на фиг.12 иллюстрирует подход, аналогичный представленному на фиг.11 алгоритму аттенюации акустического эха способом сепарации стационарных и нестационарных составляющих эха на основе ожидаемого спектра эха Тем не менее, способ на фиг.12 отличается тем, что при нем аттенюация акустического эха построена на разделении стационарных и нестационарных составляющих эха на базе оценки спектральной плотности мощности эхо-сигнала

Из следующего ниже описания очевидно, что реализации на фигурах 11 и 12 аналогичны между собой не только по своим функциям, но и по конструкции.

Говоря конкретнее, существенным отличием версии на фиг.12 от фиг.11 является то, что вычислитель уровня энергии 500, принимающий и обрабатывающий преобразованный в частотную область сигнал громкоговорителя x[n], смонтирован не строго перед вычислителем 520, а подключен напрямую к выходу времячастотного преобразователя 230 в конфигурации ДПФ. При подобной компоновке, как на вычислитель 520, так и на устройство задержки 480 на фильтр предварительного анализа эхо-сигнала 240 и на экстрактор 250 больше не поступают собственно спектральные составляющие, а их спектры мощности.

В остальном, две разновидности одной конструкции на фиг.11 и 12 различаются только тем, что аналогичные вычисления выполняются в них разными элементами и устройствами несколько по-разному. В частности, экстрактор 250 не выполняет вычисление энергопоказателей отдельных компонент спектра, поскольку это было предварительно сделано вычислителем величины энергии 500.

На фиг.13 показан вариант технического исполнения изобретения, в котором, например, на устройство 200 поступает больше одного сигнала громкоговорителя или больше одного сигнала микрофона. Формулируя иначе, на фиг.13 представлена реализация многоканального устройства.

Ранее были описаны и обсуждены конструктивные решения данного изобретения с раздельными каналами или с одиночным каналом для передачи только одного сигнала громкоговорителя и одного сигнала микрофона, однако данное изобретение не ограничивается лишь одноканальным исполнением, что и будет рассмотрено далее. Предшествующие варианты конструкции по аналогии могут быть применены в многоканальных системах глушения акустического эха.

Поскольку версия устройства 200 на фиг.13 в целом аналогична конструкции на фиг.2, ниже при описании режимов работы, соединений и других аспектов будут даваться ссылки на описание фиг.2-5.

Отображенный на фиг.13 многоканальный вариант устройства 200 имеет неограниченное количество входов 220-1, 220-2, …, через которые на него может поступать множество сигналов громкоговорителя. Соответственно, устройство 200 может включать в свой состав опцию в виде необходимого количества времячастотных преобразователей 230-1, 230-2, … для перевода или преобразования сигналов громкоговорителя из временной области в частотную область, о чем подробно говорилось в связи с фиг.2.

Все времячастотные преобразователи 230 сопряжены с соответствующим количеством входов группиратора 530, который объединяет входящие сигналы громкоговорителя в производный сигнал громкоговорителя, который затем пересылается на первый фильтр предварительного анализа эхо-сигнала 240 или на экстрактор 250 в зависимости от того, смонтирован ли произвольный первый фильтр предварительного анализа эхо-сигнала 240. В контексте фиг.2 уже говорилось, что экстрактор 250 может быть соединен с произвольным вторым фильтром предварительного анализа эхо-сигнала 260 или непосредственно с вычислителем 270. Названный вычислитель формирует на выходе рассчитанные коэффициенты фильтрации.

В отличие от варианта на фиг.2 многоканальное устройство 200 на фиг.13, кроме того, содержит в своей конструкции группиратор 540, входные каналы которого подключены к соответствующему количеству входных терминалов 280-1, 280-2, … для микрофонных сигналов, возможно, через посредство времячастотных преобразователей 290-1, 290-2, …, также являющихся опцией. Группиратор 540, подобно группиратору 530, формирует на основании принятых микрофонных сигналов во временном или в частотном представлении производный - эффективный или общий - сигнал микрофона, который может факультативно быть передан на экстрактор 250 или вычислитель 270.

Далее, устройство 200 в многоканальном исполнении, как показано на фиг.13, содержит адаптивные фильтры 210-1, 210-2, … для каждого микрофонного сигнала или каждого терминала ввода микрофонного сигнала 280, причем подключение адаптивных фильтров 210-1, 210-2, … к соответствующим входам 280-1, 280-2 … произвольно возможно через времячастотные преобразователи 290-1, 290-2,… Так же, адаптивные фильтры 210-1, 210-2, … соединены с соответствующими выходными терминалами 310-1, 310-2…, при необходимости - через соответствующее количество частотно-временных преобразователей 300-1, 300-2, … На выходе адаптивных фильтров 210 сигналы, очищенные от эха или спектрально модифицированные, поступают на терминалы вывода 310 из устройства 200.

Все адаптивные фильтры 210-1, 210-2,… параллельно соединены с выходом вычислителя 270, с которого они получают коэффициенты фильтрации. Другими словами, в варианте реализации на фиг.13 все множество микрофонных сигналов фильтруется, с функциональной точки зрения, одним и тем же адаптивным фильтром, то есть базируясь на одних и тех же коэффициентах фильтрации, с целью получения спектрально модифицированных или эхокомпенсированных интерпретаций соответствующих микрофонных сигналов.

Следовательно, если x1[n] - сигналы громкоговорителя 1, где 1 - целое число в пределах от 0 до L - 1 и где L обозначает количество громкоговорителей или сигналов громкоговорителя, то та же самая модель может быть введена по аналогии с уравнением (1) в соответствии с

где xs,1[n] модулирует составляющую нестационарной речи, a xw,1[n] модулирует составляющую стационарного шума, которые содержатся в сигнале громкоговорителя 1. В соответствии с уравнением (2) ОПФ-представление уравнения (25) выводят из

Затем с помощью группиратора 530, который можно видеть на фиг.13, вычисляют общий, групповой спектр мощности всех каналов громкоговорителя, полученный путем объединения индивидуальных спектров сигналов громкоговорителя в соответствии с

где L обозначает количество каналов громкоговорителя. После этого нестационарные и стационарные компоненты сигнала сепарируют согласно уравнениям (5) и (7) с учетом общей или сгруппированной спектральной плотности мощности, следуя уравнению (27).

По аналогии с этим вычисляют общий или объединенный спектр мощности каналов микрофона в соответствии с

где Yp[k,m] определяет сигнал микрофона 110 p, а P отображает количество микрофонов. Показатель p - также целое число в пределах от 0 до Р - 1. В версии на фиг.13 этот расчет может быть выполнен вторым группиратором 540.

Для определения двух фильтров эхокомпенсации в соответствии с уравнениями (12) и (13) в качестве следующих шагов алгоритма используют спектры (мощности) громкоговорителя |X[k,m]|2 в соответствии с уравнением (27) и спектр (мощности) микрофона |Y[k,m]|2 в соответствии с уравнением (28), как уже описывалось выше. Задание управляющего параметра βx согласно уравнениям с (14) по (17), описанное выше в контексте контроля рабочих процессов, может быть выполнено также на базе общих или групповых спектров согласно уравнениям (27) и (28).

Собственно эхоподавление в рамках модификации спектра выполняют затем для каждого сигнала микрофона индивидуально, но с использование одного фильтра эхокомпенсации 210 для каждого микрофонного канала, следуя уравнению

при p=0, 1,…,P-1.

Но, как говорилось выше, эхокомпенсирующие фильтры 210 могут быть реализованы по-другому, скажем, в соответствии с уравнением (19).

Здесь следует отметить, что при многоканальном исполнении устройства 200, как, например, на фиг.13, количество сигналов громкоговорителя L и количество сигналов микрофона Р может быть и одинаковым, и различным. В принципе, количество входных сигналов громкоговорителя и микрофона может быть любым. Более того, не обязательно применение обоих группираторов 530, 540 для множества входных сигналов громкоговорителя и микрофона. Изобретение допускает ввод только множества сигналов громкоговорителя с помощью группиратора 530 без использования группиратора 540 для множества микрофонных сигналов. Такая система применима, когда один микрофонный сигнал от одного абонента на дальнем конце линии связи поступает на несколько громкоговорителей, например, при диспетчерской связи с автомобилями.

Естественно, нет необходимости задействовать многоканальный группиратор 530 для ввода одного сигнала громкоговорителя, например, центрального в системе конференцсвязи, где каждый из множества участников диалога имеет персональный микрофон. В такой ситуации рекомендуется введение группиратора 540.

Следует дополнить, что конструкции с группираторами 530 и 540 могут быть рассчитаны на большее число сигналов громкоговорителя или микрофона, чем на них поступает в конкретный момент. Естественно, что в устройстве 200 может быть предусмотрено большее количество входов 220, 280, чем используется практически. В подобных случаях предшествующие по схеме контуры, например произвольные времячастотные преобразователи 230, 290 или группираторы 530, 540, способны самостоятельно определять количество рабочих каналов и выбирать соответствующие показатели L и Р. Естественно, также предусмотрен ввод показателей количества каналов и ожидаемого количества сигналов микрофонов и громкоговорителей извне.

Кроме того, конструктивное решение, представленное на фиг.13, конечно, может работать с одиночными сигналами громкоговорителя и микрофона, в группиратор 530 введены соответствующие показатели L и Р. В принципе, уравнения (27) и (28) применимы при Р=1 и/или L=1. Таким образом, конструктивное решение, показанное на фиг.13, представляет собой совместимое „сверху вниз” расширение версии реализации на фиг.2.

Частотное разрешение рекомендуется в форме производного от ОПФ. Равномерность ОПФ по спектральному разрешению не очень хорошо соотносится с физиологией человеческого слуха. В силу этого предпочтительно следует перегруппировать равномерно распределенные коэффициенты |X[k,m]|2 и |Y[k,m]|2 в порядок непересекающихся секторов или групп, как показано в [С.Faller and F.Baumgarte. Binaural Cue Coding - Part II: Schemes and applications. IEEE Trans. on Speech and Audio Proc., 11(6): 520-531, Nov. 2003], содержащих полосы частот, соотносимых по частотной разрешающей способности со слуховой системой человека, как представлено, в частности, в [10].

Частоте дискретизации 16 кГц при кратковременном преобразовании Фурье нормально соответствует длина блока ДПФ в 512 отсчетов и 15 групп, или сегментов, каждый из которых имеет полосу пропускания, примерно соответствующую двойной ширине эквивалентной прямоугольной полосы пропускания (ERB/ЭППП), о чем говорится в [В.R.Glasberg and В. С.J.Moore. Derivation of auditory filter shapes from notched-noise data. Hear. Res., 47: 103-138, 1990]. Полосы пропускания соответствуют сегментам, как показано на фиг.14.

На фиг.14 показано, как коэффициенты равномерного спектра ОПФ могут быть сгруппированы или разложены с целью имитации неравномерного частотного разрешения слуховой системы человека. Как видно на фиг.14, ось частоты проходит от 0 Гц примерно до 8000 Гц, что соответствует эффективной полосе пропускания, основанной на частоте дискретизации 16 кГц.

Фильтры усиления рассчитываются только для центральной частоты каждой группы. Дополнительно это снижает вычислительную сложность по сравнению с полным спектральным разрешением равномерного ОПФ. Перед применением фильтра усиления последнего сегмента или группы к равномерному сигналу спектра ОПФ последний интерполируется фильтрами-интерполяторами Ханна.

На фиг.15(а) показаны интерполирующие фильтры Ханна, применимые для сглаживания фильтров усиления в зависимости от частоты. На фиг.15(b) в виде сплошной линии показаны коэффициенты фильтров усиления, интерполированные из значений фильтров усиления в отдельных сегментах, отмеченных, в свою очередь, жирными точками.

Изображение (а) на фиг.15 подробно представляет фильтры Ханна, изображение (b) приводит пример значений фильтра усиления до и после интерполяции. Точки на фиг.15b обозначают величины до интерполяции, в то время как сплошная линия соответствует значениям, полученным в результате интерполяции. Сглаживание фильтров усиления по частоте дает в результате сглаженный вариант спектра как функции частоты и, таким образом, компенсирует музыкальные тоны и другие артефакты.

Предшествующее описание вариантов конструктивных решений показало, что данное изобретение реализуется за счет введения в предлагаемую конструкцию различных функциональных блоков, которые выполняют определенную последовательность операций, составляющих заданный алгоритм, обобщенно представленный ниже. Осуществление предлагаемого изобретения включает в себя следующий порядок действий: прием, по меньшей мере, одного сигнала громкоговорителя, прием, по меньшей мере, одного сигнала микрофона, преобразование сигнала громкоговорителя и сигнала микрофона в кратковременные спектры, вычисление спектральной плотности мощности сигналов громкоговорителя и микрофона, выделение или разложение спектральной плотности мощности на стационарную и нестационарную составляющие, расчет фильтра усиления эхокомпенсации с использованием стационарных спектров мощности громкоговорителя, расчет фильтра усиления эхокомпенсации с использованием нестационарного спектра мощности громкоговорителя, применение фильтра усиления к спектру микрофона для подавления эхо-сигнала, обратное преобразование эхокомпенсированного спектра микрофона во временную область.

В зависимости от условий способ, составляющий настоящее изобретение, может быть осуществлен как в виде аппаратных средств, так и в виде программного обеспечения. Изобретение может быть реализовано на любом цифровом накопителе, в частности на гибком диске, CD или DVD, несущем электронно-считываемые управляющие сигналы, которые могут взаимодействовать с программируемой компьютерной системой таким образом, чтобы мог быть осуществлен изобретенный способ. Реализация настоящего изобретения, в основном, представляет собой программное обеспечение или компьютерную программу, или программный продукт с кодом программы, хранящиеся на машиночитаемом носителе, предназначенные для осуществления предлагаемого способа при условии выполнения программы на компьютере или микропроцессоре. Другими словами, данное изобретение может быть реализовано в виде компьютерной программы или программного обеспечения, или программы, имеющих код программы, для осуществления предлагаемого в изобретении способа при выполнении программы с использованием процессора. Процессор может быть схемотехническим элементом компьютера, чип-карты (интеллектуальной карты), интегрированной системы SOC (SOC = система на кристалле), прикладной интегральной схемы (ASIC) или какой-либо иной интегральной микросхемы (ИС).

1. Устройство (200) для расчета коэффициентов пропускания адаптивного фильтра (210) микрофонного сигнала микрофона для подавления эха, возбуждаемого сигналом громкоговорителя, включающее фильтр предварительного анализа эхосигнала (240) для оценивания спектра составляющей эха или спектральной плотности мощности эха в сигнале микрофона; экстрактор (250) для выделения стационарной составляющей сигнала и нестационарной составляющей сигнала (1) из сигнала громкоговорителя или (2) из сигнала, производного от сигнала громкоговорителя, рассчитанного, исходя из оцененного спектра эхо-составляющей или спектральной плотности мощности эха в сигнале микрофона; и вычислитель (270) для расчета коэффициентов пропускания адаптивного фильтра (210) - (1) на базе стационарной составляющей сигнала и нестационарной составляющей сигнала, выделенных из сигнала громкоговорителя, и на базе оцененного спектра составляющей эха или энергетического спектра эха в сигнале микрофона, или - (2) на базе стационарной составляющей сигнала и нестационарной составляющей сигнала, выведенных из производного сигнала.

2. Устройство (200) по п.1, в котором экстрактор (250) выделяет стационарную компоненту сигнала на базе усреднения энергетического показателя полосового сигнала громкоговорителя или сигнала, производного от него.

3. Устройство (200) по п.2, где экстрактор (250) выполняет усреднение путем нахождения плавающего среднего значения текущего блока данных, на котором базируется полосовой сигнал, и по значениям, по меньшей мере, одного блока данных, который предшествует по времени текущему блоку данных.

4. Устройство (200) по п.2, в котором экстрактор (250) выполняет усреднение путем определения плавающего среднего на базе совокупности данных детализации вычисления и исходя из сравнения энергопоказателя текущего блока данных с энергопоказателем предыдущего блока данных или сопоставления со значением предшествующего усреднения.

5. Устройство (200) по п.3, в составе которого экстрактор (250) выполняет рекурсивное плавающее усреднение, суммируя энергопоказатель текущего блока данных с результатом предшествующего усреднения в зависимости от параметра сложения, причем параметр сложения имеет меньшую величину, когда энергопоказатель текущего блока данных больше значения ранее выведенного усреднения, и большую величину, когда энергопоказатель текущего блока данных меньше значения ранее определенного усреднения.

6. Устройство (200) по п.1, в составе которого экстрактор (250) выделяет нестационарную компоненту сигнала на основе полосового сигнала громкоговорителя или производного от него.

7. Устройство (200) по п.1, в составе которого экстрактор (250) выделяет нестационарную компоненту сигнала на основе стационарной компоненты и фильтра усиления.

8. Устройство (200) по п.7, в составе которого экстрактор (250) отличается тем, что фильтр усиления зависит от переменного или непеременного управляющего параметра.

9. Устройство (200) по п.8, в составе которого экстрактор (250) задает управляющий параметр фильтра усиления на основании функции когерентности, строящейся на сигнале громкоговорителя или производном от него, и на сигнале микрофона или производном от него.

10. Устройство (200) по п.9, в составе которого экстрактор (250) задает управляющий параметр на основании усредненного значения функции когерентности по множеству полосовых сигналов громкоговорителя или по сигналу, производному от них, и по множеству полосовых сигналов микрофона или сигнала, производного от них.

11. Устройство (200) по п.1, включающее в себя группиратор (540), предназначенный для совмещения множества микрофонных сигналов с получением совокупного микрофонного сигнала или сигнала, производного от него.

12. Устройство (200) по п.1, в составе которого экстрактор (250) формирует на выходе стационарную составляющую сигнала и нестационарную составляющую сигнала, также в составе которого вычислитель (270) рассчитывает коэффициенты пропускания первого фильтра на базе стационарной составляющей сигнала и рассчитывает коэффициенты пропускания второго фильтра на базе нестационарной составляющей сигнала и, кроме того, определяет коэффициенты фильтрации, базируясь на коэффициентах пропускания первого и второго фильтров.

13. Устройство (200) по п.12, в составе которого экстрактор (250) рассчитывает коэффициенты фильтрации так, чтобы они соответствовали последовательному соединению первого фильтра, которому соответствуют коэффициенты пропускания первого фильтра, со вторым фильтром, которому соответствуют коэффициенты пропускания второго фильтра.

14. Устройство (200) по п.1, в составе которого экстрактор (250) формирует на выходе стационарный компонентный сигнал и нестационарный компонентный сигнал, также в составе которого вычислитель (270) рассчитывает коэффициенты пропускания первого фильтра на базе стационарного компонентного сигнала и коэффициенты пропускания второго фильтра на базе нестационарного компонентного сигнала и, кроме того, определяет коэффициенты фильтрации на основании коэффициентов пропускания или первого, или второго фильтра.

15. Устройство (200) по п.14, в составе которого вычислитель (270) задает коэффициенты фильтрации на базе тех коэффициентов пропускания первого или второго фильтра, которые соответствуют более высокому уровню аттенюации.

16. Устройство (200) по п.1, в составе которого экстрактор (250) обеспечивает стационарный компонентный сигнал или нестационарный компонентный сигнал, а также сигнал управляющей информации, содержащий параметры выходного компонентного сигнала, кроме того, в составе которого вычислитель (270) рассчитывает коэффициенты фильтрации на базе выходного сигнала экстрактора (250), сигнала, производного от него, и данных, содержащихся в сигнале управляющей информации.

17. Устройство (200) по п.16, в составе которого экстрактор (250) формирует на выходе стационарный компонентный сигнал или нестационарный компонентный сигнал для передачи на вычислитель (270) в зависимости от соотношения энергопоказателей стационарного компонентного сигнала и нестационарного компонентного сигнала.

18. Устройство (200) по п.1, в составе которого экстрактор (250) выделяет стационарный компонентный сигнал или нестационарный компонентный сигнал как ожидаемые сигналы.

19. Устройство (200) по п.1, в составе которого экстрактор (250) формирует на выходе стационарный компонентный сигнал и нестационарный компонентный сигнал.

20. Устройство (200) по п.1, включающее в себя, кроме вышеназванного, адаптивный фильтр (210), предназначенный для фильтрации микрофонного сигнала с использованием заданных коэффициентов пропускания.

21. Устройство (200) по п.1, включающее в себя группиратор (540) и ряд адаптивных фильтров (210), с целью фильтрации, по меньшей мере, двух из множества микрофонных сигналов на базе идентичных коэффициентов фильтрации, полученных от вычислителя (270).

22. Устройство (200) по п.1, включающее в себя группиратор (530) для совмещения множества сигналов громкоговорителя и формирования совокупного сигнала громкоговорителя или сигнала, производного от него.

23. Способ вычисления коэффициентов пропускания адаптивного фильтра (210) микрофонного сигнала, включающий в себя: оценивание спектра эхо-составляющей или спектральной плотности мощности эха в сигнале микрофона; выделение стационарной составляющей сигнала или нестационарной составляющей сигнала (1) из сигнала громкоговорителя или (2) из сигнала, производного от сигнала громкоговорителя на базе оцененного спектра эхо-составляющей или спектральной плотности мощности эха в сигнале микрофона; и вычисление коэффициентов пропускания адаптивного фильтра,
- (1) исходя из стационарной составляющей сигнала или нестационарной составляющей сигнала, выведенных из сигнала громкоговорителя, и исходя из оцененного спектра эхо-составляющей или энергетического спектра эха в сигнале микрофона; или
- (2) исходя из стационарной составляющей сигнала и нестационарной составляющей сигнала, выведенных из производного сигнала.

24. Машиночитаемый носитель, содержащий код программы осуществления способа по п.23 с применением процессорной техники.



 

Похожие патенты:

Кодер // 2483368
Изобретение относится к устройствам кодирования. .

Изобретение относится к области предоставления обратной связи, а именно обратной связи в форме местного эффекта пользователю устройства связи с множеством микрофонов.

Изобретение относится к устройству обработки звукового сигнала (аудиосигнала) и способу обработки звукового сигнала. .

Изобретение относится к устройству и способу кодирования и воспроизведения звука, в частности, не ограничиваясь указанным, к устройству для кодированных речевых сигналов и аудио-сигналов.

Изобретение относится к воспроизведению слышимого контента, в частности к методикам расширения полосы частот. .

Изобретение относится к системе и способу улучшения декодированного тонального звукового сигнала, в частности музыкального сигнала, закодированного с использованием речевого кодека, посредством подавления уровня шума квантования в областях спектра, в которых наблюдается малая энергия.

Изобретение относится к обработке аудиосигнала, в частности к процессору или способу обработки для повышения разборчивости речи и очистки зашумленного речевого аудиосигнала.

Изобретение относится к кодированию речевого сигнала в телекоммуникационных системах, в частности, к способам и устройствам для управления сглаживанием стационарного фонового шума в таких системах.

Изобретение относится к обработке звуковых сигналов, в частности, к улучшению четкости диалога и устной речи, например, в объемном развлекательном звуковом сопровождении.

Изобретение относится к воспроизведению аудио контента, в частности к способам расширения полосы частот. .

Изобретение относится к области вычисления числа огибающих спектра, а именно к кодированию звуковых сигналов

Изобретение относится к системам кодирования звукового сигнала, которые используют способ гармонического преобразования для высокочастотной реконструкции (HFR)

Изобретение относится к области синтезаторов звукового (аудио) сигнала, кодирующих устройств звукового сигнала и потоков данных, содержащих закодированный звуковой сигнал

Изобретение относится к устройству и способу генерирования выходных данных расширения полосы пропускания (BWE), к звуковому кодирующему устройству и звуковому декодеру. Техническим результатом является обеспечение эффективного кодирования без заметных артефактов, особенно для речевых сигналов. Устройство (100) для генерирования выходных данных расширения полосы пропускания (102) для звукового сигнала (105) включает измеритель минимального уровня шума (ПО), энергетическую характеристику сигнала (120) и процессор (130). Звуковой сигнал (105) включает компоненты в первом частотном диапазоне (105а) и компоненты во втором частотном диапазоне (105b); выходные данные расширения полосы пропускания (102) приспособлены, чтобы управлять синтезом компонентов во втором частотном диапазоне (105b). Измеритель минимального уровня шума (ПО) измеряет данные минимального уровня шума (115) второго частотного диапазона (105b) для временной части (T) звукового сигнала (105). Энергетическая характеристика сигнала (120) получает данные распределения энергии (125); данные распределения энергии (125) характеризуют распределение энергии в спектре временной части (Т) звукового сигнала (105). Процессор (130) объединяет данные минимального уровня шума (115) и данные распределения энергии (125), чтобы получить выходные данные расширения полосы пропускания (102). 8 н. и 8 з.п. ф-лы, 9 ил.

Изобретение относится к кодированию звуковых сигналов, а именно к способам восстановления высоких частот, включая гармонический транспозитор частотной области. Техническим результатом является повышение качества звучания посредством восстановления высоких частот звукового сигнала усовершенствованной гармонической транспозицией при низкой дополнительной вычислительной сложности. Система содержит банк фильтров анализа (501), содержащий модуль преобразования анализа (601), имеющий коэффициент разрешения по частоте Δf; и окно анализа (611), имеющее длительность DA; причем банк фильтров анализа (501) сконфигурирован с возможностью создания набора сигналов субполос анализа из низкочастотной компоненты сигнала; модуль нелинейной обработки (502, 650), сконфигурирован с возможностью определять набор сигналов субполос синтеза по части набора сигналов субполос анализа, причем часть набора сигналов субполос анализа сдвинута по фазе на порядок транспозиции Т; и банк фильтров синтеза (504), содержащий модуль преобразования синтеза (602), имеющий разрешение по частоте QΔf, и окно синтеза (612), имеющее длительность DS; причем банк фильтров синтеза (504) сконфигурирован с возможностью создавать высокочастотную компоненту сигнала по набору сигналов субполос синтеза; где Q - коэффициент разрешения по частоте, такой, что Q≥1 и меньше порядка транспозиции Т; и при этом значение произведения разрешения по частоте Δf и длительности DA для банка фильтров анализа выбирается, исходя из коэффициента разрешения по частоте Q. 6 н. и 19 з.п. ф-лы, 12 ил.

Изобретение относится к системам звукового кодирования, которые используют способ гармонического преобразования для высокочастотной реконструкции (HFR). Описана система и способ генерирования высокочастотной составляющей сигнала из низкочастотной составляющей сигнала. Система включает блок анализирующих фильтров, создающий набор сигналов анализируемых поддиапазонов низкочастотной составляющей сигнала. Она также включает блок нелинейной обработки, предназначенный для генерирования сигнала синтезируемого поддиапазона с синтезируемой частотой путем модификации фазы первого и второго сигналов анализируемых поддиапазонов из набора сигналов анализируемых поддиапазонов и комбинирования сигналов анализируемых поддиапазонов с модифицированной фазой. В конечном счете, она включает блок синтезирующих фильтров, предназначенный для генерирования высокочастотной составляющей сигнала из сигнала синтезируемого поддиапазона. Технический результат - улучшение эффективности кодирования традиционных кодеков воспринимаемых цифровых аудиосигналов. 4 н. и 25 з.п. ф-лы, 30 ил.

Изобретение относится к устройствам и способам расчета параметров управления заграждающим фильтром. Техническим результатом является улучшение качества звучания акустических систем за счет подавления отраженных сигналов пропорционально уровню шумов. Устройство (200) для расчета параметров управления фильтром подавления шума (210), предназначенное для фильтрования второго аудиосигнала с целью устранения эхосигнала на основании первого аудиосигнала, включает в себя вычислитель (220), имеющий в своей конструкции определитель значения (230) для вычисления, по меньшей мере, одного энергопоказателя для полосового сигнала, по меньшей мере, двух последовательных во времени блоков данных, по меньшей мере, одного сигнала из группы сигналов. Вычислитель (220) также включает в себя определитель среднего значения (250) для определения, по меньшей мере, одного среднего значения, по меньшей мере, одного рассчитанного энергопоказателя для полосового сигнала. Вычислитель (220) также включает в себя модификатор (260) для корректировки, по меньшей мере, одного энергопоказателя для полосового сигнала на базе рассчитанного среднего значения для полосового сигнала. Вычислитель (220) также включает в себя устройство расчета параметров управления (270) для фильтра подавления (210) на базе, по меньшей мере, одного скорректированного энергопоказателя. 8 н. и 24 з.п. ф-лы, 14 ил., 2 прилож.

Изобретение относится к устройству кодирования речи, к устройству декодирования речи, к способам кодирования и декодирования речи и к программе кодирования и декодирования речи. Сущность изобретения состоит в том, что коэффициент линейного предсказания сигнала, представленного в частотной области, получают путем выполнения анализа по частоте с линейным предсказанием с использованием метода ковариации или метода автокорреляции. После того как скорректирована сила фильтра полученного коэффициента линейного предсказания, выполняют фильтрацию сигнала по частоте с использованием скорректированного коэффициента, посредством чего формируют временную огибающую сигнала. Технический результат - уменьшение возникающего опережающего эха и запаздывающего эха, что улучшает субъективное качество декодированного сигнала без значительного увеличения скорости передачи битов в способе расширения полосы частот в частотной области, представленном способом репликации спектральных полос (SBR). 6 н. и 1 з.п. ф-лы, 50 ил.

Изобретение относится к устройствам кодирования речи и декодирования речи, к способам кодирования речи и декодирования речи, к программам кодирования речи и декодирования речи. Сущность изобретения состоит в том, что коэффициент линейного предсказания сигнала, представленного в частотной области, получают путем выполнения анализа по частоте с линейным предсказанием с использованием метода ковариации или метода автокорреляции. После того как скорректирована сила фильтра полученного коэффициента линейного предсказания, выполняют фильтрацию сигнала по частоте с использованием скорректированного коэффициента, посредством чего формируют временную огибающую сигнала. Технический результат - уменьшение возникающего опережающего эха и запаздывающего эха и улучшение субъективного качества декодированного сигнала без значительного увеличения скорости передачи битов в способе расширения полосы частот в частотной области, представленном способом репликации спектральных полос (SBR). 13 н. и 26 з.п. ф-лы, 50 ил.
Наверх