Изменяющийся во времени уровень звукового сигнала с использованием изменяющейся во времени оценочной плотности вероятности уровня

Авторы патента:


Изменяющийся во времени уровень звукового сигнала с использованием изменяющейся во времени оценочной плотности вероятности уровня
Изменяющийся во времени уровень звукового сигнала с использованием изменяющейся во времени оценочной плотности вероятности уровня
Изменяющийся во времени уровень звукового сигнала с использованием изменяющейся во времени оценочной плотности вероятности уровня
Изменяющийся во времени уровень звукового сигнала с использованием изменяющейся во времени оценочной плотности вероятности уровня
Изменяющийся во времени уровень звукового сигнала с использованием изменяющейся во времени оценочной плотности вероятности уровня
Изменяющийся во времени уровень звукового сигнала с использованием изменяющейся во времени оценочной плотности вероятности уровня
Изменяющийся во времени уровень звукового сигнала с использованием изменяющейся во времени оценочной плотности вероятности уровня
Изменяющийся во времени уровень звукового сигнала с использованием изменяющейся во времени оценочной плотности вероятности уровня
Изменяющийся во времени уровень звукового сигнала с использованием изменяющейся во времени оценочной плотности вероятности уровня
Изменяющийся во времени уровень звукового сигнала с использованием изменяющейся во времени оценочной плотности вероятности уровня
Изменяющийся во времени уровень звукового сигнала с использованием изменяющейся во времени оценочной плотности вероятности уровня
Изменяющийся во времени уровень звукового сигнала с использованием изменяющейся во времени оценочной плотности вероятности уровня

 


Владельцы патента RU 2433525:

ДОЛБИ ЛЭБОРЕТЕРИЗ ЛАЙСЕНСИНГ КОРПОРЕЙШН (US)

Изобретение относится к области обработки звуковых сигналов. Технический результат: уменьшение изменения среднего уровня сигнала по сравнению с целевым уровнем. Способ включает в себя оценку изменяющейся во времени плотности вероятности кратковременного уровня сигнала и сглаживание уровня сигнала с использованием плотности вероятности. Сигналом может быть звуковой сигнал. Кратковременный уровень и сглаженный уровень могут быть временным рядом, и каждый из них имеет текущий и предшествующий указатели времени. При этом перед сглаживанием можно вычислить вероятность сглаженного уровня при предшествующем указателе времени. Перед сглаживанием вычисляют коэффициенты сглаживания, используя плотность вероятности. Вычисление коэффициентов сглаживания может включать в себя вычисление коэффициентов сглаживания с использованием сглаженного уровня при предшествующем указателе времени, кратковременного уровня при текущем указателе времени и вероятности сглаженного уровня при предшествующем указателе времени. Вычисление коэффициентов сглаживания может включать в себя вычисление коэффициентов сглаживания с использованием ширины оценочной плотности вероятности. 4 н. и 15 з.п. ф-лы, 5 ил.

 

Область техники изобретения

Изобретение относится к обработке звуковых сигналов. В частности, изобретение относится к вычислению изменяющейся во времени меры уровня звукового сигнала посредством сглаживания кратковременного уровня этого звукового сигнала, при котором коэффициенты процесса сглаживания регулируются, по меньшей мере частично, изменяющейся во времени оценкой плотности вероятности кратковременного уровня.

Ссылки и включение в описание изобретения путем ссылки

Некоторые методы измерения воспринимаемой (психоакустичской) громкости, полезные для лучшего понимания настоящего изобретения, описаны в опубликованной международной заявке WO 2004/111994 A2 (авторы Alan Jeffrey Seefeldt et al, опубликованной 23 декабря 2004г.) на изобретение "Способ, устройство и вычислительная программа для вычисления и коррекции воспринимаемой громкости звукового сигнала", а также в работе "Новая объективная мера воспринимаемой громкости" (Alan Seefeldt et al., Audio Engineering Society Convention Paper 6236, San Francisco, October 28, 2004). Заявка WO 2004/111994 A2 и упомянутая работа включены в полном объеме в данное описание путем ссылки.

Описание уровня техники

При обработке звуковых сигналов часто бывает необходимо сформировать изменяющуюся во времени меру уровня звукового сигнала. (В данном контексте термин "уровень" относится к такой мере уровня, как максимальный уровень, среднеквадратический уровень, уровень громкости и т.п.) Например, измеритель громкости может отображать изменяющуюся во времени меру воспринимаемой громкости звукового сигнала, причем эта мера существенно сглажена и показывает среднюю громкость за последние несколько секунд. В другом примере процесс автоматической регулировки усиления (АРУ) может вычислять сильно сглаженную, изменяющуюся во времени меру уровня звукового сигнала, а затем использовать полученную меру для формирования медленно изменяющегося усиления, которое при его применении к звуковому сигналу автоматически перемещает средний уровень звукового сигнала ближе к желаемому целевому уровню.

В этих двух из множества примеров сглаженную меру уровня можно вычислять посредством применения некоторого сглаживающего фильтра к мере кратковременного уровня. ("Кратковременный" означает вычисляемый за интервал времени, который значительно короче, чем интервал, в течение которого действует последующее сглаживание.) Например, можно вычислить среднеквадратический уровень сигнала или уровень воспринимаемой громкости, как описано в заявке WO 2004/111994 A2, в интервале длительностью несколько десятков миллисекунд, чтобы сформировать кратковременный уровень. Тогда при последующем сглаживании этого кратковременного уровня можно будет использовать постоянные времени порядка нескольких секунд. В дальнейшем обсуждении эта изменяющаяся во времени мера кратковременного уровня будет представлена как сигнал L[t], а последующая мера сглаженного уровня будет представлена как , где t представляет дискретный указатель времени.

Можно применить множество различных видов сглаживающих фильтров к L[t], чтобы получить . Можно использовать фильтр с конечной импульсной характеристикой (КИХ) или многополюсный фильтр с бесконечной импульсной характеристикой (БИХ). Конкретный применяемый фильтр не имеет особого значения. В целях иллюстрации можно рассмотреть обычно используемый однополюсный сглаживающий фильтр БИХ с быстрой атакой и медленным восстановлением. При использовании такого фильтра меру сглаженного уровня можно обновлять согласно уравнению:

(1)

Коэффициенты сглаживания αattack и αrelease можно выбрать так, чтобы αattack < αrelease.

Это означает, что отслеживает L[t] быстрее, когда L[t] возрастает (атака), чем когда L[t] уменьшается (восстановление). Для АРУ можно выбрать, например, αattack соответствующим постоянной времени, равной одной секунде, а αrelease соответствующим постоянной времени, равной четырем секундам. При этом ] изменяется достаточно медленно во времени, и в результате соответствующее усиление, которое изменяет звуковой сигнал, также изменяется медленно, тем самым сохраняя кратковременную динамику исходного звукового сигнала. Однако при использовании таких больших постоянных времени могут возникать проблемы. Предположим, что такая АРУ действует на звуковом сигнале телевизионного приемника с целью сохранения сопоставимого среднего уровня на разных программах и на различных каналах. В такой ситуации содержание звукового сигнала, обрабатываемого АРУ, может резко изменяться, например, при изменении канала, и поэтому соответствующий средний уровень звукового сигнала может также резко измениться. Однако при больших постоянных времени АРУ требуется значительное время, чтобы перейти к новому уровню и привести измененный уровень обрабатываемого звукового сигнала в соответствие с желаемым целевым уровнем. Во время такой адаптации телезритель может воспринять уровень звукового сигнала как слишком громкий или слишком тихий. В результате телезритель может быть вынужден быстро прибегнуть к пульту дистанционного управления, чтобы отрегулировать громкость, вмешиваясь в работу АРУ в то время, как она осуществляет переход.

В некоторых видах сглаживания сигнала используется определенная форма автоматический регулировки усиления. В способе, описанном в заявке на патент США 2006/274620 А1, коэффициент усилителя регулируется, чтобы контролировать уровень сигнала, полученного из лазерной оптики, считывающей закодированную цифровым методом с ограниченной длиной поля (RLL) информацию с оптического носителя, такого как диск DVD или компакт-диск. Коэффициент усилителя корректируется, чтобы перевести оптимизированную часть сигнала в область насыщения аналого-цифрового преобразователя (АЦП), обеспечив тем самым более точное восстановление цифровой информации. Для коррекции коэффициента усилителя используется гистограмма длины символов RLL, но эта коррекция выполняется мгновенно. Такая коррекция усиления не основана на вероятности любого уровня сигнала и не предусматривает коррекцию постоянных времени для любого сглаживающего фильтра.

В другом способе, описанном в патенте США 5101416, вычисляется плотность вероятности значений полученного сигнала и сравнивается вычисленная плотность вероятности с идеальной эталонной плотностью, чтобы определить, правильно ли установлен коэффициент усилителя. Если сравнение показывает, что некоторые части вычисленной плотности вероятности выше или ниже эталонной плотности, то усиление усилителя немедленно уменьшается или увеличивается, соответственно. Такая коррекция усиления не основана на вероятности любого конкретного уровня сигнала и не предусматривает коррекцию постоянных времени для любого сглаживающего фильтра.

Другие способы описаны в патенте США 6768979, опубликованной заявке на патент США 2002/196510 А1 и международной заявке WO 92/151150 A. Ни в одном из этих способов не предусмотрена коррекция постоянных времени любого сглаживающего фильтра.

В еще одном известном способе описанную проблему решают посредством использования постоянных времени, основанных на соответствующих отношениях кратковременного уровня L[t] к сглаженному уровню . Например, если кратковременный уровень сигнала значительно больше или меньше, чем сглаженный уровень, как определено некоторыми пороговыми границами вокруг сглаженного уровня, то операция сглаживания переключается на меньшие постоянные времени атаки и/или восстановления, соответственно, до тех пор пока кратковременный уровень не окажется внутри пороговых границ вокруг сглаженного уровня. Затем система переключается обратно на первоначальные большие постоянные времени. Для реализации этого более усовершенствованного метода можно модифицировать Уравнение 1, включив в него четыре случая вместо двух:

(2)

В Уравнении 2 αattackFastattack и αreleaseFastrelease, что означает, что αattackFast и αreleaseFast соответствуют меньшим постоянным времени, чем αattack и αrelease. Если αattack и αrelease соответствуют постоянным времени длительностью 1 и 4 секунды, соответственно, то αattackFast и αreleaseFast можно выбрать, например, соответствующими постоянным времени 0,1 и 0,4 секунды (в 10 раз меньше). Порог малых постоянных времени ΔLfast следует выбирать тщательно, чтобы переход на эти меньшие постоянные времени не происходил слишком часто и не приводил к нежелательной нестабильности сглаженного уровня . Если, например, меры уровня L[t] и представляют среднеквадратический уровень в блоках децибел, то можно установить ΔLfast на 10 дБ, приблизительно удвоенную воспринимаемую громкость.

Хотя сглаживание по Уравнению 2 является более усовершенствованным по сравнению со сглаживанием по Уравнению 1, оно все же не достаточно оптимально для многих сигналов. Обычно для любого приемлемого порога ΔLfast могут существовать сигналы, у которых исходная желаемая динамика кратковременного уровня L[t] отклоняется за пределы пороговых границ вокруг среднего уровня , тем самым вызывая ложный переход процесса сглаживания к режиму быстрой атаки или восстановления.

Для лучшего понимания случаев, в которых сглаживание по Уравнению 2 происходит как требуется и в которых оно не походит, представим себе распределение кратковременного уровня L[t] во времени. Это распределение можно представить как изменяющуюся во времени плотность вероятности, которая предсказывает вероятность возникновения любого конкретного значения кратковременного уровня L в интервале времени вокруг текущего указателя времени t. Продолжительность этого интервала должна быть соразмерна с набором больших постоянных времени, используемых в сглаживающем фильтре по Уравнению 2.

Теперь рассмотрим поведение этой плотности вероятности на примере с изменением телевизионных каналов, описанном выше. Допустим, что динамический диапазон кратковременного уровня для данного канала несколько ограничен, функция плотности вероятности кратковременного уровня L[t] принимает форму довольно узкой выпуклости кривой, расположенной вокруг сглаженного уровня . Когда канал изменяется с предположением, что средний уровень нового канала значительно выше, чем уровень исходного канала, функция плотности вероятности начнет изменяться: исходная выпуклость кривой будет уменьшаться, в то время как новая выпуклость кривой будет расти вокруг более высокого среднего уровня нового канала.

На фиг.1 изображена такая функция плотности вероятности в начале описанного перехода. На этой фигуре по горизонтальной оси показан уровень, а по вертикальной оси - вероятность. Сплошная линия представляет плотность вероятности кратковременного уровня в начале перехода. Можно заметить уменьшающуюся выпуклость кривой слева, представляющую уменьшающуюся вероятность, связанную с выбором старого канала, и растущую выпуклость кривой справа, представляющую увеличивающуюся вероятность, связанную с выбором нового канала. В начале этого перехода сглаженный уровень все еще попадает в выпуклость кривой выбора старого канала, а кратковременный уровень L[t] попадает в выпуклость кривой нового канала. На этой схеме кратковременный уровень L[t] больше, чем на величину больше, чем ΔLfast, и поэтому согласно Уравнению 2 используется малая постоянная времени для обновления к L[t]. Так обеспечивается достижение желаемого эффекта: сглаженный уровень быстро адаптируется к более высокому уровню нового выбранного канала, быстро перемещаясь через промежуток, разделяющий две выпуклости кривой плотности вероятности.

На фиг.2 показана плотность вероятности кратковременного уровня для сильно отличающегося звукового сигнала. В этом случае первоначальная динамика сигнала относительно большая, и поэтому выпуклость кривой плотности вероятности растянута на довольно большую ширину. Такая динамика может быть типичной для высококачественной записи джаза или классической музыки. Также на фиг.2 отношение между и L[t] точно такое же, как на фиг.1, но теперь оба значения лежат внутри основной выпуклости кривой плотности вероятности. Следовательно, переход к малой постоянной времени нежелателен, потому что это отношение между и L[t] является частью типичной динамики сигнала. В этом случае сглаживание, описанное Уравнением 2, не подходит.

Сущность изобретения

Предложены способы, носители и устройство для сглаживания изменяющегося во времени уровня сигнала. Способ включает в себя оценку изменяющейся во времени плотности вероятности кратковременного уровня сигнала и сглаживание уровня сигнала с использованием плотности вероятности. Сигналом может быть звуковой сигнал, а сглаженный уровень и оценочная плотность вероятности могут изменяться во времени приблизительно с одинаковой скоростью.

Кратковременный уровень и сглаженный уровень могут быть временным рядом, и каждый из них имеет текущий и предшествующий указатели времени. При этом перед сглаживанием можно вычислить вероятность сглаженного уровня при предшествующем указателе времени. Перед сглаживанием можно вычислить коэффициенты сглаживания с использованием плотности вероятности. Вычисление коэффициентов сглаживания может включать в себя вычисление коэффициентов сглаживания с использованием сглаженного уровня при предшествующем указателе времени, кратковременного уровня при текущем указателе времени и вероятности сглаженного уровня при предшествующем указателе времени. Вычисление коэффициентов сглаживания может включать в себя вычисление коэффициентов сглаживания с использованием ширины оценочной плотности вероятности.

Если вероятность сглаженного уровня при предшествующем указателе времени не превышает пороговую, вычисление коэффициентов сглаживания может включать в себя использование первых постоянных времени атаки и восстановления, в противном случае, если вероятность сглаженного уровня при предшествующем указателе времени больше, чем пороговая вероятность, используются постоянные времени атаки и восстановления, одна из которых больше, чем соответствующая ей первая постоянная времени. Обе используемые постоянные времени атаки и восстановления могут быть больше, чем их соответствующие первые постоянные времени.

Пороговая вероятность может быть переменной. Переменная пороговая вероятность может быть функцией оценочной плотности вероятности.

Сглаживание может включать в себя сглаживание кратковременного уровня с использованием плотности вероятности.

Оценка плотности вероятности может включать в себя подгонку параметрического представления к прошлым значениям кратковременного уровня. Подгонка может включать в себя подгонку модели гауссовой смеси к прошлым значениям кратковременного уровня. Оценка плотности вероятности может включать в себя вычисление гистограммы прошлых значений кратковременного уровня.

Машинная память может содержать программу ЭВМ для исполнения любого из описанных способов.

Вычислительная машина может содержать ЦПУ, память и шину, обеспечивающую обмен данными между ЦПУ и памятью.

Фильтр сглаживания уровня звукового сигнала может ключать в себя вычислитель кратковременного уровня для вычисления кратковременного уровня звукового сигнала, фильтр сглаживания уровня для сглаживания уровня звукового сигнала с использованием коэффициентов сглаживания, блок оценки плотности вероятности для оценки плотности вероятности звукового сигнала, вычислитель вероятности для вычисления вероятности задержанного сглаженного уровня, вычислитель коэффициентов сглаживания для вычисления коэффициентов сглаживания и элемент задержки для задержки сглаженного уровня.

Блок оценки плотности вероятности может содержать блок оценки вероятности для оценки плотности вероятности с использованием временного ряда кратковременного уровня звукового сигнала. Вычислитель вероятности может содержать вычислитель вероятности для вычисления вероятности с использованием оценочной плотности вероятности и задержанного сглаженного уровня. Вычислитель коэффициентов сглаживания может содержать вычислитель коэффициентов сглаживания для вычисления коэффициентов сглаживания с использованием вероятности, задержанного сглаженного уровня и кратковременного уровня. Вычислитель вероятности может включать в себя вычислитель вероятности для вычисления вероятности с использованием оценочной плотности вероятности и задержанного сглаженного уровня, и вычислитель коэффициентов сглаживания может содержать вычислитель коэффициентов сглаживания для вычисления коэффициентов сглаживания с использованием вероятности, задержанного сглаженного уровня и кратковременного уровня.

Фильтр сглаживания уровня может включать в себя фильтр сглаживания уровня для сглаживания кратковременного уровня звукового сигнала.

Блок оценки вероятности может включать в себя блок подгонки для подгонки параметрического представления к прошлым значениям кратковременного уровня. Блок подгонки параметрического представления может включать в себя блок подгонки для подгонки модели гауссовой смеси к прошлым значениям кратковременного уровня. Блок оценки вероятности может содержать вычислитель гистограммы для вычисления гистограммы прошлых значений кратковременного уровня.

Другой способ сглаживания изменяющегося во времени уровня сигнала может включать в себя прием сигнала, имеющего кратковременный уровень, и сглаживание изменяющегося во времени уровня, причем кратковременный уровень и сглаженный, изменяющийся во времени уровень представляют временной ряд, каждый имеет текущий и предшествующий указатели времени, и сглаживание может включать в себя использование больших постоянных времени, когда разность между сглаженным кратковременным уровнем при предшествующем указателе времени и кратковременным уровнем при текущем указателе времени превышает порог, предписывающий применение малых постоянных времени.

Различные существенные признаки настоящего изобретения и его предпочтительные варианты осуществления станут более понятны из следующего описания со ссылками на прилагаемые чертежи, на которых одинаковые элементы обозначены одними и теми ссылочными же номерами.

Краткое описание чертежей

Фиг.1 изображает плотность вероятности кратковременного уровня звукового сигнала, для которого подходит переход на малую постоянную времени сглаживания;

фиг.2 изображает плотность вероятности кратковременного уровня звукового сигнала, для которого не подходит переход на малую постоянную времени сглаживания;

фиг.3 изображает общую структурную схему варианта осуществления изобретения;

фиг.4 изображает обработку, осуществляемую согласно одному варианту осуществления изобретения на звуковом сигнале, который переключается между источниками значительно различающихся уровней;

фиг.5 изображает алгоритм, иллюстрирующий работу генератора сглаженного уровня согласно одному варианту осуществления изобретения.

Предпочтительный вариант осуществления изобретения

На фиг.3 показана структурная схема генератора 3 сглаженного уровня согласно одному варианту осуществления изобретения.

Генератор 3 сглаженного уровня содержит вычислитель 31 кратковременного уровня, фильтр 32 сглаживания кратковременного уровня, блок 33 оценки плотности вероятности, вычислитель 34 плотности вероятности, вычислитель 35 коэффициентов сглаживания и элемент задержки 36. Вычислитель 31 кратковременного уровня принимает объемный звуковой сигнал на входе и формирует кратковременный уровень L[t] 37 на выходе. Блок 33 оценки плотности вероятности принимает кратковременный уровень L[t] 37 на входе и формирует оценочную плотность вероятности p(l,t) 38 на выходе. Вычислитель 34 вероятности принимает оценочную плотность вероятности p(l,t) 38 и меру задержанного сглаженного уровня 3C на входе и формирует вероятность 39 на выходе. Вычислитель 35 коэффициентов сглаживания принимает вероятность 39 на входе, а также задержанный сглаженный кратковременный уровень 3B и кратковременный уровень L[t] 37 и формирует коэффициенты сглаживания 3A на выходе. Фильтр 32 сглаживания кратковременного уровня принимает коэффициенты сглаживания 3A и кратковременный уровень L[t] 37 на входе и формирует меру сглаженного уровня 3C на выходе. И наконец, элемент задержки 36 принимает и задерживает меру сглаженного уровня 3C.

Конечно, генератор 3 сглаженного уровня может быть реализован полностью или частично в форме универсальной вычислительной машины, включающей в себя программируемую память, в форме схемы специального назначения, в форме программируемой вентильной матрицы и т.п.

Далее будет описана работа генератора 3 сглаженного уровня согласно одному варианту осуществления изобретения.

Генератор 3 сглаженного уровня формирует оценку сглаженного уровня путем сглаживания оценки L[t] кратковременного уровня под управлением, по меньшей мере частично, информации, полученной из оценки изменяющейся во времени плотности вероятности кратковременного уровня L[t]. Полученная оценка сглаженного уровня полезна, например, как величина, отображаемая измерителем громкости в реальном времени, или для использования в цепи управления динамического процессора звукового сигнала, такой как АРУ.

На фиг.5 представлен алгоритм работы генератора 3 сглаженного уровня согласно одному варианту осуществления изобретения. Сначала вычисляется кратковременный уровень L[t] звукового сигнала, этап 505. На этапе 510 этот кратковременный уровень сглаживается и формируется сглаженный уровень меры .

Одновременно на основании кратковременного уровня L[t] обновляется изменяющаяся во времени оценка плотности вероятности кратковременного уровня, этап 515. Эта оценка плотности вероятности, p(l,t), возвращает вероятность между нулем и единицей для входного уровня l. Указатель времени t показывает, что эта функция изменяется во времени по мере того как блок 33 оценки плотности вероятности (фиг.3) принимает новые значения кратковременного уровня L[t]. В идеале, интервал времени, в течение которого блок 33 оценки плотности вероятности анализирует значения L[t] для формирования оценки p(l,t), должен быть соразмерен с постоянными времени, из которых фильтр 32 сглаживания формирует . В результате и p(l,t) изменяются во времени приблизительно с одинаковой скоростью.

Вероятность меры сглаженного уровня меры из предшествующего указателя времени, , вычисляется на этапе 520 посредством загрузки оценки плотности p(l,t) с величиной уровня . Это значение вероятности представляет информацию об отношении между и множеством значений кратковременного уровня вокруг указателя времени t, а не только об отношении между и текущим кратковременным уровнем L[t]. Например, если высокая, это показывает, что подобен множеству значений кратковременного уровня в недавнем прошлом. И напротив, если низкая, то отличается от большинства значений кратковременного уровня в недавнем прошлом.

И наконец, значение вероятности , так же как текущий кратковременный уровень L[t] и мера предшествующего сглаженного уровня , загружаются в вычислитель 35 коэффициентов сглаживания (фиг.3), который использует эти значения для выбора коэффициентов сглаживания для формирования меры текущего сглаженного уровня , этап 525.

Хотя фиг.3 отображает как регулирующую коэффициенты сглаживания, можно использовать и другую информацию, полученную из оценки плотности p(l,t). Например, вычислитель 35 коэффициентов сглаживания может использовать меру ширины оценки плотности, указатель динамического диапазона звукового сигнала.

Возвратимся к иллюстрации применения : обычно если оценка плотности p(l,t) оценивает предшествующее сглаженное значение как имеющее низкую вероятность, то малые постоянные времени должны обновить . Если вероятность относительно высокая, то следует использовать большие постоянные времени. Таким образом, если большинство значений кратковременного уровня переместилось далеко от предшествующего сглаженного значения , то будет быстрее перемещаться к таким значениям. Если уже находится близко к большинству значений кратковременного уровня, то подходит более медленное движение.

Как видно на фиг.2, вариант осуществления изобретения предотвращает нежелательный переход на меньшие постоянные времени, потому что лежит в пределах области высокой вероятности, даже несмотря на то, что кратковременный уровень L[t] находится относительно далеко. Для примера с изменением канала на фиг.1 целесообразно изучить более подробно, как эта стратегия все же обеспечивает требуемую быструю адаптацию. Для большей ясности фиг.4 изображает переход между двумя каналами за пять стадий. Простая стратегия регулировки постоянных времени предполагает, что когда больше, чем некоторый порог pr, используются большие постоянные времени для обновления . Когда меньше, чем порог pr, используются малые постоянные времени. (Указатель времени удален из надписи на фигуре, чтобы упростить выражения.)

Первая стадия на фиг.4, исходное устойчивое состояние, показывает условия непосредственно перед выбором второго, более громкого канала. Плотность вероятности кратковременного уровня распределена близко вокруг среднего уровня первого канала. Сглаженный уровень лежит в пределах основной выпуклости этой плотности. Следовательно, вероятность , , больше, чем порог pТ, и используются большие постоянные времени для обновления .

Вторая стадия, начало перехода, представляет состояние системы сразу после того, как звуковой сигнал переключился на более громкий второй канал. На этой стадии большая выпуклость кривой плотности вероятности, расположенная вокруг среднего уровня первого канала, сжимается и растет новая выпуклость кривой вокруг среднего уровня более громкого второго канала. Сглаженный уровень начал перемещаться вправо к среднему уровню второго канала. Однако его вероятность все еще больше, чем pr, и поэтому все еще используются большие постоянные времени.

На третьей стадии, в середине перехода, первая выпуклость кривой плотности вероятности продолжает сжиматься, а вторая выпуклость кривой продолжает расти. Сглаженный уровень продолжает расти вправо ко второму каналу, но теперь его вероятность падает ниже порога pr. ( переместился в промежуток низкой вероятности между двумя выпуклостями кривой.) В этот момент используются малые постоянные времени для обновления , вынуждая его быстро перемещаться через промежуток к выпуклости кривой второго канала.

На четвертой стадии, в конце перехода, переместилось в основной горб кривой второго канала, и его вероятность снова выше, чем pr. Теперь происходит переход обратно на большие постоянные времени.

И наконец, на пятой стадии, нового устойчивого состояния, сглаженный уровень установился на средний уровень второго канала, и продолжают использоваться большие постоянные времени.

При использовании информации, полученной из оценки изменяющейся во времени плотности вероятности p(l,t), в этом варианте осуществления изобретения постоянные времени адаптируются для сглаживания меры уровня звукового сигнала таким образом, чтобы обеспечить быструю реакцию во время действительных периодов перехода, но при сохранении стабильности для ранее проблематичных сигналов.

Далее будет подробно описан пример конкретного варианта осуществления изобретения. В этом варианте сглаживание, формирующее из L[t], можно представить как однополюсный фильтр с изменяющимся во времени коэффициентом α[t]:

(3)

Это сглаживание адаптируется посредством изменения коэффициента α[t] как функции оценки плотности вероятности p(l,t). Сначала будет описано выведение этой оценки плотности p(l,t) из кратковременного уровня L[t]. Затем будет описано регулирование коэффициента α[t].

Оценка плотности вероятности

Оценка плотности вероятности p(l,t) охватывает поведение кратковременного уровня L[t] за интервал времени, простирающийся в недавнее прошлое от указателя текущего времени t. Для этого блок 33 оценки (фиг.3) поддерживает буфер (не показан), содержащий прошлые значения Т кратковременного уровня L[t]. (Длину T этого буфера можно выбирать согласно желаемому применению. Например, в обсуждавшемся выше примере АРУ можно установить длину буфера равной четырем секундам.)

Из этого буфера можно получить оценку плотности вероятности целым рядом способов. Например, можно произвести подгонку параметрического представления, такого как модель гауссовой смеси, к данным в буфере. В другом методе вычисляется гистограмма буферизованных данных. Каждому значению в буфере назначается отдельный столбик. Функция плотности p(l,t) вычисляется по первому нахождению столбика, в который попадает значение l, затем вычисляется вероятность как количество точек в буфере данных, назначенных этому столбику, деленное на общее количество точек в буфере данных. Столбики гистограммы можно определить как лежащие между некоторым минимальным уровнем Lmin и максимальным уровнем Lmax с расстоянием ΔLbin. Например, если уровень представлен в дБ, можно установить Lmin = 1 dB, Lmax = 120 dB и ΔLbin = 1 dB, чтобы получить гистограмму, содержащую 120 столбиков. Общее количество столбиков B можно представить в общем как:

(4)

В каждый момент времени t подсчитывается количество выборок в длине T буфера данных, попадающих в каждый столбик гистограммы. Ht[b], b - 1...B, - это столбики гистограммы, и столбик b, которому назначено значение уровня l, можно вычислить согласно отображающей функции:

(5)

Алгоритмически вычисление гистограммы Hl[b] в любой момент времени t производится согласно следующему псевдокоду:

для b=1-B,

Ht[b)=0

конец

для τ=0-Т-1,

b=LevelToBin(L[t-τ])

Ht[b]=Ht[b]+1

конец

Затем дается оценка плотности вероятности p(l,t) гистограммой в столбике, которому назначено l, деленное на общее количество точек данных в буфере:

(6)

Полученная в результате оценочная плотность вероятности, p(l,t), является не непрерывной функцией входного уровня l, а функцией, имеющей ступенчатую форму в интервале ΔLbin. Однако, если гистограмма расстояний ΔLbin достаточно мала, оценка плотности вероятности будет достаточно гладкой для практических целей.

Вычисление коэффициента сглаживающего фильтра

Теперь будет описано вычисление коэффициента α[t] адаптивного фильтра. В нормальных условиях, когда вероятность относительно высокая, используются нормальные постоянные времени атаки и восстановления (как в Уравнении 1). Когда вероятность низкая, используются меньшие постоянные времени атаки и восстановления.

Для осуществления плавной интерполяции между нормальными и малыми постоянными времени формируется сигнал управления β[t] в интервале между нулем и единицей на основании вероятности , вычисленной из оценки плотности p(l,t):

(7)

Если больше, чем порог pТ, то сигнал управления β[t] равен единице. Когда падает ниже pТ, сигнал управления β[t] падает до нуля. И наконец, коэффициент сглаживающего фильтра α[t] вычисляется путем интерполяции между нормальными и малыми коэффициентами атаки и восстановления на основании сигнала управления β[t].

(8)

Когда β[t] равен нулю, ( лежит в области низкой вероятности), используются малые коэффициенты атаки и восстановления. Когда β[t] равен единице, ( лежит в области высокой вероятности), используются нормальные коэффициенты атаки и восстановления.

Для реализации АРУ значения αattack, αattackFast, αrelease и αreleaseFast можно установить соответствующими постоянным времени 1, 0,1, 4 и 0,4 секунды соответственно. Значение порога вероятности pТ можно установить на фиксированное значение 0,075.

Хотя в данном варианте осуществления изобретения используется фиксированное значение порога pТ, в некоторых применениях может быть целесообразным сделать pТ переменным порогом, который изменяется, например, в зависимости от некоторой меры оценки плотности p(l,t). Например, pТ может изменяться при максимуме p(l,t) на уровне l.

Настоящее описание включает в себя путем ссылки сведения всех упомянутых публикаций и заявок на патент, в такой же мере, как если бы описание содержало специальную отдельную ссылку на каждую такую отдельную публикацию или заявку на патент.

Поскольку изобретение можно реализовать в нескольких формах, не выходя за рамки объема его существенных признаков, данный вариант осуществления изобретения является иллюстративным и не имеет ограничительного значения. Следовательно, изменения, находящиеся в границах формулы изобретения или эквивалентов этих границ, подпадают под объем формулы изобретения.

1. Способ сглаживания изменяющегося во времени уровня сигнала, заключающийся в том, что
оценивают изменяющуюся во времени плотность вероятности изменяющегося во времени уровня сигнала,
вычисляют вероятность предшествующего сглаженного изменяющегося во времени уровня, используя оценку плотности вероятности,
адаптируют сглаживающий фильтр в ответ на указанную вероятность, и
применяют адаптированный сглаживающий фильтр к изменяющемуся во времени уровню для формирования сглаженного, изменяющегося во времени уровня.

2. Способ по п.1, в котором адаптируют постоянные времени сглаживающей фильтрации, чтобы они были соразмерны со скоростью изменения оценочной плотности вероятности.

3. Способ по п.1, в котором изменяющийся во времени уровень и сглаженный, изменяющийся во времени уровень представляют временной ряд и каждый из них имеет текущий и предшествующий указатели времени, при этом способ содержит этапы, на которых:
вычисляют вероятность сглаженного, изменяющегося во времени уровня при предшествующем указателе времени,
адаптируют сглаживающий фильтр в ответ на вероятность сглаженного, изменяющегося во времени уровня при предшествующем указателе времени, и
применяют адаптированный сглаженный фильтр к изменяющемуся во времени уровню при текущем указателе времени.

4. Способ по п.3, в котором адаптируют сглаживающий фильтр в ответ на сглаженный, изменяющийся во времени уровень при предшествующем указателе времени, изменяющийся во времени уровень при текущем указателе времени и вероятность сглаженного, изменяющегося во времени уровня при предшествующем указателе времени.

5. Способ по п.4, в котором адаптируют постоянные времени атаки и восстановления сглаживающего фильтра таким образом, чтобы постоянная атаки была равна первому значению атаки, а постоянная восстановления была равна первому значению восстановления, когда вычисленная вероятность сглаженного, изменяющегося во времени уровня при предшествующем указателе времени меньше или равна пороговой вероятности, и
постоянная атаки была равна второму значению атаки, а постоянная восстановления была равна второму значению восстановления, когда вычисленная вероятность сглаженного, изменяющегося во времени уровня при предшествующем указателе времени больше пороговой вероятности, причем либо второе значение атаки больше первого значения атаки, либо второе значение восстановления больше первого значения восстановления.

6. Способ по п.1, в котором адаптируют сглаживающий фильтр посредством изменения постоянных времени сглаживающего фильтра в ответ на указанную вероятность, причем меньшие постоянные времени используются, когда вероятность ниже, и большие постоянные времени используются, когда вероятность выше.

7. Способ по п.1, в котором адаптируют сглаживающий фильтр в ответ на ширину изменяющейся во времени плотности вероятности.

8. Способ по п. 5, в котором адаптируют пороговую вероятность в ответ на оценочную плотность вероятности.

9. Способ по любому из пп.1-8, в котором оценивают плотность вероятности посредством подгонки параметрического представления к прошлым значениям изменяющегося во времени уровня.

10. Способ по любому из пп.1-8, в котором оценивают плотность вероятности посредством вычисления гистограммы прошлых значений изменяющегося во времени уровня.

11. Машинная память, содержащая программу ЭВМ для исполнения вычислительной машиной любого из способов по пп.1-10.

12. Вычислительная система, содержащая ЦПУ,
память по п.11, и
шину, обеспечивающую обмен данными между ЦПУ и памятью.

13. Устройство для сглаживания изменяющегося во времени звукового сигнала, содержащее
входной терминал для приема звукового сигнала,
вычислитель кратковременного уровня, подключенный к входному терминалу, для вычисления кратковременного уровня звукового сигнала,
фильтр сглаживания уровня, подключенный к выходу вычислителя кратковременного уровня, для сглаживания кратковременного уровня звукового сигнала с использованием коэффициентов сглаживания,
блок оценки плотности вероятности, подключенный к выходу вычислителя кратковременного уровня, для оценки плотности вероятности кратковременного уровня,
элемент задержки, подключенный к выходу фильтра сглаживания уровня, для задержки сглаженного кратковременного уровня звукового сигнала, вычислитель вероятности, подключенный к выходу блока оценки плотности вероятности и к выходу элемента задержки, для вычисления вероятности задержанного сглаженного кратковременного уровня, и
вычислитель коэффициентов сглаживания, подключенный к выходу вычислителя кратковременного уровня, подключенный к выходу вычислителя вероятности и подключенный к выходу элемента задержки для вычисления коэффициентов сглаживания, причем фильтр сглаживания уровня также подключен к выходу вычислителя сглаживающих коэффициентов.

14. Устройство по п.13, в котором вычислитель плотности вероятности оценивает плотность вероятности, используя временной ряд кратковременного уровня звукового сигнала.

15. Устройство по п.13, в котором вычислитель вероятности вычисляет вероятность, используя оценочную плотность вероятности и задержанный сглаженный кратковременный уровень.

16. Устройство по п.13, в котором вычислитель коэффициентов сглаживания вычисляет коэффициенты сглаживания, используя упомянутые вероятность, задержанный сглаженный кратковременный уровень и кратковременный уровень.

17. Устройство по п.14, в котором
вычислитель вероятности вычисляет вероятность, используя оценочную плотность вероятности и задержанный сглаженный кратковременный уровень, и
вычислитель коэффициентов сглаживания вычисляет коэффициенты сглаживания, используя упомянутые вероятность, задержанный сглаженный кратковременный уровень и кратковременный уровень.

18. Устройство по пп.13-17, в котором блок оценки плотности вероятности осуществляет подгонку параметрического представления к прошлым значениям кратковременного уровня.

19. Устройство по пп.13-17, в котором блок оценки плотности вероятности вычисляет гистограмму прошлых значений кратковременного уровня.



 

Похожие патенты:

Изобретение относится к области вычислительной техники и может быть использовано для построения в общесистемной аппаратной среде цифровых авторегрессионных фильтров и фильтров с конечным импульсным откликом, устройств идентификации, свертки и модульных вычислений.

Изобретение относится к цифровой обработке радиолокационных сигналов. .

Изобретение относится к области радиотехники и может быть использовано в когерентно-импульсных РЛС обнаружения и управления воздушным движением для селекции сигналов движущихся целей на фоне пассивных помех с неизвестными корреляционными свойствами.

Изобретение относится к радиотехнике и может найти применение в качестве устройства адаптивной фильтрации в медицинской визуализации. .

Изобретение относится к адаптивным фильтрам, обеспечивающим компенсацию эхо-сигналов. .

Изобретение относится к системе связи и, в частности, к адаптивным фильтрам. .

Изобретение относится к адаптивному корректирующему фильтру с двумя частичными фильтрами (TF1, ТF2), коэффициенты фильтрации которых являются изменяемыми с помощью схемы подстройки коэффициентов (CORR), чтобы, например, образовать приближенно инверторный фильтр для изменяющегося во времени канала передачи, и при котором с помощью переключения является возможным, как недецимирующий режим работы, при котором частота опроса соответствует частоте символов, так и децимирующий режим работы, при котором частота опроса удовлетворяет теореме отсчетов.

Изобретение относится к радиотехнике, в частности к радиолокации, и может быть использовано в системах возбуждения СВЧ-генераторов на лавинно-пролетных диодах и диодах Ганна.

Изобретение относится к области электроизмерительной техники и автоматики. .

Изобретение относится к области радиотехники и связи и может быть использовано в устройствах автоматической регулировки усиления, фазовых детекторах и модуляторах, в системах фазовой автоподстройки и умножения частоты или в качестве усилителя, коэффициент передачи по напряжению которого зависит от уровня сигнала управления.

Изобретение относится к обработке звуковых сигналов и предназначено для перенастройки при обработке динамических свойств аудио для быстрой адаптации к изменениям контента в звуковом сигнале.

Изобретение относится к области радиотехники и связи и может быть использовано в качестве усилителя переменного тока, коэффициенты передачи по напряжению которого (Kу1, Kу2) зависят от уровня сигнала управления (Uу ).

Изобретение относится к области радиотехники и связи и может быть использовано в качестве широкополосного усилителя, коэффициент передачи по напряжению которого зависит от уровня сигнала управления (uу).

Изобретение относится к области радиотехники и связи и может быть использовано в качестве усилителя переменного тока, коэффициент передачи по напряжению которого (Кu) зависит от уровня сигнала управления (uy).

Изобретение относится к области радиотехники и связи и может быть использовано в качестве широкополосного усилителя, коэффициент передачи, по напряжению которого зависит от уровня сигнала управления (uy).
Наверх