Направленное маскирование звука

Изобретение относится к акустике, в частности к системам для маскирования звука. Система содержит микрофоны, спектроанализатор для определения мощностных характеристик звука и пространственный анализатор для определения характеристик направленности воспринятого звука, представляющих направление падения на человека, генератор для генерации маскирующего звука под комбинированным управлением мощностных характеристик и пространственных характеристик для маскирования звука. Система сконфигурирована для маскирования излучаемого в направлении человека звука, в которой подсистема обработки сигнала содержит пространственный анализатор для определения характеристик направленности, причем пространственный анализатор предназначен для определения характеристик направленности на основе определения количественного представления по меньшей мере одной из интерауральной временной разности и интерауральной разности по уровню. Технический результат – повышение эффективности маскирования звука. 4 н. и 6 з.п. ф-лы, 3 ил.

 

ОБЛАСТЬ ТЕХНИКИ, К КОТОРОЙ ОТНОСИТСЯ ИЗОБРЕТЕНИЕ

Изобретение относится к системе, сконфигурированной для маскирования падающего на человека звука. Изобретение относится также к подсистеме обработки сигнала для использования в системе по настоящему изобретению, к способу маскирования падающего на человека звука, а также к управляющему программному обеспечению для конфигурирования компьютера для выполнения способа по настоящему изобретению.

УРОВЕНЬ ТЕХНИКИ

Маскирование звука представляет собой добавление в окружение естественного или искусственного звука (такого как белый шум), чтобы спрятать нежелательный звук. Это то, что противоположно технике активного управления шумом. Маскирование звука уменьшает или исключает осведомленность о предшествующих звуках в данном окружении и может сделать окружение более удобным. Например, имеются коммерческие устройства, предназначенные для установки в комнате, чтобы маскировать звуки, которые в противном случае могли бы мешать работе или сну человека в этой комнате.

В соответствующей области техники известно, что не пиковый звуковой уровень, а скорее отношение пикового к базовому звуковому уровню связано с количеством пробуждений, обусловленных воздействием звуков на сон пациента. Поэтому добавлением маскирующего звука пороговый уровень пробуждения ото сна повышается, приводя к более комфортному для сна окружению. См. например, Stanchina, M., Abu-Hijleh, M., Chaudhry, В.К., Carlisle, С.С., Millman, R.P., (2005) "The influence of white noise on sleep in subjects exposed to ICU noise" ("Влияние белого шума на сон людей, подвергнутых воздействию шума в ОИТ"), Sleep Medicine 6(5): 423-428 - дискуссию относительно взаимозависимости между отношением пикового к базовому звуковому уровню и порогом в контексте экспериментов, проводившихся в больничном отделении интенсивной терапии (ОИТ).

Имеются коммерческие звукомаскирующие устройства, которые производят стационарный акустический шум в относительно широком частотном диапазоне, чтобы понизить вероятность того, что пользователь будет разбужен во время его (ее) сна окружающими звуками. В некоторых из этих устройств для улавливания потенциально раздражающего звука используется микрофон, чтобы затем этот потенциально раздражающий звук подвергнуть анализу для коррекции маскирующего звука до уровня интенсивности раздражающего звука и до получения спектральных характеристик раздражающего звука.

Имеющиеся коммерческие звукомаскирующие устройства используют, как правило, один динамик для воспроизведения звука в относительно широком частотном диапазоне, то есть белого шума. Некоторые из имеющихся коммерческих продуктов имеют разъем для наушников, чтобы во время рабочего использования продукта маскирующий звук не беспокоил находящихся рядом людей. Однако звук, воспроизводимый через наушники, часто представляет собой лишь удвоение одного канала.

Публикация US 2013/0170655 A1 описывает звукомаскирующую систему с линейкой микрофонов и линейкой динамиков. Положение говорящего определяется в ответ на звук голоса говорящего, который воспринимается микрофонами. Задержки для каждого динамика управляются таким образом, что звук от динамика доходит до принимающего человека в направлении говорящего, чей голос подлежит маскированию.

Публикация US 2013/0170662 A1 описывает звукомаскирующую систему, которая воспринимает звук от микрофона, удаляет акустически характерную величину и выдает маскирующий звук, соответствующий удаленной акустически характерной величине. Для удаления эха из воспринятого звука используется эхоподавляющая секция.

СУЩНОСТЬ ИЗОБРЕТЕНИЯ

Авторы поняли, что имеющиеся коммерческие звукомаскирующие системы не принимают во внимание направленность нежелательных звуков.

Что касается направленности звуков, - сошлемся на книгу Jens Blauert, "Spatial Hearing: The Psychophysics of Human Sound Localization", Cambridge, MA; MIT Press, 2001 (Дженс Блоэрт «Пространственный слух: Психофизика звуковой локализации человеком», Кембридж, Масс., Изд. Масс. Технол. Инст., 2001), особенно на гл. 3.2.2. Блоэрт обсуждает сценарий, в соответствии с которым в одной комнате находится группа людей, и при этом одновременно ведется несколько разговоров. Слушатель среди гула голосов имеет возможность сфокусировать свое слуховое внимание на одного конкретного говорящего, даже не видя этого конкретного говорящего. Однако если слушатель заткнет одно из своих ушей, этот слушатель будет испытывать гораздо большие трудности с пониманием того, что говорит этот конкретный говорящий. Этот психоакустический феномен известен в своей области как "эффект вечеринки с коктейлем" или как "селективное внимание". Дополнительную информацию относительно "эффекта вечеринки с коктейлем" см. например, в статье: Cherry, Ε. Colin (1953), "Some Experiments on the Recognition of Speech, with One and Two Ears" ("Некоторые эксперименты по распознаванию речи одним и двумя ушами"), Journal of Acoustical Society of America 25(5): 975-979. Это явление происходит из того факта, что человек, который прислушивается к желательному слуховому сигналу с определенным направлением падения в окружении шума с другим направлением падения, может идентифицировать желательный слуховой сигнал лучше, когда он или она слушает бинаурально (то есть двумя ушами), чем тогда, когда он или она слушает монаурально (то есть только одним ухом). Другими словами, человек может лучше распознать аудиосигнал в присутствии слухового шума, если человек слушает бинаурально, а не монаурально, и если желательный слуховой сигнал и слуховой шум имеют различные направления падения.

Авторы изобретения "вывернули" эту ситуацию наоборот и предложили специальный сценарий звукового маскирования, в котором нежелательный звук замаскирован искусственно сгенерированным шумом, который управляется таким образом, чтобы он имел по существу то же самое направление падения на человека, которого акустически необходимо раздражать как можно меньше.

Более конкретно, авторы предлагают систему, сконфигурированную для маскирования падающего на человека звука, как она определена в приложенном пункте 1 формулы изобретения.

В системе по настоящему изобретению мощностные характеристики воспринятого падающего звука определяются для того, чтобы управлять спектром маскирующего звука, а характеристики направленности определяются для того, чтобы генерировать такой маскирующий звук, который, когда будет воспринят человеком, казался бы идущим из направления, подобного направлению, с которого падает падающий звук, с тем чтобы сделать маскирование более эффективным.

Как известно, человеческое ухо производит параллельную обработку звуков, в том смысле, что ухо одновременно обрабатывает различные спектральные компоненты. Улитка внутреннего уха, по-видимому, действует как спектральный анализатор, выполняя частотный анализ входящего звука, и в психоакустике часто моделируется как совокупность звуковых полосовых фильтров с смещенно настроенными перекрывающимися диапазонами. Однако улитка представляет собой динамическую систему, в которой характеристические параметры каждого полосового фильтра, то есть центральная частота фильтра (на пике пропускания), полоса пропускания и усиление допускают изменение на уровне бессознательного управления. Выполненные измерения фильтрующих свойств улитки указывают, что форма каждого полосового фильтра является асимметричной с более крутым наклоном на стороне высоких частот и с "хвостом" более медленного затухания на стороне низких частот. В психоакустическом моделировании фильтр асимметричной формы для отдельного звукового полосового фильтра по практическим соображениям обычно замещают симметричной амплитудно-частотной характеристикой, известной как "скругленная экспоненциальная форма" (RoEx), а эффективная полоса пропускания фильтра выражается в виде эквивалентной прямоугольной полосы пропускания1) (ЭПП).

В системе по настоящему изобретению мощностные характеристики, в том виде, как они определены, содержат соответствующий признак, представляющий частотный спектр в соответствующем одном из множества частотных диапазонов. Соответственно, вариант исполнения системы может параллельно маскировать различные падающие звуки, одновременно испущенные разными источниками разных местоположений и имеющие различные частотные спектры.

В варианте исполнения системы микрофонная подсистема выдает первый сигнал, представляющий воспринятый звук. Подсистема обработки сигнала выдает второй сигнал для управления подсистемой динамиков. Система содержит подсистему адаптивной фильтрации, предназначенную для уменьшения вклада маскирующего звука, присутствующего в воспринятом звуке, во втором сигнале. Система адаптивной фильтрации содержит адаптивный фильтр и субтрактор. Адаптивный фильтр имеет вход фильтра для приема второго сигнала и выход фильтра для выдачи отфильтрованного варианта второго сигнала. Субтрактор имеет первый вход субтрактора для приема первого сигнала и второй вход субтрактора для приема отфильтрованного варианта второго сигнала, а также выход субтрактора для подачи третьего сигнала в подсистему обработки сигнала, который представляет разницу между первым сигналом и отфильтрованным вариантом второго сигнала. Адаптивный фильтр имеет вход управления для приема третьего сигнала для управления одним или более коэффициентами фильтра адаптивного фильтра.

В конфигурации, когда микрофонная подсистема акустически недостаточно хорошо изолирована от подсистемы динамика, звук, воспринятый микрофонной подсистемой, содержит звук, предназначенный для маскирования, а также маскирующий звук. Адаптивная фильтрация следит за тем, чтобы маскирующий звук, в том виде, как он воспринят, был бы по существу лишен возможности влиять на возникновение самого маскирующего звука.

Подсистема обработки сигнала содержит пространственный анализатор для определения характеристик направленности, и при этом пространственный анализатор предназначен для определения характеристик направленности на основе определения количественного представления по меньшей мере одной из интерауральной временной разности (ИВР) и интерауральной разности по уровню (ИРУ).

В локализации звука человеком концепции "интерауральной временной разности" (ИВР) и "интерауральной разности по уровню" (ИРУ) относятся к физическим количествам, которые дают возможность человеку определить боковое направление (левый, правый), с которого кажется приходящим звук.

Как известно, формирование луча представляет собой технику обработки сигнала, используемую в детекторных решетках для направленной передачи или приема сигнала. Это достигается таким комбинированием элементов в решетке, что сигналы на одних определенных углах испытывают конструктивное взаимовлияние, в то время как другие испытывают деструктивное взаимовлияние. Формирование луча может быть использовано на обоих - и на передающем, и на приемном концах, для того чтобы достичь пространственной выборочности. Более подробно - см. например, "Beamforming: A versatile approach to spatial filtering" ("Формирование луча: Универсальный подход к пространственной фильтрации"), B.D.V. Veen and К.M. Buckley, IEEE ASSP Magazine, April, 1988, pp. 4-24.

В следующем варианте исполнения система по настоящему изобретению содержит звуковой классификатор, который предназначен для выборочного удаления предопределенного участка из воспринятого звука до выполнения определения мощностных характеристик и до выполнения определения характеристик направленности.

Звуковой классификатор сконфигурирован таким образом, чтобы отличать звуки, воспринятые микрофонной подсистемой, и которые подлежат массированию, от других звуков, которые восприняты микрофонной подсистемой, и которые не подлежат массированию (например, человеческий голос или сигнал тревоги), с тем чтобы выборочно подвергать воспринятые звуки процессу маскирования. Классификатор может быть реализован, например, посредством анализа спектра воспринятого звука и идентификации в нем одного или более рисунков, которые удовлетворяют предопределенным критериям.

Система, дополнительно, относится к подсистеме обработки сигнала для использования в системе, как она описана выше.

Изобретение может использоваться в коммерческих целях посредством изготовления, использования или обеспечения системы по настоящему изобретению, как она описана выше. Альтернативно, изобретение может использоваться в коммерческих целях посредством изготовления, использования или обеспечения подсистемы обработки сигнала, сконфигурированной для использования в системе по настоящему изобретению. В месте предполагаемого использования подсистему обработки сигнала в таком случае подсоединяют к микрофонной подсистеме, системе динамика и, возможно, - к адаптивному фильтру и (или) к классификатору, полученному от других поставщиков.

Кроме того, изобретение может использоваться в коммерческих целях посредством реализации способа в соответствии с изобретением. Поэтому изобретение относится также к способу маскирования звука, падающего на человека, как он определен приложенным п. 5 формулы изобретения.

В одном варианте исполнения способа по изобретению способ включает в себя прием первого сигнала, представляющего воспринятый звук; подачу второго сигнала для генерации маскирующего звука; и адаптивную фильтрацию, предназначенную для уменьшения вклада маскирующего звука, присутствующего в воспринятом звуке, во второй сигнал. Адаптивная фильтрация включает в себя прием второго сигнала; использование адаптивного фильтра для подачи отфильтрованного варианта второго сигнала; подачу третьего сигнала, который представляет разницу между первым сигналом и отфильтрованным вариантом второго сигнала; прием третьего сигнала для управления одним или более коэффициентами фильтра адаптивного фильтра; и использование третьего сигнала для определения мощностных характеристик и для определения характеристик направленности.

Определение характеристик направленности включает в себя определение количественного представления по меньшей мере одной из интерауральной временной разности (ИАР) и интерауральной разности по уровню (ИРУ).

Следующий вариант исполнения способа по изобретению включает в себя выборочное удаление предопределенного участка из воспринятого звука до выполнения определения мощностных характеристик и до выполнения определения характеристик направленности.

Кроме того, изобретение может использоваться в коммерческих целях в виде управляющего программного обеспечения, либо поставленного в сохраненном виде на считываемом посредством компьютера носителе, таком как, например, твердотельная память, оптический диск, магнитный диск и т.д., или сделанном доступным в виде электронного файла, загружаемого через сеть передачи данных, например, интернет.

Поэтому изобретение относится также к управляющему программному обеспечению для исполнения на компьютере с целью конфигурирования компьютера для выполнения способа маскирования падающего на человека звука, как он определен в приложенном п. 8 формулы изобретения.

В одном варианте исполнения управляющего программного обеспечения по изобретению это управляющее программное обеспечение содержит пятые инструкции для адаптивной фильтрации для уменьшения вклада маскирующего звука, присутствующего в воспринятом звуке, во второй сигнал. Пятые инструкции содержат: шестые инструкции для приема второго сигнала; седьмые инструкции для использования адаптивного фильтра для подачи отфильтрованного варианта второго сигнала; восьмые инструкции для подачи третьего сигнала, который представляет разницу между первым сигналом и отфильтрованным вариантом второго сигнала; и девятые инструкции для приема третьего сигнала для управления одним или более коэффициентами фильтра адаптивного фильтра. Вторые инструкции содержат десятую инструкцию для использования третьего сигнала для определения мощностных характеристик. Третьи инструкции содержат одиннадцатые инструкции для использования третьего сигнала для определения характеристик направленности.

Третьи инструкции содержат инструкции для определения количественного представления по меньшей мере одной из интерауральной временной разности и интерауральной разности по уровню.

Следующий вариант исполнения управляющего программного обеспечения по изобретению содержит четырнадцатые инструкции для выборочного удаления предопределенного участка из воспринятого звука до выполнения определения мощностных характеристик и до выполнения определения характеристик направленности.

Для полноты сошлемся на публикацию международной заявки WO 2011043678, озаглавленной "Система и способ обработки исключения тиннитуса". Как известно, тиннитус представляет собой чувство слышимости звука в голове человека при отсутствии слуховой стимуляции. Публикация международной заявки WO 2011043678 относится к системе маскирования тиннитуса, предназначенной для использования людьми, имеющими тиннитус. Система содержит систему подачи звука, имеющую устройства подачи аудиосигнала на левое и правое ухо с регулировкой уровня и сконфигурирована с возможностью подачи человеку через устройства подачи аудиосигнала маскирующего звука таким образом, что этот маскирующий звук, кажется, исходит из виртуального местонахождения источника звука, которое по существу соответствует пространственному нахождению в трехмерном звуковом пространстве источника тиннитуса, как он слышится человеком.

Известная система и способ основаны на маскировании тиннитуса и (или) уменьшения чувствительности пациента к тиннитусу. Было определено, что некоторые связанные с тиннитусом недомогания относятся к нарушению восприятия тиннитуса в соответствии с нормальным анализом аудиторного явления (Auditory Scene Analysis - ASA). В частности, было определено, что порождающая тиннитус нервная активность совершенно отлична от нормальной звуковой активности, что, будучи сформирована в цельное изображение, она вступает в конфликт с памятью реальных звуков. Другими словами, тиннитус не локализуется как внешний источник. Невозможность локализовать источник звука является "неестественной" и представляет собой нарушение основного процесса восприятия. Дополнительно было определено, что это представляет собой "отсутствие контекста" или отсутствие соответствующего поведенческого смысла, что и вынуждает мозг излишне часто или излишне настойчиво обращать внимание на сигнал тиннитуса. Например, фоновый звук дождя легко становится привычным. Этот звук ассоциируется с визуальным и тактильным восприятием или также - с перцептуальной памятью о дожде. Контекст это звука понятен, так что он может быть "обработан" и исключен как недостойный дальнейшего внимания. Однако в сигнале тиннитуса такого понимания нет, что не соответствует реальному аудиторному объекту. Известное лечение тиннитуса и система используют персонифицированное информационное маскирование и уменьшение чувствительности. Информационное маскирование действует на когнитивном уровне и ограничивает возможность мозга осознавать тиннитус. Маскирование тиннитуса усовершенствовано пространственным совмещением воспринятого местоположения тиннитуса и пространственным представлением (или местоположением виртуального источника звука) маскирующего звука.

В отличие от этого, настоящее изобретение относится к маскированию реального звука от одного или более реальных источников и не касается информационного маскирования на уровне распознавания, чтобы ограничить возможность мозга осознавать тиннитус.

КРАТКОЕ ОПИСАНИЕ ЧЕРТЕЖЕЙ

Данное изобретение поясняется с дополнительными подробностями посредством примера и со ссылками на сопроводительные чертежи, в которых:

фиг. 1 представляет собой блок-схему первого варианта исполнения системы по настоящему изобретению;

фиг. 2 представляет собой блок-схему второго варианта исполнения системы по настоящему изобретению; и

фиг. 3 представляет собой блок-схему третьего варианта исполнения системы по настоящему изобретению.

На всех иллюстрациях похожие или соответствующие признаки обозначены одними и теми же ссылочными позициями.

ПОДРОБНЫЕ ВАРИАНТЫ ИСПОЛНЕНИЯ

Изобретение относится к системе и способу для маскирования звука, падающего на человека. Система содержит микрофонную подсистему для восприятия звука. Система дополнительно содержит спектроанализатор для определения мощностных характеристик звука, воспринятого мультимикрофонной подсистемой, и пространственный анализатор для определения характеристик направленности воспринятого звука, представляющих направление падения на человека. Система дополнительно содержит подсистему генератора для генерации маскирующего звука под комбинированным управлением мощностных характеристик и характеристик направленности для маскирования падающего звука.

Фиг. 1 представляет собой первый вариант 100 исполнения системы по настоящему изобретению. Первый вариант 100 исполнения содержит левый микрофон 102, установленный у левого уха (не показано) пользователя или рядом с ним, правый микрофон 104, установленный у правого уха (не показано) пользователя или рядом с ним. Первый вариант 100 исполнения содержит левый динамик 106, установленный у левого уха пользователя или рядом с ним, и правый динамик 108, установленный у правого уха пользователя или рядом с ним. В первом варианте 100 исполнения предполагается, что каждый из левого микрофона 102 и правого микрофона 104 хорошо акустически изолирован и от левого динамика 106, и от правого динамика 108. Например, левый микрофон 102, правый микрофон 104, левый динамик 106 и правый динамик 108 образуют часть оснащенных микрофоном пары наушников, таких как Roland CS-10ЕМ, которые имеются в продаже. Левый динамик 106 вставляется в левое ухо, а правый динамик 108 вставляется в правое ухо, в то время как каждый - и левый микрофон 102, и правый микрофон 104 направлен наружу относительно головы пользователя. Поскольку левый микрофон 102 и правый микрофон 104 сконфигурированы - для всех практических случаев - таким образом, чтобы не воспринимать звуки, испущенные левым динамиком 106 и правым динамиком 108, то говорят, что левый микрофон 102 и правый микрофон 104 акустически хорошо изолированы от левого динамика 106 и от правого динамика 108.

Первый вариант 100 исполнения содержит подсистему 103 обработки сигнала между, с одной стороны, левым микрофоном 102 и правым микрофоном 104, а, с другой стороны, - левым динамиком 106 и правым динамиком 108. Теперь будет описана работа подсистемы 103 обработки сигнала.

Левый микрофон 102 воспринимает звуки, падающие на левый микрофон 102, и создает левый аудиосигнал для левого аудиоканала. Левый аудиосигнал в левом преобразователе 110, который генерирует левый спектр, преобразуется в частотную область. Аналогично, правый микрофон 104 воспринимает звуки, падающие на правый микрофон 104, и создает правый аудиосигнал для правого аудиоканала. Правый аудиосигнал правым преобразователем 112, который генерирует правый спектр, преобразуется в частотную область. Работа левого преобразователя 110 и правого преобразователя 112 основана, например, на быстром преобразовании Фурье.

Левый спектр подается на набор из одного или более левых полосовых фильтров 114, которые определяют один или более частотных диапазонов в левом спектре. Аналогично, правый спектр подается на набор из одного или более левых полосовых фильтров 116, которые определяют один или более частотных диапазонов в правом спектре. Деление, соответственно, каждого одного из левого спектра и правого спектра на соответствующие частотные диапазоны дает возможность по отдельности обрабатывать различные диапазоны в одном и том же спектре. Например, набор левых полосовых фильтров 114 определяет один или более частотных диапазонов в левом спектре, при этом каждый конкретный один из частотных диапазонов связан с одним конкретным из слуховых полосовых фильтров. Как упоминалось выше, асимметричная форма фильтра отдельного полосового фильтра в психоакустической модели слухового восприятия на практике аппроксимируется симметричной амплитудно-частотной характеристикой, известной как "скругленная экспоненциальная" форма (RoEx). Аналогично, набор левых полосовых фильтров 116 определяет один или более частотных диапазонов в правом спектре, при этом каждый конкретный один из частотных диапазонов связан с одним конкретным из слуховых полосовых фильтров.

Первый вариант 100 исполнения, кроме того, содержит маскирующий звуковой генератор 118, который сконфигурирован для генерации сигнала, представляющего маскирующий звук. Маскирующий звуковой сигнал дополнительным преобразователем 120 частоты преобразуется в частотную область с генерацией спектра маскирующего звука. Спектр маскирующего звука подается на набор из одного или более дополнительных полосовых фильтров 122. Этот набор дополнительных полосовых фильтров 122 определяет соответствующие частотные диапазоны в спектре маскирующего звука, которые соответствуют соответствующим одним из частотных диапазонов, определенных набором левых полосовых фильтров 114 и набором правых полосовых фильтров 116.

Отдельная часть левого спектра, связанная с отдельным частотным диапазоном, другая отдельная часть правого спектра, связанная с этим отдельным частотным диапазоном, и следующая отдельная часть спектра маскирующего звука, связанная с отдельным частотным диапазоном, подаются на отдельную одну из первой подсистемы 124, второй подсистемы 126, третьей подсистемы 128 и т.д. Далее обработка отдельной части левого спектра, другой отдельной части правого спектра и следующей отдельной части спектра маскирующего звука поясняется со ссылкой на обработку посредством первой подсистемы 124.

Первая подсистема 124 содержит спектроанализатор 130, пространственный анализатор 134 и подсистему 135 генератора. Подсистема 135 генератора содержит спектральный эквалайзер 132 и виртуализатор 136. Вторая подсистема 126, третья подсистема 128 и т.д. имеют конфигурацию, подобную конфигурации первой подсистемы 124. Подсистема 135 генератора сконфигурирована для генерации маскирующего звука с комбинированным управлением мощностных характеристик, как они определены спектроанализатором 130, и характеристик направленности, как они определены пространственным анализатором 134, для маскирования звука, в том виде, как он воспринят левым микрофоном 102 и правым микрофоном 104.

Спектроанализатор 130 сконфигурирована для оценки или определения мощности в соответствующем одном из частотных диапазонов, который обрабатывается первой подсистемой 124 для звука, комбинированно воспринятого левым микрофоном 102 и правым микрофоном.

Мощность в соответствующем частотном диапазоне, как она определена спектроанализатором, соответствующим образом усредненная по времени, используется для управления спектральным эквалайзером 132. Этот спектральный эквалайзер 132 сконфигурирован для настройки мощности в соответствующем частотном диапазоне маскирующего звука при управлении мощностью, оцененной спектроанализатором 130, как она представлена в соответствующем частотном диапазоне падающего звука, воспринятого левым микрофоном 102 и правым микрофоном. "Факультативно" спектральный эквалайзер 132 является настраиваемым, так чтобы устанавливать параметры управления заранее для регулировки мощности в соответствующем частотном диапазоне маскирующего звука в зависимости от спектральной мощности соответствующего частотного диапазона воспринятого звука. Например, настраиваемость спектрального эквалайзера позволяет ограничить отношение между мощностью в частотном диапазоне воспринятого звука и мощностью в частотном диапазоне маскирующего звука диапазоном отношения между минимальной величиной и максимальной величиной. Это ограничение отношения способствует генерации маскирующего звука, который будет воспринят пользователем как более естественный, чем искусственный.

Пространственный анализатор 134 сконфигурирован для определения характеристик направленности, например, направления падения на левый микрофон 102 и на правый микрофон 104 той конкретной составляющей звука, которая воспринимается левым микрофоном 102 и правым микрофоном 104, и которая связанна с соответствующим частотным диапазоном.

Пространственный анализатор 134, таким образом, осуществляет звуковую локализацию составляющей воспринятого звука в соответствующем частотном диапазоне. Выражение "звуковая локализация", как оно используется в соответствующей области техники, относится к способности человека определять положение обнаруженного звука по направлению и по расстоянию. Звуковая локализация может также относиться к способам акустической инженерии по имитации нахождения слухового сигнала в виртуальном трехмерном пространстве. В локализации звука человеком концепции "интерауральной временной разности" (ИВР) и "интерауральной разности по уровню" (ИРУ) относятся к физическим количествам, которые дают возможность человеку определить боковое направление (левый, правый), с которого кажется приходящим звук. ИВР представляет собой разность во времени прихода звука в левое ухо человека и в правое ухо человека. Если звуковой сигнал достигает головы человека с одной стороны, то этот звуковой сигнал, чтобы дойти до дальнего уха человека, должен пройти большее расстояние. Эта разница в пути приводит к временной разности в поступлении звука в уши, которая и определяется и способствует определению направления, с которого кажется приходящим звук. Что касается ИРУ, то звук, поступающий в ближнее ухо человека, имеет большую энергию, чем звук, поступающий в дальнее ухо человека, поскольку дальнее ухо расположено в акустической тени головы человека, которая вызывает значительное ослабление звукового сигнала. ИРУ является заметно частотно-зависимой, поскольку характеристический размер головы человека находится внутри диапазона длины волны слышимого звукового спектра. Пространственный анализатор 134 сконфигурирован, например, для определения величины, представляющей по меньшей мере одну из ИВР или ИРУ звука, воспринятого левым микрофоном 102 и правым микрофоном 104.

Виртуализатор 136 сконфигурирован для генерации под комбинированным управлением спектроанализатора 130 и пространственного анализатора 134 представления левого канала и представления правого канала маскирующего звука в частотной области, связанных с соответствующим частотным диапазоном. Представление левого канала подается в левый инверсный преобразователь 138, чтобы оно было преобразовано во временную область, например, посредством обратного быстрого преобразования Фурье. Затем представление левого канала во временной области подается в левый динамик 106. Аналогично, представление правого канала подается в правый инверсный преобразователь 140, чтобы оно было преобразовано во временную область, например, посредством обратного быстрого преобразования Фурье. Затем представление правого канала во временной области подается в правый динамик 108.

Соответствующая каждая одна из второй подсистемы 126, третьей подсистемы 128 и т.д. выполняет аналогичные операции для обработки соответствующей составляющей воспринятого звука из соответствующего другого частотного диапазона. После этого возможный маскирующий звук, в том виде, как он воспроизведен в левом динамике 106 и в правом динамике 108, содержит соответствующее представление левого канала во временной области и соответствующее представление правого канала во временной области, как они поданы соответствующей одной из первой подсистемы 124, второй подсистемы 126, третьей подсистемы 128 и т.д.

Для полноты при этом следует заметить, что может быть использовано более чем два микрофона и более чем два динамика так, чтобы можно было определять направленность падающего звука с большим разрешением, и так, чтобы с большим разрешением можно было воспроизводить маскирующий звук. Наконец, заметим, что звук, воспринятый микрофонами, в данном случае левым микрофоном 102 и правым микрофоном 104, может происходить от двух или более источников, или же может падать на микрофоны со множества направлений (например, через множественные отражения от акустически отражающих объектов в диапазоне микрофонов). Первый вариант 100 исполнения определяет спектр мощности и направление падения для одного отдельного из частотных диапазонов и генерирует возможный маскирующий звук, принимая во внимание множественные источники и (или) множественные направления падения звука.

Кроме того, в случае бинаурального маскирующего звука может быть добавлена некоторая реверберация, так чтобы усилить ощущение пользователя, что воспринятый звук исходит из одного или более источников, внешних по отношению к голове пользователя.

Для полноты следует также заметить, что первый вариант 100 исполнения проиллюстрирован как включающий в себя левый микрофон 102 и правый микрофон 104. Если в первом варианте 100 исполнения присутствуют один или более дополнительных микрофонов, то выходной сигнал каждого дополнительного микрофона подается на дополнительный преобразователь частоты (не показан), а от него - на дополнительный набор полосовых фильтров (не показаны). Каждый отдельный один из полосовых фильтров из дополнительного набора подает конкретный выходной сигнал, индикативный относительно конкретного частотного диапазона, на конкретный один из первой подсистемы 124, второй подсистемы 126, третьей подсистемы 128 и т.д. Рассмотрим конкретный выходной сигнал дополнительного набора полосовых фильтров, который подан на первую подсистему 124. В этом случае конкретный выходной сигнал подается на спектроанализатор 130 и пространственный анализатор 134 параллельно левому выходному сигналу набора левых полосовых фильтров 114, поданному в первую подсистему 124, и параллельно правому выходному сигналу набора правых полосовых фильтров 116, поданному в первую подсистему 124.

Рассмотрим теперь сценарий, в котором один или оба из левого микрофона 102 и правого микрофона104 не являются акустически хорошо изолированными от левого динамика 106 и (или) от правого динамика 108. Например, типичный наушник с активным шумоподавлением имеет как блок динамика, так и блок микрофона, расположенные внутри каждой из ушных чашек. То есть типичный наушник с активным шумоподавлением имеет левый микрофон 102 и левый динамик 106, расположенные внутри левой ушной чашки, и имеет правый микрофон 104 и правый динамик 108, расположенные внутри правой ушной чашки. В результате, маскирующий звук, воспроизводимый левым динамиком 106, будет восприниматься левым микрофоном 102, а маскирующий звук, воспроизводимый правым динамиком 108, будет восприниматься правым микрофоном 104. В этом случае необходимо удалить маскирующий звук, воспроизведенный левым динамиком 106, из звука, который воспринят левым микрофоном 102, и удалить маскирующий звук, воспроизведенный правым динамиком 108, из звука, воспринятого правым микрофоном 104, так чтобы подвергнуть модифицированный таким образом воспринятый звук обработке сигнала, выполняемой подсистемой 103 обработки сигнала.

Аналогичным же образом, рассмотрим другой сценарий, в котором левый микрофон 102 и правый микрофон 104 расположены на удалении от ушей пользователя. В результате каждый отдельный микрофон из левого микрофона 102 и правого микрофона 104 является акустически связанным и с левым динамиком 106, и с правым динамиком 108. В этом случае также необходимо удалить маскирующий звук, воспроизведенный левым динамиком 106, и маскирующий звук, воспроизведенный правым динамиком 108, из звука, воспринятого каждым отдельным микрофоном из левого микрофона 102 и правого микрофона 104, с тем чтобы подвергнуть модифицированный таким образом воспринятый звук обработке сигнала, выполняемой подсистемой 103 обработки сигнала, как описано выше со ссылкой на схему по фиг. 1.

Удаление маскирующего звука, в том виде, как он воспринят каждым отдельным микрофоном из левого микрофона 102 и правого микрофона 104, может быть выполнено посредством использования адаптивной фильтрации, как это пояснено со ссылкой на схему по фиг. 2.

Фиг. 2 представляет собой схему второго варианта 200 исполнения системы по настоящему изобретению. Второй вариант 200 исполнения содержит микрофонную подсистему 202, подсистему 204 динамика и подсистему 103 обработки сигнала, как описано выше. Микрофонная подсистема 202 может содержать один, два или больше микрофонов, из которых только конкретный один обозначен ссылочной поз.206. Подсистема 204 динамика может содержать один, два или больше динамиков.

Каждый отдельный один из микрофонов микрофонной подсистемы 202, например, конкретный микрофон 206 может воспринимать предназначенный для маскирования звук, а также маскирующий звук в том виде, как он воспроизведен подсистемой 204 динамика вышеописанным со ссылкой на вариант 100 исполнения образом. Предназначенный для маскирования звук на схеме по фиг. 2 обозначен ссылочной поз.208. Маскирующий звук на схеме по фиг. 2 обозначен ссылочной поз.210. К каждому отдельному одному из микрофонов микрофонной подсистемы 202 приложена адаптивная фильтрация, которая будет пояснена со ссылкой на конкретный микрофон 206.

Конкретный микрофон 206 воспринимает подлежащий маскированию звук 208, а также маскирующий звук 210 и выдает первый сигнал. Этот первый сигнал подается на подсистему 103 обработки сигнала через субтрактор 212. Кроме того, субтрактор 212 принимает выходной сигнал фильтра от адаптивного фильтра 214, и предназначен для вычитания выходного сигнала фильтра из сигнала от микрофона. Выходной сигнал субтрактора 212 подается в подсистему 103 обработки сигнала, описанную со ссылкой на вариант 100 исполнения. Выходной сигнал подсистемы 103 обработки сигнала, в том виде, как он подан в подсистему 204 динамика, подается на вход адаптивного фильтра 214. Адаптивный фильтр 214 сконфигурирован для настройки своих коэффициентов фильтрации под управлением выходного сигнала субтрактора 212. Способы адаптивной фильтрации хорошо известны в соответствующей области техники и не требуют здесь более подробного обсуждения.

Ношение головных телефонов (или наушников) может быть неудобным. Вместо этого, динамики и микрофоны системы по настоящему изобретению расположены на расстоянии от головы пользователя. В этом случае для того чтобы получить направления мешающих звуков, которые должны подвергнуться маскированию, по отношению к, предпочтительно, фиксированному положению головы пользователя, может быть использована конфигурация из двух или более микрофонов, использующая технику формирования луча. Например, в больничном окружении возможные положения головы пациента, лежащего на больничной койке, установленной в больничной палате на фиксированном месте, обычно ограничены небольшим пространством.

Для того, чтобы организовать (программно) картину качания узкого луча (микрофона) по оси, которая имеет определенную ориентацию относительно пациента, например, по горизонтальной оси, может быть использована одномерная линейка микрофонов. Затем, для того чтобы организовать (программно) картину качания узкого луча (микрофона) по двум осям, которые имеют различную определенную ориентацию относительно пациента, например, по горизонтальной оси и по вертикальной оси, может быть использована двухмерная линейка микрофонов.

Заметим, что когда используется только левый микрофон и правый микрофон, расположенные рядом с пациентом или около него, для определения интерауральной временной разности ИВР и интерауральной разности по уровню ИРУ может быть использовано привлечение пространственного анализатора 134. Если микрофоны расположены на удалении от головы пользователя, и если для определения направлений предназначенных для маскирования звуков используется формирование луча, может быть использовано другое использование пространственного анализатора 134, которое адаптировано к конкретной технике формирование луча.

Если динамики расположены на удалении от головы пользователя, может быть использовано привлечение виртуализатора 136 таким образом, чтобы при данных оценочных направлениях падения целевых звуков, маскирующие звуки могли бы быть организованы по тем же самым направлениям с использованием подсистемы динамика. Это может быть достигнуто фильтрацией бинауральных сигналов посредством матрицы фильтров, с тем чтобы синтезировать входные сигналы для линейки динамиков, при этом фильтры построены таким образом, чтобы пути прохождения к положению уха пользователя могли бы быть относительно прозрачными (например, подавлением перекрестных помех). Альтернативно, может быть использовано такое формирование луча, когда два узких луча сформированы посредством матрицы фильтров, причем соответствующий каждый один из которых направлен в соответствующее одно из положений левого уха пользователя и правого уха пользователя. Подавление перекрестных помех в соответствующей области техники известно. Цель подавителя перекрестных помех состоит в том, чтобы воспроизводить требуемый сигнал в единственном целевом положении при полном подавлении звука во всех остальных целевых положениях. Уже давно известен основной принцип подавления перекрестных помех, использующий только два динамика и два целевых положения. В 1966 году Атал (Atal) и Шредер (Schroeder) использовали обоснование определения возможности работы подавителя перекрестных помех, использующего только два динамика, размещенных симметрично перед одним слушателем. Для того чтобы воспроизвести короткий импульс только у левого уха, сначала левый динамик испускает положительный импульс. Этот импульс у правого уха может быть подавлен слегка более слабым отрицательным импульсом, испущенным правым динамиком. Затем этот отрицательный импульс должен быть подавлен у левого уха другим, еще более слабым положительным импульсом и т.д. Модель Атала и Шредера предполагает условия "свободного поля"; влияния тела слушателя, головы и внешних элементов ушей на входящие звуковые волны игнорируется (скопировано с вебстраницы "Ctoss-Talk Cancellation" Группы жидкостной динамики и акустики, секции "Виртуальная акустика и аудиоинженерия" Института исследования звука и вибрации Университета Саутгемптона; URL=htpp://resource.isvr.soton.ас.uk/FDAG/VAP/html/xtalk.Html).

Местоположение(я), где, как предполагается, маскирующий звук эффективно маскирует подлежащий маскированию звук, может быть фиксировано независимо от направления (направлений), откуда в голову пользователя приходит подлежащий маскированию звук или звуки. В больничных палатах подлежащие маскированию звуки, например электронные системы контроля, расположены, главным образом, сбоку или сзади кровати пациента. В этом случае могут быть сгенерированы маскирующие звуки, которые имеют фиксированную направленность и только в боковые направления и назад, уменьшая изменчивость звукового окружения, и, кроме того, уменьшая требуемые вычислительные мощности, необходимые для адаптивной фильтрации (поскольку некоторые из адаптивных фильтров могут использовать фиксированные коэффициенты фильтрации).

Фиг. 3 представляет собой третий вариант 300 исполнения системы по настоящему изобретению. Третий вариант 300 исполнения содержит классификатор 302. Классификатор 302 определяет, какой участок звука, в том виде, как он воспринят микрофонной подсистемой 202, должен быть исключен из маскирования. То есть звуковой классификатор 3 02 сконфигурирован с возможностью распознавания звуков, воспринятых микрофонной подсистемой 202, и которые должны быть маскированы, и других звуков, которые восприняты микрофонной подсистемой 202, и которые не должны быть маскированы (например, человеческий голос или сигнал тревоги), с тем чтобы выборочно подвергать воспринятые звуки процессу маскирования. Например, пациент в больнице может хотеть, чтобы были маскированы звуки, создаваемые стоящим рядом оборудованием контроля, но может не хотеть, чтобы были маскированы голоса доктора или медицинской сестры. В том случае звуковой классификатор 302 блокирует вклад этого участка воспринятого звука в генерацию маскирующего звука. Звуковой классификатор 302 может быть реализован селективной настройкой или предварительным программированием полосовых фильтров, то есть левого набора полосовых фильтров 114 и правого набора полосовых фильтров 116, чьи выходные сигналы подаются на спектроанализатор и пространственный анализатор в каждой из первой подсистемы 124, второй подсистемы 126, третей подсистемы 128 и т.д., с тем чтобы исключить некоторые частотные диапазоны в воспринятом звуке от вхождения в состав возможного маскирующего звука. В качестве альтернативы звуковой классификатор 302 может быть реализован селективной деактивацией подсистемы 103 обработки сигнала в присутствии в воспринятом звуке составляющих предопределенного типа, причем эти составляющие являются указателями звука, который маскированию не подлежит. Деактивация может быть выполнена под управлением дополнительного спектроанализатора (не показан), который деактивирует подсистему 103 обработки сигнала при обнаружении в частотном спектре воспринятого звука конкретной картины, или который деактивирует подачу микрофонного сигнала на субтрактор 212 или на подсистему 103 обработки сигнала при обнаружении в частотном спектре воспринятого звука конкретной картины.

Первый вариант 100 исполнения показан содержащим маскирующий звуковой генератор 118. Третий вариант 300 исполнения содержит один или большее количество дополнительных маскирующих звуковых генераторов, то есть первый дополнительный звуковой генератор 306, второй дополнительный звуковой генератор 308 и т.д. Соответственно, вместо использования маскирующего звука одного типа для обработки в подсистеме 103 обработки сигнала используется множество различных маскирующих звуков, причем конкретный один из этих маскирующих звуков подстраивается под один конкретный из источников, которые вместе издают подлежащий маскированию звук.

1. Система (100, 200), сконфигурированная для маскирования падающего на человека звука, при этом система содержит:

микрофонную подсистему (102, 104, 202) для восприятия звука одновременно из множества мест;

подсистему (106, 108, 204) динамиков для генерации маскирующего звука под управлением воспринятого звука; и

подсистему обработки сигнала, присоединенную между микрофонной подсистемой и подсистемой динамиков и сконфигурированную для

определения мощностных характеристик частотного спектра воспринятого звука, которые являются представлениями мощности в частотном диапазоне воспринятого звука;

определения характеристик направленности воспринятого звука в частотном диапазоне, которые являются представлениями направления, с которого звук падает на человека; и

управления подсистемой динамиков для генерации маскирующего звука под комбинированным управлением мощностных характеристик и характеристик направленности,

в которой подсистема обработки сигнала содержит пространственный анализатор (134) для определения характеристик направленности и в которой пространственный анализатор предназначен для определения характеристик направленности на основе определения количественного представления по меньшей мере одной из интерауральной временной разности и интерауральной разности по уровню.

2. Система по п. 1, при этом

микрофонная подсистема выдает первый сигнал, представляющий воспринятый звук;

подсистема обработки сигнала выдает второй сигнал для управления подсистемой динамиков;

система содержит подсистему (212, 214) адаптивной фильтрации, предназначенную для уменьшения вклада маскирующего звука, присутствующего в воспринятом звуке, во второй сигнал;

система адаптивной фильтрации содержит адаптивный фильтр (214) и субтрактор (212);

адаптивный фильтр имеет вход фильтра для приема второго сигнала и выход фильтра для выдачи отфильтрованного варианта второго сигнала;

субтрактор имеет первый вход субтрактора для приема первого сигнала и второй вход субтрактора для приема отфильтрованного варианта второго сигнала, а также выход субтрактора для подачи третьего сигнала в подсистему обработки сигнала, который представляет разницу между первым сигналом и отфильтрованным вариантом второго сигнала; и

адаптивный фильтр имеет вход управления для приема третьего сигнала для управления одним или более коэффициентами фильтра адаптивного фильтра.

3. Система по п. 1, содержащая звуковой классификатор (302), который предназначен для выборочного удаления предопределенного участка из воспринятого звука до выполнения определения мощностных характеристик и до выполнения определения характеристик направленности.

4. Подсистема (103) обработки сигнала для использования в системе по п. 1, 2, или 3.

5. Способ маскирования падающего на человека звука, при этом способ включает в себя

одновременное восприятие звука из множества мест;

определение мощностных характеристик частотного спектра воспринятого звука, которые являются представлениями мощности в частотном диапазоне воспринятого звука;

определение характеристик направленности воспринятого звука в частотном диапазоне, которые являются представлениями направления, по которому звук падает на человека; и

генерацию маскирующего звука под комбинированным управлением мощностных характеристик и характеристик направленности,

и включает в себя определение количественного представления по меньшей мере одной из интерауральной временнóй разности и интерауральной разности по уровню.

6. Способ по п. 5, при этом способ включает в себя

прием первого сигнала, представляющего воспринятый звук;

подачу второго сигнала для генерации маскирующего звука; и

адаптивную фильтрацию, предназначенную для уменьшения вклада маскирующего звука, присутствующего в воспринятом звуке, во второй сигнал,

при этом адаптивная фильтрация включает в себя

прием второго сигнала;

использование адаптивного фильтра для подачи отфильтрованного варианта второго сигнала;

- подачу третьего сигнала, который представляет разницу между первым сигналом и отфильтрованным вариантом второго сигнала;

прием третьего сигнала для управления одним или более коэффициентами фильтра адаптивного фильтра; и

использование третьего сигнала для определения мощностных характеристик и для определения характеристик направленности.

7. Способ по п. 5, включающий в себя выборочное удаление предопределенного участка из воспринятого звука до выполнения определения мощностных характеристик и до выполнения определения характеристик направленности.

8. Носитель информации, содержащий управляющее программное обеспечение для исполнения на компьютере с целью конфигурирования компьютера для выполнения способа маскирования падающего на человека звука, при этом управляющее программное обеспечение содержит

первые инструкции для приема первого сигнала, представляющего звук, воспринятый из множества мест одновременно;

вторые инструкции для определения мощностных характеристик частотного спектра воспринятого звука, которые являются представлениями мощности в частотном диапазоне воспринятого звука;

третьи инструкции для определения характеристик направленности воспринятого звука в частотном диапазоне, которые являются представлениями направления, по которому звук падает на человека; и

четвертые инструкции для генерации второго сигнала для генерации маскирующего звука под комбинированным управлением мощностных характеристик и характеристик направленности,

при этом третьи инструкции содержат по меньшей мере одно из инструкций для количественного представления по меньшей мере одной из интерауральной временнóй разности и интерауральной разности по уровню.

9. Носитель информации, содержащий управляющее программное обеспечение по п. 8, в котором

управляющее программное обеспечение содержит пятые инструкции для адаптивной фильтрации для уменьшения вклада маскирующего звука, присутствующего в воспринятом звуке, во второй сигнал,

при этом пятые инструкции содержат:

шестые инструкции для приема второго сигнала;

седьмые инструкции для использования адаптивного фильтра для подачи отфильтрованного варианта второго сигнала;

восьмые инструкции для подачи третьего сигнала, который представляет разницу между первым сигналом и отфильтрованным вариантом второго сигнала;

девятые инструкции для приема третьего сигнала для управления одним или более коэффициентами фильтра адаптивного фильтра; и

вторые инструкции содержат десятые инструкции для использования третьего сигнала для определения мощностных характеристик и

третьи инструкции содержат одиннадцатые инструкции для использования третьего сигнала для определения характеристик направленности.

10. Носитель информации, содержащий управляющее программное обеспечение по п. 8, содержащее четырнадцатые инструкции для выборочного удаления предопределенного участка из воспринятого звука до выполнения определения мощностных характеристик и до выполнения определения характеристик направленности.



 

Похожие патенты:

Изобретение относится к медицинской технике, а именно к устройствам, предназначенным для предотвращения храпа человека с учетом вредного воздействия храпа и повышения комфортности сна.

Группа изобретений относится к области акустики, в частности к средствам уменьшения уровня храпа. Способ предполагает определение звуковой модели храпа, прогнозирование уровня возможного храпа в зависимости от разработанной модели храпа, формирование звука поддельного храпа для заполнения промежутков в звуковой модели храпа.

Изобретение относится к электроакустике и может быть использовано для активного подавления акустического шума на рабочем месте оператора. .

Изобретение относится к акустике, в частности к системам для маскирования звука. Система содержит микрофоны, спектроанализатор для определения мощностных характеристик звука и пространственный анализатор для определения характеристик направленности воспринятого звука, представляющих направление падения на человека, генератор для генерации маскирующего звука под комбинированным управлением мощностных характеристик и пространственных характеристик для маскирования звука. Система сконфигурирована для маскирования излучаемого в направлении человека звука, в которой подсистема обработки сигнала содержит пространственный анализатор для определения характеристик направленности, причем пространственный анализатор предназначен для определения характеристик направленности на основе определения количественного представления по меньшей мере одной из интерауральной временной разности и интерауральной разности по уровню. Технический результат – повышение эффективности маскирования звука. 4 н. и 6 з.п. ф-лы, 3 ил.

Наверх