Улучшенное пространственное разрешение звукового поля для систем многоканального воспроизведения аудио посредством получения сигналов с угловыми членами высокого порядка

Изобретение относится к технике связи и может быть использовано в многоканальных системах воспроизведения звука, воссоздающих точное восприятие таких акустических явлений, как музыкальное исполнение или спортивное соревнование. Принятое множество входных аудиосигналов, представляющих звуковое поле как функцию угловых направлений с угловыми членами нулевого и первого порядков, анализируют для получения статистических характеристик одного или более угловых направлений акустической энергии в звуковом поле. Множество обработанных сигналов получают из взвешенных комбинаций входных аудиосигналов, в которых входные аудиосигналы взвешиваются согласно статистическим характеристикам. Входные аудиосигналы и обработанные сигналы представляют звуковое поле как функцию углового направления с угловыми членами одного или более порядков, больших, чем один. Технический результат - повышение пространственного разрешения аудиосигналов, что позволяет точно воссоздать слуховое восприятие акустического явления. 3 н. и 33 з.п. ф-лы, 21 ил.

 

ОБЛАСТЬ ТЕХНИКИ, К КОТОРОЙ ОТНОСИТСЯ ИЗОБРЕТЕНИЕ

Настоящее изобретение в целом относится к аудио, более конкретно, относится к устройствам и технологиям, которые могут использоваться для улучшения воспринимаемого пространственного разрешения воспроизведения аудиосигнала с низким пространственным разрешением посредством системы многоканального воспроизведения аудио.

УРОВЕНЬ ТЕХНИКИ

Системы многоканального воспроизведения аудио предлагают потенциальную возможность точно воссоздавать слуховое восприятие акустического явления, такого как музыкальное исполнение или спортивное соревнование, посредством использования возможностей многочисленных динамиков, окружающих слушателя. В идеале система воспроизведения формирует многомерное звуковое поле, которое воссоздает восприятие кажущегося направления звуков, а также рассеянную реверберацию, которая ожидается сопровождающей такое акустическое явление.

На спортивном соревновании, например, зритель обычно ожидает, что направленные звуки от игроков на спортивной площадке сопровождались бы объемлющими звуками от других зрителей. Точное воссоздание слуховых восприятий в таком случае не может достигаться без этого объемлющего звука. Подобным образом, слуховые восприятия происходящего в помещении концерта не могут точно воссоздаваться без воссоздания реверберационных эффектов концертного зала.

Реализм восприятий, воссоздаваемых системой воспроизведения, находится под влиянием пространственного разрешения воспроизводимого сигнала. Точность воссоздания обычно возрастает по мере того, как повышается пространственное разрешение. Бытовые и промышленные системы воспроизведения аудио часто используют большие количества динамиков, но, к сожалению, аудиосигналы, которые они воспроизводят, могут иметь относительно низкое пространственное разрешение. Многие вещательные и записанные аудиосигналы имеют более низкое пространственное разрешение, чем может требоваться. Как результат, реализм, который может достигаться системой воспроизведения, может ограничиваться пространственным разрешением аудиосигнала, который должен воспроизводиться. Требуется способ для повышения пространственного разрешения аудиосигналов.

РАСКРЫТИЕ ИЗОБРЕТЕНИЯ

Цель настоящего изобретения состоит в том, чтобы предоставить повышение пространственного разрешения аудиосигналов, представляющих многомерное звуковое поле.

Эта цель достигается изобретением, описанным в этом раскрытии. Согласно одному из аспектов настоящего изобретения статистические характеристики одного или более угловых направлений акустической энергии в звуковом поле выводятся посредством анализа трех или более входных аудиосигналов, которые представляют звуковое поле как функцию углового направления с угловыми членами нулевого порядка и первого порядка. Два или более обработанных сигнала выводятся из взвешенных комбинаций трех или более входных аудиосигналов. Три или более аудиосигналов взвешиваются в комбинации согласно статистическим характеристикам. Два или более обработанных сигнала представляют звуковое поле как функцию углового направления с угловыми членами одного или более порядков, больших, чем один. Три или более входных аудиосигналов и два или более обработанных сигналов представляют звуковое поле как функцию углового направления с угловыми членами порядка ноль, один или большего, чем один.

Различные признаки настоящего изобретения и его предпочтительные варианты осуществления могут быть лучше поняты посредством ссылки на последующее обсуждение и прилагаемые чертежи, на которых одинаковыми ссылочным позициями обозначены сходные элементы на разных чертежах. Содержание последующего обсуждения и чертежей изложено только в качестве примеров и не должно истолковываться представляющим ограничения на объем настоящего изобретения.

КРАТКОЕ ОПИСАНИЕ ЧЕРТЕЖЕЙ

Фиг.1 - схематичное представление акустического явления, фиксируемого микрофонной системой и впоследствии воспроизводимого системой воспроизведения.

Фиг.2 иллюстрирует слушателя и кажущийся азимут звука.

Фиг.3 иллюстрирует часть примерной системы воспроизведения, которая распределяет сигналы по динамикам для воссоздания восприятия направления.

Фиг.4 - графическая иллюстрация функций усиления для каналов двух соседних динамиков в гипотетической системе воспроизведения.

Фиг.5 - графическая иллюстрация функций усиления, которая показывает ухудшение пространственного разрешения, являющееся следствием микширования сигналов первого порядка.

Фиг.6 - графическая иллюстрация функций усиления, которые включают в себя сигналы третьего порядка.

Фиг.7A-7D - схематические структурные схемы гипотетических примерных систем воспроизведения.

Фиг.8 и 9 - схематические структурные схемы подхода для получения членов более высокого порядка из трехканальных (W, X, Y) сигналов формата B.

Фиг.10-12 - схематические структурные схемы цепей, которые могут использоваться для получения статистических характеристик трехканальных сигналов формата B.

Фиг.13 иллюстрирует схематические структурные схемы цепей, которые могут использоваться для формирования сигналов второго и третьего порядка из статистических характеристик трехканальных сигналов формата B.

Фиг.14 - схематическая структурная схема микрофонной системы, которая включает в себя различные аспекты настоящего изобретения.

Фиг.15A и 15B - схематические представления альтернативных компоновок датчиков в микрофонной системе.

Фиг.16 - графическая иллюстрация гипотетических функций усиления для каналов динамиков в системе воспроизведения.

Фиг.17 - схематическая структурная схема устройства, которое может использоваться для реализации различных аспектов настоящего изобретения.

ВАРИАНТЫ ОСУЩЕСТВЛЕНИЯ ИЗОБРЕТЕНИЯ

A. Введение

Фиг.1 дает схематическую иллюстрацию акустического явления 10 и декодера 17, включающего в себя аспекты настоящего изобретения, который принимает аудиосигналы 18, представляющие звуки акустического явления, зафиксированные микрофонной системой 15. Декодер 17 обрабатывает принятые сигналы для формирования обработанных сигналов с улучшенным пространственным разрешением. Обработанные сигналы воспроизводятся системой, которая включает в себя матрицу динамиков 19, скомпонованных вблизи от одного или более слушателей 12, для обеспечения точного воссоздания слуховых восприятий, которые могли бы испытываться при акустическом явлении. Микрофонная система 15 фиксирует как волны 13 прямого звука, так и волны 14 отраженного звука, которые приходят после отражения от одной или более поверхностей в некоторой акустической среде 16, такой как комната или концертный зал.

В одной из реализаций микрофонная система 15 предоставляет аудиосигналы, которые соответствуют амбиофоническому формату четырехканального сигнала (W, X, Y, Z), известному как формат B. Микрофонная система SPS422B и микрофонная система MKV, доступные для приобретения у компании с ограниченной ответственностью SoundField Ltd., Уэйкфилд, Англия, являются двумя примерами, которые могут использоваться. Подробности реализации, использующей микрофонные системы SoundField, обсуждены ниже. Другие микрофонные системы и форматы сигналов могут использоваться, если требуется, не выходя из объема настоящего изобретения.

Четырехканальные (W, X, Y, Z) сигналы формата B могут быть получены из матрицы четырех полностью совместимых акустических сенсоров. Концептуально, один сенсор является однонаправленным, а три сенсора имеют взаимно ортогональные, имеющие форму диполя профили направленной чувствительности. Многие микрофонные системы формата B сконструированы из тетраэдальной матрицы из четырех направленных акустических сенсоров и сигнального процессора, который формирует четырехканальные сигналы формата B в ответ на выходной сигнал четырех сенсоров. Сигнал канала W представляет однонаправленную звуковую волну, а сигналы каналов X, Y и Z представляют звуковые волны, ориентированные вдоль трех взаимно ортогональных осей, которые типично выражаются в качестве функций углового направления с угловыми членами θ первого порядка. Ось X ориентирована горизонтально сзади вперед относительно слушателя, ось Y ориентирована горизонтально справа налево относительно слушателя, а ось Z ориентирована вертикально вверх относительно слушателя. Оси X и Y проиллюстрированы на фиг.2. Фиг.2 также иллюстрирует кажущийся азимут θ звука, который может быть выражен в качестве вектора (x, y). Посредством ограничения, чтобы вектор имел единичную длину, может быть видно, что:

Четырехканальные сигналы формата B могут передавать трехмерную информацию о звуковом поле. Применения, которые требуют только двухмерной информации о звуковом поле, могут использовать трехканальный (W, X, Y) сигнал формата B, который не включает в себя канал Z. Различные аспекты настоящего изобретения могут применяться к двумерным и трехмерным системам воспроизведения, но остальное раскрытие делает более конкретную ссылку на двумерные применения.

B. Панорамирование сигнала

Фиг.3 иллюстрирует часть примерной системы воспроизведения с восьмью динамиками, окружающими слушателя 12. Фигура иллюстрирует состояние, в котором система формирует звуковое поле в ответ на два входных сигнала P и Q, представляющих два звука с кажущимися направлениями P' и Q', соответственно. Компонент 33 панорамировщика обрабатывает входные сигналы P и Q для распределения или панорамирования обработанных сигналов среди каналов динамиков для воссоздания восприятия направления. Компонент 33 панорамировщика может использовать некоторое количество процессов. Один из процессов, который может использоваться, известен как амплитудное панорамирование ближайшего динамика (NSAP).

Процесс NSAP распределяет сигналы по каналам динамиков, адаптируя усиление каждого канала динамика в ответ на кажущееся направление звука и местоположения динамиков относительно слушателя или зоны прослушивания. В двумерной системе, например, усиление для сигнала P получается из функции азимута θ P кажущегося направления для звука, который представляет этот сигнал, и азимутов θ F и θ E двух динамиков SF и SE, соответственно, которые находятся по каждую сторону кажущегося направления θ P . В одной из реализаций усиления для всех каналов динамиков, иных, чем каналы для этих двух ближайших динамиков, установлены в ноль, а усиления каналов двух ближайших динамиков рассчитываются согласно следующим уравнениям:

Подобные расчеты используются для получения усиления для других сигналов. Сигнал Q представляет особый случай, где кажущееся направление θ Q звука, который он представляет, выровнено с одним динамиком SC. Каждый из динамиков SB или SD может выбираться в качестве второго ближайшего динамика. Как может быть видно из уравнений 1a и 1b, усиление для канала динамика SC равно единице, а усиления для всех других каналов динамиков равны нулю.

Усиления для каналов динамиков могут быть представлены графически как функция азимута. График, показанный на фиг.4, иллюстрирует функции усиления для каналов динамиков S E и S F в системе, показанной на фиг.3, где динамики S E и S F отделены друг от друга и от своих непосредственных соседей углом, равным 45 градусам. Азимут выражается исходя из системы координат, показанной на фиг.2. Когда звук, такой как представленный сигналом P, имеет кажущееся направление между 135 градусами и 180 градусами, усиления для динамиков SE и SF будут находиться между нулем и единицей, а усиления для других динамиков в системе будут установлены в ноль.

C. Профили усиления микрофонов

Системы могут применять процесс NSAP к сигналам, представляющим звуки с дискретными направлениями, чтобы формировать звуковые поля, которые способны к точному воссозданию слуховых восприятий исходного акустического явления. К сожалению, микрофонные системы не предоставляют сигналы, представляющие звуки с дискретными направлениями.

Когда акустическое явление 10 фиксируется микрофонной системой 15, звуковые волны 13, 14 типично приходят на микрофонную систему с большого количества разных направлений. Микрофонные системы от компании с ограниченной ответственностью SoundField Ltd., упомянутые выше, формируют сигналы, которые соответствуют формату B. Четырехканальные (W, X, Y, Z) сигналы формата B могут формироваться для передачи трехмерных характеристик звукового поля, выраженного в качестве функций углового направления. Посредством игнорирования сигнала канала Z трехканальные (W, X, Y) сигналы формата B могут быть получены для представления двумерных характеристик звукового поля, которые также выражаются как функции углового направления. Необходим способ для обработки этих сигналов так, чтобы слуховые восприятия могли воссоздаваться с пространственной точностью, подобной той, которая может достигаться процессом NSAP, когда применяется к сигналам, представляющим звуки с дискретными направлениями. Возможность достижения этой степени пространственной точности затрудняется пространственным разрешением сигналов, которые предоставляются микрофонной системой 15.

Пространственное разрешение сигнала, полученного из микрофонной системы, зависит от того, насколько близко реальный направленный профиль чувствительности для микрофонной системы соответствует некоторому идеальному профилю, который, в свою очередь, зависит от реального направленного профиля чувствительности для отдельных акустических сенсоров в пределах микрофонной системы. Направленный профиль чувствительности для реальных сенсоров может значительно отклоняться от некоторого идеального профиля, но сигнальная обработка может компенсировать эти отклонения от идеальных профилей. Сигнальная обработка также может преобразовывать выходные сигналы сенсоров в требуемый формат, такой как формат B. Действующий направленный профиль, включающий в себя формат сигнала системы сенсора/процессора, является объединенным результатом направленной чувствительности сенсора и сигнальной обработки. Микрофонные системы от компании с ограниченной ответственностью SoundField Ltd., упомянутые выше, являются примерами этого подхода. Эта деталь реализации не критична для настоящего изобретения, так как не важно, каким образом достигается действующий направленный профиль. В остальной части обсуждения термины, подобные «направленному профилю» и «направленности», ссылаются на действующую направленную чувствительность сенсора или комбинацию сенсора/процессора, используемую для фиксации звукового поля.

Двумерный направленный профиль чувствительности для сенсора может описываться как профиль усиления, который является функцией углового направления θ, который может иметь форму, которая может выражаться любым из следующих уравнений:

где a=0 для однонаправленного профиля усиления;

a=0,5 для имеющего форму кардиоиды профиля усиления и

a=1 для профиля усиления в форме 8.

Эти профили выражены как функции углового направления с угловыми членами θ первого порядка и упоминаются здесь как профили усиления первого порядка.

В типичных реализациях микрофонная система 15 использует три или четыре сенсора с профилями усиления первого порядка для предоставления трехканальных (W, X, Y) сигналов формата B или четырехканальных (W, X, Y, Z) сигналов формата B, которые передают двух- или трехмерную информацию о звуковом поле. Со ссылкой на уравнения 4a и 4b профиль усиления для каждого из трех каналов (W, X, Y) сигнала формата B может быть выражен как:

где канал W имеет однонаправленный профиль усиления нулевого порядка, как указано посредством a=0, а каналы X и Y имеют профиль усиления первого порядка в форме 8, как указано посредством a=1.

D. Разрешение системы воспроизведения

Количество и размещение динамиков в матрице воспроизведения может оказывать влияние на воспринимаемое пространственное разрешение воссозданного звукового поля. Здесь обсуждена и проиллюстрирована система с восьмью равноразнесенными динамиками, но эта компоновка является только примером. По меньшей мере три динамика необходимы для воссоздания звукового поля, которое окружает слушателя, но обычно предпочтительны пять или более динамиков. В предпочтительных реализациях системы воспроизведения декодер 17 формирует выходной сигнал для каждого динамика, который как можно больше декоррелирован от других выходных сигналов. Высокие уровни декорреляции имеют тенденцию стабилизировать воспринимаемое направление звука в пределах большей зоны прослушивания, избегая широко известных проблем определения местоположения для слушателей, которые расположены вне так называемой зоны наилучшего восприятия.

В одной из реализаций системы воспроизведения согласно настоящему изобретению декодер 17 обрабатывает трехканальные (W, X, Y) сигналы формата B, которые представляют звуковое поле в качестве функции направления с угловыми членами только нулевого порядка и первого порядка для получения обработанных сигналов, которые представляют звуковое поле в качестве функции направления с угловыми членами более высокого порядка, которые распределяются по одному или более динамикам. В традиционных системах декодер 17 смешивает сигналы из каждого из трех каналов формата B в соответственный обработанный сигнал для каждого из динамиков с использованием коэффициентов усиления, которые выбираются на основании местоположений динамиков. К сожалению, этот тип процесса микширования не предоставляет такого высокого пространственного разрешения, как функции усиления, используемые в процессе NSAP для типичных систем, как описано выше. График, проиллюстрированный на фиг.5, например, показывает ухудшение пространственного разрешения для функций усиления, что является следствием линейного микширования сигналов формата B первого порядка.

Причина этого ухудшения в пространственном разрешении может быть объяснена наблюдением, что точный азимут θ P звука P с амплитудой R не измеряется микрофонной системой 15. Взамен микрофонная система 15 регистрирует три сигнала W=R, X=R∙cosθ P, и Y=R∙sinθ P, которые представляют звуковое поле как функцию направления с угловыми членами нулевого порядка и первого порядка. Обработанный сигнал, сформированный для динамика SE, например, состоит из линейной комбинации сигналов каналов W, X и Y.

Кривая усиления для этого процесса микширования может рассматриваться в качестве аппроксимации Фурье низкого порядка для требуемой функции усиления NSAP. Функция усиления NSAP для канала динамика SE, показанного на фиг.4, например, может быть представлена рядом Фурье

Gain SE(θ)=a 0 +a 1cosθ+b 1sinθ+a 2cos2θ+b 2sin2θ+a3cos3θ+b 3sin3θ+... (6),

но процесс микширования типичного декодера не включает в себя члены выше первого порядка и может быть выражен как

Gain SE(θ)=a 0 +a 1cosθ+b 1sinθ(7)

Пространственное разрешение функции обработки для декодера 17 может повышаться посредством включения в состав сигналов, которые представляют звуковое поле как функцию направления с членами более высокого порядка. Например, функция усиления для канала динамика SE, которая включает в себя члены вплоть до третьего порядка, может быть выражена как:

Gain SE(θ)=a 0 +a 1cosθ+b 1sinθ+a 2cos2θ+b 2sin2θ+a3cos3θ+b 3sin3θ(8)

Функция усиления, которая включает в себя члены третьего порядка, может давать лучшее приближение к требуемой кривой усиления NSAP, как проиллюстрировано на фиг.6.

Угловые члены второго порядка и третьего порядка могли бы быть получены посредством использования микрофонной системы, которая фиксирует составляющие звукового поля второго порядка и третьего порядка, но это потребовало бы акустических сенсоров с направленными профилями чувствительности второго порядка и третьего порядка. Сенсоры с направленными чувствительностями более высокого порядка очень трудны для производства. В дополнение, этот подход не дал бы никакого решения для воспроизведения сигналов, которые записывались с использованием направленных профилей чувствительности первого порядка.

Блок-схемы, показанные на фиг.7A-7D, иллюстрируют разные гипотетические системы воспроизведения, которые могут использоваться для формирования многомерного звукового поля в ответ на разные типы входных сигналов. Система воспроизведения, проиллюстрированная на фиг.7A, возбуждает восемь динамиков в ответ на восемь дискретных входных сигналов. Системы воспроизведения, проиллюстрированные на фиг.7B и 7C, возбуждают восемь динамиков в ответ на входные сигналы формата B первого и третьего порядка, соответственно, с использованием декодера 17, который выполняет процесс декодирования, который является надлежащим для формата входных сигналов. Система воспроизведения, проиллюстрированная на фиг.7D, включает в себя различные признаки настоящего изобретения, в котором декодер 17 обрабатывает трехканальные (W, X, Y) сигналы нулевого порядка и первого порядка формата B для получения обработанных сигналов, которые аппроксимируют сигналы, которые могли быть получены из микрофонной системы с использованием сенсоров с профилями усиления второго порядка и третьего порядка. Последующее обсуждение описывает разные способы, которые могут использоваться для получения этих обработанных сигналов.

E. Получение членов более высокого порядка

Два основных подхода для получения угловых членов более высокого порядка описаны ниже. Первый подход получает угловые члены для широкополосных сигналов. Второй подход является вариантом первого подхода, который получает угловые члены для частотных поддиапазонов. Технологии могут использоваться для формирования сигналов с составляющими более высокого порядка. В дополнение, эти технологии могут применяться к четырехканальным сигналам формата B для трехмерных применений.

1. Широкополосный подход

Фиг.8 - схематическая структурная схема широкополосного подхода для получения членов более высокого порядка из трехканальных (W, X, Y) сигналов формата B. Четыре статистических характеристики, обозначенные как:

C1 = оценка cosθ(t);

S 1 = оценка sinθ(t);

C 2 = оценка cos2θ(t) и

S 2 = оценка sin(t),

выводятся из анализа сигналов формата B, и эти характеристики используются для формирования оценок членов второго порядка и третьего порядка, которые обозначены как:

X2 = Signal·cos2θ(t),

Y2 = Signal·sin2θ(t),

X3 = Signal·cos3θ(t),

Y3 = Signal·sin3θ(t).

Одна из технологий для получения четырех спектральных характеристик предполагает, что в любой конкретный момент t большая часть акустической энергии, падающей на микрофонную систему 15, приходит с одного углового направления, что делает азимут функцией времени, которая может обозначаться в качестве θ(t). Как результат, предполагается, что сигналы каналов W, X и Y по существу должны быть в виде:

W = Signal,

X = Signal·cosθ(t),

Y = Signal·sinθ(t).

Оценки четырех статистических характеристик угловых направлений акустической энергии могут быть выведены из уравнений 9a-9d, показанных ниже, в которых обозначение Av(x) представляет среднее значение сигнала x. Среднее значение может рассчитываться за период времени, который относительно короток по сравнению с интервалом, за который характеристики сигнала значительно изменяются.

.

Другие технологии могут использоваться для получения оценок четырех статистических характеристик S1, C1, S2, C2, как изложено ниже.

Четыре сигнала X2, Y2, X3, Y3, упомянутые выше, могут быть сформированы из взвешенных комбинаций сигналов канала W, X и Y с использованием четырех статистических характеристик в качестве весов любым из нескольких способов, используя следующие тригонометрические тождества:

cos2θ≡cos2 θ-sin2 θ,

sin2θ≡2cosθ·sinθ,

cos3θ≡cosθ·cos2θ-sinθ·sin2θ,

sin3θ≡cosθ·sin2θ-sinθ·cos2θ.

Сигнал X 2 может быть получен из любой из последующих взвешенных комбинаций:

Значение, вычисленное в уравнении 10c, является средним первых двух выражений. Сигнал Y 2 может получаться из любой из следующих взвешенных комбинаций:

Значение, вычисленное в уравнении 11c, является средним первых двух выражений. Сигналы третьего порядка могут получаться из следующих взвешенных комбинаций:

Другие взвешенные комбинации могут использоваться для расчета четырех сигналов X 2, Y 2, X 3 , Y 3. Уравнения, показанные выше, являются всего лишь примерами расчетов, которые могут использоваться.

Могут использоваться другие технологии для получения четырех статистических характеристик. Например, если имеются в распоряжении разные ресурсы обработки, может быть практичным получать С1 из следующего уравнения:

Это уравнение рассчитывает значение C 1 в образце n звучания посредством анализа сигналов каналов W, X, Y по предыдущим К отсчетам.

Другой технологией, которая может использоваться для получения C 1, является расчет с использованием рекурсивного сглаживающего фильтра вместо конечных сумм в уравнении 14a, как показано в следующем уравнении:

Постоянная времени сглаживающего фильтра определяется коэффициентом α. Этот расчет может выполняться, как показано на структурной схеме, проиллюстрированной на фиг.10. Ошибок деления на ноль, которые происходили бы, когда знаменатель выражения в уравнении 14b равен нулю, можно избежать добавлением небольшого значения ε к делителю, как показано на чертеже. Это слегка модифицирует уравнение, как изложено ниже:

Ошибки деления на ноль также можно избежать посредством использования контура обратной связи, как показано на фиг.11. Эта технология использует предыдущую оценку C1(n-1) для вычисления следующей функции ошибки:

Если значение функции ошибки больше нуля, предыдущая оценка C 1 слишком мала, значение signum(Err(n)) равно единице, и оценка увеличивается на величину корректировки, равную α 1. Если значение функции ошибки является меньше нуля, предыдущая оценка C 1 слишком велика, signum(Err(n)) равно отрицательной единице, и оценка уменьшается на величину корректировки, равную α 1. Если значение функции ошибки равно нулю, предыдущая оценка C 1 является правильной, signum(Err(n)) равно нулю, и оценка не меняется. Грубый вариант оценки C 1 формируется в элементе хранения или задержки, показанном в нижней левой части структурной схемы, проиллюстрированной на фиг.11, а сглаженный вариант этой оценки формируется на выходе, помеченном C 1, в нижней правой части структурной схемы. Постоянная времени сглаживающего фильтра определяется коэффициентом α 2.

Четыре статистических характеристики C 1 , S 1 , С 2 , S 2 могут быть получены с использованием схем и процессов, соответствующих структурным схемам, показанным на фиг.12. Сигналы X 2, Y 2, X 3, Y 3 с членами более высокого порядка могут быть получены согласно уравнениям 10c, 11c, 12 и 13 посредством использования схем и процессов, соответствующих структурным схемам, показанным на фиг.13.

Процессы, используемые для получения четырех статистических характеристик по входным сигналам каналов W, X и Y, будут подвергаться задержке, если эти процессы используют технологии усреднения по времени. В системе реального времени может быть полезным добавлять некоторую задержку в тракты входных сигналов, как показано на фиг.9, чтобы компенсировать задержку в статистическом выводе. Типичное значение задержки для статистического анализа во многих реализациях находится между 10 мс и 50 мс. Задержка, введенная в тракт входного сигнала, обычно должна быть меньше или равна задержке статистического анализа. Во многих реализациях задержка сигнального тракта может не включаться без значительного снижения эффективности системы в целом.

2. Многополосный подход

Методы, описанные выше, выводят широкополосные статистические характеристики, которые могут выражаться в виде скалярных значений, которые изменяются во времени, но не изменяются в зависимости от частоты. Эти методы вывода могут быть расширены для вывода зависящих от полосы частот статистических характеристик, которые могут выражаться в виде векторов с элементами, соответствующими некоторому количеству разных частот или разных частотных поддиапазонов. В качестве альтернативы, каждая из частотно-зависимых статистических характеристик C 1 , S 1 , C 2 и S 2 может выражаться как импульсная характеристика.

Если элементы в каждом из векторов C 1 , S 1 , С 2 и S2 обрабатываются как частотно-зависимые значения усиления, то взвешенные комбинации сигналов X 2, Y 2, X 3 и Y 3 могут формироваться посредством применения надлежащего фильтра к сигналам каналов W, X и Y, которые имеют частотные характеристики, основанные на значениях усиления в этих векторах. Операции умножения, показанные в предыдущих уравнениях и схемах, заменяются операцией фильтрации, такой как свертка.

Статистический анализ сигналов каналов W, X и Y может выполняться в частотной области или во временной области. Если анализ выполняется в частотной области, входные сигналы могут преобразовываться в кратковременную частотную область с использованием блочного преобразования Фурье или подобного для формирования коэффициентов частотной области, и четыре статистических характеристики могут вычисляться для каждого коэффициента частотной области или для групп коэффициентов частотной области, определяющих частотные поддиапазоны. Процесс, используемый для формирования сигналов X 2, Y 2, X 3 и Y 3, может выполнять эту обработку по каждому коэффициенту или по каждой полосе.

F. Реализация в микрофонной системе

Методы, обсужденные выше, могут быть включены в компоновку преобразователь/процессор для формирования микрофонной системы 15, которая может предоставлять выходные сигналы с улучшенной пространственной точностью. В одной из реализаций, схематично показанной на фиг.14, микрофонная система 15 содержит три полностью совместимых или почти полностью совместимых акустических преобразователя А, В, С, имеющих направленные профили чувствительности с формой кардиоиды, которые размещены в вершинах равностороннего треугольника, причем каждый преобразователь обращен в сторону от центра треугольника. Направленные профили усиления преобразователей могут быть выражены в качестве:

где преобразователь A обращен вперед по оси X, преобразователь В обращен назад и влево под углом 120 градусов от оси X, а преобразователь C обращен назад и вправо под углом 120 градусов от оси X.

Выходные сигналы из этих преобразователей могут преобразовываться в трехканальные (W, X, Y) сигналы формата B первого порядка, как изложено ниже:

.

Минимум три преобразователя требуется для регистрации трехканальных сигналов формата B. На практике, когда используются недорогие преобразователи, может быть предпочтительным использовать четыре преобразователя. Схематичные представления, показанные на фиг.15A и 15B, иллюстрируют альтернативные варианты осуществления. Матрица трех преобразователей может быть скомпонована преобразователями, повернутыми под разными углами, такими как 60, -60 и 180 градусов. Матрица четырех преобразователей может быть скомпонована в так называемой «Т-образной» конфигурации с преобразователями, повернутыми под углами 0, 90, -90 и 180 градусов, или скомпонована в так называемой «крестообразной» конфигурации с преобразователями, повернутыми под 45, -45, 135 и -135 градусами. Профилями усиления для крестообразной конфигурации являются:

где подстрочные индексы LF, RF, LB и RB обозначают усиления для преобразователей, обращенных в левом переднем, правом переднем, левом заднем и правом заднем направлениях.

Выходные сигналы из крестообразной конфигурации преобразователей могут преобразовываться в трехканальные (W, X, Y) сигналы формата B первого порядка, как изложено ниже:

В реальной практике направленные профили усиления для каждого преобразователя отклоняются от профиля идеальной кардиоиды. Уравнения преобразования, показанные выше, могут настраиваться, чтобы учитывать эти отклонения. В дополнение, преобразователи могут иметь худшую направленную чувствительность на более низких частотах; однако, это свойство может допускаться во многих приложениях, так как слушатели обычно менее чувствительны к ошибкам направления на более низких частотах.

G. Уравнения микширования

Набор из семи сигналов (W, X, Y, X 2, Y 2, Х 3, Y 3) первого, второго и третьего порядка может микшироваться или комбинироваться посредством матрицы для возбуждения требуемого количества динамиков. Следующий набор уравнений микширования определяет матрицу 7×5, которая может использоваться для возбуждения пяти динамиков в типичной конфигурации объемного звучания, включающей в себя левый (L), правый (R), центральный (C), левый объемный (LS) и правый объемный (RS) каналы:

Функции усиления динамиков, которые обеспечиваются этими уравнениями микширования, проиллюстрированы графически на фиг.16. Эти функции усиления предполагают, что матрица микширования снабжается идеальным набором входных сигналов.

H. Реализация

Устройства, которые включают в себя различные аспекты настоящего изобретения, могут быть реализованы разными способами, в том числе в программном обеспечении для выполнения компьютером или некоторым другим устройством, которое включает в себя специализированные компоненты, такие как схема цифрового сигнального процессора (DSP), связанные с компонентами, подобными используемым в компьютере общего применения. На фиг.17 показана блок-схема устройства 70, которое может использоваться для реализации аспектов настоящего изобретения. Процессор 72 предоставляет вычислительные ресурсы. ОЗУ 73 (RAM) является системным оперативным запоминающим устройством, используемым процессором 72 для обработки. ПЗУ 74 (ROM) представляет некоторую разновидность постоянного хранилища, такого как постоянное запоминающее устройство или флэш-память, для хранения программ, необходимых для управления устройством 70 и, возможно, для осуществления различных аспектов настоящего изобретения. Устройство 75 управления I/O (вводом/выводом) представляет интерфейсную схему для приема и передачи сигналов посредством каналов 76, 77 связи. В показанном варианте осуществления все основные компоненты системы присоединяются к шине 71, которая может представлять более чем одну физическую или логическую шину; однако, шинная архитектура не требуется для реализации настоящего изобретения.

Запоминающее устройство 78 является необязательным. Программы, которые реализуют различные аспекты настоящего изобретения, могут быть записаны в запоминающем устройстве 78, содержащем носитель для хранения данных, такой как магнитная лента или диск, или оптический носитель. Носитель для хранения данных также может использоваться для записи программ инструкций для операционных систем, служебных программ и приложений.

Функции, требуемые для достижения различных аспектов настоящего изобретения, могут выполняться компонентами, которые реализуются широким многообразием способов, в том числе в компонентах дискретной логики, интегральных схемах, одной или более ASIC (специализированных интегральных схемах) и/или управляемых программой процессорах. Способ, которым эти компоненты реализованы, не важен для настоящего изобретения.

Программные реализации настоящего изобретения могут передаваться многообразием машиночитаемых носителей, таких как тракты связи базовой полосы или модулированные по всему спектру, включающему в себя частоты от ультразвукового до ультрафиолетового диапазона, или носителей для хранения данных, которые переносят информацию, по существу, с использованием любой технологии записи, в том числе магнитной ленты, карт или диска, оптических карт или диска, и обнаружимых маркировок на носителях, включая бумагу.

1. Способ повышения пространственного разрешения аудиосигналов, представляющих звуковое поле, содержащий этапы, на которых:
принимают три или более входных аудиосигналов, которые представляют звуковое поле как функцию углового направления с угловыми членами нулевого порядка и первого порядка;
анализируют три или более входных аудиосигналов для получения статистических характеристик одного или более угловых направлений акустической энергии в звуковом поле;
получают два или более обработанных сигнала из взвешенных комбинаций трех или более входных аудиосигналов, в которых три или более аудиосигналов взвешиваются согласно статистическим характеристикам, причем два или более обработанных сигнала представляют звуковое поле как функцию углового направления с угловыми членами одного или более порядков, больших чем один;
предоставляют пять или более выходных аудиосигналов, которые представляют звуковое поле как функцию углового направления с угловыми членами порядка ноль, один и большего чем один, причем пять или более выходных аудиосигналов содержат три или более входных аудиосигналов и два или более обработанных сигналов.

2. Способ по п.1, в котором три или более выходных аудиосигналов принимают с множества акустических преобразователей, каждый из которых имеет направленные чувствительности с угловыми членами порядка, не большего чем первый порядок.

3. Способ по п.1, в котором получают из статистических характеристик два или более сигналов, которые представляют звуковое поле как функцию углового направления с угловыми членами второго порядка.

4. Способ по п.1, в котором получают из статистических характеристик четыре или более обработанных сигналов, которые представляют звуковое поле как функцию углового направления с угловыми членами второго порядка и третьего порядка.

5. Способ по п.1, в котором получают из статистических характеристик четыре или более обработанных сигналов, которые представляют звуковое поле как функцию углового направления с угловыми членами двух или более порядков, больших чем один.

6. Способ по п.1, в котором статистические характеристики получают, по меньшей мере, частично из средних значений трех или более входных аудиосигналов, рассчитываемых в течение интервалов времени.

7. Способ по п.1, в котором каждый из входных аудиосигналов представлен отсчетами, а статистические характеристики получают, по меньшей мере, частично из суммы множества отсчетов для соответствующего входного аудиосигнала.

8. Способ по п.1, в котором статистические характеристики получают, по меньшей мере, частично посредством того, что применяют сглаживающий фильтр к значениям, полученным из трех или более входных аудиосигналов.

9. Способ по п.1, в котором статистические характеристики представляют характеристики звукового поля, выраженные как синусная функция или косинусная функция члена первого порядка углового направления.

10. Способ по п.1, в котором получают частотно-зависимые статистические характеристики для трех или более входных аудиосигналов.

11. Способ по п.10, содержащий этапы, на которых:
применяют блочное преобразование к трем или более входным аудиосигналам, чтобы формировать коэффициенты частотной области;
получают частотно-зависимые статистические характеристики из отдельных коэффициентов частотной области или групп коэффициентов частотной области; и
получают два или более обработанных сигналов посредством того, что применяют фильтры к трем или более входным аудиосигналам, имеющим частотные характеристики, основанные на частотно-зависимых статистических характеристиках.

12. Способ по п.10, содержащий этап, на котором получают два или более обработанных сигналов посредством применения фильтров к трем или более входным аудиосигналам, имеющим импульсные характеристики, основанные на частотно-зависимых статистических характеристиках.

13. Устройство для повышения пространственного разрешения аудиосигналов, представляющих звуковое поле, причем устройство содержит:
средство для приема трех или более входных аудиосигналов, которые представляют звуковое поле как функцию углового направления с угловыми членами нулевого порядка и первого порядка;
средство для анализа трех или более входных аудиосигналов для получения статистических характеристик одного или более угловых направлений акустической энергии в звуковом поле;
средство для получения двух или более обработанных сигналов из взвешенных комбинаций трех или более входных аудиосигналов, в которых три или более аудиосигналов взвешиваются согласно статистическим характеристикам, причем два или более обработанных сигнала представляют звуковое поле как функцию углового направления с угловыми членами одного или более порядков, больших чем один/средство для предоставления пяти или более выходных аудиосигналов, которые представляют звуковое поле как функцию углового направления с угловыми членами порядка ноль, один и большего чем один, причем пять или более выходных аудиосигналов содержат три или более входных аудиосигналов и два или более обработанных сигналов.

14. Устройство по п.13, в котором три или более выходных аудиосигналов принимаются с множества акустических преобразователей, каждый из которых имеет направленные чувствительности с угловыми членами порядка, не большего чем первый порядок.

15. Устройство по п.13, в котором из статистических характеристик получаются два или более сигналов, которые представляют звуковое поле как функцию углового направления с угловыми членами второго порядка.

16. Устройство по п.13, в котором из статистических характеристик получаются четыре или более обработанных сигналов, которые представляют звуковое поле как функцию углового направления с угловыми членами второго порядка и третьего порядка.

17. Устройство по п.13, в котором из статистических характеристик получаются четыре или более обработанных сигналов, которые представляют звуковое поле в качестве функции углового направления с угловыми членами двух или более порядков, больших чем один.

18. Устройство по п.13, в котором статистические характеристики получаются, по меньшей мере, частично из средних значений трех или более входных аудиосигналов, рассчитываемых в течение интервалов времени.

19. Устройство по п.13, в котором каждый из входных аудиосигналов представлен отсчетами, а статистические характеристики получаются, по меньшей мере, частично из суммы множества отсчетов для соответствующего входного аудиосигнала.

20. Устройство по п.13, в котором статистические характеристики получаются, по меньшей мере, частично посредством применения сглаживающего фильтра к значениям, полученным из трех или более входных аудиосигналов.

21. Устройство по п.13, в котором статистические характеристики представляют характеристики звукового поля, выраженные как синусная функция или косинусная функция члена первого порядка углового направления.

22. Устройство по п.13, в котором получаются частотно-зависимые статистические характеристики для трех или более входных аудиосигналов.

23. Устройство по п.22, которое содержит:
средство для применения блочного преобразования к трем или более входным аудиосигналам, чтобы формировать коэффициенты частотной области;
средство для получения частотно-зависимых статистических характеристик из отдельных коэффициентов частотной области или групп коэффициентов частотной области; и
средство для получения двух или более обработанных сигналов посредством применения фильтров к трем или более входным аудиосигналам, имеющим частотные характеристики, основанные на частотно-зависимых статистических характеристиках.

24. Устройство по п.22, которое содержит средство для получения двух или более обработанных сигналов посредством применения фильтров к трем или более входным аудиосигналам, имеющим импульсные характеристики, основанные на частотно-зависимых статистических характеристиках.

25. Запоминающий носитель, хранящий программу из инструкций, выполняемых устройством, причем выполнение программы из инструкций побуждает устройство выполнять способ повышения пространственного разрешения аудиосигналов, представляющих звуковое поле, содержащий этапы, на которых:
принимают три или более входных аудиосигналов, которые представляют звуковое поле как функцию углового направления с угловыми членами нулевого порядка и первого порядка;
анализируют три или более входных аудиосигналов для получения статистических характеристик одного или более угловых направлений акустической энергии в звуковом поле;
получают два или более обработанных сигнала из взвешенных комбинаций трех или более входных аудиосигналов, в которых три или более аудиосигналов взвешиваются согласно статистическим характеристикам, причем два или более обработанных сигнала представляют звуковое поле как функцию углового направления с угловыми членами одного или более порядков, больших чем один;
предоставляют пять или более выходных аудиосигналов, которые представляют звуковое поле как функцию углового направления с угловыми членами порядка ноль, один и большего чем один, причем пять или более выходных аудиосигналов содержат три или более входных аудиосигналов и два или более обработанных сигналов.

26. Запоминающий носитель по п.25, причем три или более выходных аудиосигналов принимаются с множества акустических преобразователей, каждый из которых имеет направленные чувствительности с угловыми членами порядка, не большего чем первый порядок.

27. Запоминающий носитель по п.25, причем в способе получают из статистических характеристик два или более сигналов, которые представляют звуковое поле как функцию углового направления с угловыми членами второго порядка.

28. Запоминающий носитель по п.25, причем в способе получают из статистических характеристик четыре или более обработанных сигналов, которые представляют звуковое поле как функцию углового направления с угловыми членами второго порядка и третьего порядка.

29. Запоминающий носитель по п.25, причем в способе получают из статистических характеристик четыре или более обработанных сигналов, которые представляют звуковое поле как функцию углового направления с угловыми членами двух или более порядков, больших чем один.

30. Запоминающий носитель по п.25, причем статистические характеристики получаются, по меньшей мере, частично из средних значений трех или более входных аудиосигналов, рассчитываемых в течение интервалов времени.

31. Запоминающий носитель по п.25, причем каждый из входных аудиосигналов представлен отсчетами, а статистические характеристики получаются, по меньшей мере, частично из суммы множества отсчетов для соответствующего входного аудиосигнала.

32. Запоминающий носитель по п.25, причем статистические характеристики получаются, по меньшей мере, частично посредством того, что применяют сглаживающий фильтр к значениям, полученным из трех или более входных аудиосигналов.

33. Запоминающий носитель по п.25, причем статистические характеристики представляют характеристики звукового поля, выраженные как синусная функция или косинусная функция члена первого порядка углового направления.

34. Запоминающий носитель по п.25, причем в способе получают частотно-зависимые статистические характеристики для трех или более входных аудиосигналов.

35. Запоминающий носитель по п.34, причем способ содержит этапы, на которых:
применяют блочное преобразование к трем или более входным аудиосигналам, чтобы формировать коэффициенты частотной области/получают частотно-зависимые статистические характеристики из отдельных коэффициентов частотной области или групп коэффициентов частотной области; и
получают два или более обработанных сигналов посредством того, что применяют фильтры к трем или более входным аудиосигналам, имеющим частотные характеристики, основанные на частотно-зависимых статистических характеристиках.

36. Запоминающий носитель по п.34, причем способ содержит этап, на котором получают два или более обработанных сигналов посредством применения фильтров к трем или более входным аудиосигналам, имеющим импульсные характеристики, основанные на частотно-зависимых статистических характеристиках.



 

Похожие патенты:

Изобретение относится к способу и устройству для декодирования аудиосигнала, принятого на цифровом носителе, например сигнала вещания. .

Изобретение относится к способам и устройствам воспроизведения многоканальных звуковых сигналов. .

Изобретение относится к синтезированию с применением аудиорендеринга выходного стереосигнала или выходного многоканального аудиосигнала, сформированных в результате понижающего микширования с использованием дополнительных управляющих данных

Изобретение относится к способу и устройству для генерирования бинаурального звукового сигнала и, в частности, к генерированию бинаурального звукового сигнала из моносигнала понижающего микширования

Изобретение относится к обработке аудиосигналов, в частности к матричному декодеру аудиосигнала

Использование: данное изобретение относится к сфере обработки звукового сигнала, главным образом, обработки пространственного звукового сигнала, и преобразования различных форматов пространственных звуковых сигналов. Сущность: улучшенная обработка звукового сигнала может быть достигнута, если звуковые сигналы преобразуются в направленные компоненты. Другими словами, данное изобретение показывает, что улучшенная пространственная обработка может быть достигнута, когда формат пространственного звукового сигнала соответствует направленным компонентам, таким как записанные, например, направленным микрофоном В-формата. Кроме того, данное изобретение показывает, что направленные или всенаправленные компоненты из различных источников могут обрабатываться совместно и, к тому же, с повышенной эффективностью. Другими словами, особенно при обработке пространственных звуковых сигналов из множественных источников звука, обработка может быть выполнена более эффективно, если сигналы множественных источников звука доступны в формате их всенаправленных и направленных компонентов, поскольку они могут обрабатываться совместно. В осуществлениях, поэтому, генераторы звукового эффекта или звуковые процессоры могут использоваться более эффективно, обрабатывая объединенные компоненты множественных источников. Технический результат: улучшение пространственной обработки звукового сигнала. 3 н. и 13 з.п. ф-лы, 11 ил.

Изобретение относится к средствам кодирования и декодирования основывающихся на объектах аудиосигналов. Технический результат заключается в предоставлении средств кодирования и декодирования аудио. Извлекают из аудиосигнала первый аудиосигнал и первый аудиопараметр, в которых музыкальный объект закодирован на канальной основе, и второй аудиосигнал и второй аудиопараметр, в которых вокальный объект закодирован на объектной основе. Формируют третий аудиосигнал посредством использования, по меньшей мере, одного из первого и второго аудиосигналов. Формируют многоканальный аудиосигнал посредством использования, по меньшей мере, одного из первого и второго аудиопараметров и третьего аудиосигнала. 5 н. и 4 з.п. ф-лы, 16 ил.

Изобретение относится к средствам кодирования и декодирования звуковых сигналов. Технический результат заключается в повышении качества кодирования сигнала. Генерируют низведенный сигнал и остаточный сигнал на основе стереофонического сигнала. Определяют разность интенсивностей между каналами и взаимную корреляцию между каналами. Предпочтительно параметры параметрического стереофонического кодирования являются зависящими от времени и от частоты. Этап преобразования генерирует псевдолевый/правый стереофонический сигнал путем выполнения преобразования на основе низведенного сигнала и остаточного сигнала. Псевдостереофонический сигнал обрабатывается перцептуальным стереофоническим кодером. Для стереофонического кодирования может быть выбрано левое/правое кодирование или среднее/побочное кодирование. Предпочтительно выбор между левым/правым кодированием и средним/побочным кодированием является зависящим от времени и от частоты. 4 н. и 16 з.п. ф-лы, 26 ил.

Изобретение относится к средствам для создания цифрового пространственного стереоаудиофайла из исходного многоканального аудиофайла. Технический результат заключается в формировании ощущения, что звуковая среда экстернализирована. Создают базу данных импульсных сигналов из полученных акустических сигналов во множестве физических пространств путем записи сигналов, производимых акустическими громкоговорителями. Когда сигнал является стереосигналом, генерируют N.i сигнала из стереосигнала. Преобразовывают сигнал каждого из N.i каналов из одного из файлов импульсного отклика, выбранного в вышеупомянутой базе данных. Выполняют обработку в каждом из каналов для исключения взаимных помех. Объединяют каналы с целью создания стереосигнала. Применяют динамическую фильтрацию и эквализацию. 3 з.п. ф-лы, 3 ил.

Изобретение относится к средствам аудиокодирования и аудиодекодирования. Технический результат заключается в повышении эффективности кодирования аудиоданных. Способ кодирования вектора параметров в системе кодирования аудио, причем каждый параметр соответствует апериодической величине, вектор имеет первый элемент и по меньшей мере один второй элемент. Представляют каждый параметр в векторе посредством значения индекса, которое может принимать N значений. Ассоциируют каждый из одного второго элемента с символом, причем символ вычисляется посредством следующих этапов, на которых: вычисляют разность между значением индекса второго элемента и значением индекса его предыдущего элемента в векторе; применяют операцию по модулю N к разности; кодируют каждый по меньшей мере из одного второго элемента посредством энтропийного кодирования символа, ассоциированного по меньшей мере с одним вторым элементом на основе таблицы вероятностей, содержащей вероятности символов. 11 н. и 14 з.п. ф-лы, 15 ил.
Наверх