Патенты автора ТИРГАРТ, Оливер (DE)

Изобретение относится к области вычислительной техники для обработки аудиоданных. Технический результат заключается в обеспечении кодирования пространственных аудиосцен с низкими битовыми скоростями и максимальной точностью воспроизвения первоначальной аудиосцены после передачи. Технический результат достигается за счет того, что пространственное звуковое представление является представлением Ambisonics первого порядка или представлением Ambisonics высокого порядка, содержащим множество сигналов коэффициентов, или многоканальным представлением, содержащим множество аудиоканалов, формирование транспортного представления содержит комбинирование еще двух сигналов коэффициентов из представления Ambisonics высокого порядка или представления Ambisonics первого порядка, или комбинирование двух или более аудиоканалов из многоканального представления, а формирование транспортных метаданных содержит формирование в качестве транспортных метаданных информацию, указывающую, как были объединены два или более сигналов коэффициентов из представления Ambisonics высокого порядка или представления Ambisonics первого порядка или два или более аудиоканалов из многоканального представления, или какие из двух и более сигналов коэффициентов из представления Ambisonics первого порядка или представления Ambisonics высокого порядка или какие из двух или более аудиоканалов из многоканального представления были объединены. 6 н. и 26 з.п. ф-лы, 23 ил.

Изобретение относится к способам и устройствам аудиокодирования. Технический результат заключается в уменьшении ошибки квантования при кодировании аудиосигнала. Технический результат достигается за счет выполнения следующих этапов способа: получение данных о направлении и данных о диффузности из входного сигнала; оценка первого связанного с энергией или амплитудой показателя для всенаправленной компоненты, выводимой из входного сигнала, и оценку второго связанного с энергией или амплитудой показателя для направленной компоненты, выводимой из входного сигнала, и генерирование компонент звукового поля, при этом генератор звуковых компонент выполнен с возможностью выполнения компенсации энергии направленной компоненты с использованием первого связанного с энергией или амплитудой показателя, второго связанного с энергией или амплитудой показателя, данных о направлении и данных о диффузности. 3 н. и 19 з.п. ф-лы, 15 ил.

Изобретение относится к области вычислительной техники для обработки аудиоданных. Технический результат заключается в повышении точности генерирования описания звукового поля из входного сигнала. Технический результат достигается за счет получения данных о диффузности из входного сигнала; генерирования из входного сигнала одной или более компонент звукового поля первой группы компонент звукового поля, имеющей для каждой компоненты звукового поля прямую компоненту и диффузную компоненту, и генерирование из входного сигнала второй группы компонент звукового поля, имеющих только прямую компоненту, при этом генерирование содержит выполнение компенсации энергии при генерировании первой группы компонент звукового поля, причем компенсация энергии зависит от данных о диффузности и по меньшей мере одного из числа компонент звукового поля во второй группе, числа диффузных компонент в первой группе, максимального порядка компонент звукового поля первой группы и максимального порядка компонент звукового поля второй группы. 3 н. и 18 з.п. ф-лы, 15 ил.

Изобретение относится к области вычислительной техники для обработки аудиоданных. Технический результат заключается в снижении задержки для обеспечения возможности разговорных сервисов в сетях мобильной связи. Технический результат достигается за счет генерирования описания звукового поля низкого порядка из входного сигнала вплоть до предопределенного порядка и моды, при этом генератор низкого порядка выполнен с возможностью выведения описания звукового поля низкого порядка посредством копирования входного сигнала или выполнения взвешенной комбинации каналов входного сигнала; генерирования описания звукового поля среднего порядка выше упомянутого предопределенного порядка или с упомянутым предопределенным порядком и выше предопределенной моды и ниже высокого порядка, используя синтез по меньшей мере одной прямой части и по меньшей мере одной диффузной части, с использованием данных о направлении и данных о диффузности, так что описание звукового поля среднего порядка содержит прямой вклад и диффузный вклад; и генерирования описания звукового поля высокого порядка, имеющего компоненту с высоким порядком или выше него, с использованием синтеза по меньшей мере одной прямой части без синтеза какой-либо диффузной компоненты, так что описание звукового поля высокого порядка содержит только прямой вклад. 3 н. и 19 з.п. ф-лы, 15 ил.

Заявленная группа изобретений направлена на обработку аудиосигналов, и в частности на эффективные схемы кодирования параметров направленного кодирования аудио, таких как метаданные DirAC. Техническим результатом является обеспечение повышения качества при уменьшении скорости передачи битов для кодирования параметров пространственного кодирования аудио. Устройство для кодирования параметров направленного кодирования аудио, содержащих параметры рассеянности для временных квантов и частотных элементов разрешения и параметры направления для временных квантов и частотных элементов разрешения, содержит модуль (100) вычисления параметров для вычисления параметров рассеянности с первым временным или частотным разрешением и для вычисления параметров направления со вторым временным или частотным разрешением, при этом второе временное или частотное разрешение отличается от первого временного или частотного разрешения; и процессор (200) квантования и кодирования для формирования квантованного и кодированного представления параметров рассеянности и параметров направления. 6 н. и 27 з.п. ф-лы, 42 ил.

Изобретение относится к вычислительной технике. Технический результат заключается в улучшении обработки аудиосцен и описаний аудиосцен. Устройство для формирования описания объединенной аудиосцены содержит интерфейс ввода для приема первого описания первой сцены в первом формате и второго описания второй сцены во втором формате, при этом второй формат отличается от первого формата; преобразователь форматов для преобразования первого описания в общий формат и для преобразования второго описания в общий формат, когда второй формат отличается от общего формата; и объединитель форматов для объединения первого описания в общем формате и второго описания в общем формате для получения описания объединенной аудиосцены. 15 н. и 26 з.п. ф-лы, 41 ил.

Изобретение относится к средствам для кодирования и декодирования аудиосцены. Технический результат заключается в повышении эффективности кодирования. Для его реализации выполняют базовое кодирование по меньшей мере двух компонентных сигналов. Причем базовое кодирование содержит формирование первого закодированного представления для первого фрагмента по меньшей мере двух компонентных сигналов и формирование второго закодированного представления для второго фрагмента упомянутых по меньшей мере двух компонентных сигналов. Причем базовое кодирование содержит формирование временного кадра из упомянутых по меньшей мере двух компонентных сигналов. Причем первая частотная подполоса временного кадра из упомянутых по меньшей мере двух компонентных сигналов является первым фрагментом, и вторая частотная подполоса временного кадра является вторым фрагментом. Базовое кодирование также содержит формирование первого закодированного представления для первой частотной подполосы и формирование второго закодированного представления для второй частотной подполосы. 6 н. и 32 з.п. ф-лы, 20 ил.

Изобретение относится к средствам для формирования описания звукового поля. Технический результат заключается в повышении качества формируемого звукового поля. Формируют по меньшей мере одно описание звукового поля, указывающее звуковое поле относительно по меньшей мере одного опорного местоположения. Формируют метаданные, связанные с пространственной информацией звукового поля. При этом упомянутое по меньшей мере одно описание звукового поля и метаданные составляют улучшенное описание звукового поля. Формирование упомянутого по меньшей мере одного описания звукового поля содержит этап, на котором формируют информацию степени рассеяния для множества частотных бинов временного кадра звукового поля, и при этом формирование метаданных содержит этап, на котором формируют информацию расстояния для частотного бина только тогда, когда значение степени рассеяния для частотного бина ниже порогового значения степени рассеяния, или при этом формирование метаданных содержит этап, на котором формируют метаданные расстояния, отличающиеся от предварительно определенного значения, только тогда, когда значение степени рассеяния для частотного бина ниже порогового значения степени рассеяния. 6 н. и 18 з.п. ф-лы, 22 ил.

Изобретение относится к акустическим средствам определения информации о направлении. Устройство предназначено для получения информации о направлении от множества микрофонных сигналов, в которых различающиеся эффективные направления обзора микрофонов связаны с микрофонными сигналами. При этом устройство содержит блок объединения, выполненный с возможностью получения значения амплитуды микрофонного сигнала и комбинирования единиц информации о направлении, описывающих эффективные направления обзора микрофонов, при этом единица информации о направлении, описывающая данное эффективное направление обзора микрофона, взвешивается в зависимости от значения амплитуды микрофонного сигнала, связанного с данным эффективным направлением обзора микрофона, для получения информации о направлении. Единица информации о направлении, описывающая данное эффективное направление обзора микрофона, представляет собой вектор, указывающий в данном эффективном направлении обзора микрофона, а блок объединения предназначен для соответствующей линейной комбинации единиц информации о направлении, взвешенных в зависимости от значений амплитуд, соответствующих данной частотно-временной ячейке, и в котором единицы информации о направлении являются независимыми от частотно-временных ячеек. Микрофоны выполнены ненаправленными, а между микрофонами расположен затеняющий объект. Технический результат - эффективное определение направления. 5 н. и 14 з.п ф-лы, 21 ил.

 


Наверх