Патенты автора ХЕРРЕ, Юрген (DE)

Изобретение относится к области вычислительной техники для обработки аудиоданных. Технический результат заключается в обеспечении кодирования пространственных аудиосцен с низкими битовыми скоростями и максимальной точностью воспроизвения первоначальной аудиосцены после передачи. Технический результат достигается за счет того, что пространственное звуковое представление является представлением Ambisonics первого порядка или представлением Ambisonics высокого порядка, содержащим множество сигналов коэффициентов, или многоканальным представлением, содержащим множество аудиоканалов, формирование транспортного представления содержит комбинирование еще двух сигналов коэффициентов из представления Ambisonics высокого порядка или представления Ambisonics первого порядка, или комбинирование двух или более аудиоканалов из многоканального представления, а формирование транспортных метаданных содержит формирование в качестве транспортных метаданных информацию, указывающую, как были объединены два или более сигналов коэффициентов из представления Ambisonics высокого порядка или представления Ambisonics первого порядка или два или более аудиоканалов из многоканального представления, или какие из двух и более сигналов коэффициентов из представления Ambisonics первого порядка или представления Ambisonics высокого порядка или какие из двух или более аудиоканалов из многоканального представления были объединены. 6 н. и 26 з.п. ф-лы, 23 ил.

Изобретение относится к аудиопроцессорам для обеспечения множества сигналов громкоговорителей или подачи звука в громкоговорители на основе множества входных сигналов, таких как канальные сигналы и/или объектные сигналы. Техническим результатом изобретения является обеспечение наилучшего компромисса между сложностью обработки звука и аудиовосприятием слушателя. Аудиопроцессор выполнен с возможностью получения информации в отношении положения слушателя, а также в отношении положения множества громкоговорителей или электроакустических преобразователей звука, которые могут быть размещены в одном и том же отсеке, например в звуковой панели. Аудиопроцессор дополнительно выполнен с возможностью выбора одного или более громкоговорителей для рендеринга объектов, и/или канальных объектов, и/или адаптированных сигналов, извлекаемых из входных сигналов, таких как канальные сигналы или канальные объекты, либо таких как микшированные с повышением или микшированные с понижением сигналы. Выбор одного или более громкоговорителей зависит от информации в отношении положения слушателя, от информации в отношении положений громкоговорителей и учитывает информацию в отношении одной или более акустических преград. Другими словами, аудиопроцессор определяет, какие громкоговорители должны использоваться при рендеринге различных канальных объектов или адаптированных сигналов с учетом затухания звука между громкоговорителем и слушателем или удлинения акустического тракта между громкоговорителем и слушателем вследствие свойств преграды. Процессор аудиосигналов дополнительно выполнен с возможностью рендеринга объектов, и/или канальных объектов, и/или адаптированных сигналов, извлекаемых из входных сигналов, в зависимости от информации в отношении положения слушателя и в зависимости от информации в отношении положений громкоговорителей для получения сигналов громкоговорителей таким образом, чтобы рендерируемый звук следовал за слушателем. 6 н. и 31 з.п. ф-лы, 34 ил.

Изобретение относится в общем к аудиопроцессорам для рендеринга аудио, при котором звук следует за слушателем. Техническим результатом изобретения является оптимизация воспроизведения аудио и рендеринга аудиосигналов для формирования достоверного и приятного слухового впечатления слушателя. Аудиопроцессор для обеспечения множества сигналов громкоговорителей или подачи звука в громкоговорители на основании множества входных сигналов, таких как канальные сигналы и/или объектные сигналы, выполнен с возможностью получения информации в отношении положения слушателя и положения множества громкоговорителей или преобразователей звука, которые могут быть размещены в одном и том же отсеке, например в звуковой панели. Аудиопроцессор дополнительно выполнен с возможностью динамической адаптации выделения объектов, и/или канальных объектов, и/или адаптированных сигналов, таких как адаптированные канальные сигналы, извлекаемых из входных сигналов громкоговорителей, таких как канальные сигналы или канальные объекты либо таких как микшированные с повышением или микшированные с понижением сигналы. Адаптация местоположения зависит от информации в отношении положения слушателя и от информации в отношении положений громкоговорителей. Другими словами, аудиопроцессор определяет, какие громкоговорители должны использоваться при рендеринге различных канальных объектов или адаптированных сигналов. Процессор аудиосигналов дополнительно выполнен с возможностью рендеринга объектов, и/или канальных объектов, и/или адаптированных сигналов, извлекаемых из входных сигналов, в зависимости от информации в отношении положения слушателя, от информации в отношении положений громкоговорителей и в зависимости от упомянутого выделения, для получения сигналов громкоговорителей таким образом, чтобы рендерируемый звук следовал за слушателем. 8 н. и 30 з.п. ф-лы, 28 ил.

Изобретение относится к области вычислительной техники для обработки аудиоданных. Технический результат заключается в обеспечении максимального снижения уровня шума при условии отсутствия артефактов. Технический результат достигается за счет определения оцененного целевого сигнала, который зависит от входного аудиосигнала, определения результирующих значений в зависимости от оцененного качества звука оцененного целевого сигнала, чтобы получить одно или несколько значений параметров, и формирования отделенного аудиосигнала в зависимости от одного или нескольких значений параметров и в зависимости от одного из оцененного целевого сигнала, и входного аудиосигнала, и оцененного разностного сигнала, причем оцененный разностный сигнал является оценкой сигнала, который содержит только участок разностного аудиосигнала, причем формирование отделенного аудиосигнала проводят в зависимости от значений параметров и в зависимости от линейной комбинации оцененного целевого сигнала и входного аудиосигнала; или при этом формирование отделенного аудиосигнала проводят в зависимости от значений параметров и в зависимости от линейной комбинации оцененного целевого сигнала и оцененного разностного сигнала. 3 н. и 13 з.п. ф-лы, 6 ил.

Изобретение относится к средствам для воспроизведения пространственно протяженного источника звука. Технический результат заключается в повышении эффективности воспроизведения пространственно протяженного источника звука. Принимают позицию слушателя. Вычисляют проекцию двумерной или трехмерной оболочки, ассоциированной с пространственно протяженным источником звука, на плоскость проекции с использованием позиции слушателя, информации относительно геометрии пространственно протяженного источника звука и информации относительно позиции пространственно протяженного источника звука. Вычисляют позиции по меньшей мере двух источников звука для пространственно протяженного источника звука с использованием плоскости проекции. Осуществляют рендеринг по меньшей мере двух источников звука в позициях, чтобы получать воспроизведение пространственно протяженного источника звука, имеющего два или более выходных сигналов. При этом рендеринг содержит этап, на котором используют различные звуковые сигналы для различных позиций, при этом различные звуковые сигналы ассоциированы с пространственно протяженным источником звука. 7 н. и 34 з.п. ф-лы, 11 ил.

Изобретение относится к области вычислительной техники для обработки аудиоданных. Технический результат заключается в повышении точности многосигнального кодирования или декодирования. Технический результат достигается за счет вычисления информации о средней энергии предварительно обработанных аудиосигналов; вычисления информации об энергии каждого предварительно обработанного аудиосигнала, вычисления значения нормализации широкополосной энергии для конкретного предварительно обработанного аудиосигнала на основании информации о средней энергии и информации об энергии упомянутого конкретного предварительно обработанного аудиосигнала; и выполнения нормализации широкополосной энергии по меньшей мере трех предварительно обработанных аудиосигналов с использованием значений нормализации широкополосной энергии для конкретных предварительно обработанных аудиосигналов, причем каждый предварительно обработанный аудиосигнал имеет нормализованную энергию. 6 н. и 38 з.п. ф-лы, 17 ил.

Изобретение относится к области вычислительной техники для обработки аудиоданных на основе карты направленной громкости. Технический результат заключается в повышении точности обработки аудиоданных. Технический результат достигается за счет регулирования сложности рендеринга в зависимости от вкладов входных аудиосигналов в общую карту направленной громкости из преобразованной для прослушивания аудиосцены. 7 н. и 9 з.п. ф-лы, 34 ил., 1 табл.

Заявленная группа изобретений направлена на обработку аудиосигналов, и в частности на эффективные схемы кодирования параметров направленного кодирования аудио, таких как метаданные DirAC. Техническим результатом является обеспечение повышения качества при уменьшении скорости передачи битов для кодирования параметров пространственного кодирования аудио. Устройство для кодирования параметров направленного кодирования аудио, содержащих параметры рассеянности для временных квантов и частотных элементов разрешения и параметры направления для временных квантов и частотных элементов разрешения, содержит модуль (100) вычисления параметров для вычисления параметров рассеянности с первым временным или частотным разрешением и для вычисления параметров направления со вторым временным или частотным разрешением, при этом второе временное или частотное разрешение отличается от первого временного или частотного разрешения; и процессор (200) квантования и кодирования для формирования квантованного и кодированного представления параметров рассеянности и параметров направления. 6 н. и 27 з.п. ф-лы, 42 ил.

Изобретение относится к вычислительной технике. Технический результат заключается в улучшении обработки аудиосцен и описаний аудиосцен. Устройство для формирования описания объединенной аудиосцены содержит интерфейс ввода для приема первого описания первой сцены в первом формате и второго описания второй сцены во втором формате, при этом второй формат отличается от первого формата; преобразователь форматов для преобразования первого описания в общий формат и для преобразования второго описания в общий формат, когда второй формат отличается от общего формата; и объединитель форматов для объединения первого описания в общем формате и второго описания в общем формате для получения описания объединенной аудиосцены. 15 н. и 26 з.п. ф-лы, 41 ил.

Изобретение относится к средствам для кодирования и декодирования аудиосцены. Технический результат заключается в повышении эффективности кодирования. Для его реализации выполняют базовое кодирование по меньшей мере двух компонентных сигналов. Причем базовое кодирование содержит формирование первого закодированного представления для первого фрагмента по меньшей мере двух компонентных сигналов и формирование второго закодированного представления для второго фрагмента упомянутых по меньшей мере двух компонентных сигналов. Причем базовое кодирование содержит формирование временного кадра из упомянутых по меньшей мере двух компонентных сигналов. Причем первая частотная подполоса временного кадра из упомянутых по меньшей мере двух компонентных сигналов является первым фрагментом, и вторая частотная подполоса временного кадра является вторым фрагментом. Базовое кодирование также содержит формирование первого закодированного представления для первой частотной подполосы и формирование второго закодированного представления для второй частотной подполосы. 6 н. и 32 з.п. ф-лы, 20 ил.

Изобретение относится к средствам для аудиообработки, а именно для формирования описания звукового поля. Технический результат заключается в повышении эффективности обработки описания звукового поля. Вычисляют модифицированное звуковое поле с использованием пространственной информации, описания звукового поля и информации перемещения, указывающей перемещение из опорного местоположения в другое опорное местоположение. Принимают, в качестве описания звукового поля, описание звукового поля первого слоя и описание звукового поля второго слоя. Выполняют разделение источников для описаний звукового поля первого и второго слоев, чтобы извлекать источники описаний звукового поля первого и второго слоев и данных направления поступления (DoA) для извлеченных источников. Вычисляют, для каждого извлеченного источника, модифицированные DoA-данные относительно другого местоположения с использованием DoA-данных и информации перемещения. Обрабатывают извлеченные источники и модифицированные DoA-данные, чтобы получать модифицированное описание звукового поля. 6 н. и 24 з.п. ф-лы, 23 ил.

Изобретение относится к средствам для формирования описания звукового поля. Технический результат заключается в повышении эффективности формирования звукового поля. Формируют первое описание звукового поля, указывающее звуковое поле относительно первого опорного местоположения, и второе описание звукового поля, указывающее звуковое поле относительно второго опорного местоположения, причем второе опорное местоположение отличается от первого опорного местоположения. Формируют метаданные, связанные с пространственной информацией звукового поля. При этом формирование метаданных содержит определение по меньшей мере одного из первого геометрического описания для первого описания звукового поля и второго геометрического описания для второго описания звукового поля в качестве метаданных. При этом первое описание звукового поля, второе описание звукового поля и метаданные, содержащие по меньшей мере одно из первого геометрического описания и второго геометрического описания, составляют улучшенное описание звукового поля. 14 н. и 32 з.п. ф-лы, 19 ил.

Изобретение относится к средствам для формирования описания звукового поля. Технический результат заключается в повышении качества формируемого звукового поля. Формируют по меньшей мере одно описание звукового поля, указывающее звуковое поле относительно по меньшей мере одного опорного местоположения. Формируют метаданные, связанные с пространственной информацией звукового поля. При этом упомянутое по меньшей мере одно описание звукового поля и метаданные составляют улучшенное описание звукового поля. Формирование упомянутого по меньшей мере одного описания звукового поля содержит этап, на котором формируют информацию степени рассеяния для множества частотных бинов временного кадра звукового поля, и при этом формирование метаданных содержит этап, на котором формируют информацию расстояния для частотного бина только тогда, когда значение степени рассеяния для частотного бина ниже порогового значения степени рассеяния, или при этом формирование метаданных содержит этап, на котором формируют метаданные расстояния, отличающиеся от предварительно определенного значения, только тогда, когда значение степени рассеяния для частотного бина ниже порогового значения степени рассеяния. 6 н. и 18 з.п. ф-лы, 22 ил.

Изобретение относится к средствам для постобработки звукового сигнала. Технический результат заключается в повышении эффективности обработки. Преобразуют звуковой сигнал во время-частотное представление. Оценивают место всплеска по времени для всплескового участка с использованием звукового сигнала или время-частотного представления. Манипулируют время-частотным представлением для ослабления или устранения упреждающего эха во время–частотном представлении в расположении по времени перед местом всплеска. При этом оценивают пороговые значения упреждающего эха применительно к спектральным значениям во время-частотном представлении в пределах длительности упреждающего эха, причем пороговые значения упреждающего эха указывают пороговые значения амплитуды соответствующих спектральных значений после ослабления или устранения упреждающего эха. При этом определяют пороговые значения упреждающего эха с использованием взвешивающей кривой, имеющей возрастающую характеристику от начала длительности упреждающего эха до места всплеска. Манипулируют время-частотным представлением для выполнения профилирования время–частотного представления в месте всплеска, чтобы усилить выпад всплесковой части. 3 н. и 12 з.п. ф-лы, 61 ил., 1 табл.

Изобретение относится к средствам для обработки аудио. Технический результат заключается в повышении эффективности аудиообработки. Формируют временную последовательность блоков значений аудиосигналов. Определяют характеристику текущего блока аудиосигнала и определяют изменчивость характеристики в группе блоков, содержащей по меньшей мере два блока из упомянутой последовательности блоков. Разделяют текущий блок на фоновую часть и часть переднего плана. При этом пороговое значение разделения определяется на основе упомянутой изменчивости. При этом текущий блок разделяется на сигнал фонового компонента и сигнал компонента переднего плана, когда характеристика текущего блока находится в предварительно определенной взаимосвязи с пороговым значением разделения. Или при этом полный текущий блок определяется в качестве сигнала компонента переднего плана, когда характеристика текущего блока находится в предварительно определенной взаимосвязи с пороговым значением разделения. Или при этом определяют то, что полный текущий блок определяется в качестве сигнала фонового компонента, когда характеристика текущего блока не находится в предварительно определенной взаимосвязи с пороговым значением разделения. 3 н. и 18 з.п. ф-лы, 15 ил.

Изобретение относится к средствам для воспроизведения аудио. Технический результат заключается в повышении качества воспроизведения аудио. Для каждого из набора из одного или более громкоговорителей формируется набор из одного или более параметров, которые определяют получение сигнала громкоговорителя для воспроизведения соответствующим громкоговорителем из аудиосигнала, на основе позиции слушателя и позиционирования громкоговорителей из данного набора из одного или более громкоговорителей, каковое позиционирование громкоговорителей определяет позицию и ориентацию громкоговорителей. Причем аудиопроцессор основывает упомянутое формирование набора из одного или более параметров соответствующего громкоговорителя из набора из одного или более громкоговорителей на характеристике громкоговорителя по меньшей мере одного из упомянутого набора из одного или более громкоговорителей, причем характеристика громкоговорителя представляет зависящий от угла излучения частотный отклик характеристики излучения этого по меньшей мере одного из набора из одного или более громкоговорителей. 4 н. и 15 з.п. ф-лы, 4 ил.

Изобретение относится к средствам для обработки аудиосигнала. Технический результат заключается в повышении эффективности обработки аудиосигнала. Отделяют первый участок спектра аудиосигнала от второго участка спектра аудиосигнала, первый участок имеет первую характеристику сигнала, и второй участок имеет вторую характеристику сигнала. Расширяют частотную полосу первого участка с использованием первых параметров. Расширяют частотную полосу второго участка с использованием вторых параметров. Используют первый расширенный участок и второй расширенный участок для получения расширенного объединенного аудиосигнала. Сдвигают фазу по меньшей мере участка аудиосигнала для получения сигнала со сдвигом фазы. Фильтруют сигнал со сдвигом фазы с использованием высокочастотного фильтра для получения первого отфильтрованного сигнала. Фильтруют аудиосигнал с использованием низкочастотного фильтра для получения второго отфильтрованного сигнала. Объединяют отфильтрованные сигналы для получения улучшенного аудиосигнала. 5 н. и 16 з.п. ф-лы, 33 ил.

Изобретение относится к средствам для спектральной обработки аудиосигнала. Технический результат заключается в повышении эффективности обработки аудиосигнала. Получают спектр аудиосигнала и выявляют информацию, относящуюся к тонкой структуре спектра, причем тонкая структура спектра относится к локальным максимумам и/или минимумам спектра. Определяют сходство в упомянутой тонкой структуре. Причем определение сходства происходит с использованием первого сегмента и с использованием второго сегмента информации, относящейся к тонкой структуре, причем первый и второй сегменты сдвинуты на количество отсчетов спектра. Обеспечивают информацию, указывающую, что аудиосигнал содержит предварительно определенную характеристику, в зависимости от оценки сходства. 3 н. и 18 з.п. ф-лы, 33 ил.

Изобретение относится к средствам для постобработки звукового сигнала. Технический результат заключается в повышении эффективности постобработки звукового согнала. Преобразуют звуковой сигнал в спектральное представление, содержащее последовательность спектральных кадров. Рассчитывают прогнозные данные фильтра для прогнозирования по частоте в пределах спектрального кадра. Профилируют, в ответ на прогнозные данные фильтра, спектральный кадр для улучшения качества всплескового участка в пределах спектрального кадра. Преобразуют последовательность спектральных кадров, содержащую профилированный спектральный кадр, во временную область. Рассчитывают автокорреляционный сигнал. Производят оконную обработку автокорреляционного сигнала с помощью окна, имеющего первую постоянную времени, чтобы получить первый результирующий сигнал. Рассчитывают первые прогнозные данные фильтра из первого результирующего сигнала. Производят оконную обработку автокорреляционного сигнала с помощью окна, имеющего вторую постоянную времени, чтобы получить второй результирующий сигнал. Рассчитывают вторые прогнозные данные фильтра из второго результирующего сигнала. 3 н. и 17 з.п. ф-лы, 62 ил.

Изобретение относится к средствам для обработки звукового сигнала. Технический результат заключается в повышении эффективности обработки звукового сигнала. Формируют (110) временную последовательность блоков значений аудиосигналов. Определяют (120) блочную характеристику текущего блока аудиосигнала и определяют среднюю характеристику для группы блоков, причем группа блоков содержит, по меньшей мере, два блока. Разделяют (130) текущий блок на фоновую часть и часть переднего плана в ответ на соотношение блочной характеристики текущего блока и средней характеристики группы блоков. При этом сигнал (140) фонового компонента содержит фоновую часть текущего блока и сигнал (150) компонента переднего плана содержит часть переднего плана текущего блока. 3 н. и 20 з.п. ф-лы, 15 ил.

Изобретение относится к средствам для повышающего и понижающего микширования. Технический результат заключается в повышении эффективности обработки многоканальных данных. Вычисляют микшированный с понижением сигнал на основе многоканального сигнала, причем вычисление содержит вычисление понижающего микширования с использованием абсолютной фазовой компенсации таким образом, что поворот фазы применяется только к каналу, имеющему более низкую энергию среди по меньшей мере двух каналов, или к каналу сильнее применяется поворот фазы, чем к каналу, имеющему более высокую энергию, при вычислении микшированного с понижением сигнала. Формируют выходной сигнал, который содержит информацию о микшированном с понижением сигнале. 6 н. и 30 з.п. ф-лы, 13 ил.

Изобретение относится к кодированию многоканального сигнала 100. Технический результат - улучшение концепции для обработки многоканальных данных. Для этого предусмотрено по меньшей мере два канала 101, 102 и устройство содержит понижающий микшер 120 для расчета сигнала 122 понижающего микширования из многоканального сигнала 100; вычислитель 140 параметров для расчета коэффициента 141 передачи побочного сигнала из первого канала 101 по меньшей мере из двух каналов и второго канала 102 по меньшей из мере двух каналов и для расчета коэффициента 142 передачи остаточного сигнала из первого канала 101 и второго канала 102; и выходной интерфейс 160 для формирования выходного сигнала, причем выходной сигнал содержит информацию о сигнале 122 понижающего микширования, а также о коэффициенте 141 передачи побочного сигнала и коэффициенте 142 передачи остаточного сигнала. 6 н. и 38 з.п. ф-лы, 17 ил.

Изобретение относится к средствам для определения характеристики, относящейся к искусственному ограничению частотной полосы аудиосигнала. Технический результат заключается в обеспечении обнаружения факта обработки аудиосигнала, которая могла внести артефакты в аудиосигнал, а также сокращение таких артефактов. Оценивают наклон спектра аудиосигнала для получения результата оценки наклона. Обеспечивают информацию, указывающую, что аудиосигнал содержит предварительно определенную характеристику, в зависимости от оценки результата оценки наклона. Обеспечивают информацию, указывающую, что аудиосигнал содержит предварительно определенную характеристику, посредством предоставления соответствующей информации, указывающей результат для кадра для множества кадров аудиосигнала для каждого из множества кадров, и получают множество результатов на основе множества кадров, и объединяют множество результатов для получения объединенного результата, пригодного для множества кадров. Исполняют медианную фильтрацию с использованием множества результатов для получения объединенного результата. 3 н. и 14 з.п., 33 ил.

Изобретение относится к аудиокодированию/аудиодекодированию. Технический результат – повышение точности воспроизведения аудиосигнала. Устройство содержит процессор параметров для вычисления информации микширования и процессор понижающего микширования, предназначенный для формирования одного или нескольких выходных аудиоканалов и для приема потока данных, содержащего транспортные аудиоканалы в транспортном аудиосигнале. Процессор параметров конфигурируется для приема информации понижающего микширования и для приема ковариационной информации, а также для вычисления информации микширования в зависимости от информации понижающего микширования и в зависимости от ковариационной информации. Процессор понижающего микширования конфигурируется для формирования одного или нескольких выходных аудиоканалов из транспортного аудиосигнала в зависимости от информации микширования. Ковариационная информация указывает информацию о разности уровней для одного из одного или нескольких сигналов аудиоканалов и дополнительно указывает информацию о разности уровней для одного из одного или нескольких сигналов аудиообъектов. 7 н. и 11 з.п. ф-лы, 10 ил.

Изобретение относится к акустике. Устройство для захвата звуковой информации из целевого местоположения содержит первый и второй формирователи луча, генератор сигнала. Причем первый и второй формирователи луча выполнены с возможностью записи звукового сигнала. Первый формирователь луча и второй формирователь луча расположены таким образом, что первая виртуальная прямая линия, которую определяют так, что она проходит через первый формирователь луча и целевое местоположение, и вторая виртуальная прямая линия не параллельны по отношению друг к другу. Причем генератор сигнала выполнен с возможностью генерации сигнала, основываясь на звуковом сигнале первого и второго формирователя луча, так, чтобы звуковой выходной сигнал содержал относительно больше звуковой информации из целевого местоположения по сравнению со звуковой информацией из целевого местоположения в звуковом сигнале первого и второго формирователей луча, Причем генератор сигнала содержит блок вычисления пересечения для генерации звукового выходного сигнала в спектральной области, основываясь на звуковых сигналах первого и второго формирователей луча, и причем блок вычисления пересечения выполнен с возможностью вычисления звукового выходного сигнала в спектральной области с помощью вычисления взаимной спектральной плотности звуковых сигналов. Технический результат - обеспечение улучшенного захвата звуковой информации. 3 н. и 10 з.п. ф-лы, 10 ил.

 


Наверх