Патенты автора ДИШ, Саша (DE)

Изобретение относится к области вычислительной техники для обработки аудиосигналов. Технический результат заключается в снижении задержки при обеспечении понижающего микширования к многоканальному аудиосигналу. Технический результат достигается за счет оценки весовых значений по частотным полосам для двух каналов, вычисления весовых значений по частотным полосам на основе целевого значения энергии для каждой частотной полосы таким образом, чтобы энергия в частотной полосе микшированного с понижением аудиосигнала находилась в заданном отношении к энергиям в тех же частотных полосах упомянутых по меньшей мере двух каналов; взвешивания представления в спектральной области двух каналов с использованием весовых значений по частотным полосам, чтобы получить взвешенные представления в спектральной области. 6 н. и 44 з.п. ф-лы, 14 ил.

Настоящее техническое решение относится к области вычислительной техники. Технический результат заключается в повышении качества восприятия посредством адаптивного к сигналу генерирования заполняющего промежутки контента или необработанного патч-контента для расчетного высокочастотного сигнала, которые адаптированы по восприятию к НЧ-сигналу. Технический результат достигается за счёт аудиопроцессора, который содержит: определитель огибающей для определения временной огибающей части исходного аудиосигнала; анализатор для анализа временной огибающей для определения значений признаков временной огибающей; синтезатор сигналов для генерирования сигнала синтеза, причем генерирование содержит размещение импульсов по отношению к определенным временным значениям, при этом импульсы взвешиваются с использованием весов, выведенных из амплитуд временной огибающей, связанных с временными значениями, в которые размещаются импульсы; и объединяющий блок для объединения, по меньшей мере, полосы сигнала синтеза, которая не включена в исходный аудиосигнал, и исходного аудиосигнала, для получения аудиосигнала с улучшенной частотной характеристикой. 3 н. и 17 з.п. ф-лы, 17 ил.

Изобретение относится к области вычислительной техники для обработки аудиоданных. Технический результат заключается в снижении вычислительной сложности при оценке подобия аудиосигналов. Технический результат достигается за счет этапов, на которых получают информацию модуляции, ассоциированную с сигналами огибающей для множества частотных диапазонов модуляции, при этом информация модуляции описывает временную модуляцию сигналов огибающей для множества частотных диапазонов модуляции и содержит множество значений, которые ассоциированы с различными частотами модуляции, которые присутствуют в соответствующем сигнале огибающей; и сравнивают полученную информацию модуляции с опорной информацией модуляции, ассоциированной с опорным аудиосигналом, чтобы получать информацию относительно подобия между входным аудиосигналом и опорным аудиосигналом. 10 н. и 20 з.п. ф-лы, 16 ил., 2 табл.

Изобретение относится к области вычислительной техники для обработки аудиоданных. Технический результат заключается в обеспечении максимального снижения уровня шума при условии отсутствия артефактов. Технический результат достигается за счет определения оцененного целевого сигнала, который зависит от входного аудиосигнала, определения результирующих значений в зависимости от оцененного качества звука оцененного целевого сигнала, чтобы получить одно или несколько значений параметров, и формирования отделенного аудиосигнала в зависимости от одного или нескольких значений параметров и в зависимости от одного из оцененного целевого сигнала, и входного аудиосигнала, и оцененного разностного сигнала, причем оцененный разностный сигнал является оценкой сигнала, который содержит только участок разностного аудиосигнала, причем формирование отделенного аудиосигнала проводят в зависимости от значений параметров и в зависимости от линейной комбинации оцененного целевого сигнала и входного аудиосигнала; или при этом формирование отделенного аудиосигнала проводят в зависимости от значений параметров и в зависимости от линейной комбинации оцененного целевого сигнала и оцененного разностного сигнала. 3 н. и 13 з.п. ф-лы, 6 ил.

Изобретение относится к области вычислительной техники для обработки аудиоданных. Технический результат заключается в повышении точности многосигнального кодирования или декодирования. Технический результат достигается за счет вычисления информации о средней энергии предварительно обработанных аудиосигналов; вычисления информации об энергии каждого предварительно обработанного аудиосигнала, вычисления значения нормализации широкополосной энергии для конкретного предварительно обработанного аудиосигнала на основании информации о средней энергии и информации об энергии упомянутого конкретного предварительно обработанного аудиосигнала; и выполнения нормализации широкополосной энергии по меньшей мере трех предварительно обработанных аудиосигналов с использованием значений нормализации широкополосной энергии для конкретных предварительно обработанных аудиосигналов, причем каждый предварительно обработанный аудиосигнал имеет нормализованную энергию. 6 н. и 38 з.п. ф-лы, 17 ил.

Настоящее техническое решение относится к области вычислительной техники для обработки аудиоданных. Технический результат заключается в уменьшении наложения спектров во временной области аудиосигнала за счет отбрасывания избыточной и перцепционно нерелевантной информации. Технический результат достигается за счёт вариантов аудиопроцессора для обработки аудиосигнала, с тем чтобы получать субполосное представление аудиосигнала с возможностью выполнять каскадное перекрывающееся критически дискретизированное преобразование, для частично перекрывающихся блоков выборок аудиосигнала; при этом выполнение каскадного перекрывающегося критически дискретизированного преобразования содержит сегментацию набора элементов разрешения; при этом выполнение каскадного перекрывающегося критически дискретизированного преобразования с сегментацией набора элементов разрешения, где наборы элементов разрешения обрабатываются со вторым перекрывающимся критически дискретизированным преобразованием из каскадного перекрывающегося критически дискретизированного преобразования. 12 н. и 14 з.п. ф-лы, 27 ил.

Изобретение относится к области обработки аудиоданных. Технический результат заключается в повышении точности декодирования кодированного многоканального аудиосигнала. Технический результат достигается за счет декодирования кодированного базового канала, чтобы получать декодированный базовый канал, выполнения декорреляционной фильтрации, по меньшей мере, части декодированного базового канала, чтобы получать заполняющий сигнал, и выполнения многоканальной обработки с использованием спектрального представления декодированного базового канала и спектрального представления заполняющего сигнала, при этом декорреляционная фильтрация представляет собой широкополосную фильтрацию, и многоканальная обработка содержит этап, на котором применяют узкополосную обработку к спектральному представлению декодированного базового канала и спектральному представлению заполняющего сигнала. 3 н. и 35 з.п. ф-лы, 19 ил.

Изобретение относится к средствам для постобработки звукового сигнала. Технический результат заключается в повышении эффективности обработки. Преобразуют звуковой сигнал во время-частотное представление. Оценивают место всплеска по времени для всплескового участка с использованием звукового сигнала или время-частотного представления. Манипулируют время-частотным представлением для ослабления или устранения упреждающего эха во время–частотном представлении в расположении по времени перед местом всплеска. При этом оценивают пороговые значения упреждающего эха применительно к спектральным значениям во время-частотном представлении в пределах длительности упреждающего эха, причем пороговые значения упреждающего эха указывают пороговые значения амплитуды соответствующих спектральных значений после ослабления или устранения упреждающего эха. При этом определяют пороговые значения упреждающего эха с использованием взвешивающей кривой, имеющей возрастающую характеристику от начала длительности упреждающего эха до места всплеска. Манипулируют время-частотным представлением для выполнения профилирования время–частотного представления в месте всплеска, чтобы усилить выпад всплесковой части. 3 н. и 12 з.п. ф-лы, 61 ил., 1 табл.

Изобретение относится к средствам для обработки аудио. Технический результат заключается в повышении эффективности аудиообработки. Формируют временную последовательность блоков значений аудиосигналов. Определяют характеристику текущего блока аудиосигнала и определяют изменчивость характеристики в группе блоков, содержащей по меньшей мере два блока из упомянутой последовательности блоков. Разделяют текущий блок на фоновую часть и часть переднего плана. При этом пороговое значение разделения определяется на основе упомянутой изменчивости. При этом текущий блок разделяется на сигнал фонового компонента и сигнал компонента переднего плана, когда характеристика текущего блока находится в предварительно определенной взаимосвязи с пороговым значением разделения. Или при этом полный текущий блок определяется в качестве сигнала компонента переднего плана, когда характеристика текущего блока находится в предварительно определенной взаимосвязи с пороговым значением разделения. Или при этом определяют то, что полный текущий блок определяется в качестве сигнала фонового компонента, когда характеристика текущего блока не находится в предварительно определенной взаимосвязи с пороговым значением разделения. 3 н. и 18 з.п. ф-лы, 15 ил.

Изобретение относится к средствам для обработки аудиосигнала. Технический результат заключается в повышении эффективности обработки аудиосигнала. Отделяют первый участок спектра аудиосигнала от второго участка спектра аудиосигнала, первый участок имеет первую характеристику сигнала, и второй участок имеет вторую характеристику сигнала. Расширяют частотную полосу первого участка с использованием первых параметров. Расширяют частотную полосу второго участка с использованием вторых параметров. Используют первый расширенный участок и второй расширенный участок для получения расширенного объединенного аудиосигнала. Сдвигают фазу по меньшей мере участка аудиосигнала для получения сигнала со сдвигом фазы. Фильтруют сигнал со сдвигом фазы с использованием высокочастотного фильтра для получения первого отфильтрованного сигнала. Фильтруют аудиосигнал с использованием низкочастотного фильтра для получения второго отфильтрованного сигнала. Объединяют отфильтрованные сигналы для получения улучшенного аудиосигнала. 5 н. и 16 з.п. ф-лы, 33 ил.

Изобретение относится к средствам для спектральной обработки аудиосигнала. Технический результат заключается в повышении эффективности обработки аудиосигнала. Получают спектр аудиосигнала и выявляют информацию, относящуюся к тонкой структуре спектра, причем тонкая структура спектра относится к локальным максимумам и/или минимумам спектра. Определяют сходство в упомянутой тонкой структуре. Причем определение сходства происходит с использованием первого сегмента и с использованием второго сегмента информации, относящейся к тонкой структуре, причем первый и второй сегменты сдвинуты на количество отсчетов спектра. Обеспечивают информацию, указывающую, что аудиосигнал содержит предварительно определенную характеристику, в зависимости от оценки сходства. 3 н. и 18 з.п. ф-лы, 33 ил.

Изобретение относится к средствам для постобработки звукового сигнала. Технический результат заключается в повышении эффективности постобработки звукового согнала. Преобразуют звуковой сигнал в спектральное представление, содержащее последовательность спектральных кадров. Рассчитывают прогнозные данные фильтра для прогнозирования по частоте в пределах спектрального кадра. Профилируют, в ответ на прогнозные данные фильтра, спектральный кадр для улучшения качества всплескового участка в пределах спектрального кадра. Преобразуют последовательность спектральных кадров, содержащую профилированный спектральный кадр, во временную область. Рассчитывают автокорреляционный сигнал. Производят оконную обработку автокорреляционного сигнала с помощью окна, имеющего первую постоянную времени, чтобы получить первый результирующий сигнал. Рассчитывают первые прогнозные данные фильтра из первого результирующего сигнала. Производят оконную обработку автокорреляционного сигнала с помощью окна, имеющего вторую постоянную времени, чтобы получить второй результирующий сигнал. Рассчитывают вторые прогнозные данные фильтра из второго результирующего сигнала. 3 н. и 17 з.п. ф-лы, 62 ил.

Изобретение относится к средствам для обработки звукового сигнала. Технический результат заключается в повышении эффективности обработки звукового сигнала. Формируют (110) временную последовательность блоков значений аудиосигналов. Определяют (120) блочную характеристику текущего блока аудиосигнала и определяют среднюю характеристику для группы блоков, причем группа блоков содержит, по меньшей мере, два блока. Разделяют (130) текущий блок на фоновую часть и часть переднего плана в ответ на соотношение блочной характеристики текущего блока и средней характеристики группы блоков. При этом сигнал (140) фонового компонента содержит фоновую часть текущего блока и сигнал (150) компонента переднего плана содержит часть переднего плана текущего блока. 3 н. и 20 з.п. ф-лы, 15 ил.

Изобретение относится к области обработки аудиосигналов. Технический результат заключается в минимизации типичного подавления сигнала и нестабильностей, наблюдаемых в традиционном понижающем микшировании. Технический результат достигается за счет вычисления сигнала неполного понижающего микширования из двух каналов, суммируя два канала, так чтобы выполнялось предопределенное соотношение энергий или соотношение амплитуд между двумя каналами многоканального сигнала и каналом неполного понижающего микширования, когда упомянутые два канала совпадают по фазе и так что потери энергии или потери амплитуды создаются в сигнале неполного понижающего микширования относительно упомянутых по меньшей мере двух каналов, когда упомянутые по меньшей мере два канала не совпадают по фазе, вычисления дополняющего сигнала из многоканального сигнала, причем дополняющий сигнал отличен от сигнала неполного понижающего микширования, и суммирования сигнала неполного понижающего микширования и дополняющего сигнала, чтобы получать сигнал понижающего микширования многоканального сигнала. 9 н. и 10 з.п. ф-лы, 24 ил.

Изобретение для кодирования аудиосигналов. Технический результат заключается в повышении эффективности кодирования. Осуществляют базовое кодирование первых аудиоданных в первой спектральной полосе. Осуществляют параметрическое кодирование вторых аудиоданных во второй спектральной полосе, отличающейся от первой спектральной полосы. Анализируют первые аудиоданные в первой спектральной полосе для получения первого результата анализа и анализируют вторые аудиоданные во второй спектральной полосе для получения второго результата анализа. Вычисляют значение компенсации с использованием первого результата анализа и второго результата анализа. Вычисляют параметр из вторых аудиоданных во второй спектральной полосе с использованием значения компенсации. Параметрически кодируют третьи аудиоданные в третьей спектральной полосе. Анализируют третьи аудиоданные в третьей спектральной полосе для получения третьего результата анализа. Обнаруживают, с использованием по меньшей мере третьего результата анализа, должна ли третья спектральная полоса быть скомпенсирована или нет. Вычисляют дополнительный параметр из третьих аудиоданных в третьей спектральной полосе без какого-либо значения компенсации, когда на этапе обнаружения обнаруживают, что третья спектральная полоса не должна быть скомпенсирована. 6 н. и 20 з.п. ф-лы, 16 ил.

Изобретение относится к средствам для определения характеристики, относящейся к искусственному ограничению частотной полосы аудиосигнала. Технический результат заключается в обеспечении обнаружения факта обработки аудиосигнала, которая могла внести артефакты в аудиосигнал, а также сокращение таких артефактов. Оценивают наклон спектра аудиосигнала для получения результата оценки наклона. Обеспечивают информацию, указывающую, что аудиосигнал содержит предварительно определенную характеристику, в зависимости от оценки результата оценки наклона. Обеспечивают информацию, указывающую, что аудиосигнал содержит предварительно определенную характеристику, посредством предоставления соответствующей информации, указывающей результат для кадра для множества кадров аудиосигнала для каждого из множества кадров, и получают множество результатов на основе множества кадров, и объединяют множество результатов для получения объединенного результата, пригодного для множества кадров. Исполняют медианную фильтрацию с использованием множества результатов для получения объединенного результата. 3 н. и 14 з.п., 33 ил.

Заявленное устройство относится к устройству для анализа спектрограммы уровня аудиосигнала. Устройство содержит модуль определения изменения частоты, выполненный с возможностью определять изменение частоты для каждого частотно-временного бина из множества частотно-временных бинов спектрограммы уровня аудиосигнала в зависимости от спектрограммы уровня аудиосигнала. Кроме того, устройство содержит классификатор, выполненный с возможностью назначать каждый частотно-временной бин из множества частотно-временных бинов группе компонентов сигнала из двух или более групп компонентов сигнала в зависимости от изменения частоты, определенного для упомянутого частотно-временного бина. Устройство обеспечивает усовершенствованные принципы обработки аудиосигнала. 3 н. и 14 з.п. ф-лы, 6 ил.

Изобретение относится к аудиокодированию/аудиодекодированию. Технический результат – повышение точности воспроизведения аудиосигнала. Устройство содержит процессор параметров для вычисления информации микширования и процессор понижающего микширования, предназначенный для формирования одного или нескольких выходных аудиоканалов и для приема потока данных, содержащего транспортные аудиоканалы в транспортном аудиосигнале. Процессор параметров конфигурируется для приема информации понижающего микширования и для приема ковариационной информации, а также для вычисления информации микширования в зависимости от информации понижающего микширования и в зависимости от ковариационной информации. Процессор понижающего микширования конфигурируется для формирования одного или нескольких выходных аудиоканалов из транспортного аудиосигнала в зависимости от информации микширования. Ковариационная информация указывает информацию о разности уровней для одного из одного или нескольких сигналов аудиоканалов и дополнительно указывает информацию о разности уровней для одного из одного или нескольких сигналов аудиообъектов. 7 н. и 11 з.п. ф-лы, 10 ил.

Изобретение относится к области радиосвязи и предназначено для кодирования, обработки и декодирования аудиосигнала, для получения восстановленной огибающей аудиосигнала. Технический результат – предоставление улучшенных концепций для кодирования и декодирования огибающей аудиосигнала и получение гладкой и точной спектральной огибающей аудиосигнала. Устройство содержит восстановитель огибающей сигнала для генерации восстановленной огибающей. Восстановитель огибающей сигнала сконфигурирован для генерации восстановленной огибающей аудиосигнала так, что одна или более разделяющих точек разделяют восстановленную огибающую аудиосигнала на два или более сегмента огибающей сигнала. Правило присвоения определяет значение сегмента огибающей сигнала для каждого сегмента огибающей сигнала из упомянутых двух или более сегментов огибающей сигнала в зависимости от упомянутого сегмента огибающей сигнала. Кроме того, восстановитель огибающей сигнала сконфигурирован для генерации восстановленной огибающей аудиосигнала так, что для каждого из двух или более сегментов огибающей сигнала абсолютное значение данного сегмента огибающей сигнала больше, чем половина абсолютного значения сегмента огибающей сигнала каждого из других сегментов огибающей сигнала. 11 н. и 16 з.п. ф-лы, 2 табл., 19 ил.

Изобретение относится к обработке аудиосигнала и предназначено для кодирования аудиообъектов с применением адаптируемого к аудиообъекту индивидуального временно-частотного разрешения. Технический результат – повышение качества воспроизводимого аудиосигнала. Аудиодекодер декодирует многообъектный аудиосигнал, состоящий из сигнала X понижающего микширования и дополнительной информации PSI. Дополнительная информация содержит дополнительную информацию PSIi для аудиообъекта si во временно-частотной области R(tR,fR) и информацию TFRIi, указывающую временно-частотное разрешение TFRh дополнительной информации для аудиообъекта si во временно-частотной области R(tR,fR). Аудиодекодер содержит блок определения временно-частотного разрешения, выполненный с возможностью определения информации TFRIi временно-частотного разрешения из дополнительной информации PSI для аудиообъекта si., блок выделения объекта, выполненный с возможностью выделения аудиообъекта si из сигнала X понижающего микширования с использованием дополнительной информации в соответствии с временно-частотным разрешением TFRIi. 11 н. и 11 з.п. ф-лы, 14 ил.

 


Наверх