Патенты автора ХЕЛЛМУТ Оливер (DE)

Изобретение относится к декодеру аудиосигнала, генерирующему на выходе представление сигнала повышающего микширования на базе представления сигнала понижающего микширования и объектно-ориентированной параметрической информации. Технический результат - повышение точности воспроизведения аудиосигналов. Для этого декодер аудиосигнала содержит разделитель объектов, предназначенный для разложения представления сигнала понижающего микширования на первую аудиоинформацию, описывающую первую комбинацию из одного или более аудиообъектов первого типа, и вторую аудиоинформацию, описывающую вторую комбинацию из одного или более аудиообъектов второго типа, в зависимости от представления сигнала понижающего микширования с использованием, по меньшей мере, части объектно-ориентированной параметрической информации, процессор аудиосигналов, предназначенный для приема второй аудиоинформации и обработки второй аудиоинформации, исходя из объектно-ориентированной параметрической информации, с получением обработанной версии второй аудиоинформации, комбинатор аудиосигнала, выполняющий объединение первой аудиоинформации с обработанной версией второй аудиоинформации с формированием на выходе представления сигнала повышающего микширования. 12 н. и 27 з.п. ф-лы, 22 ил.

Описывается бинауральная визуализация многоканального звукового сигнала в бинауральный выходной сигнал (24). Многоканальный звуковой сигнал включает сигнал стерео понижающего микширования (18), в который множество звуковых сигналов микшируется с понижением; и дополнительная информация включает информацию о понижающем микшировании (DMG, DCLD), показывающую для каждого звукового сигнала, до какой степени соответствующий звуковой сигнал был микширован в первый канал и второй канал сигнала стерео понижающего микширования (18) соответственно, а также информацию об уровне объекта множества звуковых сигналов и информацию о межобъектной взаимной корреляции, описывающую сходство между парами звуковых сигналов множества звуковых сигналов. Основанный на первом предписании визуализации, предварительный бинауральный сигнал (54) вычисляется из первого и второго каналов сигнала стерео понижающего микширования (18). Декоррелированный сигнал генерируется как перцепционный эквивалент моно понижающего микширования (58) из первого и второго каналов сигнала стерео понижающего микширования (18), являющийся, однако, декодированным до моно понижающего микширования (58). Технический результат - улучшение бинауральной визуализации при уничтожении ограничения в отношении свободы создания сигнала понижающего микширования из оригинальных звуковых сигналов. 3 н. и 8 з.п. ф-лы, 6 ил., 3 табл.

Устройства для обработки аудиосигнала с целью получения контрольной информации для фильтра повышения разборчивости речи (12) включает в себя устройство выделения признаков (14) для извлечения по крайней мере одной характеристики в полосе частот множества частотных диапазонов кратковременного спектрального представления множества кратковременных спектральных представлений, где по крайней мере одна характеристика представляет спектральную форму кратковременного спектрального представления в полосе частот. Устройство дополнительно содержит устройство объединения признаков (15) для объединения по крайней мере одной характеристики для каждой полосы частот с использованием параметров комбинирования для получения контрольной информации для фильтра повышения разборчивости речи для части времени звукового сигнала. Устройство объединения признаков может использовать регрессионный метод нейронных сетей, который основан на параметрах комбинирования, полученных в фазе подготовки для нейронной сети. Технический результат - повышение разборчивости речи. 7 н.п. и 10 з.п. ф-лы, 10 ил.

Устройство (100) для генерирования многоканального звукового сигнала (142), основанного на входном звуковом сигнале (102), включает средство повышающего микширования главного сигнала (110), секционный (сегментный) селектор (120), средство повышающего микширования секционного сигнала (110) и объединитель (140). Средство повышающего микширования секционного сигнала (110) формируется, чтобы обеспечить главный многоканальный звуковой сигнал (112), основанный на входном звуковом сигнале (102). Секционный селектор (120) формируется, чтобы выбрать или не выбрать секцию входного звукового сигнала (102), основанного на анализе входного звукового сигнала (102). Выбранная секция входного звукового сигнала (102), обработанная выбранная секция входного звукового сигнала (102) или опорный сигнал, связанный с выбранной секцией входного звукового сигнала (102), предоставляется как секционный сигнал (122). Средство повышающего микширования секционного сигнала (130) формируется, чтобы обеспечить секционный сигнал повышающего микширования (132), основанный на секционном сигнале (122), а объединитель (140) формируется, чтобы совместить главный многоканальный звуковой сигнал (112) и секционный сигнал повышающего микширования (132), чтобы получить многоканальный звуковой сигнал (142). Технический результат - улучшение гибкости и качества звука. 3 н. и 9 з.п. ф-лы, 10 ил.

 


Наверх