Устройство и способ для кодирования части аудиосигнала с использованием обнаружения неустановившегося состояния и результата качества

Авторы патента:

ФУКС Гийом (DE)

МАРКОВИЧ Горан (DE)

ХЕЛЬМРИХ Кристиан (DE)

G10L19/00 - Техника анализа-синтеза речи для уменьшения избыточности, например в вокодерах ; кодирование или декодирование речи

Владельцы патента RU 2573231:

ФРАУНХОФЕР-ГЕЗЕЛЛЬШАФТ ЦУР ФЕРДЕРУНГ ДЕР АНГЕВАНДТЕН ФОРШУНГ Е.Ф. (DE)

Изобретение относится к технологиям кодирования аудиосигналов. Техническим результатом является повышение эффективности кодирования аудиосигналов за счет определения алгоритма кодирования, исходя из обнаружения значения результата качества аудиосигнала и обнаружения неустановившегося состояния. Предложено устройство для кодирования части аудиосигнала для получения кодированного аудиосигнала для части аудиосигнала. Устройство содержит детектор неустановившегося состояния для обнаружения того, располагается ли неустановившийся сигнал в части аудиосигнала, чтобы получать результат обнаружения неустановившегося состояния. Устройство также содержит каскад кодировщика для выполнения первого алгоритма кодирования над аудиосигналом, чтобы получить первое значение результата качества адуиосигнала для упомянутой части аудиосигнала, при этом первый алгоритм кодирования имеет первую характеристику, и для выполнения второго алгоритма кодирования над аудиосигналом, чтобы получить второе значение результата качества аудиосигнала, при этом второй алгоритм кодирования имеет вторую характеристику, которая является отличной от первой характеристики. 3 н. и 12 з.п. ф-лы, 8 ил.

Настоящее изобретение относится к аудиокодированию и, в частности, к коммутируемому аудиокодированию, причем для разных временных частей кодированный сигнал генерируется с использованием разных алгоритмов кодирования.

Известны коммутируемые аудиокодеры, которые определяют разные алгоритмы кодирования для разных частей аудиосигнала. Примером является так называемый расширенный адаптивный многоскоростной широкополосный кодек или кодек AMR-WB+, определенный в международном стандарте 3GPP TS 26.290 V6.1.0 2004-12. В этой технической спецификации описывается принцип кодирования, который расширяет основанный на ACELP (алгебраическое линейное предсказание с кодовым возбуждением) кодек AMR-WB посредством добавления TCX (возбуждение с кодированным преобразованием), расширение полосы пропускания, и стерео. Аудиокодек AMR-WB+ обрабатывает входные кадры, равные 2048 выборкам, на внутренней частоте дискретизации F_S. Внутренняя частота дискретизации является ограниченной диапазоном от 12,800 до 38,400 Гц. Кадры из 2048 выборок разбиваются на два критически дискретизированных равных частотных диапазона. Это дает в результате два суперкадра из 1024 выборок, соответствующих низкочастотному (LF) и высокочастотному (HF) диапазонам. Каждый суперкадр разделяется на четыре кадра из 256 выборок. Дискретизация на внутренней частоте выборки получается посредством использования переменной схемы преобразования дискретизации, которая повторно дискретизирует входной сигнал. Сигналы LF и HF затем кодируются с использованием двух разных подходов. Сигнал LF кодируется и декодируется с использованием "базового" кодировщика/декодера, на основе коммутируемых ACELP и TCX. В режиме ACELP, используется стандартный кодек AMR-WB. Сигнал HF кодируется с помощью относительно малого количества битов (16 бит/кадр) с использованием способа расширения полосы пропускания (BWE).

Параметры, передаваемые от кодировщика к декодеру, являются битами выбора режима, параметрами LF и параметрами сигнала HF. Параметры для каждого суперкадра из 1024 выборок разбиваются на четыре пакета одинакового размера. Когда входной сигнал является стерео, левый и правый каналы объединяются в сигналы моно для кодирования ACELP-TCX, тогда как стереокодирование принимает оба входных канала. В структуре декодера AMR-WB+, диапазоны LF и HF декодируются отдельно. Затем диапазоны объединяются в наборе фильтров синтеза. Если вывод ограничен только моно, параметры стерео пропускаются и декодер работает в режиме моно.

При кодировании сигнала LF кодек AMR-WB+ применяет анализ LP (линейное предсказание) как для режима ACELP, так и режима TCX. Коэффициенты LP линейно интерполируются на каждом подкадре из 64 выборок. Окно анализа LP является полукосинусом длины 384 выборок. Режим кодирования выбирается на основе способа анализа посредством синтеза с обратной связью. Только кадры из 256 выборок рассматриваются для кадров ACELP, тогда как кадры 256, 512 или 1024 выборок возможны в режиме TCX. Кодирование ACELP состоит из анализа и синтеза с долгосрочным предсказанием (LTP) и возбуждения алгебраической кодовой книги. В режиме TCX перцепционно взвешенный сигнал обрабатывается в области преобразования. Преобразованный посредством преобразования Фурье взвешенный сигнал квантуется с использованием квантования многовесовой решетки расщепления (алгебраического векторного квантования). Преобразование вычисляется в окнах из 1024, 512 или 256 выборок. Сигнал возбуждения восстанавливается посредством обратной фильтрации квантованного взвешенного сигнала посредством обратного взвешивающего фильтра. Чтобы определять, должна ли некоторая часть аудиосигнала кодироваться с использованием режима ACELP или режима TCX, используется выбор режима с обратной связью или выбор режима без обратной связи. При выборе режима с обратной связью используются 11 последовательных испытаний. После испытания, выбор режима осуществляется между двумя режимами, подлежащими сравнению. Критерием выбора является среднее сегментное SNR (отношение сигнала к шуму) между взвешенным аудиосигналом и синтезированным взвешенным аудиосигналом. Следовательно, кодировщик выполняет полное кодирование в обоих алгоритмах кодирования, полное декодирование в соответствии с обоими алгоритмами кодирования, и, затем, результаты обеих операций кодирования/декодирования сравниваются с исходным сигналом. Следовательно, для каждого алгоритма кодирования, т.е. ACELP с одной стороны и TCX с другой стороны, получается значение сегментного SNR, и используется алгоритм кодирования, имеющий более хорошее значение сегментного SNR или имеющий более хорошее значение среднего сегментного SNR, определенное на кадре посредством усреднения по значениям сегментного SNR для индивидуальных подкадров.

Дополнительная схема коммутируемого аудиокодирования является так называемым кодером USAC (USAC = унифицированное кодирование аудио и речи). Этот алгоритм кодирования описывается в ISO/IEC 23003-3. Общая структура может быть описана следующим образом. Сначала имеется общая система предварительной/последующей обработки функционального блока объемного звука MPEG, чтобы обрабатывать стерео, или многоканальная обработка и блок улучшенного SBR, генерирующий параметрическое представление более высоких аудиочастот входного сигнала. Затем, имеется две ветви, одна, состоящая из тракта инструментов модифицированного улучшенного кодирования аудио (AAC), и другая, состоящая из тракта на основе кодирования с линейным предсказанием (области LP или LPC), который, в свою очередь, обеспечивает либо представление частотной области, либо представление временной области остатка LPC. Все передаваемые спектры для обоих, AAC и LPC, представляются в области MDCT, следуя за квантованием и арифметическим кодированием. Представление временной области использует схему кодирования с возбуждением ACELP. Функции декодера состоят в том, чтобы находить описание квантованных аудиоспектров или представление временной области в полезной нагрузке битового потока и чтобы декодировать квантованные значения и другую информацию восстановления. Следовательно, кодировщик вырабатывает два решения. Первое решение состоит в том, чтобы выполнять классификацию сигналов для решения касательно режима частотной области по отношению к области линейного предсказания. Второе решение состоит в том, чтобы определять, внутри области линейного предсказания (LPD), часть сигнала должна кодироваться с использованием ACELP или TCX.

Для применения схемы коммутируемого аудиокодирования в сценариях, где является необходимой очень низкая задержка, конкретное внимание должно уделяться частям кодирования на основе преобразования, так как эти части кодирования вводят некоторую задержку, которая зависит от длины преобразования и формы окна. Поэтому принцип кодирования USAC не является подходящим для приложений с очень низкой задержкой вследствие того, что ветвь модифицированного кодирования AAC имеет значительную длину преобразования и адаптацию длины (также известную как коммутация блоков), включая сюда переходные окна.

С другой стороны, было найдено, что принцип кодирования AMR-WB+ является проблематичным из-за решения на стороне кодировщика относительно того, должен ли использоваться ACELP или TCX. ACELP обеспечивает хорошую эффективность кодирования, но может давать результатом значительные проблемы качества аудио, когда часть сигнала не является подходящей для режима кодирования ACELP. Следовательно, по причинам качества могут склоняться использовать TCX всякий раз, когда входной сигнал не содержит речь. Однако чрезмерное использование TCX при низких скоростях передачи битов дает в результате проблемы скорости передачи битов, так как TCX обеспечивает относительно низкую эффективность кодирования. Поэтому, когда в большей степени имеется ориентация на эффективность кодирования, могут использовать ACELP всякий раз, когда возможно, но, как утверждалось ранее, это может давать результатом проблемы качества аудио вследствие того факта, что ACELP не является оптимальным, например, для музыкальных и аналогичных стационарных сигналов.

Вычисление сегментного SNR является мерой качества, которая определяет более хороший режим кодирования на основе только результата, т.е. является ли SNR между исходным сигналом или кодированным/декодированным сигналом более хорошим, так что используется алгоритм кодирования, дающий результатом более хорошее SNR. Это, однако, всегда должно работать при ограничениях скорости передачи битов. Поэтому, было найдено, что использование только меры качества, такой как, например, мера сегментного SNR не всегда дает в результате наилучший компромисс между качеством и скоростью передачи битов.

Целью настоящего изобретения является обеспечить улучшенный принцип для кодирования части аудиосигнала.

Эта цель достигается посредством устройства для кодирования части аудиосигнала по пункту 1 формулы изобретения или способа для кодирования части аудиосигнала по п. 14 формулы изобретения.

Настоящее изобретение основывается на обнаружении, что более хорошее решение выбора между первым алгоритмом кодирования, подходящим для более неустановившихся (неустановившихся) частей сигнала, и вторым алгоритмом кодирования, подходящим для более стационарных частей сигнала, может получаться, когда решение выбора основывается не только на мере качества, но, дополнительно, на результате обнаружения неустановившегося состояния. В то время как мера качества рассматривает только результат цепи кодирования/декодирования по отношению к исходному сигналу, результат обнаружения неустановившегося состояния дополнительно полагается на анализ одного исходного входного аудиосигнала. В результате было обнаружено, что комбинация обеих мер, т.е. результата качества с одной стороны и результата обнаружения неустановившегося состояния с другой стороны для окончательного определения того, какая часть аудиосигнала должна кодироваться посредством какого алгоритма кодирования, ведет к улучшенному компромиссу между эффективностью кодирования с одной стороны и качеством аудио с другой стороны.

Устройство для кодирования части аудиосигнала, чтобы получать кодированный аудиосигнал для части аудиосигнала, содержит детектор неустановившегося состояния для обнаружения, располагается ли неустановившийся сигнал в части аудиосигнала, чтобы получать результат обнаружения неустановившегося состояния. Устройство дополнительно содержит каскад кодировщика для выполнения первого алгоритма кодирования над аудиосигналом, при этом первый алгоритм кодирования имеет первую характеристику, и для выполнения второго алгоритма кодирования над аудиосигналом, при этом второй алгоритм кодирования имеет вторую характеристику, которая является отличной от первой характеристики. В одном варианте осуществления, первая характеристика, связанная с первым алгоритмом кодирования, является более подходящей для более неустановившегося сигнала, и вторая характеристика кодирования, связанная со вторым алгоритмом кодирования, является более подходящей для более стационарных аудиосигналов. В качестве примера, первый алгоритм кодирования является алгоритмом кодирования ACELP и второй алгоритм кодирования является алгоритмом кодирования TCX, который может основываться на модифицированном дискретном косинусном преобразовании, преобразовании FFT или любом другом преобразовании или наборе фильтров. Дополнительно, процессор обеспечивается для определения того, какой алгоритм кодирования дает в результате кодированный аудиосигнал, который является более хорошей аппроксимацией для части аудиосигнала, чтобы получать результат качества. Дополнительно, обеспечивается контроллер, где контроллер сконфигурирован для определения, генерировать ли кодированный аудиосигнал для части аудиосигнала посредством либо первого алгоритма кодирования, либо второго алгоритма кодирования. В соответствии с изобретением, контроллер сконфигурирован для выполнения этого определения не только на основе результата качества, но, дополнительно, на основе результата обнаружения неустановившегося состояния.

В одном варианте осуществления, контроллер сконфигурирован для определения второго алгоритма кодирования, хотя результат качества показывает более хорошее качество для первого алгоритма кодирования, когда результат обнаружения неустановившегося состояния показывает установившийся (не переходный) сигнал. Дополнительно, контроллер сконфигурирован для определения первого алгоритма кодирования, хотя результат качества показывает более хорошее качество для второго алгоритма кодирования, когда результат обнаружения неустановившегося состояния показывает неустановившийся сигнал.

В дополнительном варианте осуществления, это определение, в котором результат неустановившегося состояния может отрицать результат качества, улучшается с использованием гистерезисной функции, так что второй алгоритм кодирования определяется только тогда, когда количество более ранних частей сигнала, для которых был определен первый алгоритм кодирования, является более маленьким, чем предопределенное количество. Аналогично, контроллер сконфигурирован с возможностью определять только первый алгоритм кодирования, когда количество более ранних частей сигнала, для которых в прошлом был определен второй алгоритм кодирования, является более маленьким, чем предопределенное количество. Преимущество от гистерезисной обработки состоит в том, что количество переключений между режимами кодирования уменьшается для некоторых входных сигналов. Слишком частое переключение в критических точках в сигнале может генерировать слышимые артефакты особенно для низких скоростей передачи битов. Вероятность таких артефактов уменьшается посредством реализации гистерезиса.

В дополнительном варианте осуществления, предпочтение отдается результату качества по отношению к результату обнаружения неустановившегося состояния, когда результат качества показывает сильное преимущество качества для одного алгоритма кодирования. Затем, алгоритм кодирования, имеющий намного более хороший результат качества, чем другой алгоритм кодирования, выбирается независимо от того, является ли сигнал неустановившимся сигналом или нет. С другой стороны, результат обнаружения неустановившегося состояния может становиться решающим, когда различие в качестве между обоими алгоритмами кодирования не является настолько высоким. С этой целью, является предпочтительным определять не только бинарный результат качества, но количественный результат качества. Бинарный результат качества показывает только то, какой алгоритм кодирования дает в результате более хорошее качество, тогда как количественный результат качества не только определяет то, какой алгоритм кодирования дает в результате более хорошее качество, но и насколько более хорошим является соответствующий алгоритм кодирования. С другой стороны, могут также использовать количественный результат обнаружения неустановившегося состояния, но, в основном, бинарный результат обнаружения неустановившегося состояния также является достаточным.

Следовательно, настоящее изобретение обеспечивает конкретное преимущество по отношению к хорошему компромиссу между скоростью передачи битов с одной стороны и качеством с другой стороны, так как, для неустановившихся сигналов, выбирается алгоритм кодирования, дающий результатом меньшее качество. Когда результат качества отдает предпочтение, например, решению выбора TCX, тем не менее выбирается режим ACELP, что может давать результатом слегка уменьшенное качество аудио, но, в конце, дает в результате более высокую эффективность кодирования, связанную с использованием режима ACELP.

Когда, с другой стороны, результат качества отдает предпочтение кадру ACELP, тем не менее, для установившихся сигналов принимается решение выбора TCX. Следовательно, слегка меньшая эффективность кодирования принимается в пользу более хорошего качества аудио.

Таким образом, настоящее изобретение дает в результате улучшенный компромисс между качеством и скоростью передачи битов вследствие того факта, что рассматривается не только качество кодированного и снова декодированного сигнала, но, в дополнение, также фактически подлежащий кодированию входной сигнал анализируется по отношению к его характеристике переходного процесса и результат этого анализа неустановившегося состояния используется, чтобы дополнительно влиять на решение выбора алгоритма, более подходящего для неустановившихся сигналов, или алгоритма, более подходящего для стационарных сигналов.

Дополнительные варианты осуществления настоящего изобретения далее иллюстрируются с помощью ссылки на сопровождающие чертежи, на которых:

Фиг. 1 иллюстрирует блок-схему устройства для кодирования части аудиосигнала в соответствии с одним вариантом осуществления;

Фиг. 2 иллюстрирует таблицу для двух разных алгоритмов кодирования и сигналы, для которых они являются подходящими;

Фиг. 3 иллюстрирует обзор в отношении условия качества, условия неустановившегося состояния и условия гистерезиса, которые могут применяться независимо друг от друга, но которые, предпочтительно, применяются объединенно;

Фиг. 4 иллюстрирует таблицу состояний, показывающую, выполняется ли переключение или нет для разных ситуаций;

Фиг. 5 иллюстрирует блок-схему последовательности операций для определения результата неустановившегося состояния в одном варианте осуществления;

Фиг. 6А иллюстрирует блок-схему последовательности операций для определения результата качества в одном варианте осуществления;

Фиг. 6В иллюстрирует больше деталей в отношении результата качества из фиг. 6a; и

Фиг. 7 иллюстрирует более подробно блок-схему устройства для кодирования в соответствии с одним вариантом осуществления.

Фиг. 1 иллюстрирует устройство для кодирования части аудиосигнала, обеспечиваемого на входной линии 10. Часть аудиосигнала вводится в детектор 12 неустановившегося состояния для обнаружения, располагается ли неустановившийся сигнал в части аудиосигнала, чтобы получать результат обнаружения неустановившегося состояния на линии 14. Дополнительно, обеспечивается каскад 16 кодировщика, при этом каскад кодировщика сконфигурирован для выполнения первого алгоритма кодирования над аудиосигналом, при этом первый алгоритм кодирования имеет первую характеристику. Дополнительно, каскад 16 кодировщика сконфигурирован для выполнения второго алгоритма кодирования над аудиосигналом, при этом второй алгоритм кодирования имеет вторую характеристику, которая является отличной от первой характеристики.

Дополнительно, устройство содержит процессор 18 для определения того, какой алгоритм кодирования из первого и второго алгоритмов кодирования дает в результате кодированный аудиосигнал, который является более хорошей аппроксимацией для части исходного аудиосигнала. Процессор 18 генерирует результат качества на основе этого определения на линии 20. Результат качества на линии 20 и результат обнаружения неустановившегося состояния на линии 14, оба, обеспечиваются в контроллер 22. Контроллер 22 сконфигурирован с возможностью определения того, генерировать ли кодированный аудиосигнал для части аудиосигнала посредством либо первого алгоритма кодирования, либо второго алгоритма кодирования. Для этого определения используются не только результат 20 качества, но также результат 14 обнаружения неустановившегося состояния. Дополнительно, необязательно обеспечивается выходной интерфейс 24, при этом выходной интерфейс выводит кодированный аудиосигнал как, например, битовый поток или другое представление кодированного сигнала, по линии 26.

В одном варианте осуществления там, где каскад 16 кодировщика выполняет обработку анализа посредством синтеза, каскад 16 кодировщика принимает ту же часть аудиосигнала и кодирует часть этого аудиосигнала посредством первого алгоритма кодирования, чтобы получать первое кодированное представление части аудиосигнала. Дополнительно, каскад кодировщика генерирует кодированное представление той же части аудиосигнала с использованием второго алгоритма кодирования. Дополнительно, каскад 16 кодировщика содержит, в этой обработке анализа посредством синтеза, декодеры для обоих первого алгоритма кодирования и второго алгоритма кодирования. Один соответствующий декодер декодирует первое кодированное представление с использованием алгоритма декодирования, связанного с первым алгоритмом кодирования. Дополнительно, обеспечивается декодер для выполнения дополнительного алгоритма декодирования, связанного со вторым алгоритмом кодирования, так что, в конце, каскад кодировщика не только имеет два кодированных представления для одной и той же части аудиосигнала, но также два декодированных сигнала для одной и той же части исходного аудиосигнала на линии 10. Эти два декодированных сигнала затем обеспечиваются в процессор посредством линии 28 и процессор сравнивает оба декодированные представления с такой же частью исходного аудиосигнала, полученного посредством ввода 30. Затем определяется сегментное SNR для каждого алгоритма кодирования. Этот так называемый результат качества обеспечивает, в одном варианте осуществления, не только индикацию более хорошего алгоритма кодирования, т.е. бинарный сигнал, относящийся к тому, дал ли первый алгоритм кодирования или второй алгоритм кодирования результатом более хороший SNR. Дополнительно, результат качества показывает количественную информацию, т.е. насколько более хорошим, например, в дБ, является соответствующий алгоритм кодирования.

В этой ситуации контроллер, когда полностью полагается на результат 20 качества, осуществляет доступ к каскаду кодировщика посредством линии 32, так что каскад кодировщика передает уже сохраненное кодированное представление соответствующего алгоритма кодирования в выходной интерфейс 24, так что это кодированное представление представляет соответствующую часть исходного аудиосигнала в кодированном аудиосигнале.

Альтернативно, когда процессор 18 выполняет режим без обратной связи для определения результата качества, не является необходимым, чтобы оба алгоритма кодирования применялись к одной и той же части аудиосигнала. Вместо этого, процессор 18 определяет то, какой алгоритм кодирования является более хорошим, и, затем, каскад 16 кодировщика управляется через линию 28, чтобы только применять алгоритм кодирования, показанный посредством процессора, и, затем, это кодированное представление, полученное в результате выбранного алгоритма кодирования, обеспечивается в выходной интерфейс 24 посредством линии 34.

В зависимости от конкретного варианта осуществления каскада 16 кодировщика, оба алгоритма кодирования могут работать в области LPC. В этом случае, как, например, для ACELP в качестве первого алгоритма кодирования и TCX в качестве второго алгоритма кодирования, выполняется общая предварительная обработка LPC. Эта предварительная обработка LPC может содержать анализ LPC части аудиосигнала, который определяет коэффициенты LPC для части аудиосигнала. Затем фильтр анализа LPC регулируется с использованием определенных коэффициентов LPC и исходный аудиосигнал фильтруется посредством этого фильтра анализа LPC. Затем каскад кодировщика вычисляет разность для каждой выборки между выходом фильтра анализа LPC и входным сигналом аудио, чтобы вычислять сигнал остатка LPC, который затем подвергается первому алгоритму кодирования или второму алгоритму кодирования в режиме без обратной связи или который обеспечивается в оба алгоритма кодирования в режиме с обратной связью, как описано ранее. Альтернативно, фильтрация посредством фильтра LPC и определение по выборкам сигнала остатка может заменяться технологией FDNS (формирование шума частотной области), описанной в стандарте USAC.

Фиг. 2 иллюстрирует предпочтительный вариант осуществления каскада кодировщика. В качестве первого алгоритма кодирования используется алгоритм кодирования ACELP, имеющий характеристику кодирования CELP. Дополнительно, этот алгоритм кодирования является более подходящим для неустановившихся сигналов. Второй алгоритм кодирования имеет характеристику кодирования, которая делает этот второй алгоритм кодирования более подходящим для установившихся сигналов. В качестве примера используется алгоритм кодирования возбуждения с преобразованием, такой как TCX и, конкретно, является предпочтительным алгоритм кодирования TCX 20, который имеет длину кадра 20 мс (длина окна может быть более высокой вследствие перекрывания), что делает принцип кодирования, проиллюстрированный на фиг. 1, особенно подходящим для вариантов осуществления с низкой задержкой, которые требуются в сценариях реального времени, таких как сценарии, где имеется двусторонняя связь как в приложениях телефонии и, конкретно, в приложениях мобильной или сотовой телефонии.

Однако настоящее изобретение является дополнительно полезным в других комбинациях первого и второго алгоритмов кодирования. В качестве примера, первый алгоритм кодирования, более подходящий для неустановившихся сигналов, может содержать любой из хорошо известных кодировщиков временной области, таких как используемые в GSM кодировщики (G.729) или любые другие кодировщики временной области. Алгоритм кодирования установившегося сигнала, с другой стороны, может быть любым хорошо известным кодировщиком области преобразования, таким как MP3, AAC, AC3, или любым другим преобразованием, или алгоритмом кодирования аудио на основе набора фильтров. Для варианта осуществления с низкой задержкой, однако, является предпочтительной комбинация ACELP с одной стороны и TCX с другой стороны, при этом, в частности, кодировщик TCX может основываться на FFT или даже более предпочтительно на MDCT с короткой длиной окна. Следовательно, оба алгоритма кодирования работают в области LPC, полученной посредством преобразования аудиосигнала в область LPC с использованием фильтра анализа LPC. Однако ACELP тогда работает во "временной" области LPC, в то время как кодировщик TCX работает в "частотной" области LPC.

Далее, предпочтительный вариант осуществления контроллера 22 из фиг. 1 описывается в контексте фиг. 3.

Предпочтительно переключение между первым алгоритмом кодирования, таким как ACELP, и вторым алгоритмом кодирования, таким как TCX 20, выполняется с использованием трех условий. Первое условие является условием качества, представленным посредством результата 20 качества из фиг. 1. Второе условие является условием неустановившегося состояния, представленным посредством результата обнаружения неустановившегося состояния на линии 14 из фиг. 1. Третье условие является условием гистерезиса, которое полагается на решения, выработанные контроллером 22 в прошлом, т.е. для более ранних частей аудиосигнала.

Условие качества осуществляется так, что переключение на алгоритм кодирования более высокого качества выполняется, когда условие качества показывает большое расстояние качества между первым алгоритмом кодирования и вторым алгоритмом кодирования. Когда, например, определяется, что один алгоритм кодирования превосходит другой алгоритм кодирования на, например, разницу SNR в один дБ, то условие качества определяет переключение или, формулируя иначе, фактически используемый алгоритм кодирования для фактически рассматриваемой части аудиосигнала независимо от какого-либо обнаружения неустановившегося состояния или ситуации гистерезиса.

Когда, однако, условие качества показывает только маленькое расстояние качества между обоими алгоритмами кодирования, такое как расстояние качества разницы SNR в один или менее дБ, может происходить переключение на алгоритм кодирования более низкого качества, когда результат обнаружения неустановившегося состояния показывает, что алгоритм кодирования более низкого качества соответствует характеристике аудиосигнала, т.е. является ли аудиосигнал неустановившимся или нет. Когда, однако, результат обнаружения неустановившегося состояния показывает, что алгоритм кодирования более низкого качества не соответствует характеристике аудиосигнала, то должен использоваться алгоритм кодирования более высокого качества. В последнем случае, еще раз, условие качества определяет результат, но только когда конкретное сопоставление между алгоритмом кодирования более низкого качества и нестационарной (неустановившейся)/стационарной ситуацией аудиосигнала не соответствуют друг другу.

Условие гистерезиса является особенно полезным в комбинации с условием неустановившегося состояния, т.е. в том, что переключение на алгоритм кодирования более низкого качества выполняется только тогда, когда меньше, чем последние N кадров были закодированы с помощью другого алгоритма. В предпочтительных вариантах осуществления N равняется пяти кадрам, но также могут использоваться другие значения, предпочтительно более низкие или равные N кадрам или частям сигнала, каждая содержит минимальное количество выборок выше, например, 128 выборок.

Фиг. 4 иллюстрирует таблицу изменений состояний в зависимости от некоторых ситуаций. Левый столбец показывает ситуацию, где количество более ранних кадров больше, чем N или меньше, чем N для либо TCX, либо ACELP.

Последняя строка показывает, имеется ли большое расстояние качества для TCX или большое расстояние качества для ACELP. В тех двух случаях, которые являются первыми двумя столбцами, изменение выполняется там, где показано посредством "X", в то время как изменение не выполняется, как показано посредством "0".

Дополнительно, последние два столбца показывают ситуацию, когда определяется маленькое расстояние качества для TCX и когда обнаруживается неустановившийся сигнал, или когда определяется маленькое расстояние качества для ACELP, и часть сигнала обнаруживается как являющаяся установившейся.

Первые две строки последних двух столбцов обе показывают, что результат качества является решающим, когда количество более ранних кадров больше, чем 10. Следовательно, когда имеется сильная индикация из прошлого для одного алгоритма кодирования, то обнаружение неустановившегося состояния не играет роли тоже.

Когда, однако, количество более ранних кадров, которые кодированы в одном из двух алгоритмов кодирования, является более маленьким, чем N, выполняется переключение от TCX на ACELP, показанное в поле 40 для неустановившихся сигналов. Дополнительно, как показано в поле 41, изменение с ACELP на TCX выполняется, даже когда имеется маленькое расстояние качества в пользу ACELP, вследствие того факта, что мы имеем установившийся сигнал. Когда количество последних кадров LCLP является более маленьким, чем N, последующий кадр также кодируется с помощью ACELP и, поэтому, нет необходимости в переключении, как показано в поле 42. Когда, дополнительно, количество кадров TCX является более маленьким, чем N, и когда имеется маленькое расстояние качества для ACELP и сигнал является установившимся, текущий кадр кодируется с использованием TCX и, нет необходимости в переключении, как показано посредством поля 43. Следовательно, влияние гистерезиса ясно видно из сравнения полей 42, 43 с четырьмя полями выше этих двух полей.

Следовательно, настоящее изобретение предпочтительно влияет на гистерезис для решения с обратной связью посредством вывода детектора неустановившегося состояния. Поэтому, не существует, как в AMR-WB+, чистого решения с обратной связью относительно того, выбрать ли TCX или ACELP. Вместо этого, на вычисление с обратной связью влияет результат обнаружения неустановившегося состояния, т.е. в аудиосигнале определяется каждая неустановившаяся часть сигнала. Решение в отношении того, вычислять ли кадр ACELP или кадр TCX, поэтому, зависит не только от вычислений с обратной связью, или, в общем, результата качества, но дополнительно зависит от того, обнаружено ли неустановившееся состояние или нет.

Другими словами, гистерезис для определения того, какой алгоритм кодирования должен использоваться для текущего кадра, может быть выражен следующим образом:

когда результат качества для TCX является слегка более маленьким, чем результат качества для ACELP, и когда в текущее время рассматриваемые части сигнала или только текущий кадр не является неустановившимся, тогда используется TCX вместо ACELP.

Когда, с другой стороны, результат качества для ACELP является слегка более маленьким, чем результат качества для TCX, и когда кадр является неустановившимся, тогда используется ACELP вместо TCX. Предпочтительно, мера плоскостности вычисляется как результат обнаружения неустановившегося состояния, который является количественным числом. Когда плоскостность больше чем или равна некоторому значению, тогда определяется, что кадр является неустановившимся (с неустановившимся состоянием). Когда, с другой стороны, плоскостность является более маленькой, чем это пороговое значение, тогда определяется, что кадр является установившимся (с установившимся состоянием). В качестве порога предпочтительна мера плоскостности, равная двум, где вычисление плоскостности описывается более подробно на фиг. 5.

Дополнительно, в отношении результата качества, количественная мера является предпочтительной. Когда используется мера SNR или, в частности, мера сегментного SNR, тогда признак "слегка меньший" как использовался ранее, может означать на один дБ меньше. Следовательно, когда отношения SNR для TCX и ACELP являются более отличными друг от друга, или, формулируя иначе, когда абсолютное различие между обоими значениями SNR больше, чем один дБ, тогда условие качества из фиг. 3 одно определяет алгоритм кодирования для текущей части аудиосигнала.

Вышеописанное решение может дополнительно конкретизироваться, когда обнаружение неустановившегося состояния или вывод гистерезиса или SNR для TCX или ACELP прошлых или более ранних кадров включается в условие "если". В результате, строится гистерезис, который, для одного варианта осуществления, проиллюстрирован на фиг. 3 как условие номер 3. В частности, фиг. 3 иллюстрирует альтернативу, когда вывод гистерезиса, т.е. определение для прошлого, используется для модификации условия неустановившегося состояния.

Альтернативно, дополнительное условие гистерезиса, которое основывается на более ранних отношениях SNR для TCX или ACELP, может содержать то, что определение для алгоритма кодирования более низкого качества выполняется только тогда, когда изменение в различии SNR по отношению к более раннему кадру является более низким, чем, например, некоторый порог. Дополнительный вариант осуществления может содержать использование результата обнаружения неустановившегося состояния для одного или нескольких более ранних кадров, когда результат обнаружения неустановившегося состояния является количественным числом. Тогда, переключение на алгоритм кодирования более низкого качества может, например, выполняться, только когда изменение количественного результата обнаружения неустановившегося состояния от более раннего кадра к текущему кадру находится, снова, ниже некоторого порога. Другие комбинации этих чисел для дополнительной модификации условия 3 гистерезиса из фиг. 3 могут оказываться полезными, чтобы получать более хороший компромисс между скоростью передачи битов с одной стороны и качеством аудио с другой стороны.

Дополнительно, условие гистерезиса, как проиллюстрировано в контексте фиг. 3 и как описано ранее, может использоваться вместо или в дополнение к дополнительному гистерезису, который, например, основывается на внутренних данных анализа алгоритмов кодирования ACELP и TCX.

Далее, делается ссылка на фиг. 5 для иллюстрации предпочтительного определения результата обнаружения неустановившегося состояния на линии 14 из фиг. 1.

На этапе 50 аудиосигнал временной области, такой как входной сигнал PCM на линии 10, подвергается высокочастотной фильтрации, чтобы получать аудиосигнал, прошедший высокочастотную фильтрацию. Затем, на этапе 52, кадр подвергнутого высокочастотной фильтрации сигнала, который может быть равным части аудиосигнала, подразделяется на множество, например восемь подблоков. Затем, на этапе 54, вычисляется значение энергии для каждого подблока. Это вычисление энергии может содержать возведение в квадрат каждого значения выборки в подблоке и последующее сложение возведенных в квадрат выборок с или без усреднения. Затем, на этапе 56, формируются пары смежных подблоков. Пары могут содержать первую пару, состоящую из первого и второго подблока, вторую пару, состоящую из второго и третьего подблока, третью пару, состоящую из третьего и четвертого подблока, и т.д. Дополнительно, также может использоваться пара, содержащая последний подблок более раннего кадра и первый подблок текущего кадра. Альтернативно, могут выполняться другие способы формирования пар, такие как, например, только формирование пар первого и второго подблока, третьего и четвертого подблока, и т.д. Затем, как также описано на этапе 56 из фиг. 5, более высокое значение энергии каждой пары подблоков выбирается и, как описано на этапе 58, делится на более низкое значение энергии пары подблоков. Затем, как описано на этапе 60 из фиг. 5, все результаты из этапа 58 для кадра объединяются. Это объединение может состоять из сложения результатов блока 58 и усреднения, где результат сложения делится на количество пар, такое как восемь, когда восемь пар в расчете на подблок были определены на этапе 56. Результатом этапа 60 является мера плоскостности, которая используется контроллером 22, чтобы определять, является ли часть сигнала неустановившейся или нет. Когда мера плоскостности больше, чем или равна 2, обнаруживается неустановившаяся часть сигнала, в то время как, когда мера плоскостности меньше, чем 2, определяется, что сигнал является установившимся или стационарным. Однако также могут использоваться другие пороги между 1,5 и 3, но было показано, что порог, равный двум, обеспечивает наилучшие результаты.

Следует отметить, что могут использоваться также другие детекторы неустановившегося состояния. Неустановившиеся сигналы могут дополнительно содержать сигналы вокализованной речи. Традиционно, неустановившиеся сигналы содержат подобные аплодисментам сигналы или кастаньеты, или взрывные звуки речи, содержащие сигналы, полученные посредством произнесения букв "p" или "t", или подобных. Однако гласные звуки, такие как "a", "e", "i", "o", "u", в классическом подходе не считаются неустановившимися сигналами, так как они характеризуются периодическими импульсами, образующимися в голосовой щели, или импульсами основного тона. Однако, так как гласные звуки также представляют сигналы вокализованной речи, гласные звуки также рассматриваются как неустановившиеся сигналы для настоящего изобретения. Обнаружение этих сигналов могут осуществляться, в дополнение или альтернативно к процедуре из фиг. 5, посредством детекторов речи, различающих вокализованную речь от невокализированной речи, или посредством оценки метаданных, связанных с аудиосигналом и показывающих, модулю оценки метаданных, является ли соответствующая часть неустановившейся или установившейся частью.

Далее, описывается фиг. 6А, чтобы проиллюстрировать третий способ вычисления результата качества на линии 20 из фиг. 1, т.е. то, как процессор 18 предпочтительно сконфигурирован.

На этапе 61, описывается процедура с обратной связью, где для каждой из множества возможностей часть кодируется и декодируется с использованием первого и второго алгоритмов кодирования. Затем, на этапе 63, вычисляется мера, такая как сегментное SNR, зависящая от различия кодированного и снова декодированного аудиосигнала и исходного сигнала. Эта мера вычисляется для обоих алгоритмов кодирования.

Затем, на этапе 65 вычисляется среднее сегментное SNR с использованием индивидуальных сегментных SNR, и это вычисление снова выполняется для обоих алгоритмов кодирования, так что, в конце, этап 65 дает в результате два разных усредненных значения SNR для одной и той же части аудиосигнала. Различие между этими сегментированными значениями SNR для кадра используется как количественный результат качества на линии 20 из фиг. 1.

Фиг. 6В иллюстрирует два уравнения, где верхнее уравнение используется на этапе 63 и где нижнее уравнение используется на этапе 65. обозначает взвешенный аудиосигнал и обозначает кодированный и снова декодированный взвешенный сигнал.

Усреднение, выполняемое на этапе 65, является усреднением по одному кадру, где каждый кадр состоит из некоторого количества подкадров N_SF, и где четыре таких кадра вместе формируют суперкадр. Следовательно, суперкадр содержит 1024 выборки, индивидуальный кадр содержит 256 выборок и каждый подкадр, для которого верхнее уравнение на фиг. 6Вb или этап 63 выполняется, содержит 64 выборки. В верхнем уравнении, используемом на этапе 63, n является индексом номера выборки и N является максимальным количеством выборок в подкадре, равном 63, показывающем, что подкадр имеет 64 выборки.

Фиг. 7 иллюстрирует дополнительный вариант осуществления устройства для кодирования согласно изобретению, аналогичный варианту осуществления из фиг. 1, и одинаковые ссылочные позиции показывают аналогичные элементы. Однако фиг. 7 иллюстрирует более детальное представление каскада 16 кодировщика, который содержит предварительный процессор 16a для выполнения взвешивания и анализа/фильтрации LPC, и блок 16a предварительного процессора обеспечивает данные LPC на линии 70 в выходной интерфейс 24. Дополнительно, каскад 16 кодировщика из фиг. 1 содержит первый алгоритм кодирования в 16b и второй алгоритм кодирования в 16c, которые являются алгоритмом кодирования ACELP и алгоритмом кодирования TCX, соответственно.

Дополнительно, каскад 16 кодировщика может содержать либо переключатель 16d, подсоединенный перед блоками 16d, 16c, либо переключатель 16e, подсоединенный после блоков 16b, 16c, где "перед" и "после" указывают на направление потока сигналов, которое идет, по меньшей мере, по отношению к блоку 16a по 16e сверху вниз на фиг. 7. Блок 16d не будет присутствовать в решении с обратной связью. В этом случае, будет присутствовать только переключатель 16e, так как оба алгоритма 16b, 16c кодирования работают над одной и той же частью аудиосигнала и результат выбранного алгоритма кодирования забирается и передается в выходной интерфейс 24.

Если, однако, решение без обратной связи или любое другое решение выполняется до того, как оба алгоритма кодирования будут выполнены над одним и тем же сигналом, то переключатель 16e не будет присутствовать, но будет присутствовать переключатель 16d, и каждая часть аудиосигнала будет кодироваться с использованием только какого-либо одного из блоков 16b, 16c.

Дополнительно, в частности, для режима с обратной связью, выводы обоих блоков соединяются с блоком 18, 22 процессора и контроллера, как показано посредством линий 71, 72. Управление переключателем осуществляется посредством линий 73, 74 из блока 18, 22 процессора и контроллера в соответствующие переключатели 16d, 16e. Снова, в зависимости от варианта осуществления, там будет обычно только одна из линий 73, 74.

Кодированный аудиосигнал 26, поэтому, содержит, среди других данных, результат ACELP или TCX, который обычно в дополнение кодируется с избыточностью, как, например, посредством кодирования Хаффмана или арифметического кодирования, до ввода в выходной интерфейс 24. Дополнительно, данные 70 LPC обеспечиваются в выходной интерфейс 24, чтобы включаться в кодированный аудиосигнал. Дополнительно, является предпочтительным дополнительно включать решение выбора режима кодирования в кодированный аудиосигнал, показывая декодеру, что текущая часть аудиосигнала является частью ACELP или TCX.

Хотя некоторые аспекты были описаны в контексте устройства, является ясным, что эти аспекты также представляют описание соответствующего способа, где блок или устройство соответствует этапу способа или признаку этапа способа. Аналогично, аспекты, описанные в контексте этапа способа, также представляют описание соответствующего блока или элемента, или признака соответствующего устройства.

В зависимости от некоторых требований вариантов осуществления, варианты осуществления изобретения могут осуществляться в аппаратном обеспечении или в программном обеспечении. Вариант осуществления может выполняться с использованием цифрового запоминающего носителя, например гибкого диска, DVD, CD, ROM, PROM, EPROM, EEPROM или флэш-памяти, имеющего электронным образом читаемые сигналы управления, сохраненные на нем, которые взаимодействуют (или являются способными взаимодействовать) с программируемой компьютерной системой, так что соответствующий способ выполняется.

Некоторые варианты осуществления согласно изобретению содержат невременный носитель данных, имеющий электронным образом читаемые сигналы управления, которые могут взаимодействовать с программируемой компьютерной системой, так что выполняется один из описанных здесь способов.

В общем, варианты осуществления настоящего изобретения могут осуществляться как компьютерный программный продукт с программным кодом, при этом программный код выполнен с возможностью выполнения одного из способов, когда компьютерный программный продукт исполняется на компьютере. Программный код может, например, храниться на машиночитаемом носителе.

Другие варианты осуществления содержат компьютерную программу для выполнения одного из описанных здесь способов, сохраненную на машиночитаемом носителе.

Другими словами, один вариант осуществления способа согласно изобретению представляет собой, поэтому, компьютерную программу, имеющую программный код для выполнения одного из описанных здесь способов, когда компьютерная программа исполняется на компьютере.

Дополнительный вариант осуществления способов согласно изобретению представляет собой, поэтому, носитель данных (или цифровой запоминающий носитель, или машиночитаемый носитель), содержащий, записанную на нем компьютерную программу для выполнения одного из описанных здесь способов.

Дополнительный вариант осуществления способа согласно изобретению представляет собой, поэтому, поток данных или последовательностью сигналов, представляющих компьютерную программу для выполнения одного из описанных здесь способов. Поток данных или последовательность сигналов могут, например, быть сконфигурированными с возможностью передачи посредством соединения передачи данных, например, посредством сети Интернет.

Дополнительный вариант осуществления содержит средство обработки, например компьютер, или программируемое логическое устройство, сконфигурированное с возможностью или выполненное с возможностью выполнения одного из описанных здесь способов.

Дополнительный вариант осуществления содержит компьютер, имеющий установленную на нем компьютерную программу для выполнения одного из описанных здесь способов.

В некоторых вариантах осуществления может использоваться программируемое логическое устройство (например, программируемая пользователем вентильная матрица), чтобы выполнять некоторые или все из функциональных возможностей описанных здесь способов. В некоторых вариантах осуществления программируемая пользователем вентильная матрица может взаимодействовать с микропроцессором, чтобы выполнять один из описанных здесь способов. В общем, способы предпочтительно выполняются посредством любого аппаратного устройства.

Вышеописанные варианты осуществления являются только иллюстративными для принципов настоящего изобретения. Следует понимать, что модификации и изменения компоновок и деталей, здесь описанных, должны быть очевидны специалистам в данной области техники. Поэтому предполагается, что ограничение накладывается только объемом представленной патентной формулы изобретения и не конкретными деталями, представленными здесь в качестве описания и объяснения вариантов осуществления.

1. Устройство для кодирования части аудиосигнала (10), чтобы получать кодированный аудиосигнал (26) для части аудиосигнала, содержащее:
детектор (12) неустановившегося состояния для обнаружения, располагается ли неустановившийся сигнал в части аудиосигнала, чтобы получать результат (14) обнаружения неустановившегося состояния;
каскад (16) кодировщика для выполнения первого алгоритма кодирования над аудиосигналом, чтобы получить первое значение результата качества аудиосигнала для упомянутой части аудиосигнала, при этом первый алгоритм кодирования имеет первую характеристику, и для выполнения второго алгоритма кодирования над аудиосигналом, чтобы получить второе значение результата качества аудиосигнала для упомянутой части аудиосигнала, при этом второй алгоритм кодирования имеет вторую характеристику, которая является отличной от первой характеристики;
процессор (18) для определения, какой алгоритм кодирования из первого и второго алгоритмов кодирования дает в результате кодированный аудиосигнал, который является лучшей аппроксимацией для упомянутой части аудиосигнала по отношению к другому алгоритму кодирования из первого и второго алгоритмов кодирования, чтобы получать результат (20) качества, при этом процессор выполнен с возможностью определять результат качества как расстояние между первым значением результата качества и вторым значением результата качества; и
контроллер (22) для определения, должен ли кодированный аудиосигнал для части аудиосигнала генерироваться, используя либо первый алгоритм кодирования, либо второй алгоритм кодирования, на основе результата (14) обнаружения неустановившегося состояния и результата (20) качества.

2. Устройство по п. 1, в котором каскад (16) кодировщика сконфигурирован с возможностью использования первого алгоритма кодирования, который является более подходящим для неустановившихся сигналов, чем второй алгоритм кодирования.

3. Устройство по п. 2, в котором первый алгоритм кодирования является алгоритмом кодирования ACELP, и при этом второй алгоритм кодирования является алгоритмом кодирования с преобразованием.

4. Устройство по п. 1, в котором контроллер (22) сконфигурирован с возможностью определения второго алгоритма кодирования, хотя результат (20) качества показывает лучшее качество для первого алгоритма кодирования, когда результат (14) обнаружения неустановившегося состояния показывает установившийся сигнал.

5. Устройство по п. 1, в котором контроллер (22) сконфигурирован с возможностью определения первого алгоритма кодирования, хотя результат качества показывает лучшее качество для второго алгоритма кодирования, когда результат обнаружения неустановившегося состояния показывает неустановившийся сигнал.

6. Устройство по п. 4, в котором контроллер (22) сконфигурирован с возможностью определения второго алгоритма кодирования или первого алгоритма кодирования, только когда результат качества показывает расстояние качества между алгоритмами кодирования, которое является меньшим, чем пороговое значение расстояния.

7. Устройство по п. 6, в котором пороговое значение расстояния равняется или меньше чем 3 дБ, и при этом значения результата качества для обоих алгоритмов кодирования вычисляются с использованием вычисления SNR между аудиосигналом (10) и кодированной и снова декодированной версией аудиосигнала.

8. Устройство по п. 4, в котором контроллер (22) сконфигурирован с возможностью определять только второй алгоритм кодирования или первый алгоритм кодирования, когда количество более ранних частей сигнала, для которых был определен первый или второй алгоритм кодирования, является более маленьким, чем предопределенное количество.

9. Устройство по п. 8, в котором контроллер (22) сконфигурирован с возможностью использовать количество более ранних частей сигнала, меньшее 10.

10. Устройство по п. 1,
в котором контроллер (22) сконфигурирован с возможностью применения гистерезисной обработки, так что второй алгоритм кодирования или первый алгоритм кодирования определяется, только когда более низкое значение результата качества из первого и второго значений результата качества показывает более низкое качество для второго алгоритма кодирования или первого алгоритма кодирования, когда количество более ранних частей сигнала, имеющих первый алгоритм кодирования или второй алгоритм кодирования, соответственно, равно или меньше чем предопределенное количество, и когда результат обнаружения неустановившегося состояния показывает предварительно определенное состояние двух возможных состояний, содержащих установившиеся состояния и неустановившиеся состояния.

11. Устройство по п. 1, в котором детектор (12) неустановившегося состояния сконфигурирован с возможностью выполнять следующие этапы:
высокочастотную фильтрацию (50) аудиосигнала, чтобы получать блок подвергнутого высокочастотной фильтрации сигнала;
подразделение (52) блока подвергнутого высокочастотной фильтрации сигнала на множество подблоков;
вычисление (54) энергии для каждого подблока;
объединение (58) значений энергии для каждой пары смежных подблоков, чтобы получать результат для каждой пары; и
объединение (60) результатов для пар, чтобы получать результат (14) обнаружения неустановившегося состояния.

12. Устройство по п. 1, в котором каскад (16) кодировщика дополнительно содержит каскад фильтрации LPC для определения коэффициентов LPC из аудиосигнала для фильтрации аудиосигнала с использованием фильтра анализа LPC, определенного посредством коэффициентов LPC, чтобы определять остаточный сигнал, при этом первый алгоритм кодирования или второй алгоритм кодирования применяется к остаточному сигналу, и
при этом кодированный аудиосигнал дополнительно содержит информацию (70) о коэффициентах LPC.

13. Устройство по п. 1,
в котором каскад (16) кодирования либо содержит переключатель (16d), соединенный с первым алгоритмом (16b) кодирования и вторым алгоритмом (16с) кодирования, или переключатель (16е), подсоединенный после первого алгоритма (16b) кодирования и второго алгоритма (16с) кодирования, при этом переключатель (16d, 16е) управляется посредством контроллера (22).

14. Способ кодирования части аудиосигнала (10), чтобы получать кодированный аудиосигнал (26) для части аудиосигнала, содержащий:
обнаружение (12), располагается ли неустановившийся сигнал в части аудиосигнала, чтобы получать результат (14) обнаружения неустановившегося состояния;
выполнение (16) первого алгоритма кодирования над аудиосигналом, чтобы получить первое значение результата качества аудиосигнала для упомянутой части аудиосигнала, при этом первый алгоритм кодирования имеет первую характеристику, и выполнение второго алгоритма кодирования над аудиосигналом, чтобы получить второе значение результата качества аудиосигнала для упомянутой части аудиосигнала, при этом второй алгоритм кодирования имеет вторую характеристику, которая является отличной от первой характеристики;
определение (18) какой алгоритм кодирования из первого и второго алгоритмов кодирования дает в результате кодированный аудиосигнал, который является лучшей аппроксимацией для упомянутой части аудиосигнала по отношению к другому алгоритму кодирования из первого и второго алгоритмов кодирования, чтобы получать результат (20) качества, при этом определение содержит определение результата качества как расстояния между первым значением результата качества и вторым значением результата качества; и
определение (22), должен ли кодированный аудиосигнал для упомянутой части аудиосигнала генерироваться, используя либо первый алгоритм кодирования, либо второй алгоритм кодирования, на основе результата (14) обнаружения неустановившегося состояния и результата (20) качества.

15. Запоминающий носитель, имеющий записанные на нем выполняемые компьютером инструкции, которые при исполнении на компьютере выполняют способ кодирования части аудиосигнала по п. 14.

Изобретение относится к кодированию аудиосигнала, в частности к передаче длины элемента кадра. Технический результат - повышение точности кодирования аудиосигнала.

Устройство и способ извлечения прямого сигнала/сигнала окружения из сигнала понижающего микширования и пространственной параметрической информации // 2568926

Изобретение относится к области обработки звуковых сигналов. Технический результат заключается в обеспечении возможности извлечения части прямого сигнала или части сигнала окружения из сигнала понижающего микширования посредством использования пространственной параметрической информации.

Аудиокодер, аудиодекодер, способ для кодирования аудиоинформации, способ для декодирования аудиоинформации и компьютерная программа, использующие оптимизированную хэш-таблицу // 2568381

Изобретение относится к средствам кодирования и декодирования аудиоинформации, использующим оптимизированную кэш-таблицу. Технический результат заключается в повышении скорости передачи информации.

Адаптивная обработка несколькими узлами обработки медиаданных // 2568372

Изобретение относится к адаптивной обработке медиаданных. Технический результат - улучшение представления и обработки содержимого медиаданных.

Способ создания музыкального произведения и устройство его осуществления // 2568265

Изобретение относится к вариантам создания музыкальных произведений, может быть использовано для создания музыки на электронных таблицах из коллекции Word 2007 в ноутбуке.

Ограничение понижающего микширования // 2565015

Изобретение относится к области микширования. Технический результат - обеспечение совместимости уровня речевого сигнала, в то же время позволяя избегнуть клиппинга выходного (выходных) сигнала (сигналов), а также предоставление способов понижающего микширования, имеющих данные общие свойства и являющихся подходящими для сохранения динамических, временных и/или пространственных свойств звукового сигнала.

Способы и системы генерирования коэффициентов фильтра и конфигурирования фильтров // 2562771

Изобретение относится к способам и системам конфигурирования (в том числе путем адаптивного обновления) фильтра с предсказанием. Технический результат заключается в повышении эффективности определения небольших групп наборов возможных коэффициентов фильтра с предсказанием, из которых для конфигурирования фильтра с предсказанием может выбираться требуемый набор коэффициентов для оптимизации фильтра с бесконечной импульсной характеристикой (IIR) при использовании в соответствии со значимыми характеристиками сигнала.

Передискретизация выходных сигналов аудиокодеков на основе квадратурных зеркальных фильтров (qmf) // 2562434

Изобретение относится к средствам передискретизации выходных сигналов аудиокодеков на основе квадратурных зеркальных фильтров. Технический результат заключается в расширении арсенала технических средств для передискретизации аудиосигнала.

Избирательный басовый постфильтр // 2562422

Изобретение относится к кодированию цифрового звука, а именно к способам кодирования звуковых сигналов, содержащих составляющие разного характера. Технический результат заключается в повышении точности воспроизведения звука.

Способ и устройство для обработки аудио сигнала и для обеспечения большей детализации во времени для комбинированного унифицированного кодека речи и аудио (usac) // 2562384

Изобретение относится к обработке аудио сигнала. Технический результат - упрощение устройства и обеспечение большей детализации во времени для комбинированного унифицированного кодека речи и аудио.

Устройство для оптимизации одного или более параметров представления сигнала повышающего микширования на основе представления сигнала понижающего микширования, декодер аудиосигнала, транскодер аудиосигнала, кодер аудиосигнала, аудиобитстрим, способ и компьютерная программа с использованием объектно-ориентированной параметрической информации // 2573738

Изобретение относится к средствам оптимизации одного и более параметров для формирования представления сигнала повышающего микширования на основе представления сигнала понижающего микширования и объектно-ориентированной параметрической информации. Технический результат заключается в уменьшении акустических искажений при повышающем микшировании аудиосигнала. Средство включает в себя регулятор параметров. Регулятор параметров принимает один или более входных параметров, на основе которых генерирует один или более скорректированных параметров. Регулятор параметров генерирует один или более скорректированных параметров с использованием одного или более входных параметров и объектно-ориентированной параметрической информации таким образом, что искажение представления сигнала повышающего микширования, вызванного использованием неоптимальных параметров, уменьшается по крайней мере для входных параметров, отклоняющихся от оптимальных параметров на величину, превышающую заданный предел отклонений.13 н. и 23 з.п. ф-лы, 12 ил.

Устройство для декодирования сигнала, содержащего переходные процессы, используя блок объединения и микшер // 2573774

Изобретение относится к средствам для генерирования декоррелированного сигнала. Технический результат заключается в повышении эффективности генерирования декоррелированного сигнала. Устройство содержит блок отделения сигнала переходного процесса, декоррелятор переходного процесса, второй декоррелятор, блок объединения и микшер, в котором блок отделения сигнала переходного процесса приспособлен для разделения входного сигнала на первый компонент сигнала и на второй компонент сигнала таким образом, чтобы первый компонент сигнала содержал части сигнала переходного процесса входного сигнала, и таким образом, чтобы второй компонент сигнала содержал части сигнала без переходного процесса входного сигнала. Блок объединения и микшер скомпонованы таким образом, чтобы декоррелированный сигнал из блока объединения выводился в микшер в качестве входного сигнала. 3 н. и 11 з.п. ф-лы, 10 ил.

Устройство и способ для кодирования и декодирования аудиосигнала с использованием выровненной части опережающего просмотра // 2574849

Изобретение относится к средствам кодирования и декодирования аудиосигнала с использованием выровненной части опережающего просмотра. Технический результат заключается в повышении качества кодированного аудиосигнала. Блок применения оконной функции для применения окна анализа кодирования с предсказанием к потоку дискретных значений аудиосигнала для получения обработанных с помощью оконной функции данных для анализа с предсказанием и для применения окна анализа кодирования с преобразованием к потоку дискретных значений аудиосигнала для получения обработанных с помощью оконной функции данных для анализа с преобразованием, при этом окно анализа кодирования с преобразованием связано с дискретными значениями аудиосигнала в пределах текущего кадра дискретных значений аудиосигнала и с дискретными значениями аудиосигнала заданной части будущего кадра дискретных значений аудиосигнала, являющихся частью опережающего просмотра кодирования с преобразованием. Окно анализа кодирования с предсказанием связано с частью дискретных значений аудиосигнала текущего кадра и с дискретными значениями аудиосигнала заданной части будущего кадра, являющегося частью опережающего просмотра кодирования с предсказанием. 6 н. и 20 з.п. ф-лы, 17 ил.

Аудиокодек с преобразованием и способы кодирования и декодирования временного сегмента аудиосигнала // 2574851

Изобретение относится к средствам для кодирования/декодирования временного сегмента аудиосигнала. Технический результат заключается в повышении эффективности кодирования в аудиокодере с преобразованием. Выводят указатель z положения на частотной шкале остаточного вектора, ассоциированного с временным сегментом аудиосигнала. Выводят показатель Ф, относящийся к величине структуры остаточного вектора. Определяют, удовлетворен ли предварительно заданный критерий, предусматривающий показатель Ф, указатель z и предварительно заданный порог θ, что соответствует оценке, будет ли слышно изменение знака по меньшей мере некоторых из ненулевых коэффициентов остаточного вектора после реконструкции временного сегмента аудиосигнала. Кодируется соответствующая амплитуда коэффициентов остаточного вектора, и знаки коэффициентов остаточного вектора кодируются, только когда определено, что критерий удовлетворен и, таким образом, что изменение знака будет слышно. 4 н. и 22 з.п. ф-лы, 8 ил.

Кодер аудио и декодер, имеющий гибкие функциональные возможности конфигурации // 2575390

Изобретение относится к кодированию аудио-файлов с высоким качеством и низкой частотой следования битов. Технический результат заключается в оптимизации настроек конфигурации для всех канальных элементов одновременно. Технический результат достигается за счет считывания данных конфигурации для каждого канального элемента в секции конфигурации и считывания данных полезных данных для каждого канального элемента в секции полезных данных, декодирования множества канальных элементов, и конфигурирования конфигурируемого декодера так, чтобы конфигурируемый декодер конфигурировался в соответствии с первыми данными конфигурации декодера при декодировании первого канального элемента и в соответствии со вторыми данными конфигурации декодера при декодировании второго канального элемента. 6 н. и 12 з.п. ф-лы, 28 ил., 32 табл.

Кодирование и декодирование позиций слотов с событиями в кадре аудиосигнала // 2575393

Изобретение относится к области обработки аудиосигнала и аудиокодирования. Технический результат - повышение точности кодирования и декодирования. Раскрыты устройство для декодирования, устройство для кодирования, способ декодирования и способ кодирования позиций слотов, содержащих события в кадре аудиосигнала, и соответствующие программы и кодированные сигналы, при этом устройство для декодирования содержит: анализирующий блок для анализа числа слотов кадра, указывающего общее число слотов кадра аудиосигнала, числа слотов с событиями, указывающего число слотов, содержащих события кадра аудиосигнала, и числа состояний события и блок генерирования для генерирования указания множества позиций слотов, содержащих события в кадре аудиосигнала, с использованием числа слотов кадра, числа слотов с событиями и числа состояний события. 6 н. и 11 з.п. ф-лы, 25 ил., 6 табл.

Кодер, использующий прямое подавление помех дискретизации // 2575809

Изобретение относится к кодеку, поддерживающему переключение между режимом кодирования с преобразованием с подавлением помех дискретизации во временной области и режимом кодирования временной области. Технический результат состоит в том, что кодек сделан менее подверженным потере кадра. Это достигается посредством добавления дополнительного синтаксического участка к кадрам, в зависимости от которого устройство синтаксического анализа декодера может выбрать между первым действием ожидания, что текущий кадр содержит, и, таким образом, считывая данные прямого подавления помех дискретизации из текущего кадра, и вторым действием неожидания, что текущий кадр содержит, и, таким образом, не считывая данные прямого подавления помех дискретизации из текущего кадра. 6 н. и 14 з.п. ф-лы, 27 ил.

Основанная на линейном предсказании схема кодирования, использующая формирование шума в спектральной области // 2575993

Изобретение относится к способу кодирования аудио сигнала и средствам для осуществления этого способа. Технический результат изобретения заключается в создании концепции кодирования, позволяющей уменьшить сложность при сопоставимой или даже увеличенной эффективности кодирования. Концепция кодирования, основанная на линейном предсказании при использовании спектрального разложения входного аудио сигнала для вычисления коэффициентов линейного предсказания, использует формирование шума в спектральной области на основании вычисленных коэффициентов линейного предсказания. Эффективность кодирования может сохраняться, даже если используется такое перекрывающееся преобразование для спектрального разложения, которое вызывает наложение и требует отмены наложения во времени, такое как критически дискретизированное перекрывающееся преобразование, например MDCT. 3 н. и 10 з.п. ф-лы, 4ил.

Декодер аудиосигнала, кодер аудиосигнала, способ формирования представления сигнала повышающего микширования, способ формирования представления сигнала понижающего микширования, компьютерная программа и бистрим, использующий значение общего параметра межобъектной корреляции // 2576476

Изобретение относится к средствам, генерирующим представление сигнала повышающего микширования на основе представления сигнала понижающего микширования с использованием объектно-ориентированной параметрической информации и с учетом данных аудиорендеринга. Технический результат заключается в улучшении качества акустического образа. Аудиокодер включает в себя определитель параметров объектов, генерирующий значения межобъектной корреляции множества пар аудиообъектов, определяющий по сигнальному параметру битстрима выбор между вычислением индивидуальных значений параметров межобъектной корреляции в битстриме для выведения значений межобъектной корреляции множества пар взаимосвязанных аудиообъектов и выведением значений межобъектной корреляции множества пар взаимосвязанных аудиообъектов из значения общего для битстрима параметра межобъектной корреляции. Аудиодекодер, также включающий в себя процессор сигналов, генерирующий представление сигнала повышающего микширования на основе представления сигнала понижающего микширования. 9 н. и 11 з.п. ф-лы, 11 ил.

Устройство для обеспечения представления сигнала повышающего микширования на основе представления сигнала понижающего микширования, устройство для обеспечения битового потока, представляющего многоканальный звуковой сигнал, способы, компьютерная программа и битовый поток, использующий передачу сигналов с контролем искажения // 2577199

Изобретение относится к области обеспечения представления сигнала повышающего микширования на основе представления сигнала понижающего микширования и объектно-связанной параметрической информации, которые включены в представление битового потока звукового содержания, и информации о визуализации. Технический результат заключается в улучшении разборчивости речи говорящего посредством многоканального звукового воспроизведения. Технический результат достигается за счет устройства для обеспечения представления сигнала повышающего микширования на основе представления сигнала понижающего микширования и объектно-связанной параметрической информации, которые включаются в представление битового потока звукового содержания, которое в зависимости от информации о визуализации включает ограничитель искажения, формируемый для регулирования параметров повышающего микширования посредством использования схемы контроля искажения, чтобы избежать или ограничить слышимые искажения, которые вызваны несоответствующим выбором параметров визуализации. Ограничитель искажения формируется, чтобы получить параметр управления ограничением искажения, который включается в представление битового потока звукового содержания и чтобы регулировать схему контроля искажения в зависимости от параметра управления ограничением искажения. 6 н. и 12 з.п. ф-лы, 11 ил.