Кодирование аудиосигнала



Кодирование аудиосигнала
Кодирование аудиосигнала
Кодирование аудиосигнала

 


Владельцы патента RU 2428748:

Нокиа Корпорейшн (FI)

Изобретение относится к кодированию аудиосигнала, более конкретно к способу, устройствам, системе и машиночитаемому носителю, поддерживающим такое кодирование. При кодировании аудиосигнала к исходному аудиосигналу применяют подавление шума с получением аудиосигнала с уменьшенным шумом, причем применяют к упомянутому аудиосигналу с уменьшенным шумом анализ параметров. Режим кодирования выбирают на основании результатов упомянутого анализа параметров. Затем исходный аудиосигнал кодируют с использованием выбранного режима кодирования. Технический результат - достижение кодирования аудиосигнала высокого качества с переменной битовой скоростью. 6 н. и 13 з.п. ф-лы, 3 ил.

 

Область техники

Данное изобретение относится к кодированию аудиосигнала, более конкретно к способу, устройствам, системе и компьютерному программному продукту, поддерживающим такое кодирование.

Уровень техники

Аудиосигналы, подобные речевым, кодируются, например, для эффективной передачи или хранения.

Речевые кодеры и декодеры (кодеки) обычно оптимизированы для речевых сигналов, и довольно часто они работают на фиксированной битовой скорости.

Но аудиокодек может также быть сконфигурированным для работы с изменяемой битовой скоростью. На самых низких битовых скоростях такой аудиокодек может работать с речевыми сигналами так же, как специальный речевой кодек на тех же битовых скоростях. На самых высоких битовых скоростях качество работы кодека может быть хорошим для любых сигналов, включая музыку и фоновые шумы, которые могут считаться частью аудиосигнала, а не обычным шумом.

Дополнительной опцией кодирования аудиосигнала является «встроенное» (embedded) кодирование речи с переменной скоростью, которое также называется многоуровневым кодированием. Под встроенным кодированием речи с переменной скоростью подразумевают кодирование речи, в котором формируется битовый поток, включающий основные кодированные данные, сгенерированные основным кодером, и дополнительные данные улучшения, которые повышают качество первичных кодированных данных, генерированных основным кодером. Подмножество или подмножества битового потока могут быть затем декодированы с хорошим качеством. МСЭ-Т стремится стандартизировать широкополосный кодек в диапазоне частот 50-7000 Гц и битовой скоростью от 8 до 32 Кбит/с. Основной кодер будет работать на скорости 8 кбит/с, а дополнительные уровни с малой детализацией будут повышать качество речи и аудиосигнала. Минимальной целью является наличие по меньшей мере пяти битовых потоков со скоростями 8, 12, 16, 24 и 32 Кбит/с, получаемых из одного битового потока.

При кодировании аудиосигнала в некоторых случаях может быть использовано подавление шума как этап обработки, предшествующий самому кодированию, для улучшения качества звука. Наибольшее преимущество от подавления шума может быть получено на низких битовых скоростях, поскольку такое подавление в некоторых случаях позволяет получить относительно хорошее качество на выходе в зашумленной среде.

Характеристики кодека, работающего без подавления шума, на низких битовых скоростях ухудшаются, так как кодек пытается воспроизвести полный сигнал, включающий в себя и шумовой компонент. В результате доступного количества битов становится недостаточно для сохранения формы сигнала и основных характеристик речи. С увеличением битовой скорости эта проблема уменьшается.

Более высокие битовые скорости могут в итоге давать высокое качество аудиосигнала без какой-либо предварительной обработки. В случае музыкальных сигналов подавление шума может даже вносить искажения в сигнал. Таким образом, для достижения кодирования высокого качества с переменной битовой скоростью можно использовать подавление шума на низких битовых скоростях, и не использовать подавление шума на высоких битовых скоростях кодирования речевого/аудиосигнала.

Также при встроенном кодировании речи с переменной скоростью параметры кодирования с низкими битовыми скоростями, в данном случае в основном 8 и 12 Кбит/с, улучшаются при использовании подавления шума, а результатом применения высоких битовых скоростей будет наилучшее качество речи и аудиосигнала без какой-либо предварительной обработки. В этом случае можно реализовать принцип адаптивного подавления шума. То есть к аудиосигналу может быть применен первый этап подавления шума, и результирующий сигнал может быть кодирован основным кодером. Дополнительно, второй этап подавления шума может быть применен (либо подавление шума применено не будет) к тому же аудиосигналу, и результирующий сигнал может быть использован для генерирования данных для улучшения качества.

В дополнение к различным битовым скоростям кодер аудиосигнала может также выбирать различные режимы кодирования для кодирования аудиосигнала.

Первый режим кодирования может быть оптимизирован, например, для речи, второй - для музыки, и третий - для смешанного сигнала, и так далее. Соответствующий метод кодирования может быть выбран, например, на основании определения параметров кодируемого сигнала.

Сущность изобретения

Данное изобретения исходит из того, что применение подавления шума к кодируемому аудиосигналу не всегда является желательным, несмотря на вышеуказанные отрицательные эффекты в случае кодирования с низкой битовой скоростью.

Когда, несмотря на сильный фоновый шум, подавление шума не используется, кодек с низкой битовой скоростью имеет тенденцию к выбору неоптимального режима кодирования. Применение неоптимального режима кодирования приводит к ограничению качества кодирования и делает отрицательный эффект ограниченного числа бит в случае низкой битовой скорости еще более заметным. Неоптимальный режим часто может быть выбран из-за того, что кодек пытается воспроизвести также и шумовые характеристики сигнала, а не только характеристики речи. В результате, в кодеках, которые имеют оптимизированные решения, особенно для вокализированной речи и вокальных переходов, при кодировании зашумленной речи слишком часто используются режимы кодирования для невокализованной речи, являющейся шумоподобной, и особенно основные режимы кодирования, которые пытаются кодировать все кадры, не классифицированные для специализированного кодирования.

Несмотря на то, что можно реализовать выбор режима так, чтобы он работал хорошо как для чистых, так и для зашумленных сигналов, такой подход, очевидно, является компромиссом по качеству между чистыми и зашумленными сигналами. Это также требует существенного объема работ по точной настройке классификатора режима для всех типов фонового шума, включая, в числе прочего, шум в офисах, уличный шум, шум от автомобилей, мешающий шум говорящего и т.д.

Описывается способ, который содержит применение подавления шума к исходному аудиосигналу с получением аудиосигнала с уменьшенным шумом. Этот способ также содержит выбор режима кодирования, на основе аудиосигнала с уменьшенным шумом. Способ также содержит кодирование исходного аудиосигнала с использованием выбранного режима кодирования.

Кроме того, описывается устройство, содержащее компонент для подавления шума, сконфигурированный для применения подавления шума к исходному аудиосигналу с получением аудиосигнала с уменьшенным шумом. Это устройство также содержит компонент для выбора, сконфигурированный для выбора режима кодирования, на основе аудиосигнала с уменьшенным шумом, предоставляемого компонентом для подавления шума. Устройство также содержит компонент для кодирования, сконфигурированный для кодирования исходного аудиосигнала с использованием режима кодирования, выбранного компонентом для выбора.

Компоненты описанного устройства могут быть реализованы аппаратно и/или программно. Они могут быть реализованы, например процессором, исполняющим программный код для выполнения требуемых функций. Альтернативно, компоненты могут быть реализованы, например, в интегральной схеме (например, в микросхеме или наборе микросхем). Кроме того, описанное устройство может содержать только указанные компоненты, но также может содержать и дополнительные компоненты.

Кроме того, описывается электронное устройство, которое содержит описанное устройство и дополнительно - интерфейс для аудиосигнала. Интерфейс для аудиосигнала может быть, например микрофоном или разъемом для микрофона, а также интерфейсом с какими-либо другими устройствами, обеспечивающими аудиосигнал.

Кроме того, описывается устройство, которое содержит компонент для декодирования, выполненный с возможностью декодирования аудиосигнала, кодированного в соответствии с описанным способом.

Кроме того, описывается система, которая содержит описанное устройство, и дополнительно - другое устройство, включающее компонент для декодирования, сконфигурированный для декодирования аудиосигнала, кодированного описанным устройством.

В завершении предлагается компьютерный программный продукт, в котором программный код хранится на машинночитаемом носителе данных. Этот программный код, исполняемый процессором, реализует предлагаемый способ. Компьютерный программный продукт может быть, например, отдельным устройством памяти или памятью, интегрированной в электронное устройство.

Данное изобретение также включает компьютерный программный код, отдельный от компьютерного программного продукта и читаемого компьютером носителя.

Характеристики кодирования аудиосигнала без подавления шума часто могут быть улучшены при более частом использовании существующих специальных режимов кодирования в случае присутствия фонового шума. Это может быть достигнуто путем применения подавления шума в аудиосигнале только для определения режима кодирования, как описано выше. Затем к исходному аудиосигналу применяется реальное кодирование, с использованием выбранного режима кодирования. Решение о выборе режима кодирования, таким образом, основано на сигнале, к которому применено подавление шума, с кодированием исходного зашумленного сигнала и сохранением основных характеристик этого сигнала. В результате, оптимальный режим кодирования может быть выбран и в случае присутствия фонового шума, без влияния на выбор режима для незашумленного сигнала.

Настоящий подход пригоден для улучшения характеристик кодирования в случае фонового шума, по сравнению с обычным кодированием без подавления шума. Дополнительно, нет необходимости основывать разработку и выбор режима на компромиссе между незашумленными и зашумленными сигналами, поскольку можно считать, что сигнал, для которого выбирается режим, всегда является незашумленным. Кроме того, может быть устранено нежелательное кодирование сигнала, к которому было применено подавление шума. В результате, сохраняется естественность сигнала и не появляется дополнительные искажения, которые иногда могут быть слышны в сигнале, к которому было применено подавление шума. Представленный подход также пригоден для уменьшения до некоторой степени отрицательного эффекта ограниченного числа бит в случае кодирования с низкой битовой скоростью.

Следует понимать, что выражение «исходный аудиосигнал» используется только для указания его отличия от «аудиосигнала с уменьшенным шумом». Поэтому подавлению шума и/или кодированию исходного аудиосигнала может предшествовать любой тип предварительной обработки исходного аудиосигнала. В одном варианте осуществления к аудиосигналу с уменьшенным шумом применен анализ параметров. Результат анализа может затем быть использован как базис для выбора режима кодирования.

Для некоторых типов анализа один только результат анализа параметров может быть недостаточной основой для надежного выбора режима кодирования. В этих случаях может быть использована дополнительная информация, в частности (но не исключительно), аудиосигнал с уменьшенным шумом. Таким анализом параметров может быть, например, анализ основного тона. В этом случае получаемые величины параметров, в частности оценка основного тона, могут быть использованы как дополнение при кодировании исходного аудиосигнала.

Представленный подход может быть реализован с любой схемой кодирования аудиосигнала, которая позволяет кодировать с выбором одного из множества режимов кодирования. Это может быть использовано, например, со схемой с переменной битовой скоростью, такой как схема встроенного кодирования с переменной битовой скоростью.

Если представленный подход используется со схемой кодирования с переменной битовой скоростью, то выбор режима кодирования на основе аудиосигнала с уменьшенным шумом может быть реализован исключительно для низких, но не для высоких битовых скоростей, даже когда такое различение не требуется.

Описанное устройство может, например, являться кодером или включать кодер с переменной битовой скоростью / встроенный кодер с переменной битовой скоростью (Variable Bit Rate-Embedded Variable, VBR-EV).

Электронное устройство может быть, например, мобильным терминалом или персональным компьютером, но также и любым другим устройством, использующимся для кодирования аудиоданных.

Описанный подход может быть реализован, например, при кодировании аудиосигналов для передачи посредством сети с коммутацией пакетов, например, для Voice over IP (VolP), или для передачи посредством сети с коммутацией каналов, например глобальной системы мобильной связи (GSM). Описанный подход может быть также реализован при кодировании аудиосигналов для передачи посредством других типов сетей или для кодирования аудиосигналов независимо от каких-либо передач.

Необходимо отметить, что признаки и этапы всех представленных вариантов осуществления могут быть комбинированы любым подходящим способом.

Другие объекты и признаки настоящего изобретения станут понятными из следующего подробного описания, представленного вместе с соответствующими чертежами. Необходимо отметить, однако, что эти чертежи предназначены исключительно для иллюстративных целей, а не для ограничения данного изобретения, которое описано в прилагаемой формуле изобретения. Также понятно, что чертежи выполнены не в масштабе, и что они призваны концептуально иллюстрировать описанные здесь структуры и процедуры.

Краткое описание чертежей

Фиг.1 - блок-схема системы в соответствии с вариантом осуществления данного изобретения;

фиг.2 - схема алгоритма, иллюстрирующего функционирование системы связи на фиг.1; и

фиг.3 - блок-схема электронного устройства в соответствии с вариантом осуществления данного изобретения.

Подробное описание изобретения

Фиг.1 представляет собой блок-схему системы, которая делает возможным выбор режима кодирования в соответствии с первым вариантом осуществления данного изобретения.

Система содержит первое электронное устройство 110 и второе электронное устройство 130. Системой может быть, например, мобильная система связи, в которой электронные устройства 110, 130 являются мобильными терминалами.

Первое электронное устройство 110 содержит микрофон 111, интегральную схему (IC) 112 и передатчик (ТХ) 113. Интегральная схема 112 или электронное устройство 110 может считаться примером варианта осуществления устройства в соответствии с данным изобретением.

Интегральная схема 112 содержит аналого-цифровой преобразователь (ADC) 114 и аудиокодер 120. Аудиокодер 120 содержит подавитель 121 шума, блок 122 оценки основного тона, селектор 123 режима и кодер 124. Микрофон 110 соединен с аналого-цифровым преобразователем 114. Аналого-цифровой преобразователь 114 также соединен с подавителем 121 шума и кодером 124. Подавитель 121 шума также соединен с кодером 124 посредством блока 122 оценки основного тона и селектора 123 режима. Блок оценки 122 основного тона дополнительно соединен с кодером 124 напрямую. Кодер 124 соединен с передатчиком 113.

Кодер 124 может быть выбран по желанию. Им может быть, например, встроенный речевой кодер с переменной скоростью, который содержит основной кодер и несколько кодеров уровней улучшения. Основной кодер может быть задаваемым кодом алгебраическим линейным прогнозированием (Algebraic Code-Excited Linear Prediction, ACELP), например, адаптивным многоскоростным широкополосным (Adaptive Multirate Wideband, AMR-WB) кодером или многорежимным широкополосным кодером с переменной скоростью (Variable-Rate Multimode Wideband, VMR-WB). Выбор кодера уровня улучшения может зависеть, например, от того, является ли целью уровня улучшения увеличить устойчивость к ошибкам, повысить выходной уровень качества речи или получить хорошее качество кодирования музыкальных сигналов, и т.д.

Должно быть отмечено, что электронное устройство 110 может содержать различные другие непоказанные компоненты. Интегральная схема 112 также может содержать дополнительные компоненты. Должно быть отмечено также, что аналого-цифровой преобразователь 114 также может быть выполнен внешним по отношению к интегральной схеме 112, и что микрофон 111 может быть также реализован в форме дополнительного устройства к электронному устройству 110. Кроме того, нужно отметить, что микрофон 111, аналого-цифровой преобразователь 114, аудиокодер 120 и передатчик 113 также могут быть соединены между собой посредством одного или нескольких других компонентов первого электронного устройства 110.

Второе электронное устройство 130 содержит соединенные между собой в следующем порядке элементы: приемник (RX) 131, декодер 132, цифроаналоговый преобразователь 133 и динамики 134.

Должно быть отмечено, что электронное устройство 130 также может содержать различные другие непоказанные компоненты, и что динамики 134 могут быть реализованы также в форме дополнительных устройств. Также должно быть отмечено, что приемник 131, декодер 132, цифроаналоговый преобразователь 133 и динамики 134 также могут быть соединены между собой посредством одного или нескольких других компонентов электронного устройства 130.

Пример функционирования системы в соответствии с данным изобретением на фиг.1 будет теперь описано со ссылкой на фиг.2. Фиг.2 - это блок-схема алгоритма, иллюстрирующего обработку в аудиокодере 120.

Пользователь первого электронного устройства 110 может использовать микрофон 111 для ввода аудиоданных, которые передаются второму электронному устройству 130 посредством сети мобильной связи.

Аналого-цифровой преобразователь 114 преобразует аналоговый аудиосигнал, принятый микрофоном 111, в цифровой аудиосигнал.

Аудиокодер 120 принимает цифровой аудиосигнал от аналого-цифрового преобразователя 114.

В аудиокодере 120 принятый аудиосигнал поступает на подавитель 121 шума.

Подавитель 121 шума применяет подавление шума к принятому аудиосигналу (этап 201). Уровень подавления шума может быть установлен, например, равным 14 дБ, либо равным любой другой желаемой величине.

Результирующий сигнал, прошедший подавление шума, подается в блок оценки 122 основного тона. Блок оценки 122 основного тона выполняет стандартную оценку основного тона для сигнала, прошедшего подавление шума (этап 202), и предоставляет результаты оценки основного тона селектору 123 режима и кодеру 124.

Селектор 123 режима принимает также сигнал, прошедший подавление шума, либо напрямую от подавителя 121 шума, либо от блока оценки 122 основного тона. Селектор 123 режима использует принятую оценку основного тона и принятый сигнал, прошедший подавление шума, для выбора подходящего режима кодирования (этап 203), и информирует о выбранном режиме кодер 124. Поскольку оценка основного тона выполняется на базе сигнала, прошедшего подавление шума, фоновый шум не влияет на выбор режима. Выбранный режим, таким образом, может быть особенно подходящим для намеренно вводимых аудиоданных.

Кодер 124 принимает зашумленный аудиосигнал, оценку основного тона и информацию о выбранном режиме кодирования.

Кодер 124 выполняет кодирование принятого зашумленного аудиосигнала, в соответствии с выбранным режимом кодирования (этап 204). Благодаря применению кодирования к зашумленному аудиосигналу сохраняется естественность сигнала.

Кодирование, основанное на зашумленном сигнале, может включать, например, квантование спектральных пар иммитанса в частотной области (ISF) и поиск в кодовой книге ACELP. Требуемая оценка основного тона может быть получена на основе зашумленного аудиосигнала, но также может быть использована и оценка основного тона, предоставленная блоком оценки 122 основного тона.

В случае встроенного речевого кодера с переменной скоростью основной кодер кодирует зашумленные аудиосигналы, например, с битовой скоростью 8 Кбит/с, и предоставляет получаемые кодированные данные первому уровню улучшения. Первый уровень улучшения принимает кодированные данные, а также зашумленный аудиосигнал, и генерирует данные улучшения для кодированных данных, с дополнительной битовой скоростью 4 Кбит/с. Дополнительные уровни улучшения могут генерировать дополнительные данные улучшения, например, с соответствующей дополнительной битовой скоростью 4 Кбит/с, 8 Кбит/с и более 8 Кбит/с.

Кодированные данные и данные уровня улучшения объединяются вместе с информацией о режиме кодирования в один встроенный битовый поток, который поступает в передатчик 113. Передатчик 113 передает встроенный битовый поток посредством сети мобильной связи второму электронному устройству 130 (этап 205). Приемник 131 второго электронного устройства 130 принимает встроенный битовый поток и передает его декодеру 132. Декодер 132 декодирует весь встроенный битовый поток или подмножество встроенного битового потока для восстановления цифровых аудиоданных. Декодер 132 может использовать для получения этих данных только кодированные данные с битовой скоростью 8 Кбит/с. Альтернативно, декодер может дополнительно использовать данные уровня улучшения одного или более уровней, т.е. данные с общей битовой скоростью 12 Кбит/с, 16 Кбит/с, 24 Кбит/с или 32 Кбит/с.

Декодированные цифровые аудиоданные подаются на цифроаналоговый преобразователь 133, который преобразует цифровые аудиоданные в аналоговые аудиоданные. Затем аналоговые аудиоданные могут быть представлены пользователю посредством динамиков 134.

Функции, проиллюстрированные подавителем 121 шума, также могут рассматриваться как средства для применения подавления шума к исходному аудиосигналу с получением аудиосигнала с уменьшенным шумом. Функции, проиллюстрированные селектором 123 режима, также могут быть рассмотрены как средства выбора режима кодирования на основе аудиосигнала с уменьшенным шумом. Функции, проиллюстрированные кодером 124, также могут быть рассмотрены как средства кодирования исходного аудиосигнала с использованием выбранного режима кодирования.

Должно быть отмечено, что существует множество возможностей для изменения варианта осуществления изобретения, представленного на фиг.1. Например, одно (или оба) из электронных устройств 110 (110, 130) может быть устройством, отличным от мобильного терминала. Одно из электронных устройств может быть, например, персональным компьютером и т.д. Функции интегральной схемы 120 также могут быть реализованы на дискретных компонентах или программным способом. Кроме того, выбор режима может быть основан на типе анализа параметров, отличного от анализа основного тона, и т.д.

Фиг.3 - блок-схема примера электронного устройства 310, обеспечивающего выбор режима кодирования в соответствии со вторым вариантом осуществления данного изобретения.

Электронное устройство 310 также может быть, например, мобильным терминалом или системой беспроводной связи. Электронное устройство 310 может считаться примером варианта осуществления устройства в соответствии с данным изобретением.

Электронное устройство 310 содержит микрофон 311, соединенный через аналого-цифровой преобразователь 314 с процессором 321. Процессор 321 далее соединен через цифроаналоговый преобразователь 333 с динамиками 334. Процессор 321 также соединен с приемопередатчиком (TX/RX) 313, с интерфейсом пользователя (UI) 315 и с памятью 322.

Процессор 321 сконфигурирован для выполнения различных программных кодов. Реализованные программные коды содержат код кодирования аудиоданных, для кодирования зашумленного аудиосигнала с использованием режима кодирования, выбранного на основе аудиосигнала, прошедшего подавление шума. Реализованные программные коды также содержат код декодирования аудиоданных. Реализованные программные коды 323 могут храниться, например, в памяти 322, из которой извлекаются процессором 321 по мере необходимости. Память 322 также может предоставлять раздел 324 для хранения данных, например данных, требующих кодирования в соответствии с данным изобретением.

Интерфейс 315 пользователя позволяет пользователю вводить команды в электронное устройство 310 (например, с помощью клавиатуры) и/или получать информацию от электронного устройства 310, например, посредством дисплея. Приемопередатчик 313 позволяет осуществлять связь с другими электронными устройствами, например, посредством сети беспроводной связи.

Должно быть отмечено также, что существует множество способов реализации и изменения структуры электронного устройства 310.

Пользователь электронного устройства 310 может использовать микрофон 311 для ввода аудиоданных, предназначенных для передачи каким-либо другим электронным устройствам, или для сохранения этих данных в секции 324 данных памяти 322. Соответствующее приложение вызывается для этого пользователем посредством интерфейса 315 пользователя. Это приложение, которое может исполняться процессором 321, позволяет процессору 321 выполнять код кодирования, хранящийся в памяти 322.

Аналого-цифровой преобразователь 314 преобразует входной аналоговый аудиосигнал в цифровой аудиосигнал и предоставляет цифровой аудиосигнал для процессора 321.

Процессор 321 может затем обрабатывать цифровой аудиосигнал тем же способом, что описан со ссылкой на фиг.3 для электронного устройства 110, показанного на фиг.1.

Результирующий битовый поток в виде встроенного битового потока подается на приемопередатчик 313 для передачи на другое электронное устройство. Альтернативно, кодированные данные могут быть также сохранены в секции 324 данных памяти 322, например, для более поздней передачи или для более позднего представления этих данных тем же электронным устройством 310.

Электронное устройство 310 может также принимать битовый поток с соответствующим образом кодированными данными из другого электронного устройства, посредством своего приемопередатчика 313. В этом случае процессор 321 может выполнять программный код для декодирования, хранящийся в памяти 322. Процессор 321 декодирует принятые данные или соответствующее подмножество данных из встроенного битового потока и передает декодированные данные цифро-аналоговому преобразователю 333. Цифроаналоговый преобразователь 333 преобразует цифровые декодированные данные в аналоговые аудиоданные и выводит их посредством динамиков 334. Исполнение программного кода для декодирования также может быть инициировано приложением, которое вызывается пользователем посредством интерфейса пользователя 315.

Принятые кодированные данные могут быть также сохранены (вместо немедленного представления посредством динамиков 334) в секции 324 данных памяти 322, например, для более позднего представления или пересылки на другое электронное устройство.

Функции, продемонстрированные процессором 321, выполняющим программный код для кодирования, также могут рассматриваться как средство для применения подавления шума к исходному аудиосигналу с получением аудиосигнала с уменьшенным шумом; как средство для выбора режима кодирования на основе аудиосигнала с уменьшенным шумом; и как средство для кодирования исходного аудиосигнала с использованием выбранного режима кодирования.

Альтернативно, функциональные модули программного кода для кодирования также могут быть рассмотрены как средство для применения подавления шума к исходному аудиосигналу с получением аудиосигнала с уменьшенным шумом; как средство для выбора режима кодирования на основе аудиосигнала с уменьшенным шумом; и как средство для кодирования исходного аудиосигнала с использованием выбранного режима кодирования.

В итоге, представленные варианты осуществления данного изобретения делают возможным выбор подходящих режимов кодирования для кодирования аудиоданных, даже когда это кодирование применяется к зашумленным аудиоданным, без подавления шума. Представленный улучшенный выбор режима приводит к улучшению характеристик кодирования аудиоданных.

Хотя здесь были показаны и описаны фундаментальные новые признаки данного изобретения применительно к предпочтительным вариантам его осуществления, понятно, что специалистами могут быть выполнены различные упрощения, замены и изменения в форме и подробностях описанных устройств и способов, без отклонения от данного изобретения. Например, все комбинации тех элементов и/или этапов метода, которые выполняют в основном те же функции в основном тем же путем для достижения тех же результатов, находятся в рамках данного изобретения. Кроме того, нужно заметить, что структуры, и/или элементы, и/или этапы способа, показанные и/или описанные вместе с любой представленной формой или вариантом осуществления данного изобретения, могут быть реализованы в любой другой представленной, описанной или предложенной форме или варианте осуществления. Поэтому изобретение ограничено только прилагаемой формулой изобретения. Кроме того, пункты формулы изобретения, сформулированные по принципу «средство-плюс-функция», предназначены для охвата структур, описанных здесь как выполняющие перечисленные функции, а также не только структурных эквивалентов, но и эквивалентных структур.

1. Способ кодирования, включающий:
применение подавления шума к исходному аудиосигналу с получением аудиосигнала с уменьшенным шумом;
применение к упомянутому аудиосигналу с уменьшенным шумом анализа параметров;
выбор режима кодирования на основании результатов упомянутого анализа параметров и
кодирование упомянутого исходного аудиосигнала с использованием упомянутого выбранного режима кодирования.

2. Способ по п.1, отличающийся тем, что к упомянутому аудиосигналу с уменьшенным шумом применяют анализ основного тона и результаты упомянутого анализа основного тона и упомянутый аудиосигнал с уменьшенным шумом используют как основу для выбора упомянутого режима кодирования.

3. Способ по п.2, отличающийся тем, что упомянутое кодирование исходного аудиосигналу дополнительно использует результаты упомянутого анализа основного тона.

4. Способ по п.1, отличающийся тем, что упомянутое кодирование исходного аудиосигнала является встроенным кодированием с переменной битовой скоростью.

5. Способ по п.1, отличающийся тем, что упомянутый выбор режима кодирования, основанный на упомянутом аудиосигнале с уменьшенным шумом, применяют только для кодирования с низкой битовой скоростью при кодировании с переменной битовой скоростью.

6. Устройство для кодирования, включающее:
компонент для подавления шума, сконфигурированный для применения подавления шума к исходному аудиосигналу с получением аудиосигнала с уменьшенным шумом;
компонент для анализа параметров, сконфигурированный для применения анализа параметров к упомянутому аудиосигналу с уменьшенным шумом;
компонент для выбора, сконфигурированный для выбора режима кодирования на основании результатов упомянутого анализа параметров, предоставляемого упомянутым компонентом для анализа параметров; и
компонент для кодирования, сконфигурированный для кодирования упомянутого исходного аудиосигнала с использованием режима кодирования, выбранного упомянутым компонентом для выбора.

7. Устройство по п.6, также включающее компонент для анализа, сконфигурированный для применения анализа основного тона к упомянутому аудиосигналу с уменьшенным шумом, при этом упомянутый компонент для выбора сконфигурирован для использования результатов упомянутого анализа основного тона для выбора упомянутого режима кодирования.

8. Устройство по п.7, отличающееся тем, что упомянутый компонент для кодирования сконфигурирован для кодирования упомянутого исходного аудиосигнала с использованием дополнительно результатов упомянутого анализа основного тона.

9. Устройство по п.6, отличающееся тем, что упомянутый компонент для кодирования сконфигурирован для применения к упомянутому исходному аудиосигналу встроенного кодирования с переменной битовой скоростью.

10. Устройство по п.6, отличающееся тем, что упомянутый компонент для кодирования сконфигурирован для применения к упомянутому исходному аудиосигналу кодирования с переменной битовой скоростью и упомянутый компонент для выбора сконфигурирован для выбора режима кодирования на основании упомянутого аудиосигнала с уменьшенным шумом только при применении кодирования с низкой битовой скоростью упомянутым компонентом для кодирования.

11. Электронное устройство для кодирования аудиосигнала, включающее:
устройство по п.6 и
интерфейс для аудиосигнала.

12. Система для кодирования и декодирования, включающая:
устройство по п.6 и
устройство, включающее компонент для декодирования, сконфигурированный для декодирования аудиосигнала, кодированного упомянутым устройством по п.6.

13. Машиночитаемый носитель данных, содержащий программный код, при этом при выполнении процессором упомянутого программного кода реализуется следующее:
применение подавления шума к исходному аудиосигналу с получением аудиосигнала с уменьшенным шумом;
применение к упомянутому аудиосигналу с уменьшенным шумом анализа параметров;
выбор режима кодирования на основании упомянутого анализа параметров и
кодирование упомянутого исходного аудиосигнала с использованием упомянутого выбранного режима кодирования.

14. Машиночитаемый носитель данных по п.13, отличающийся тем, что упомянутый программный код применяет анализ основного тона к упомянутому аудиосигналу с уменьшенным шумом и упомянутый программный код использует результаты упомянутого анализа основного тона и упомянутый аудиосигнал с уменьшенным шумом как основу для выбора режима кодирования.

15. Машиночитаемый носитель данных по п.14, отличающийся тем, что упомянутый программный код дополнительно использует результаты упомянутого анализа основного тона для кодирования упомянутого исходного аудиосигнала.

16. Машиночитаемый носитель данных по п.13, отличающийся тем, что упомянутое кодирование упомянутого исходного аудиосигнала является встроенным кодированием с переменной битовой скоростью.

17. Машиночитаемый носитель данных по п.13, отличающийся тем, что упомянутый выбор режима кодирования, основанный на упомянутом аудиосигнале с уменьшенным шумом, применяется только для кодирования с низкой битовой скоростью при кодировании с переменной битовой скоростью.

18. Устройство для кодирования, включающее:
средства для применения подавления шума к исходному аудиосигналу с получением аудиосигнала с уменьшенным шумом;
средство для применения к упомянутому аудиосигналу с уменьшенным шумом анализа параметров;
средства для выбора режима кодирования на основании результатов упомянутого анализа параметров и
средства для кодирования упомянутого исходного аудиосигнала с использованием упомянутого выбранного режима кодирования.

19. Устройство по п.18, также включающее средства для применения к упомянутому аудиосигналу с уменьшенным шумом анализа основного тона, при этом упомянутое средство для выбора режима кодирования использует результаты упомянутого анализа основного тона как основу для выбора упомянутого режима кодирования.



 

Похожие патенты:

Изобретение относится к связи, а более конкретно, к методикам для кодирования и декодирования. .

Изобретение относится к звуковому кодированию/декодированию, в частности к концепциям масштабируемого кодирования/декодирования, имеющим базовый слой и слой расширения.

Изобретение относится к способу переключения скорости передачи битов при декодировании аудиосигнала, кодированного с помощью системы аудиокодирования, причем упомянутое декодирование содержит этап последующей обработки, зависящий от скорости передачи битов.

Изобретение относится к методам кодирования речи, в частности к кодированию речи с обеспечением устойчивости к ошибкам и передаче речи по сети с пакетной коммутацией для приложений, связанных с передачей речевых данных по протоколу Интернет (VoIP, Voice over IP).

Изобретение относится к трансформации шкалы времени, т.е. .

Изобретение относится к декодированию сжатой цифровой информации, в частности к декодированию битовых потоков, отражающих контент, который сжат с применением методов кодирования с долговременным предсказанием.

Изобретение относится к способу и устройству для обработки звукового сигнала. .

Изобретение относится к области кодирования аудиосигнала низкой скорости передачи битов высокого качества. .

Изобретение относится к многоканальному преобразованию параметров, в частности к генерированию параметров когерентности и параметров выходного уровня, которые указывают на пространственные свойства между двумя звуковыми сигналами, основанными на объектно-параметровом базовом представлении звукового воспроизведения в пространстве

Изобретение относится к средствам кодирования/декодирования спектра модифицированного дискретного косинусного преобразования

Изобретение относится к кодированию источников, в частности к кодированию источников звука, при котором аудиосигнал обрабатывается, по меньшей мере, двумя различными аудиокодерами, использующими два различных алгоритма кодирования

Изобретение относится к кодерам и декодерам, в частности, к реализации набора фильтров для перспективного аудиокодирования (ААС) и усовершенствованного с низкой задержкой (ELD) ААС

Изобретение относится к области методов сжатия данных, в частности к способу и устройству для многоступенчатого квантования

Изобретение относится к кодирующему и декодирующему устройствам и их способам, используемым в системе связи с масштабируемой схемой кодирования

Изобретение относится к области техники связи, в частности к способу и устройству для кодирования и декодирования

Изобретение относится к аудиодекодеру, в частности к МРЕG Surround декодеру или объектно-ориентированному декодеру

Изобретение относится к способу и устройству для предотвращения ограничения аудиосигнала, когда защита от ограничения сигнала на основе принятых аудиометаданных не гарантируется
Наверх