Способ, устройство и система для обработки аудиоданных

Авторы патента:

ВАН Чжэ (CN)

G10L21/02 - усиление речи, например подавление шума, нейтрализация эхо-сигнала (подавление эхо-сигнала в громкоговорящих телефонных системах H04M 9/08, в аппаратах для людей с дефектами слуха H04R 15/00)

G10L19/00 - Техника анализа-синтеза речи для уменьшения избыточности, например в вокодерах ; кодирование или декодирование речи

Владельцы патента RU 2641464:

ХУАВЭЙ ТЕКНОЛОДЖИЗ КО., ЛТД. (CN)

Настоящее изобретение раскрывает средства для обработки аудиоданных и относится к области техники связи. Технический результат заключается в уменьшении полосы пропускания и повышении качества кодирования аудиоданных. Получают шумовой кадр аудиосигнала. Раскладывают текущий шумовой кадр на шумовой сигнал полосы низких частот и шумовой сигнал полосы высоких частот. Кодируют и передают шумовой сигнал полосы низких частот посредством использования первого механизма прерывистой передачи. Кодируют и передают шумовой сигнал полосы высоких частот посредством использования второго механизма прерывистой передачи. 4 н. и 22 з.п. ф-лы, 9 ил.

ОБЛАСТЬ ТЕХНИКИ, К КОТОРОЙ ОТНОСИТСЯ ИЗОБРЕТЕНИЕ

[0001] Настоящее изобретение относится к области техники связи и, в частности, к способу, устройству и системе для обработки аудиоданных.

УРОВЕНЬ ТЕХНИКИ

[0002] В области цифровой связи существуют строгие требования к приложениям для передачи речи, изображений, аудио и видео, таким как вызовы с мобильного телефона, аудио/видеоконференц-связь, широковещательное телевидение и мультимедийные развлечения. Речь оцифровывается и затем передается из одного терминала в другой терминал через сеть речевой связи. В данном документе терминалы могут представлять собой мобильные телефоны, цифровые телефонные терминалы или речевые терминалы либо любые другие типы. Примеры цифровых телефонных терминалов представляют собой VoIP-телефоны или ISDN-телефоны, компьютеры и телефоны на основе кабельной связи. Чтобы сокращать ресурсы, занимаемые в процессе сохранения или передачи аудиосигналов, отправляющая сторона выполняет обработку сжатия для аудиосигналов перед передачей аудиосигналов в приемную сторону, и приемная сторона выполняет обработку распаковки, чтобы восстанавливать аудиосигналы и воспроизводить аудиосигналы.

[0003] В речевой связи речь включается только приблизительно 40% времени, а в другое время имеется только молчание или фоновый шум. Чтобы экономить полосы пропускания передачи и не допускать необязательного потребления полос пропускания в период молчания или фонового шума, развивается технология DTX/CNG (на основе системы прерывистой передачи/формирования комфортного шума). Если упрощать, DTX/CNG означает не кодирование кадров шума непрерывно, а выполнение кодирования только один раз за интервал в несколько кадров в период шума/молчания согласно политике, причем скорость передачи кодированных битов, в общем, гораздо ниже скорости передачи битов при речевом кадровом кодировании. Шумовой кадр, кодированный на такой низкой скорости, упоминается как "SID (кадр дескриптора вставки молчания)". Декодер восстанавливает непрерывные фоновые шумовые кадры на стороне декодирования согласно прерывисто принимаемым SID. Такой непрерывно восстановленный фоновый шум не является высококачественным воспроизведением фонового шума стороны кодирования, а нацелен на то, чтобы не допускать результирующего ухудшения качества при прослушивании в максимально возможной степени, так что пользователь чувствует себя комфортно при прослушивании шума. Восстановленный фоновый шум упоминается как "CN (комфортный шум)", а способ для восстановления CN на стороне декодирования упоминается как "формирование комфортного шума".

[0004] В предшествующем уровне техники ITU-T G.718 является новым стандартным широкополосным кодеком, который включает в себя широкополосную DTX/CNG-систему. Система может отправлять SID согласно фиксированному интервалу, а также может адаптивно регулировать интервал отправки SID согласно оцененному уровню шума. SID-кадр G.718 включает в себя 16 ISP-параметров и параметров энергии возбуждения. Эта группа параметров ISP (спектральной пары иммитанса) представляет спектральную огибающую для полосы пропускания всей широкой полосы частот, и энергия возбуждения получается посредством аналитического фильтра, представленного посредством этой группы ISP-параметров. На стороне декодирования G.718 оценивает, согласно ISP-параметрам, полученным посредством декодирования SID в CNG-состоянии, LPC-коэффициент, требуемый для CNG, оценивает, согласно параметрам энергии возбуждения, полученным посредством декодирования SID-кадра, энергию возбуждения, требуемую для CNG, и использует отрегулированный по усилению белый шум для того, чтобы возбуждать синтезирующий CNG-фильтр, чтобы получать восстановленный CN.

[0005] Тем не менее, для сверхширокополосной спектральной огибающей полоса пропускания сверхширокой полосы частот является чрезвычайно широкой; когда предшествующий уровень техники расширяется на сверхширокополосную DTX/CNG-систему, более интенсивные вычислительные нагрузки должны использоваться, и большее число битов должно быть использовано для того, чтобы вычислять и кодировать еще десяток ISP-параметров, поскольку полная сверхширокополосная спектральная огибающая должна быть кодирована для SID. Поскольку сигналы полосы высоких частот шума (которая означает частотный диапазон выше широкой полосы частот в данном документе), в общем, не являются перцепционно чувствительными при прослушивании, используемые вычислительные нагрузки и биты, потребляемые для этой части сигналов, не являются экономически эффективными, в силу этого снижая эффективность кодирования кодека.

СУЩНОСТЬ ИЗОБРЕТЕНИЯ

[0006] Чтобы разрешать проблему при сверхширокополосном кодировании и передаче, варианты осуществления настоящего изобретения предоставляют способ, устройство и систему для обработки аудиоданных. Технические решения заключаются в следующем:

[0007] Согласно одному аспекту способ для обработки аудиоданных предоставляется и включает в себя:

- получение шумового кадра аудиосигнала и разложение шумового кадра на шумовой сигнал полосы низких частот и шумовой сигнал полосы высоких частот; и

- кодирование сигнала полосы низких частот посредством использования первого механизма прерывистой передачи и передачу кодированного шумового сигнала полосы низких частот посредством использования первого механизма прерывистой передачи и кодирование шумового сигнала полосы высоких частот посредством использования второго механизма прерывистой передачи и передачу кодированного шумового сигнала полосы высоких частот посредством использования второго механизма прерывистой передачи, причем политика для отправки первого кадра SID дескриптора вставки молчания первого механизма прерывистой передачи отличается от политики для отправки второго SID второго механизма прерывистой передачи, либо политика для кодирования первого SID первого механизма прерывистой передачи отличается от политики для кодирования второго SID второго механизма прерывистой передачи.

[0008] Согласно одному аспекту способ для обработки аудиоданных предоставляется и включает в себя:

- получение, посредством декодера, кадра SID дескриптора вставки молчания и определение того, включает ли SID в себя параметр полосы низких частот и/или параметр полосы высоких частот;

- когда SID включает в себя параметр полосы низких частот, декодирование SID, чтобы получать шумовой параметр полосы низких частот, локальное формирование шумового параметра полосы высоких частот и получение первого кадра комфортного шума CN согласно шумовому параметру полосы низких частот, полученному посредством декодирования, и локально сформированному шумовому параметру полосы высоких частот;

- когда SID включает в себя параметр полосы высоких частот, декодирование SID, чтобы получать шумовой параметр полосы высоких частот, локальное формирование шумового параметра полосы низких частот и получение второго CN-кадра согласно шумовому параметру полосы высоких частот, полученному посредством декодирования, и локально сформированному шумовому параметру полосы низких частот; и

- когда SID включает в себя параметр полосы высоких частот и параметр полосы низких частот, декодирование SID, чтобы получать шумовой параметр полосы высоких частот и шумовой параметр полосы низких частот, и получение третьего CN-кадра согласно шумовому параметру полосы высоких частот и шумовому параметру полосы низких частот, полученным посредством декодирования.

[0009] Согласно другому аспекту устройство для кодирования аудиоданных предоставляется и включает в себя:

- модуль получения, сконфигурированный с возможностью получать шумовой кадр аудиосигнала и разлагать шумовой кадр на шумовой сигнал полосы низких частот и шумовой сигнал полосы высоких частот; и

- передающий модуль, сконфигурированный с возможностью кодировать шумовой сигнал полосы низких частот посредством использования первого механизма прерывистой передачи и передавать кодированный шумовой сигнал полосы низких частот посредством использования первого механизма прерывистой передачи и кодировать шумовой сигнал полосы высоких частот посредством использования второго механизма прерывистой передачи и передавать кодированный шумовой сигнал полосы высоких частот посредством использования второго механизма прерывистой передачи, причем политика для отправки первого кадра SID дескриптора вставки молчания первого механизма прерывистой передачи отличается от политики для отправки второго SID второго механизма прерывистой передачи, либо политика для кодирования первого SID первого механизма прерывистой передачи отличается от политики для кодирования второго SID второго механизма прерывистой передачи.

[0010] Согласно другому аспекту устройство для декодирования аудиоданных предоставляется и включает в себя:

- модуль получения, сконфигурированный с возможностью получать кадр SID дескриптора вставки молчания и определять то, SID включает в себя параметр полосы низких частот и/или параметр полосы высоких частот;

- первый модуль декодирования, сконфигурированный с возможностью: когда SID, полученный посредством модуля получения, включает в себя параметр полосы низких частот, декодировать SID, чтобы получать шумовой параметр полосы низких частот, локально формировать шумовой параметр полосы высоких частот и получать первый кадр комфортного шума CN согласно шумовому параметру полосы низких частот, полученному посредством декодирования, и локально сформированному шумовому параметру полосы высоких частот;

- второй модуль декодирования, сконфигурированный с возможностью: когда SID, полученный посредством модуля получения, включает в себя параметр полосы высоких частот, декодировать SID, чтобы получать шумовой параметр полосы высоких частот, локально формировать шумовой параметр полосы низких частот и получать второй CN-кадр согласно шумовому параметру полосы высоких частот, полученному посредством декодирования, и локально сформированному шумовому параметру полосы низких частот; и

- третий модуль декодирования, сконфигурированный с возможностью: когда SID, полученный посредством модуля получения, включает в себя параметр полосы высоких частот и параметр полосы низких частот, декодировать SID, чтобы получать шумовой параметр полосы высоких частот и шумовой параметр полосы низких частот, и получать третий CN-кадр согласно шумовому параметру полосы высоких частот и шумовому параметру полосы низких частот, полученным посредством декодирования.

[0011] Согласно другому аспекту система для обработки аудиоданных предоставляется и включает в себя вышеприведенное устройство для кодирования аудиоданных и вышеприведенное устройство для декодирования аудиоданных.

[0012] Технические решения, предоставляемые посредством вариантов осуществления настоящего изобретения, обеспечивают следующие преимущества. Текущий шумовой кадр раскладывается на шумовой сигнал полосы низких частот и шумовой сигнал полосы высоких частот; затем шумовой сигнал полосы низких частот кодируется и передается посредством использования первого механизма прерывистой передачи, и шумовой сигнал полосы высоких частот кодируется и передается посредством использования второго механизма прерывистой передачи; декодер получает кадр SID дескриптора вставки молчания и определяет то, включает SID в себя параметр полосы низких частот и/или параметр полосы высоких частот; и различные способы декодирования шума используются согласно различным результатам определения. Таким образом, различные способы обработки кодирования и декодирования используются для сигнала полосы высоких частот и сигнала полосы низких частот, может уменьшаться вычислительная сложность, и кодированные биты могут экономиться при допущении непонижения субъективного качества кодека, и биты, которые экономятся, могут помогать достигать цели уменьшения полосы пропускания передачи или повышения общего качества кодирования, за счет этого решая проблему при сверхширокополосном кодировании и передаче.

КРАТКОЕ ОПИСАНИЕ ЧЕРТЕЖЕЙ

[0013] Чтобы более понятно описывать технические решения в вариантах осуществления настоящего изобретения, далее кратко представлены прилагаемые чертежи, требуемые для описания вариантов осуществления. Очевидно, что прилагаемые чертежи в последующем описании показывают только некоторые варианты осуществления настоящего изобретения, и специалисты в данной области техники по-прежнему могут получать другие чертежи из этих прилагаемых чертежей без творческих усилий.

[0014] Фиг.1 является блок-схемой последовательности операций способа для обработки аудиоданных согласно варианту 1 осуществления настоящего изобретения;

[0015] фиг.2 является блок-схемой последовательности операций способа для обработки аудиоданных согласно варианту 2 осуществления настоящего изобретения;

[0016] фиг.3 является блок-схемой последовательности операций способа для обработки аудиоданных согласно варианту 3 осуществления настоящего изобретения;

[0017] фиг.4 является блок-схемой последовательности операций способа для обработки аудиоданных согласно варианту 4 осуществления настоящего изобретения;

[0018] фиг.5 является принципиальной схемой устройства для кодирования аудиоданных согласно варианту 6 осуществления настоящего изобретения;

[0019] фиг.6 является принципиальной схемой другого устройства для кодирования аудиоданных согласно варианту 6 осуществления настоящего изобретения;

[0020] фиг.7 является принципиальной схемой устройства для декодирования аудиоданных согласно варианту 7 осуществления настоящего изобретения;

[0021] фиг.8 является принципиальной схемой другого устройства для декодирования аудиоданных согласно варианту 7 осуществления настоящего изобретения; и

[0022] фиг.9 является принципиальной схемой системы для обработки аудиоданных согласно варианту 8 осуществления настоящего изобретения.

ПОДРОБНОЕ ОПИСАНИЕ ВАРИАНТОВ ОСУЩЕСТВЛЕНИЯ

[0023] Чтобы делать цели, технические решения и преимущества настоящего изобретения более понятными, далее подробно описываются варианты осуществления настоящего изобретения со ссылкой на прилагаемые чертежи.

Вариант 1 осуществления

[0024] Ссылаясь на фиг.1, этот вариант осуществления предоставляет способ для обработки аудиоданных, причем способ включает в себя следующее:

[0025] 101. Получение шумового кадра аудиосигнала и разложение шумового кадра на шумовой сигнал полосы низких частот и шумовой сигнал полосы высоких частот.

[0026] 102. Кодирование и передача шумового сигнала полосы низких частот посредством использования первого механизма прерывистой передачи и кодирование и передача шумового сигнала полосы высоких частот посредством использования второго механизма прерывистой передачи, причем политика для отправки первого кадра SID дескриптора вставки молчания первого механизма прерывистой передачи отличается от политики для отправки второго SID второго механизма прерывистой передачи, либо политика для кодирования первого SID первого механизма прерывистой передачи отличается от политики для кодирования второго SID второго механизма прерывистой передачи.

[0027] В этом варианте осуществления первый SID включает в себя параметр полосы низких частот шумового кадра, а второй SID включает в себя параметр полосы низких частот или параметр полосы высоких частот шумового кадра.

[0028] Необязательно, в этом варианте осуществления, кодирование и передача шумового сигнала полосы высоких частот посредством использования второго механизма прерывистой передачи включает в себя:

- определение того, имеет или нет шумовой сигнал полосы высоких частот предварительно установленную спектральную структуру; если да и удовлетворяется условие отправки политики для отправки второго SID, кодирование SID шумового сигнала полосы высоких частот посредством использования политики для кодирования второго SID и отправки SID; а если нет, определение того, что шумовой сигнал полосы высоких частот не должен быть кодирован и передан.

[0029] Определение того, имеет или нет шумовой сигнал полосы высоких частот предварительно установленную спектральную структуру, включает в себя:

- получение спектра шумового сигнала полосы высоких частот, разделение спектра, по меньшей мере, на две подполосы частот, и если средняя энергия любой первой подполосы частот в подполосах частот не меньше средней энергии второй подполосы частот в подполосах частот, причем полоса частот, в которой расположена вторая подполоса частот, выше полосы частот, в которой расположена первая подполоса частот, определение того, что шумовой сигнал полосы высоких частот не имеет предварительно установленной спектральной структуры; в противном случае, определение того, что шумовой сигнал полосы высоких частот имеет предварительно установленную спектральную структуру.

[0030] Необязательно, в этом варианте осуществления, кодирование и передача шумового сигнала полосы высоких частот посредством использования второго механизма прерывистой передачи включает в себя:

- формирование отклонения согласно первому отношению и второму отношению, причем первое отношение представляет собой отношение энергии шумового сигнала полосы высоких частот к энергии шумового сигнала полосы низких частот шумового кадра, а второе отношение представляет собой отношение энергии шумового сигнала полосы высоких частот к энергии шумового сигнала полосы низких частот в момент, когда SID, включающий в себя шумовой параметр полосы высоких частот, отправлен в прошлый раз перед шумовым кадром; и

- определение того, достигает или нет отклонение предварительно установленного порогового значения; если да, кодирование SID шумового сигнала полосы высоких частот посредством использования политики для кодирования второго SID и отправки SID; а если нет, определение того, что шумовой сигнал полосы высоких частот не должен быть кодирован и передан.

[0031] Необязательно, то, что первое отношение представляет собой отношение энергии шумового сигнала полосы высоких частот к энергии шумового сигнала полосы низких частот шумового кадра, включает в себя то, что:

- первое отношение представляет собой отношение мгновенной энергии шумового сигнала полосы высоких частот к мгновенной энергии шумового сигнала полосы низких частот шумового кадра; и

- соответственно то, что второе отношение представляет собой отношение энергии шумового сигнала полосы высоких частот к энергии шумового сигнала полосы низких частот в момент, когда SID, включающий в себя шумовой параметр полосы высоких частот, отправлен в прошлый раз перед шумовым кадром, включает в себя то, что:

- второе отношение представляет собой отношение мгновенной энергии шумового сигнала полосы высоких частот к мгновенной энергии шумового сигнала полосы низких частот в момент, когда SID, включающий в себя шумовой параметр полосы высоких частот, отправлен в прошлый раз перед шумовым кадром.

[0032] Альтернативно, то, что первое отношение представляет собой отношение энергии шумового сигнала полосы высоких частот к энергии шумового сигнала полосы низких частот шумового кадра, включает в себя то, что:

- первое отношение представляет собой отношение средневзвешенной энергии шумовых сигналов полосы высоких частот шумового кадра и шумового кадра до шумового кадра к средневзвешенной энергии шумовых сигналов полосы низких частот шумового кадра и шумового кадра до шумового кадра; и

- второе отношение представляет собой отношение средневзвешенной энергии сигналов полосы высоких частот к средневзвешенной энергии сигналов полосы низких частот шумового кадра и шумового кадра до шумового кадра в момент, когда SID, включающий в себя шумовой параметр полосы высоких частот, отправлен в прошлый раз перед шумовым кадром.

[0033] В этом варианте осуществления формирование отклонения согласно первому отношению и второму отношению включает в себя:

- отдельное вычисление логарифмического значения первого отношения и логарифмического значения второго отношения; и

- вычисление абсолютного значения разности между логарифмическим значением первого отношения и логарифмическим значением второго отношения, чтобы получать отклонение.

[0034] Необязательно, в этом варианте осуществления, кодирование и передача шумового сигнала полосы высоких частот посредством использования второго механизма прерывистой передачи включает в себя:

- определение того, удовлетворяет или нет спектральная структура шумового сигнала полосы высоких частот шумового кадра по сравнению со средней спектральной структурой шумовых сигналов полосы высоких частот перед шумовым кадром, предварительно установленному условию; если да, кодирование SID шумового сигнала полосы высоких частот шумового кадра посредством использования политики для кодирования второго SID и отправки SID; а если нет, определение того, что шумовой сигнал полосы высоких частот шумового кадра не должен быть кодирован и передан.

[0035] Средняя спектральная структура шумовых сигналов полосы высоких частот перед шумовым кадром включает в себя: взвешенное среднее спектров шумовых сигналов полосы высоких частот перед шумовым кадром.

[0036] В этом варианте осуществления условие отправки в политике для отправки второго SID второго механизма прерывистой передачи дополнительно включает в себя: удовлетворение посредством первого механизма прерывистой передачи условию для отправки первого SID.

[0037] Вариант осуществления способа, предоставленный посредством настоящего изобретения, обеспечивает следующие преимущества. Получается текущий шумовой кадр аудиосигнала, и текущий шумовой кадр раскладывается на шумовой сигнал полосы низких частот и шумовой сигнал полосы высоких частот; затем шумовой сигнал полосы низких частот кодируется и передается посредством использования первого механизма прерывистой передачи, и шумовой сигнал полосы высоких частот кодируется и передается посредством использования второго механизма прерывистой передачи. Таким образом, различные способы обработки используются для сигнала полосы высоких частот и сигнала полосы низких частот, может уменьшаться вычислительная сложность, и кодированные биты могут экономиться при допущении непонижения субъективного качества кодека, и биты, которые экономятся, помогают достигать цели уменьшения полосы пропускания передачи или повышения общего качества кодирования, за счет этого решая проблему при сверхширокополосном кодировании и передаче.

Вариант 2 осуществления

[0038] Ссылаясь на фиг.2, этот вариант осуществления предоставляет способ для обработки аудиоданных, причем способ включает в себя следующее:

[0039] 201. Декодер получает кадр SID дескриптора вставки молчания и определяет то, включает SID в себя параметр полосы низких частот или параметр полосы высоких частот.

[0040] 202. Если SID включает в себя параметр полосы низких частот, декодирование SID, чтобы получать шумовой параметр полосы низких частот, локальное формирование шумового параметра полосы высоких частот и получение первого кадра комфортного шума CN согласно шумовому параметру полосы низких частот, полученному посредством декодирования, и локально сформированному шумовому параметру полосы высоких частот.

[0041] 203. Если SID включает в себя параметр полосы высоких частот, декодирование SID, чтобы получать шумовой параметр полосы высоких частот, локальное формирование шумового параметра полосы низких частот и получение второго CN-кадра согласно шумовому параметру полосы высоких частот, полученному посредством декодирования, и локально сформированному шумовому параметру полосы низких частот.

[0042] 204. Если SID включает в себя параметр полосы высоких частот и параметр полосы низких частот, декодирование SID, чтобы получать шумовой параметр полосы высоких частот и шумовой параметр полосы низких частот, и получение третьего CN-кадра согласно шумовому параметру полосы высоких частот и шумовому параметру полосы низких частот, полученным посредством декодирования.

[0043] Необязательно, в этом варианте осуществления, если SID включает в себя параметр полосы низких частот, перед декодированием SID, чтобы получать шумовой параметр полосы низких частот, локальным формированием шумового параметра полосы высоких частот и получением первого кадра комфортного шума CN согласно шумовому параметру полосы низких частот, полученному посредством декодирования, и локально сформированному шумовому параметру полосы высоких частот, способ дополнительно включает в себя:

- если декодер находится в первом состоянии формирования CNG комфортного шума, переход, посредством декодера, во второе CNG-состояние.

[0044] Необязательно, в этом варианте осуществления, если SID включает в себя параметр полосы высоких частот и параметр полосы низких частот, перед декодированием SID, чтобы получать шумовой параметр полосы высоких частот и шумовой параметр полосы низких частот, и получением третьего CN-кадра согласно шумовому параметру полосы высоких частот и шумовому параметру полосы низких частот, полученным посредством декодирования, способ дополнительно включает в себя:

- если декодер находится во втором CNG-состоянии, переход, посредством декодера, в первое CNG-состояние.

[0045] Необязательно, в этом варианте осуществления, определение того, SID включает в себя параметр полосы низких частот и/или параметр полосы высоких частот, включает в себя:

- если число битов SID меньше предварительно установленного первого порогового значения, определение того, что SID включает в себя параметр полосы высоких частот; если число битов SID превышает предварительно установленное первое пороговое значение и меньше предварительно установленного второго порогового значения, определение того, что SID включает в себя параметр полосы низких частот; и если число битов SID превышает предварительно установленное второе пороговое значение и меньше предварительно установленного третьего порогового значения, определение того, что SID включает в себя параметр полосы высоких частот и параметр полосы низких частот; или

- если SID включает в себя первый идентификатор, определение того, что SID включает в себя параметр полосы высоких частот; если SID включает в себя второй идентификатор, определение того, что SID включает в себя параметр полосы низких частот; и если SID включает в себя третий идентификатор, определение того, что SID включает в себя параметр полосы низких частот и параметр полосы высоких частот.

[0046] В этом варианте осуществления локальное формирование шумового параметра полосы высоких частот включает в себя:

- отдельное получение средневзвешенной энергии шумового сигнала полосы высоких частот и коэффициента синтезирующей фильтрации шумового сигнала полосы высоких частот в момент, соответствующий SID; и

- получение шумового сигнала полосы высоких частот согласно полученной средневзвешенной энергии шумового сигнала полосы высоких частот и полученному коэффициенту синтезирующей фильтрации шумового сигнала полосы высоких частот в момент, соответствующий SID.

[0047] Необязательно, в этом варианте осуществления, получение средневзвешенной энергии шумового сигнала полосы высоких частот в момент, соответствующий SID, включает в себя:

- получение энергии сигнала полосы низких частот первого CN-кадра согласно шумовому параметру полосы низких частот, полученному посредством декодирования;

- вычисление отношения энергии шумового сигнала полосы высоких частот к энергии шумового сигнала полосы низких частот в момент, когда SID, включающий в себя параметр полосы высоких частот, принимается перед SID, чтобы получать первое отношение;

- получение, согласно энергии сигнала полосы низких частот первого CN-кадра и первому отношению, энергии шумового сигнала полосы высоких частот в момент, соответствующий SID; и

- выполнение взвешенного усреднения для энергии шумового сигнала полосы высоких частот в момент, соответствующий SID, и энергии сигнала полосы высоких частот локально буферизованного CN-кадра, чтобы получать средневзвешенную энергию шумового сигнала полосы высоких частот в момент, соответствующий SID, причем средневзвешенная энергия шумового сигнала полосы высоких частот в момент, соответствующий SID, представляет собой энергию сигналов полосы высоких частот первого CN-кадра.

[0048] Необязательно, в этом варианте осуществления, вычисление отношения энергии шумового сигнала полосы высоких частот к энергии шумового сигнала полосы низких частот в момент, когда SID, включающий в себя параметр полосы высоких частот, принимается перед SID, чтобы получать первое отношение, включает в себя:

- вычисление отношения мгновенной энергии шумового сигнала полосы высоких частот к мгновенной энергии шумового сигнала полосы низких частот в момент, когда SID, включающий в себя параметр полосы высоких частот, принимается перед SID, чтобы получать первое отношение; или

- вычисление отношения средневзвешенной энергии шумового сигнала полосы высоких частот к средневзвешенной энергии шумового сигнала полосы низких частот в момент, когда SID, включающий в себя параметр полосы высоких частот, принимается перед SID, чтобы получать первое отношение.

[0049] Когда энергия шумового сигнала полосы высоких частот в момент, соответствующий SID, превышает энергию сигнала полосы высоких частот предыдущего CN-кадра, который локально буферизуется, энергия сигнала полосы высоких частот предыдущего CN-кадра, который локально буферизуется, обновляется на первой скорости; в противном случае энергия сигнала полосы высоких частот предыдущего CN-кадра, который локально буферизуется, обновляется на второй скорости, причем первая скорость превышает вторую скорость.

[0050] Необязательно, в этом варианте осуществления, получение средневзвешенной энергии шумового сигнала полосы высоких частот в момент, соответствующий SID, включает в себя:

- выбор сигнала полосы высоких частот речевого кадра с минимальной энергией сигналов полосы высоких частот из речевых кадров в пределах предварительно установленного периода времени перед SID; и

- получение, согласно энергии сигнала полосы высоких частот речевого кадра с минимальной энергией сигналов полосы высоких частот из речевых кадров, средневзвешенной энергии шумового сигнала полосы высоких частот в момент, соответствующий SID, причем средневзвешенная энергия шумового сигнала полосы высоких частот в момент, соответствующий SID, представляет собой энергию сигналов полосы высоких частот первого CN-кадра; или

- выбор сигналов полосы высоких частот N речевых кадров с энергией сигналов полосы высоких частот, меньшей предварительно установленного порогового значения, из речевых кадров в пределах предварительно установленного периода времени перед SID; и

- получение, согласно средневзвешенной энергии сигналов полосы высоких частот N речевых кадров, средневзвешенной энергии шумового сигнала полосы высоких частот в момент, соответствующий SID, причем средневзвешенная энергия шумового сигнала полосы высоких частот в момент, соответствующий SID, представляет собой энергию сигналов полосы высоких частот первого CN-кадра.

[0051] Необязательно, в этом варианте осуществления, получение коэффициента синтезирующей фильтрации шумового сигнала полосы высоких частот в момент, соответствующий SID, включает в себя:

- распределение M коэффициентов ISF (спектральной частоты иммитанса) или ISP-коэффициентов, или коэффициентов LSF (частоты спектральной линии), или коэффициентов LSP (пары спектральных линий) в частотном диапазоне, соответствующем сигналу полосы высоких частот;

- выполнение обработки рандомизации для M коэффициентов, причем признак рандомизации заключается в следующем: инструктирование каждому коэффициенту из M коэффициентов постепенно приближаться к целевому значению, соответствующему каждому коэффициенту, причем целевое значение является значением в предварительно установленном диапазоне, смежном со значением коэффициента, и целевое значение каждого коэффициента из M коэффициентов изменяется после каждых N кадров, где M и N являются натуральными числами; и

- получение, согласно коэффициентам фильтрации, полученным посредством обработки рандомизации, коэффициента синтезирующей фильтрации шумового сигнала полосы высоких частот в момент, соответствующий SID.

[0052] Необязательно, в этом варианте осуществления, получение коэффициента синтезирующей фильтрации шумового сигнала полосы высоких частот в момент, соответствующий SID, включает в себя:

- получение M ISF-коэффициентов или ISP-коэффициентов, или LSF-коэффициентов, или LSP-коэффициентов локально буферизованного шумового сигнала полосы высоких частот;

[0053] Необязательно, в этом варианте осуществления, перед получением первого CN-кадра согласно шумовому параметру полосы низких частот, полученному посредством декодирования, и локально сформированному шумовому параметру полосы высоких частот, способ дополнительно включает в себя:

- когда кадры предыстории, смежные с SID, представляют собой кодированные речевые кадры, если средняя энергия сигналов полосы высоких частот или части сигналов полосы высоких частот, которые декодируются из кодированных речевых кадров, меньше средней энергии шумовых сигналов полосы высоких частот или части шумовых сигналов полосы высоких частот, которые формируются локально, умножение шумовых сигналов полосы высоких частот последующих L кадров, начиная с SID, на коэффициент сглаживания, меньший 1, чтобы получать новую средневзвешенную энергию локально сформированных шумовых сигналов полосы высоких частот; и

- соответственно получение первого CN-кадра согласно шумовому параметру полосы низких частот, полученному посредством декодирования, и локально сформированному шумовому параметру полосы высоких частот включает в себя:

- получение четвертого CN-кадра согласно шумовому параметру полосы низких частот, полученному посредством декодирования, коэффициенту синтезирующей фильтрации шумового сигнала полосы высоких частот в момент, соответствующий SID, и новой средневзвешенной энергии локально сформированных шумовых сигналов полосы высоких частот.

[0054] Вариант осуществления способа, предоставленный посредством настоящего изобретения, обеспечивает следующие преимущества. Декодер получает кадр SID дескриптора вставки молчания и определяет то, включает SID в себя параметр полосы низких частот и/или параметр полосы высоких частот; если SID включает в себя параметр полосы низких частот, декодирует SID, чтобы получать шумовой параметр полосы низких частот, локально формирует шумовой параметр полосы высоких частот и получает первый кадр комфортного шума CN согласно шумовому параметру полосы низких частот, полученному посредством декодирования, и локально сформированному шумовому параметру полосы высоких частот; если SID включает в себя параметр полосы высоких частот, декодирует SID, чтобы получать шумовой параметр полосы высоких частот, локально формирует шумовой параметр полосы низких частот и получает второй CN-кадр согласно шумовому параметру полосы высоких частот, полученному посредством декодирования, и локально сформированному шумовому параметру полосы низких частот; и если SID включает в себя параметр полосы высоких частот и параметр полосы низких частот, декодирует SID, чтобы получать шумовой параметр полосы высоких частот и шумовой параметр полосы низких частот, и получает третий CN-кадр согласно шумовому параметру полосы высоких частот и шумовому параметру полосы низких частот, полученным посредством декодирования. Таким образом, различные способы обработки используются для сигнала полосы высоких частот и сигнала полосы низких частот, может уменьшаться вычислительная сложность, и кодированные биты могут экономиться при допущении непонижения субъективного качества кодека, и биты, которые экономятся, помогают достигать цели уменьшения полосы пропускания передачи или повышения общего качества кодирования, за счет этого решая проблему при сверхширокополосном кодировании и передаче.

Вариант 3 осуществления

[0055] Этот вариант осуществления предоставляет способ для обработки аудиоданных. На стороне кодирования, независимо от спектра CNG-шума полосы низких частот или спектра CNG-шума полосы высоких частот, в общем, гармоническая структура теряется, и, следовательно, в сигнале полосы высоких частот CNG перцепционно эффективной при прослушивании является, главным образом, энергия сигнала полосы высоких частот CNG, а не спектральная структура сигнала полосы высоких частот CNG. Следовательно, при DTX-передаче сверхширокополосного сигнала, во многих случаях, необязательно передавать спектр сигнала полосы высоких частот в SID; вместо этого, надлежащий способ может быть использован для того, чтобы создавать спектр полосы высоких частот локально на стороне декодирования. Локально созданный спектр полосы высоких частот не должен вызывать очевидное перцепционное искажение. Таким образом, вычислительные нагрузки и биты для вычисления и кодирования спектра полосы высоких частот экономятся на стороне кодирования. Между тем, для других шумовых сигналов гармоническая структура может существовать в сигнале полосы высоких частот, и создание спектра полосы высоких частот локально только на стороне декодирования может вызывать проблему ухудшения перцепционного качества при переключении между CNG-сегментом и речевым сегментом. Следовательно, для такого шума спектральный параметр должен быть передан в SID. Можно видеть, что DTX/CNG-система, которая учитывает как эффективность, так и качество, должна допускать адаптивный выбор кодировать или выбор не кодировать спектральный параметр полосы высоких частот в SID на стороне кодирования согласно признаку полосы высоких частот фонового шума и восстановление CNG-кадра на стороне декодирования посредством использования различных способов декодирования согласно различным типам SID. В этом варианте осуществления способ для обработки аудиоданных предоставляется и включает в себя следующее: спектр полосы высоких частот шума анализируется и классифицируется; декодер вслепую создает спектр сигнала полосы высоких частот; когда SID не включает в себя параметр энергии полосы высоких частот, декодер оценивает энергию сигналов полосы высоких частот; и декодер переключается между различными CNG-модулями, и т.д. Ссылаясь на фиг.3, в частности, способ для обработки аудиоданных на стороне кодера согласно этому варианту осуществления включает в себя:

[0056] 301. Кодер получает шумовой кадр аудиосигнала и раскладывает шумовой кадр на шумовой сигнал полосы низких частот и шумовой сигнал полосы высоких частот.

[0057] В этом варианте осуществления, вследствие различных правил кодирования кодера, кодер получает шумовой кадр аудиосигнала, и шумовой кадр может представлять собой текущий шумовой кадр или может представлять собой шумовой кадр, буферизованный на стороне кодера, что не ограничено конкретным образом в этом варианте осуществления. В этом варианте осуществления сверхширокополосные входные аудиосигналы, дискретизированные при 32 кГц, используются в качестве примера. Кодер сначала выполняет обработку кадрирования для входных аудиосигналов, например, 20 мс (или 640 точек дискретизации) используется в качестве кадра. Для текущего кадра (в этом варианте осуществления текущий кадр означает текущий кадр, который должен быть кодирован) кодер сначала выполняет фильтрацию верхних частот. В общем, полоса пропускания означает частоты выше 50 Гц. Фильтрованный по верхним частотам текущий кадр раскладывается на сигнал s₀ полосы низких частот и сигнал s₁ полосы высоких частот посредством аналитического фильтра на основе квадратурного зеркального фильтра QMF (квадратурного зеркального фильтра). Сигнал s₀ полосы низких частот дискретизируется при 16 кГц и представляет спектр 0-8 кГц текущего кадра. Сигнал s₁ полосы высоких частот также дискретизируется при 16 кГц и представляет спектр 8-16 кГц текущего кадра. Когда VAD (детектор речевой активности) указывает, что текущий кадр представляет собой кадр приоритетного сигнала, т.е. кадр речевого сигнала, кодер выполняет кодирование речи для текущего кадра. В этом варианте осуществления то, что кодер кодирует кодированный речевой кадр, относится к объему предшествующего уровня техники, и подробности не описываются повторно в этом варианте осуществления. VAD указывает, что кодер переходит в рабочее DTX-состояние, когда текущий кадр представляет собой шумовой кадр. В этом варианте осуществления шумовой кадр означает либо фоновый шумовой кадр, либо кадр молчания.

[0058] В этом варианте осуществления, в рабочем DTX-состоянии, DTX-контроллер определяет, согласно политике отправки SID, то, следует или нет кодировать и отправлять SID сигнала полосы низких частот текущего кадра. В этом варианте осуществления политика для отправки SID сигнала полосы низких частот заключается в следующем: (1) отправка SID в первом шумовом кадре после кодированного речевого кадра и задание флага flag_SID отправки SID равным 1; (2) в период шума, отправка SID-кадра в N-ном кадре после каждого SID-кадра и задание flag_SID равным 1 в кадре, где N является целым числом, превышающим 1, и внешне вводится в кодер; и (3) в период шума, невыполнение отправки SID в других кадрах и задание flag_SID равным 0. В этом варианте осуществления политика для отправки SID сигнала полосы низких частот является аналогичной политике предшествующего уровня техники и не описывается подробно в настоящем изобретении.

[0059] 302. Определение того, удовлетворяет или нет сигнал полосы высоких частот текущего шумового кадра предварительно установленному условию кодирования и передачи; если да, выполнение этапа 304; если нет, выполнение этапа 303.

[0060] В этом варианте осуществления, определение того, удовлетворяет или нет сигнал полосы высоких частот текущего шумового кадра предварительно установленному условию кодирования и передачи, включает в себя: определение того, имеет или нет шумовой сигнал полосы высоких частот предварительно установленную спектральную структуру; если да и удовлетворяется условие отправки политики для отправки второго SID, кодирование SID шумового сигнала полосы высоких частот посредством использования политики для кодирования второго SID и отправки SID; а если нет, определение того, что шумовой сигнал полосы высоких частот не должен быть кодирован и передан. Определение того, имеет или нет шумовой сигнал полосы высоких частот предварительно установленную спектральную структуру, включает в себя: получение спектра шумового сигнала полосы высоких частот, разделение спектра, по меньшей мере, на две подполосы частот и, если средняя энергия любой первой подполосы частот в подполосах частот не меньше средней энергии второй подполосы частот в подполосах частот, причем полоса частот, в которой расположена вторая подполоса частот, выше полосы частот, в которой расположена первая подполоса частот, определение того, что шумовой сигнал полосы высоких частот не имеет предварительно установленной спектральной структуры; в противном случае, определение того, что шумовой сигнал полосы высоких частот имеет предварительно установленную спектральную структуру.

[0061] В этом варианте осуществления, в рабочем DTX-состоянии, кодер выполняет спектральный анализ для сигнала s₁ полосы высоких частот текущего шумового кадра, чтобы определять то, имеет или нет s₁ явную спектральную структуру, т.е. предварительно установленную спектральную структуру. Конкретный способ в этом варианте осуществления заключается в следующем: понижающая дискретизация до 12,8 кГц выполняется для s₁, и 256-точечное FFT (быстрое преобразование Фурье) выполняется для сигнала после понижающей дискретизации, чтобы получать спектр C(i), где i=0, ..., 127. C(i) разделяется на четыре подполосы частот равной ширины, и вычисляется энергия E(i) каждой подполосы частот. Каждая подполоса частот представляет собой любую вышеупомянутую первую подполосу частот. , где i=0, ..., 3, l(i) и h(i) соответственно, представляет верхнюю границу и нижнюю границу i-ой подполосы частот, l(i)={0, 32, 64, 96} и h(i)={31, 63, 95, 127}. Проверяется то, удовлетворяется или нет следующее условие:

(1),

где E(j) представляет собой вторую вышеупомянутую подполосу частот. Если удовлетворяется вышеприведенная формула (1), т.е., если энергия любой первой подполосы частот в подполосах частот не меньше энергии второй подполосы частот в подполосах частот, считается, что сигнал полосы высоких частот не имеет явной спектральной структуры; в противном случае, сигнал полосы высоких частот имеет явную спектральную структуру. Если сигнал полосы высоких частот имеет явную спектральную структуру, DTX-политика отправляет параметр полосы высоких частот. В этом варианте осуществления, если флаг flag_hb отправки параметров полосы высоких частот не равен 1, flag_hb=1 задается в следующий раз, когда flag_SID=1; в противном случае, flag_hb=0.

[0062] В этом варианте осуществления, когда удовлетворяется условие отправки SID, то, необходимо или нет кодировать и передавать сигнал полосы высоких частот текущего шумового кадра, может быть определено посредством использования спектральной структуры сигнала полосы высоких частот текущего шумового кадра, и определение того, имеет или нет шумовой сигнал полосы высоких частот предварительно установленную спектральную структуру, и удовлетворяет или нет шумовой сигнал полосы низких частот условию отправки SID, используется в качестве первого условия определения. Необязательно, в этом варианте осуществления, определение того, удовлетворяет или нет сигнал полосы высоких частот текущего шумового кадра предварительно установленному кодированию и условию отправки, включает в себя: формирование отклонения согласно первому отношению и второму отношению, причем первое отношение представляет собой отношение энергии шумового сигнала полосы высоких частот к энергии шумового сигнала полосы низких частот шумового кадра, а второе отношение представляет собой отношение энергии шумового сигнала полосы высоких частот к энергии шумового сигнала полосы низких частот в момент, когда SID, включающий в себя шумовой параметр полосы высоких частот, отправлен в прошлый раз перед шумовым кадром; и определение того, достигает или нет отклонение предварительно установленного порогового значения; если да, кодирование SID шумового сигнала полосы высоких частот посредством использования политики для кодирования второго SID и отправки SID; а если нет, определение того, что шумовой сигнал полосы высоких частот не должен быть кодирован и передан. Необязательно, то, что первое отношение представляет собой отношение энергии шумового сигнала полосы высоких частот к энергии шумового сигнала полосы низких частот шумового кадра, включает в себя то, что: первое отношение представляет собой отношение мгновенной энергии шумового сигнала полосы высоких частот к мгновенной энергии шумового сигнала полосы низких частот шумового кадра; и соответственно то, что второе отношение представляет собой отношение энергии шумового сигнала полосы высоких частот к энергии шумового сигнала полосы низких частот в момент, когда SID, включающий в себя шумовой параметр полосы высоких частот, отправлен в прошлый раз перед шумовым кадром, включает в себя то, что: второе отношение представляет собой отношение мгновенной энергии шумового сигнала полосы высоких частот к мгновенной энергии шумового сигнала полосы низких частот в момент, когда SID, включающий в себя шумовой параметр полосы высоких частот, отправлен в прошлый раз перед шумовым кадром. Альтернативно, то, что первое отношение представляет собой отношение энергии шумового сигнала полосы высоких частот к энергии шумового сигнала полосы низких частот шумового кадра, включает в себя то, что: первое отношение представляет собой отношение средневзвешенной энергии шумовых сигналов полосы высоких частот шумового кадра и шумового кадра до шумового кадра к средневзвешенной энергии шумовых сигналов полосы низких частот шумового кадра и шумового кадра до шумового кадра; и соответственно то, что второе отношение представляет собой отношение энергии шумового сигнала полосы высоких частот к энергии шумового сигнала полосы низких частот в момент, когда SID, включающий в себя шумовой параметр полосы высоких частот, отправлен в прошлый раз перед шумовым кадром, включает в себя то, что: второе отношение представляет собой отношение средневзвешенной энергии сигналов полосы высоких частот к средневзвешенной энергии сигналов полосы низких частот шумового кадра и шумового кадра до шумового кадра в момент, когда SID, включающий в себя шумовой параметр полосы высоких частот, отправлен в прошлый раз перед шумовым кадром. В этом варианте осуществления предпочтительно формирование отклонения согласно первому отношению и второму отношению включает в себя: отдельное вычисление логарифмического значения первого отношения и логарифмическое значение второго отношения; и вычисление абсолютного значения разности между логарифмическим значением первого отношения и логарифмическим значением второго отношения, чтобы получать отклонение.

[0063] В частности, в этом варианте осуществления определение того, достигает или нет отклонение предварительно установленного порогового значения, может быть реализовано следующим образом:

[0064] В рабочем DTX-состоянии кодер отдельно вычисляет логарифмические энергии e₁ и e₀ сигнала s₁ полосы высоких частот и сигнала s₀ полосы низких частот текущего кадра.

(2)

[0065] Долговременные скользящие средние e_1a и e_0a для e₁ и e₀ на стороне кодирования обновляются:

(3),

где sign[.] представляет знаковую функцию, MIN[.] представляет минимальную функцию, |.| представляет функцию абсолютного значения, форма x^(-1) представляет значение предыдущего кадра x, и α=0,1 является коэффициентом отсутствия последействия, который определяет то, является скорость обновления высокой или низкой. Предыдущий кадр представляет собой SID, который отправлен в прошлый раз перед текущим шумовым кадром, и включает в себя шумовой параметр полосы высоких частот. В этом варианте осуществления абсолютная величина обновления e_1a и e_0a ограничивается. Если варьирование энергии между e_x текущего шумового кадра и e_xa предыдущего кадра превышает 3 дБ, e_xa текущего кадра обновляется на 3 дБ. Когда кодер переходит в рабочее DTX-состояние в первый раз, e_xa инициализируется в качестве e_x текущего кадра. Кодер проверяет то, достигает или нет степени отклонение между отношением (а именно, первым отношением) энергии сигнала полосы высоких частот к энергии сигнала полосы низких частот текущего шумового кадра и отношением (вторым отношением) энергии полосы высоких частот к энергии полосы низких частот в момент, когда SID, включающий в себя параметр полосы высоких частот, отправлен в прошлый раз, т.е. проверяет то, удовлетворяется или нет следующее условие:

(4),

где и соответственно представляют логарифмическую энергию полосы высоких частот и логарифмическую энергию полосы низких частот в момент, когда SID-кадр, включающий в себя параметр полосы высоких частот, отправлен в прошлый раз. Если удовлетворяется вышеприведенная формула (4), шумовой сигнал полосы высоких частот должен быть кодирован и передан. Если флаг отправки параметров полосы высоких частот flag_hb=0, задается flag_hb=1.

[0066] В этом варианте осуществления долговременное усреднение перемещения представляет собой один тип средневзвешенного вычисления, что не ограничено конкретным образом в этом варианте осуществления.

[0067] В этом варианте осуществления, определение того, достигает или нет отклонение предварительно установленного порогового значения, может быть использовано в качестве второго условия определения. В конкретном процессе реализации, чтобы определять то, должен или нет шумовой сигнал полосы высоких частот быть кодирован и передан, просто должно определяться первое условие определения или второе условие определения, что не ограничено конкретным образом в этом варианте осуществления.

[0068] В этом варианте осуществления второе условие определения является необязательным. Цель выполнения этого этапа состоит в том, чтобы помогать стороне декодирования в локальной оценке энергии шума полосы высоких частот согласно энергии полосы низких частот шума и отношению энергии полосы высоких частот шума к энергии полосы низких частот шума в момент, когда SID, включающий в себя параметр полосы высоких частот, отправлен в прошлый раз. В частности, если отклонение не вычисляется на стороне кодирования, речевой кадр с минимальной энергией сигналов полосы высоких частот может быть получен на стороне декодирования из речевых кадров в пределах периода времени перед текущим шумовым кадром, и энергия текущего шума полосы высоких частот оценивается локально согласно энергии сигнала полосы высоких частот речевого кадра с минимальной энергией сигналов полосы высоких частот из речевых кадров в пределах периода времени перед текущим шумовым кадром. Например, энергия сигнала полосы высоких частот речевого кадра с минимальной энергией сигналов полосы высоких частот из речевых кадров в пределах периода времени перед текущим шумовым кадром выбирается в качестве энергии текущего шума полосы высоких частот. Альтернативно, сигналы полосы высоких частот N речевых кадров с энергией сигналов полосы высоких частот, меньшей предварительно установленного порогового значения, выбираются из речевых кадров в пределах предварительно установленного периода времени перед SID; и средневзвешенная энергия шумового сигнала полосы высоких частот в момент, соответствующий SID, получается согласно средневзвешенной энергии сигналов полосы высоких частот N речевых кадров. Конкретные ограничения не накладываются в этом варианте осуществления.

[0069] 303. Передача шумового сигнала полосы низких частот посредством использования первого механизма прерывистой передачи.

[0070] В этом варианте осуществления предпочтительно передача шумового сигнала полосы низких частот посредством использования первого механизма прерывистой передачи включает в себя: в рабочем DTX-состоянии кодер выполняет линейный прогнозный анализ 16-го порядка для сигнала s₀ полосы низких частот текущего шумового кадра и получает 16 коэффициентов lpc(i) линейного прогнозирования, где i=0, 1, ..., 15. LPC-коэффициенты преобразуются в ISP-коэффициенты, чтобы получать 16 ISP-коэффициентов isp(i), где i=0, 1, ..., 15, и ISP-коэффициенты буферизуются. Если SID кодируется в текущем кадре, т.е. flag_SID=1, выполняется поиск среднего ISP-коэффициента в буферизованных ISP-коэффициентах N кадров предыстории, включающих в себя текущий кадр. Способ заключается в следующем: во-первых, вычисление расстояния δ от ISP-коэффициента каждого кадра до ISP-коэффициента другого кадра:

(5);

затем, выбор ISP-коэффициента кадра с наименьшим δ в качестве ISP-коэффициента isp_SID(i), который должен быть кодирован, где i=0, ..., 15; преобразование isp_SID(i) в ISF-коэффициент isf_SID(i), квантование isf_SID(i), получение и инкапсулирование группы квантованных индексов idx_ISF в SID; локальное декодирование idx_ISF; получение декодированного ISF-коэффициента isf'(i), где i=0, ..., 15; преобразование isf'(i) в ISP-коэффициент isp'(i), где i=0, ..., 15, буферизация isp'(i); для каждого шумового кадра, обновление долговременного скользящего среднего декодированных ISP-коэффициентов стороны кодирования посредством использования буферизованного isp'(i):

(6),

где предпочтительно α=0,9, и isp_a(i) инициализируется в качестве isp'(i) первого SID; преобразование isp_a(i) в LPC-коэффициент lpc_a(i), получение аналитического фильтра A(Z); фильтрация сигнала s₀ полосы низких частот каждого шумового кадра посредством A(Z), чтобы получать остаточный сигнал r(i), где i=0, 1, ..., 319, и вычисление логарифмической остаточной энергии e_r:

(7).

[0071] В этом варианте осуществления e_r буферизуется. Когда flag_SID текущего шумового кадра равен 1, средневзвешенная логарифмическая энергия e_SID вычисляется согласно буферизованному e_r M кадров предыстории, включающих в себя текущий шумовой кадр: , где w₁(k) является группой M-мерных положительных коэффициентов, и их сумма меньше 1. Квантуется e_SID, и получается квантованный индекс idx_e.

[0072] В этом варианте осуществления, в рабочем DTX-состоянии, когда flag_SID=1, если flag_hb=0, только параметр полосы низких частот кодируется и отправляется в SID-кадре, и в этом случае SID-кадр формируется из idx_ISF и idx_e и упоминается как "небольшой SID-кадр" для удобства.

[0073] В этом варианте осуществления политика для кодирования и передачи шумового сигнала полосы низких частот является аналогичной политике для кодирования и передачи шумового широкополосного сигнала в предшествующем уровне техники. Только краткое введение предоставляется в этом варианте осуществления. Конкретный процесс реализации не описывается подробно в этом варианте осуществления. В этом варианте осуществления шумовой сигнал полосы высоких частот текущего шумового кадра не должен быть кодирован, и кодируется только шумовой сигнал полосы низких частот. Следовательно, вычислительная нагрузка уменьшается на стороне кодирования, и передаваемые биты экономятся.

[0074] 304. Передача шумового сигнала полосы низких частот посредством использования первого механизма прерывистой передачи и передача шумового сигнала полосы высоких частот посредством использования второго механизма прерывистой передачи.

[0075] В этом варианте осуществления, если flag_hb=1, помимо того, что параметр полосы низких частот должен быть кодирован, параметр полосы высоких частот также должен быть кодирован в SID. Кодирование параметра полосы низких частот шума полосы низких частот является идентичным режиму кодирования на этапе 303, и подробности не описываются повторно в этом варианте осуществления. В этом варианте осуществления предпочтительно способ для кодирования параметра полосы высоких частот заключается в следующем: только тогда, когда кодер находится в рабочем DTX-состоянии, и flag_SID=1, кодер выполняет линейный прогнозный анализ 10-го порядка для сигнала s₁ полосы высоких частот текущего кадра и получает 10 коэффициентов lpc(i) линейного прогнозирования, где i=0, 1, ..., 9; lpc(i) взвешивается:

(8),

и получается взвешенный LPC-коэффициент lpc_w(i), где w₂(i) представляет группу 9-мерных весовых коэффициентов, которые меньше или равны 1; lpc_w(i) преобразуется в LSP-коэффициент, чтобы получать 10 LSP-коэффициентов lsp_w(i), где i=0, 1, ..., 9, и долговременное скользящее среднее lsp_w(i) стороны кодирования обновляется согласно lsp_w(i).

(9),

где предпочтительно α=0,9, и lsp_a(i) инициализируется в качестве lsp_w(i) текущего кадра каждый раз, когда flag_hb изменяется с 0 на 1. Когда SID должен включать в себя параметры полосы высоких частот, квантуется lsp_a(i), и получается группа квантованных индексов idx_LSP. Квантуется долговременное скользящее среднее e_1a логарифмических энергий сигналов полосы высоких частот на стороне кодирования, и получается квантованный индекс idx_E. В этом случае SID формируется из idx_ISF, idx_e, idx_LSP и idx_E. В этом варианте осуществления SID, сформированный из idx_ISF, idx_e, idx_LSP и idx_E, упоминается как "большой SID".

[0076] Необязательно, lsp_a(i) также может быть обновлен непрерывно в рабочем DTX-состоянии. Иными словами, независимо от того, равно значение flag_hb 1 или 0, lsp_a(i) обновляется. В частности, способ для обновления lsp_a(i), когда flag_hb=0, является идентичным вышеприведенному способу, когда flag_hb=1, и подробности не описываются повторно в этом варианте осуществления.

[0077] В этом варианте осуществления принцип политики для кодирования шумового сигнала полосы высоких частот является аналогичным принципу политики для кодирования шумового сигнала полосы низких частот. Только краткое введение предоставляется в этом варианте осуществления. Конкретный процесс реализации не описывается подробно в этом варианте осуществления.

[0078] В этом варианте осуществления, когда удовлетворяется условие для кодирования и передачи шумового сигнала полосы высоких частот, кодирование и передача шумового сигнала полосы высоких частот всегда выполняются одновременно с кодированием и передачей шумового сигнала полосы низких частот. Тем не менее, необязательно кодирование и передача шумового сигнала полосы высоких частот также могут не выполняться одновременно с кодированием и передачей шумового сигнала полосы низких частот. Иными словами, когда отправляется SID, может быть предусмотрено три возможных случая: (1) только сигнал полосы низких частот текущего шумового кадра кодируется и передается; (2) только сигнал полосы высоких частот текущего шумового кадра кодируется и передается; и (3) сигнал полосы низких частот и сигнал полосы высоких частот текущего шумового кадра кодируются и передаются одновременно, и в этом случае условие отправки в политике для отправки второго SID второго механизма прерывистой передачи дополнительно включает в себя: удовлетворение посредством первого механизма прерывистой передачи условию для отправки первого SID. Три случая отправки SID не ограничены конкретным образом в этом варианте осуществления.

[0079] В этом варианте осуществления этапы 302-304 представляют собой, в частности, этапы кодирования и передачи шумового сигнала полосы низких частот посредством использования первого механизма прерывистой передачи и кодирования и передачи шумового сигнала полосы высоких частот посредством использования второго механизма прерывистой передачи, причем политика для отправки первого кадра SID дескриптора вставки молчания первого механизма прерывистой передачи отличается от политики для отправки второго SID второго механизма прерывистой передачи, либо политика для кодирования первого SID первого механизма прерывистой передачи отличается от политики для кодирования второго SID второго механизма прерывистой передачи.

[0080] Вариант осуществления способа, предоставленный посредством настоящего изобретения, обеспечивает следующие преимущества. Получается текущий шумовой кадр аудиосигнала, и текущий шумовой кадр раскладывается на шумовой сигнал полосы низких частот и шумовой сигнал полосы высоких частот; затем шумовой сигнал полосы низких частот кодируется и передается посредством использования первого механизма прерывистой передачи, и шумовой сигнал полосы высоких частот кодируется и передается посредством использования второго механизма прерывистой передачи. Таким образом, различные способы обработки используются для сигнала полосы высоких частот и сигнала полосы низких частот, может уменьшаться вычислительная сложность, и кодированные биты могут экономиться при допущении непонижения субъективного качества кодека, и биты, которые экономятся, помогают достигать цели уменьшения полосы пропускания передачи или повышения общего качества кодирования, за счет этого решая проблему при сверхширокополосном кодировании и передаче.

Вариант 4 осуществления

[0081] Этот вариант осуществления предоставляет способ для обработки аудиоданных. По сравнению с обработкой шумового сигнала на стороне кодера, сторона декодера может определять, согласно принимаемому потоку битов, то, представляет собой текущий кадр кодированный речевой кадр либо SID- или NO_DATA-кадр. NO_DATA-кадр представляет собой кадр, указывающий, что сторона кодирования не кодирует и отправляет SID в период шума. Когда текущий кадр представляет собой SID, декодер дополнительно может определять, согласно числу битов SID, то, включает SID в себя параметр полосы низких частот и/или полосы высоких частот. Необязательно, декодер также может определять, согласно конкретному идентификатору, вставленному в SID, то, включает SID в себя параметр полосы низких частот и/или полосы высоких частот. Это требует добавления дополнительного бита идентификатора, когда кодируется SID. Например, когда первый идентификатор вставляется в SID, он идентифицирует то, что SID включает в себя только параметр полосы высоких частот; когда вставляется второй идентификатор, он идентифицирует то, что SID включает в себя только параметр полосы низких частот, а когда вставляется третий идентификатор, он идентифицирует то, что SID включает в себя параметр полосы высоких частот и параметр полосы низких частот. Если текущий кадр представляет собой кодированный речевой кадр, декодер декодирует речевой кадр. Процесс конкретной обработки является аналогичным процессу предшествующего уровня техники и не описывается подробно в этом варианте осуществления. Когда текущий кадр представляет собой SID- или NO_DATA-кадр, декодер выбирает, согласно конкретному рабочему состоянию CNG, соответствующий способ, чтобы восстанавливать CN-кадр. В этом варианте осуществления CNG имеет два рабочих состояния: CNG-состояние полудекодирования, соответствующее небольшому SID-кадру, а именно, первое CNG-состояние, и CNG-состояние полного декодирования, соответствующее большому SID-кадру, а именно второе CNG-состояние. В CNG-состоянии полного декодирования декодер восстанавливает CN-кадр согласно шумовому параметру полосы высоких частот и шумовому параметру полосы низких частот, полученным посредством декодирования большого SID-кадра. В CNG-состоянии полудекодирования, декодер восстанавливает CN-кадр согласно шумовому параметру полосы низких частот, полученному посредством декодирования небольшого SID-кадра, и локально оцененному шумовому параметру полосы высоких частот. Когда текущий кадр на стороне декодирования представляет собой большой SID-кадр, если флаг flag_CNG рабочего CNG-состояния равен 0 (что указывает CNG-состояние полудекодирования), флаг flag_CNG рабочего CNG-состояния задается равным 1 (что указывает CNG-состояние полного декодирования); в противном случае исходное состояние остается неизменным. Аналогично, когда текущий кадр на стороне декодирования представляет собой небольшой SID-кадр, если флаг flag_CNG рабочего CNG-состояния равен 1, флаг flag_CNG рабочего CNG-состояния задается равным 0; в противном случае исходное состояние остается неизменным. Ссылаясь на фиг.4, в частности, этот вариант осуществления предоставляет способ для обработки аудиоданных на стороне декодера, причем способ включает в себя следующее:

[0082] 401. Декодер получает SID, и если SID включает в себя параметр полосы высоких частот и параметр полосы низких частот, декодирует SID, чтобы получать шумовой параметр полосы высоких частот и шумовой параметр полосы низких частот, и получает третий CN-кадр согласно шумовому параметру полосы высоких частот и шумовому параметру полосы низких частот, полученным посредством декодирования.

[0083] В этом варианте осуществления, после приема кодированного кадра, отправленного посредством стороны кодера, сторона декодера сначала определяет тип речевого кадра, так что различные способы декодирования соответственно используются согласно различным типам речевых кадров. В частности, если число битов SID меньше предварительно установленного первого порогового значения, определяется то, что SID включает в себя параметр полосы высоких частот; если число битов SID превышает предварительно установленное первое пороговое значение и меньше предварительно установленного второго порогового значения, определяется то, что SID включает в себя параметр полосы низких частот; и если число битов SID превышает предварительно установленное второе пороговое значение и меньше предварительно установленного третьего порогового значения, определяется то, что SID включает в себя параметр полосы высоких частот и параметр полосы низких частот. Альтернативно, если SID включает в себя первый идентификатор, определяется то, что SID включает в себя параметр полосы высоких частот; если SID включает в себя второй идентификатор, определяется то, что SID включает в себя параметр полосы низких частот; или если SID включает в себя третий идентификатор, определяется то, что SID включает в себя параметр полосы низких частот и параметр полосы высоких частот.

[0084] В этом варианте осуществления, если SID включает в себя параметр полосы высоких частот и параметр полосы низких частот, SID декодируется, чтобы получать шумовой параметр полосы высоких частот и шумовой параметр полосы низких частот, и третий CN-кадр получается согласно шумовому параметру полосы высоких частот и шумовому параметру полосы низких частот, полученным посредством декодирования. В частности, декодер декодирует SID, чтобы получать декодированную логарифмическую энергию e_D возбуждения полосы низких частот, ISF-коэффициент isf_d(i) полосы низких частот, логарифмическую энергию E_D полосы высоких частот и LSP-коэффициент lsp_d(i) полосы высоких частот; isf_d(i) преобразуется ISP-коэффициент isp_d(i), и e_D и E_D преобразуются в энергии e_d и E_d, где и , и затем буферизуются isp_d(i), e_d, lsp_d(i) и E_d.

[0085] В этом варианте осуществления, когда декодер находится в рабочем CNG-состоянии и flag_CNG=1, независимо от того, представляет собой или нет текущий кадр SID- или NO_DATA-кадр, буферизованные isp_d(i), e_d, lsp_d(i) и E_d используются для того, чтобы обновлять долговременное скользящее среднее каждого из буферизованных isp_d(i), e_d, lsp_d(i) и E_d на стороне декодирования:

, (10)

где α=0,9, и β=0,7. ECN буферизуется в буфер E_1old энергии полосы высоких частот. Случайная небольшая энергия добавляется на основе e_CN, и получается конечная энергия e'_CN возбуждения, используемая для того, чтобы восстанавливать сигнал шума полосы низких частот: , где RND представляет случайное число в диапазоне [-32767, 32767]. В этом варианте осуществления формируется 320-точечная последовательность exc₀(i) белых шумов, где i=0, 1, ..., 319; e'_CN используется для того, чтобы выполнять регулировку усиления для exc₀(i), чтобы получать exc'₀(i), т.е. exc₀(i) умножается на коэффициент G₀ усиления, так что энергия exc'₀(i) равна e'_CN, где ; isp_CN(i) преобразуется в LPC-коэффициент, чтобы получать синтезирующий фильтр 1/A₀(Z), отрегулированное по усилению возбуждение exc'₀(i) используется для того, чтобы возбуждать фильтр 1/A(Z), чтобы получать CN-сигнал s'₀ полосы низких частот, который восстанавливается на стороне декодирования и дискретизируется при 16 кГц, и энергия s'₀ вычисляется и буферизуется в буфер E_0old энергии полосы низких частот.

[0086] В этом варианте осуществления обработка шумового сигнала полосы высоких частот на стороне декодирования является аналогичной обработке шумового сигнала полосы низких частот. Формируется другая 320-точечная последовательность exc₁(i) белых шумов, где i=0, 1, ..., 319, lsp_CN(i) преобразуется в LPC-коэффициент, чтобы получать синтезирующий фильтр 1/A₁(Z), и exc₁(i) используется для того, чтобы возбуждать фильтр 1/A₁(Z), чтобы получать неотрегулированный по усилению CN-сигнал s^~₁(i) полосы высоких частот; s^~₁(i) умножается на коэффициенты усиления G₁ и G₂, где G₂=0,8, и получается CN-сигнал s'₁ полосы высоких частот, который восстанавливается на стороне декодирования и дискретизируется при 16 кГц, где . В этом варианте осуществления цель G₂ состоит в том, чтобы выполнять подавление энергии для восстановленного шумового сигнала в некоторой степени.

[0087] В этом варианте осуществления, на стороне декодера, s'₀ и s'₁ проходят через синтезирующий QMF-фильтр, и в завершение получается первый CN-кадр, который восстанавливается посредством декодера и дискретизируется при 32 кГц.

[0088] 402. Если SID включает в себя параметр полосы низких частот, декодирование SID, чтобы получать шумовой параметр полосы низких частот, локальное формирование шумового параметра полосы высоких частот и получение первого CN-кадра согласно шумовому параметру полосы низких частот, полученному посредством декодирования, и локально сформированному шумовому параметру полосы высоких частот.

[0089] В этом варианте осуществления, когда декодер находится в рабочем CNG-состоянии, и flag_CNG=0, независимо от того, представляет собой или нет текущий кадр SID- или NO_DATA-кадр, CN-сигнал s'₀ полосы низких частот, который восстанавливается на стороне декодирования и дискретизируется при 16 кГц, получается согласно идентичному способу, который используется, когда flag_CNG=1, а именно способу на этапе 402, который дополнительно не описывается в этом варианте осуществления.

[0090] В этом варианте осуществления сигнал полосы высоких частот первого CN-кадра по-прежнему получается посредством использования способа возбуждения синтезирующего фильтра посредством использования белого шума, за исключением того, что энергия сигнала полосы высоких частот первого CN-кадра и коэффициент синтезирующей фильтрации получаются посредством выполнения локальной оценки. В этом варианте осуществления локальное формирование шумового параметра полосы высоких частот включает в себя: отдельное получение средневзвешенной энергии шумового сигнала полосы высоких частот и коэффициента синтезирующей фильтрации шумового сигнала полосы высоких частот в момент, соответствующий SID; и получение шумового сигнала полосы высоких частот согласно полученной средневзвешенной энергии шумового сигнала полосы высоких частот и полученному коэффициенту синтезирующей фильтрации шумового сигнала полосы высоких частот в момент, соответствующий SID.

[0091] В этом варианте осуществления предпочтительно получение средневзвешенной энергии шумового сигнала полосы высоких частот в момент, соответствующий SID, включает в себя: получение энергии сигнала полосы низких частот первого CN-кадра согласно шумовому параметру полосы низких частот, полученному посредством декодирования; вычисление отношения энергии шумового сигнала полосы высоких частот к энергии шумового сигнала полосы низких частот в момент, когда SID, включающий в себя параметр полосы высоких частот, принимается перед SID, чтобы получать первое отношение; получение, согласно энергии сигнала полосы низких частот первого CN-кадра и первому отношению, энергии шумового сигнала полосы высоких частот в момент, соответствующий SID; и выполнение взвешенного усреднения для энергии шумового сигнала полосы высоких частот в момент, соответствующий SID, и энергии сигнала полосы высоких частот локально буферизованного CN-кадра, чтобы получать средневзвешенную энергию шумового сигнала полосы высоких частот в момент, соответствующий SID, причем средневзвешенная энергия шумового сигнала полосы высоких частот в момент, соответствующий SID, представляет собой энергию сигналов полосы высоких частот первого CN-кадра. Необязательно, вычисление отношения энергии шумового сигнала полосы высоких частот к энергии шумового сигнала полосы низких частот в момент, когда SID, включающий в себя параметр полосы высоких частот, принимается перед SID, чтобы получать первое отношение, включает в себя: вычисление отношения мгновенной энергии шумового сигнала полосы высоких частот к мгновенной энергии шумового сигнала полосы низких частот в момент, когда SID, включающий в себя параметр полосы высоких частот, принимается перед SID, чтобы получать первое отношение; или вычисление отношения средневзвешенной энергии шумового сигнала полосы высоких частот к средневзвешенной энергии шумового сигнала полосы низких частот в момент, когда SID, включающий в себя параметр полосы высоких частот, принимается перед SID, чтобы получать первое отношение. Мгновенная энергия представляет собой энергию, полученную посредством декодирования. Когда энергия шумового сигнала полосы высоких частот в момент, соответствующий SID, превышает энергию сигнала полосы высоких частот предыдущего CN-кадра, который локально буферизуется, энергия сигнала полосы высоких частот предыдущего CN-кадра, который локально буферизуется, обновляется на первой скорости; в противном случае, энергия сигнала полосы высоких частот предыдущего CN-кадра, который локально буферизуется, обновляется на второй скорости, причем первая скорость превышает вторую скорость.

[0092] В частности, в этом варианте осуществления, получение средневзвешенной энергии шумового сигнала полосы высоких частот в момент, соответствующий SID, может быть реализовано посредством использования следующего способа:

- получение энергии E₀ сигнала полосы низких частот первого CN-кадра s'₀ согласно шумовому параметру полосы низких частот, полученному посредством декодирования; оценка, согласно энергии E_1old сигнала полосы высоких частот и E_0old сигнала полосы низких частот предыдущего CN-кадра в CNG-состоянии полного декодирования и E₀, энергии E^~₁ шумового сигнала полосы высоких частот в момент, соответствующий SID, где ; и обновление долговременного скользящего среднего ECN энергий CN-сигналов полосы высоких частот на стороне декодирования посредством использования E^~₁: , где коэффициент λ является переменной, когда E^~₁>E_CN, λ=0,98; в противном случае, λ=0,9, причем λ=0,98 является первой скоростью, а λ=0,9 является второй скоростью.

[0093] В этом варианте осуществления, если отклонение не вычисляется на стороне кодирования, необязательно, получение средневзвешенной энергии шумового сигнала полосы высоких частот в момент, соответствующий SID, включает в себя: выбор сигнала полосы высоких частот речевого кадра с минимальной энергией сигналов полосы высоких частот из речевых кадров в пределах предварительно установленного периода времени перед SID; и получение, согласно энергии сигнала полосы высоких частот речевого кадра с минимальной энергией сигналов полосы высоких частот из речевых кадров, средневзвешенной энергии шумового сигнала полосы высоких частот в момент, соответствующий SID; или выбор сигналов полосы высоких частот N речевых кадров с энергией сигналов полосы высоких частот, меньшей предварительно установленного порогового значения, из речевых кадров в пределах предварительно установленного периода времени перед SID; и получение, согласно средневзвешенной энергии сигналов полосы высоких частот N речевых кадров, средневзвешенной энергии шумового сигнала полосы высоких частот в момент, соответствующий SID, причем средневзвешенная энергия шумового сигнала полосы высоких частот в момент, соответствующий SID, представляет собой энергию сигналов полосы высоких частот первого CN-кадра.

[0094] В этом варианте осуществления предпочтительно получение коэффициента синтезирующей фильтрации шумового сигнала полосы высоких частот в момент, соответствующий SID, включает в себя: распределение M коэффициентов спектральной частоты ISF иммитанса или коэффициентов спектральной пары ISP иммитанса, или коэффициентов частоты LSF спектральной линии, или коэффициентов пары LSP спектральных линий в частотном диапазоне, соответствующем сигналу полосы высоких частот; выполнение обработки рандомизации для M коэффициентов, причем признак рандомизации заключается в следующем: инструктирование каждому коэффициенту из M коэффициентов постепенно приближаться к целевому значению, соответствующему каждому коэффициенту, причем целевое значение является значением в предварительно установленном диапазоне, смежном со значением коэффициента, целевое значение каждого коэффициента из M коэффициентов изменяется после каждых N кадров, и N может быть переменным; и получение, согласно коэффициентам фильтрации, полученным посредством обработки рандомизации, коэффициента синтезирующей фильтрации шумового сигнала полосы высоких частот в момент, соответствующий SID.

[0095] В частности, в этом варианте осуществления получение коэффициента синтезирующей фильтрации шумового сигнала полосы высоких частот в момент, соответствующий SID, может быть реализовано посредством использования следующего способа:

[0096] Девять ISF-коэффициентов isf_ext(i) равномерно распределяются в полосе частот в -16 кГц, соответствующей ISF-коэффициентам isf_d(14) полосы низких частот, где i=0, 1, ..., 8:

(11),

isf_ext(i) преобразуется в полосу частот 0-8 кГц, и получается isf'_ext(i):

(12),

isf'_ext(i) рандомизируется посредством использования группы 9-мерных коэффициентов R(i) рандомизации, где i=0, 1, ..., 8, и получается рандомизированный ISF-коэффициент isf₁(i):

(13),

где R(i) получается согласно следующей формуле (14):

(14),

где α=0,8, и R_t(i) упоминается как "целевой коэффициент рандомизации" и получается согласно следующей формуле:

(15).

[0097] В вышеприведенной формуле (15) RND представляет группу 9-мерных последовательностей случайных чисел, и случайные числа в каждой размерности отличаются друг от друга, и все попадают в диапазон [-1, 1]; cnt является счетчиком кадров. В рабочем CNG-состоянии, когда flag_CNG=0, для каждого SID-кадра или NO_DATA-кадра 1 прибавляется к счетчику. mod(cnt, 10) представляет cnt mod 10. В другом варианте осуществления, когда вычисляется R_t(i), 10 в mod(cnt, 10) также может быть переменной, например:

(16),

где RND представляет случайное число в диапазоне [-1, 1], что не ограничено конкретным образом в этом варианте осуществления.

[0098] В этом варианте осуществления ISF-коэффициент isf_d(15) полосы низких частот используется в качестве isf₁(9) и синтезируется с рандомизированным ISF-коэффициентом isf₁(i), где i=0, 1, ..., 8, чтобы формировать ISF-коэффициент фильтрации 10-го порядка, который затем преобразуется в LPC-коэффициент lpc₁(i), где i=0, 1, ..., 9; lpc₁(i) умножается на группу 10-мерных весовых коэффициентов W(i)={0,6699, 0,5862, 0,5129, 0,4488, 0,3927, 0,3436, 0,3007, 0,2631, 0,2302, 0,2014}, и получается взвешенный LPC-коэффициент lpc^~₁(i), т.е. оценивается синтезирующий фильтр 1/A^~₁(Z).

[0099] В этом варианте осуществления формируется 320-точечная последовательность exc₂(i) белых шумов, где i=0, 1, ..., 319, и exc₂(i) используется для того, чтобы возбуждать фильтр 1/A^~₁(Z), чтобы получать неотрегулированный по усилению CN-сигнал s^~₁(i) полосы высоких частот; s^~₁(i) умножается на коэффициенты усиления G₃ и G₄, G₄=0,6, и получается CN-сигнал s'₁ полосы высоких частот, который восстанавливается на стороне декодирования и дискретизируется при 16 кГц, где .

[0100] Если текущий кадр представляет собой SID, необходимо преобразовывать lpc^~₁(i) в LSP-коэффициент lsp^~₁(i) и использовать lsp^~₁(i), чтобы обновлять долговременное скользящее среднее LSP-коэффициентов сигналов полосы высоких частот CN-кадров, буферизованных на стороне декодирования:

(17),

где β=0,7.

[0101] В этом варианте осуществления необязательное получение коэффициента синтезирующей фильтрации шумового сигнала полосы высоких частот в момент, соответствующий SID, включает в себя: получение M ISF-коэффициентов или ISP-коэффициентов, или LSF-коэффициентов, или LSP-коэффициентов локально буферизованного шумового сигнала полосы высоких частот; выполнение обработки рандомизации для M коэффициентов, причем признак рандомизации заключается в следующем: инструктирование каждому коэффициенту из M коэффициентов постепенно приближаться к целевому значению, соответствующему каждому коэффициенту, причем целевое значение является значением в предварительно установленном диапазоне, смежном со значением коэффициента, и целевое значение каждого коэффициента из M коэффициентов изменяется после каждых N кадров; и получение, согласно коэффициентам фильтрации, полученным посредством обработки рандомизации, коэффициента синтезирующей фильтрации шумового сигнала полосы высоких частот в момент, соответствующий SID. Конкретные ограничения не накладываются в этом варианте осуществления.

[0102] В этом варианте осуществления после того как получаются параметр полосы низких частот и параметр полосы высоких частот, s'₀ и s'₁ проходят через синтезирующий QMF-фильтр, и в завершение получается первый CN-кадр, который восстанавливается посредством декодера и дискретизируется при 32 кГц.

[0103] Дополнительно, в этом варианте осуществления, необязательно, до того, как первый CN-кадр получается согласно шумовому параметру полосы низких частот, полученному посредством декодирования, и локально сформированному шумовому параметру полосы высоких частот, может быть дополнительно оптимизирован локально сформированный шумовой параметр полосы высоких частот, так что может получаться более преимущественный комфортный шум. Конкретный этап оптимизации включает в себя: когда кадры предыстории, смежные с SID, представляют собой кодированные речевые кадры, если средняя энергия сигналов полосы высоких частот или части сигналов полосы высоких частот, которые декодируются из кодированных речевых кадров, меньше средней энергии шумовых сигналов полосы высоких частот или части шумовых сигналов полосы высоких частот, которые формируются локально, умножение шумовых сигналов полосы высоких частот последующих L кадров, начиная с SID, на коэффициент сглаживания, меньший 1, чтобы получать новую средневзвешенную энергию локально сформированных шумовых сигналов полосы высоких частот; и соответственно получение первого CN-кадра согласно шумовому параметру полосы низких частот, полученному посредством декодирования, и локально сформированному шумовому параметру полосы высоких частот включает в себя: получение четвертого CN-кадра согласно шумовому параметру полосы низких частот, полученному посредством декодирования, коэффициенту синтезирующей фильтрации шумового сигнала полосы высоких частот в момент, соответствующий SID, и новой средневзвешенной энергии локально сформированных шумовых сигналов полосы высоких частот.

[0104] В этом варианте осуществления, когда кадр перед текущим SID представляет собой кодированный речевой кадр, и энергия E_sp сигнала полосы высоких частот кодированного речевого кадра ниже энергии E_s'1 s'₁, необходимо сглаживать энергии сигналов полосы высоких частот текущего SID и последующих нескольких SID (50 кадров в этом варианте осуществления). Конкретный способ сглаживания заключается в следующем: умножение s'₁ текущего кадра на усиление G_s, чтобы получать сглаженный s'_1s. , где cnt является счетчиком кадров, 1 прибавляется к счетчику для каждого кадра, начиная с первого CN-кадра после кодированного речевого кадра, и представляет собой энергию сглаженного сигнала полосы высоких частот предыдущего кадра и инициализируется в качестве E_sp, когда cnt=1. Процесс сглаживания выполняется только максимум для 50 кадров. В этот период, если превышает E_s'1, завершается процесс сглаживания. Необязательно, и E_s'1 также могут представлять энергии только части кадров, что не ограничено конкретным образом в этом варианте осуществления. В этом варианте осуществления s'₀ и s'₁ (или s'_1s) проходят через синтезирующий QMF-фильтр, и в завершение получается CN-кадр, который восстанавливается посредством декодера и дискретизируется при 32 кГц.

[0105] 403. Если SID включает в себя параметр полосы высоких частот, декодирование SID, чтобы получать шумовой параметр полосы высоких частот, локальное формирование шумового параметра полосы низких частот и получение второго CN-кадра согласно шумовому параметру полосы высоких частот, полученному посредством декодирования, и локально сформированному шумовому параметру полосы низких частот.

[0106] В этом варианте осуществления, если SID включает в себя параметр полосы высоких частот, SID декодируется, чтобы получать параметр полосы высоких частот, и шумовой параметр полосы низких частот формируется локально, и второй CN-кадр получается согласно параметру полосы высоких частот, полученному посредством декодирования, и локально сформированному шумовому параметру полосы низких частот. Способ для декодирования параметра полосы высоких частот является идентичным способу на этапе 401, и подробности не описываются повторно в этом варианте осуществления. Способ для локального формирования параметра полосы низких частот является идентичным способу для локального формирования широкополосного параметра, и подробности не описываются повторно в этом варианте осуществления.

[0107] Вариант осуществления способа, предоставленный посредством настоящего изобретения, обеспечивает следующие преимущества. Декодер получает кадр SID дескриптора вставки молчания и определяет то, включает SID в себя параметр полосы низких частот и/или параметр полосы высоких частот; если SID включает в себя параметр полосы низких частот, декодирует SID, чтобы получать шумовой параметр полосы низких частот, локально формирует шумовой параметр полосы высоких частот и получает первый кадр комфортного шума CN согласно шумовому параметру полосы низких частот, полученному посредством декодирования, и локально сформированному шумовому параметру полосы высоких частот; если SID включает в себя параметр полосы высоких частот, декодирует SID, чтобы получать шумовой параметр полосы высоких частот, локально формирует шумовой параметр полосы низких частот и получает второй CN-кадр согласно шумовому параметру полосы высоких частот, полученному посредством декодирования, и локально сформированному шумовому параметру полосы низких частот; и если SID включает в себя параметр полосы высоких частот и параметр полосы низких частот, декодирует SID, чтобы получать шумовой параметр полосы высоких частот и шумовой параметр полосы низких частот, и получает третий CN-кадр согласно шумовому параметру полосы высоких частот и шумовому параметру полосы низких частот, полученным посредством декодирования. Таким образом, различные способы обработки используются для сигнала полосы высоких частот и сигнала полосы низких частот, может уменьшаться вычислительная сложность, и кодированные биты могут экономиться при допущении непонижения субъективного качества кодека, и биты, которые экономятся, помогают достигать цели уменьшения полосы пропускания передачи или повышения общего качества кодирования, за счет этого решая проблему при сверхширокополосном кодировании и передаче. Помимо этого, до того, как второй CN-кадр получается согласно шумовому параметру полосы низких частот, полученному посредством декодирования, и локально сформированному шумовому параметру полосы высоких частот, может быть дополнительно оптимизирован локально сформированный шумовой параметр полосы высоких частот, так что может получаться более преимущественный комфортный шум. В силу этого, дополнительно оптимизируется производительность декодера.

Вариант 5 осуществления

[0108] Этот вариант осуществления предоставляет способ для обработки аудиоданных. Идентично способу для обработки аудиоданных в варианте 2 осуществления, сторона кодера получает шумовой кадр аудиосигнала и раскладывает шумовой кадр на шумовой сигнал полосы низких частот и шумовой сигнал полосы высоких частот. Тем не менее, необязательно, определение того, удовлетворяет или нет сигнал полосы высоких частот шумового кадра предварительно установленному условию кодирования и передачи, включает в себя: определение того, удовлетворяет или нет спектральная структура шумового сигнала полосы высоких частот шумового кадра, по сравнению со средней спектральной структурой шумовых сигналов полосы высоких частот перед шумовым кадром, предварительно установленному условию; если да, кодирование SID шумового сигнала полосы высоких частот шумового кадра посредством использования политики для отправки второго SID и отправку SID; а если нет, определение того, что шумовой сигнал полосы высоких частот шумового кадра не должен быть кодирован и передан. Средняя спектральная структура шумовых сигналов полосы высоких частот перед шумовым кадром включает в себя: взвешенное среднее спектров шумовых сигналов полосы высоких частот перед шумовым кадром. В этом варианте осуществления определение того, удовлетворяет или нет спектральная структура шумового сигнала полосы высоких частот шумового кадра, по сравнению со средней спектральной структурой шумовых сигналов полосы высоких частот перед шумовым кадром, предварительно установленному условию, используется в качестве третьего условия для определении того, следует или нет кодировать и передавать шумовой сигнал полосы высоких частот.

[0109] В этом варианте осуществления, необязательно, то, следует или нет кодировать и передавать шумовой сигнал полосы высоких частот, также может быть определено посредством использования второго условия определения, что не ограничено конкретным образом в этом варианте осуществления.

[0110] В этом варианте осуществления DTX определяет то, следует или нет кодировать и передавать параметр полосы высоких частот, т.е. задание flag_hb может определяться посредством использования следующих условий: (1) удовлетворяется или нет третье условие определения; если да, задание flag_hb равным 0; в противном случае, задание flag_hb равным 1; и (2) удовлетворяется или нет второе условие определения; если нет, задание flag_hb равным 0; и если да, задание flag_hb равным 1.

[0111] В этом варианте осуществления конкретный способ для реализации третьего условия определения может заключаться в следующем: кодер получает LSP-коэффициент lsp(i) 10-го порядка шумового сигнала s₁ полосы высоких частот текущего шумового кадра, где i=0, ..., 9, и необязательно коэффициент также может представлять собой LSF- или ISF-, или ISP-коэффициент, что не ограничено конкретным образом в этом варианте осуществления. LSP- или LSF-, или ISF-, или ISP-коэффициент является только различным способом представления в различной области, но все они представляют коэффициент синтезирующей фильтрации, что не ограничено конкретным образом в этом варианте осуществления; lsp(i) используется для того, чтобы обновлять его скользящее среднее:

(18),

где lsp_a(i) является долговременным скользящим средним lsp(i). Вычисляется спектральное искажение между текущим lspa(i) и lsp_a(i) в момент, когда SID-кадр, включающий в себя параметр полосы высоких частот, отправлен в прошлый раз: , где D_lsp представляет спектральное искажение, а представляет lsp_a(i) в момент, когда SID-кадр, включающий в себя параметр полосы высоких частот, отправлен в прошлый раз. Если D_lsp меньше определенного порогового значения, задается flag_hb=0; в противном случае, задается flag_hb=1.

[0112] В этом варианте осуществления способ работы для кодирования параметра полосы низких частот и/или параметра полосы высоких частот посредством кодера при необходимости по существу является идентичным способу работы в варианте 3 осуществления, и подробности не описываются повторно в этом варианте осуществления.

[0113] В этом варианте осуществления, когда декодер находится в рабочем CNG-состоянии и flag_CNG=0, необходимо локально формировать шумовой сигнал полосы высоких частот. Способ для получения средневзвешенной энергии шумового сигнала полосы высоких частот в момент, соответствующий SID, является идентичным способу в варианте 4 осуществления, и подробности не описываются повторно в этом варианте осуществления. Тем не менее, в этом варианте осуществления предпочтительно получение коэффициента синтезирующей фильтрации шумового сигнала полосы высоких частот в момент, соответствующий SID, включает в себя: получение M ISF-коэффициентов или ISP-коэффициентов, или LSF-коэффициентов, или LSP-коэффициентов локально буферизованного шумового сигнала полосы высоких частот; выполнение обработки рандомизации для M коэффициентов, причем признак рандомизации заключается в следующем: инструктирование каждому коэффициенту из M коэффициентов постепенно приближаться к целевому значению, соответствующему каждому коэффициенту, причем целевое значение является значением в предварительно установленном диапазоне, смежном со значением коэффициента, и целевое значение каждого коэффициента из M коэффициентов изменяется после каждых N кадров; и получение, согласно коэффициентам фильтрации, полученным посредством обработки рандомизации, коэффициента синтезирующей фильтрации шумового сигнала полосы высоких частот в момент, соответствующий SID. В частности, получение коэффициента синтезирующей фильтрации шумового сигнала полосы высоких частот в момент, соответствующий SID, может быть реализовано следующим образом:

[0114] При условии lsp'(i)=lsp_CN(i), где i=0, ..., 9, lsp_CN(i) является долговременным скользящим средним LSP-коэффициентов сигналов полосы высоких частот CN-кадров, которые локально буферизуются на стороне декодирования. Обработка рандомизации выполняется для lsp'(i) посредством использования идентичного способа из варианта 4 осуществления, и получается lsp₁(i):

(19).

[0115] lsp₁(i) преобразуется в LPC-коэффициент lpc₁(i), и синтезирующий фильтр 1/A^~₁(Z) получается после взвешивания с w(i) посредством использования идентичного способа из варианта 4 осуществления. В этом варианте осуществления формируется 320-точечная последовательность exc₂(i) белых шумов, где i=0, 1, ..., 319, и exc₂(i) используется для того, чтобы возбуждать фильтр 1/A^~₁(Z), чтобы получать неотрегулированный по усилению CN-сигнал s^~₁(i) полосы высоких частот; s^~₁(i) умножается на коэффициент G₃ усиления, и получается сигнал s'₁ полосы высоких частот CN-кадра, который восстанавливается на стороне декодирования и дискретизируется при 16 кГц. В этом варианте осуществления, когда текущий кадр представляет собой SID, lsp₁(i), полученный посредством использования этого способа, не используется для того, чтобы обновлять долговременное скользящее среднее LSP-коэффициентов сигналов полосы высоких частот CN-кадров, которые буферизуются на стороне декодирования.

[0116] В этом варианте осуществления, когда кодер кодирует большой SID-кадр, когда долговременное скользящее среднее e_1a логарифмических энергий сигналов полосы высоких частот квантуется на стороне кодирования, квантование выполняется после того, как e_1a ослабляется (т.е. после того, как значение вычитается). Следовательно, в этом случае, при декодировании необязательно умножать s^~₁(i) на G₂ или G₄ в варианте 4 осуществления. Другие этапы стороны декодирования в этом варианте осуществления являются аналогичными этапам в вышеприведенном варианте осуществления, и подробности не описываются повторно в этом варианте осуществления.

[0117] Вариант осуществления способа, предоставленный посредством настоящего изобретения, обеспечивает следующие преимущества. Получается текущий шумовой кадр аудиосигнала, и текущий шумовой кадр раскладывается на шумовой сигнал полосы низких частот и шумовой сигнал полосы высоких частот; затем шумовой сигнал полосы низких частот кодируется и передается посредством использования первого механизма прерывистой передачи, и шумовой сигнал полосы высоких частот кодируется и передается посредством использования второго механизма прерывистой передачи. Декодер получает кадр SID дескриптора вставки молчания и определяет то, включает SID в себя параметр полосы низких частот и/или параметр полосы высоких частот; если SID включает в себя параметр полосы низких частот, декодирует SID, чтобы получать шумовой параметр полосы низких частот, локально формирует шумовой параметр полосы высоких частот и получает первый кадр комфортного шума CN согласно шумовому параметру полосы низких частот, полученному посредством декодирования, и локально сформированному шумовому параметру полосы высоких частот; если SID включает в себя параметр полосы высоких частот, декодирует SID, чтобы получать шумовой параметр полосы высоких частот, локально формирует шумовой параметр полосы низких частот и получает второй CN-кадр согласно шумовому параметру полосы высоких частот, полученному посредством декодирования, и локально сформированному шумовому параметру полосы низких частот; и если SID включает в себя параметр полосы высоких частот и параметр полосы низких частот, декодирует SID, чтобы получать шумовой параметр полосы высоких частот и шумовой параметр полосы низких частот, и получает третий CN-кадр согласно шумовому параметру полосы высоких частот и шумовому параметру полосы низких частот, полученным посредством декодирования. Таким образом, различные способы обработки используются для сигнала полосы высоких частот и сигнала полосы низких частот, может уменьшаться вычислительная сложность, и кодированные биты могут экономиться при допущении непонижения субъективного качества кодека, и биты, которые экономятся, помогают достигать цели уменьшения полосы пропускания передачи или повышения общего качества кодирования, за счет этого решая проблему при сверхширокополосном кодировании и передаче.

Вариант 6 осуществления

[0118] Ссылаясь на фиг.5, этот вариант осуществления предоставляет устройство для кодирования аудиоданных, причем устройство включает в себя: модуль 501 получения и передающий модуль 502.

[0119] Модуль 501 получения сконфигурирован с возможностью получать шумовой кадр аудиосигнала и разлагать шумовой кадр на шумовой сигнал полосы низких частот и шумовой сигнал полосы высоких частот.

[0120] Передающий модуль 502 сконфигурирован с возможностью кодировать и передавать шумовой сигнал полосы низких частот посредством использования первого механизма прерывистой передачи и кодировать и передавать шумовой сигнал полосы высоких частот посредством использования второго механизма прерывистой передачи, причем политика для отправки первого кадра SID дескриптора вставки молчания первого механизма прерывистой передачи отличается от политики для отправки второго SID второго механизма прерывистой передачи, либо политика для кодирования первого SID первого механизма прерывистой передачи отличается от политики для кодирования второго SID второго механизма прерывистой передачи.

[0121] В этом варианте осуществления первый SID включает в себя параметр полосы низких частот шумового кадра, а второй SID включает в себя параметр полосы низких частот и/или параметр полосы высоких частот шумового кадра.

[0122] Необязательно, ссылаясь на фиг.6, передающий модуль 502 включает в себя:

- первый передающий блок 502a, сконфигурированный с возможностью определять то, имеет или нет шумовой сигнал полосы высоких частот предварительно установленную спектральную структуру; если да и удовлетворяется условие отправки политики для отправки второго SID, кодировать идентификатор шумового сигнала полосы высоких частот посредством использования политики для кодирования второго SID и отправлять SID; а если нет, определять то, что шумовой сигнал полосы высоких частот не должен быть кодирован и передан.

[0123] В этом варианте осуществления первый передающий блок 502a включает в себя:

- первый субблок определения, сконфигурированный с возможностью получать спектр шумового сигнала полосы высоких частот, разделять спектр, по меньшей мере, на две подполосы частот, и если средняя энергия любой первой подполосы частот в подполосах частот не меньше средней энергии второй подполосы частот в подполосах частот, причем полоса частот, в которой расположена вторая подполоса частот, выше полосы частот, в которой расположена первая подполоса частот, определять то, что шумовой сигнал полосы высоких частот не имеет предварительно установленной спектральной структуры; в противном случае, определять то, что шумовой сигнал полосы высоких частот имеет предварительно установленную спектральную структуру.

[0124] Ссылаясь на фиг.6, необязательно, передающий модуль 502 включает в себя:

- второй передающий блок 502b, сконфигурированный с возможностью формировать отклонение согласно первому отношению и второму отношению, причем первое отношение представляет собой отношение энергии шумового сигнала полосы высоких частот к энергии шумового сигнала полосы низких частот шумового кадра, а второе отношение представляет собой отношение энергии шумового сигнала полосы высоких частот к энергии шумового сигнала полосы низких частот в момент, когда SID, включающий в себя шумовой параметр полосы высоких частот, отправлен в прошлый раз перед шумовым кадром; и определять то, достигает или нет отклонение предварительно установленного порогового значения; если да, кодировать SID шумового сигнала полосы высоких частот посредством использования политики для кодирования второго SID и отправлять SID; а если нет, определять то, что шумовой сигнал полосы высоких частот не должен быть кодирован и передан.

[0125] Необязательно, то, что первое отношение представляет собой отношение энергии шумового сигнала полосы высоких частот к энергии шумового сигнала полосы низких частот шумового кадра, включает в себя то, что:

[0126] Альтернативно, то, что первое отношение представляет собой отношение энергии шумового сигнала полосы высоких частот к энергии шумового сигнала полосы низких частот шумового кадра, включает в себя то, что:

[0127] Необязательно, в этом варианте осуществления второй передающий блок 502b включает в себя:

- субблок вычисления, сконфигурированный с возможностью отдельно вычислять логарифмическое значение первого отношения и логарифмическое значение второго отношения; и вычислять абсолютное значение разности между логарифмическим значением первого отношения и логарифмическим значением второго отношения, чтобы получать отклонение.

[0128] Ссылаясь на фиг.6, необязательно, в этом варианте осуществления передающий модуль 502 включает в себя:

- третий передающий блок 502c, сконфигурированный с возможностью определять то, удовлетворяет или нет спектральная структура шумового сигнала полосы высоких частот шумового кадра, по сравнению со средней спектральной структурой шумовых сигналов полосы высоких частот перед шумовым кадром, предварительно установленному условию; если да, кодировать SID шумового сигнала полосы высоких частот шумового кадра посредством использования политики для отправки второго SID и отправлять SID; а если нет, определять то, что шумовой сигнал полосы высоких частот шумового кадра не должен быть кодирован и передан.

[0129] В этом варианте осуществления, необязательно, средняя спектральная структура шумовых сигналов полосы высоких частот перед шумовым кадром включает в себя: взвешенное среднее спектров шумовых сигналов полосы высоких частот перед шумовым кадром.

[0130] Необязательно, в этом варианте осуществления, условие отправки в политике для отправки второго SID второго механизма прерывистой передачи дополнительно включает в себя: удовлетворение посредством первого механизма прерывистой передачи условию для отправки первого SID.

[0131] Вариант осуществления устройства, предоставленный посредством настоящего изобретения, обеспечивает следующие преимущества. Получается текущий шумовой кадр аудиосигнала, и текущий шумовой кадр раскладывается на шумовой сигнал полосы низких частот и шумовой сигнал полосы высоких частот; затем шумовой сигнал полосы низких частот кодируется и передается посредством использования первого механизма прерывистой передачи, и шумовой сигнал полосы высоких частот кодируется и передается посредством использования второго механизма прерывистой передачи. Таким образом, различные способы обработки используются для сигнала полосы высоких частот и сигнала полосы низких частот, может уменьшаться вычислительная сложность, и кодированные биты могут экономиться при допущении непонижения субъективного качества кодека, и биты, которые экономятся, помогают достигать цели уменьшения полосы пропускания передачи или повышения общего качества кодирования, за счет этого решая проблему при сверхширокополосном кодировании и передаче.

Вариант 7 осуществления

[0132] Ссылаясь на фиг.7, этот вариант осуществления предоставляет устройство для декодирования аудиоданных, причем устройство включает в себя: модуль 601 получения, первый модуль 602 декодирования, второй модуль 603 декодирования и третий модуль 604 декодирования.

[0133] Модуль 601 получения сконфигурирован с возможностью определять то, включает принимаемый текущий кадр SID дескриптора вставки молчания в себя параметр полосы низких частот или параметр полосы высоких частот.

[0134] Первый модуль 602 декодирования сконфигурирован с возможностью: если SID, полученный посредством модуля 601 получения, включает в себя параметр полосы низких частот, декодировать SID, чтобы получать шумовой параметр полосы низких частот, локально формировать шумовой параметр полосы высоких частот и получать первый кадр комфортного шума CN согласно шумовому параметру полосы низких частот, полученному посредством декодирования, и локально сформированному шумовому параметру полосы высоких частот.

[0135] Второй модуль 603 декодирования сконфигурирован с возможностью: если SID, полученный посредством модуля 601 получения, включает в себя параметр полосы высоких частот, декодировать SID, чтобы получать шумовой параметр полосы высоких частот, локально формировать шумовой параметр полосы низких частот и получать второй CN-кадр согласно шумовому параметру полосы высоких частот, полученному посредством декодирования, и локально сформированному шумовому параметру полосы низких частот.

[0136] Третий модуль 604 декодирования сконфигурирован с возможностью: если SID, полученный посредством модуля 601 получения, включает в себя параметр полосы высоких частот и параметр полосы низких частот, декодировать SID, чтобы получать шумовой параметр полосы высоких частот и шумовой параметр полосы низких частот, и получать третий CN-кадр согласно шумовому параметру полосы высоких частот и шумовому параметру полосы низких частот, полученным посредством декодирования.

[0137] Необязательно, в этом варианте осуществления первый модуль 602 декодирования дополнительно сконфигурирован с возможностью: перед декодированием SID, чтобы получать шумовой параметр полосы низких частот, локальным формированием шумового параметра полосы высоких частот и получением первого кадра комфортного шума CN согласно шумовому параметру полосы низких частот, полученному посредством декодирования, и локально сформированному шумовому параметру полосы высоких частот, если декодер находится в первом состоянии формирования CNG комфортного шума, переходить во второе CNG-состояние.

[0138] Необязательно, в этом варианте осуществления третий модуль 604 декодирования дополнительно сконфигурирован с возможностью: перед декодированием SID, чтобы получать шумовой параметр полосы высоких частот и шумовой параметр полосы низких частот, и получением третьего CN-кадра согласно шумовому параметру полосы высоких частот и шумовому параметру полосы низких частот, полученным посредством декодирования, если декодер находится во втором CNG-состоянии, переходить в первое CNG-состояние.

[0139] Необязательно, модуль 601 получения включает в себя:

- первый блок определения, сконфигурированный с возможностью: если число битов SID меньше предварительно установленного первого порогового значения, определять то, что SID включает в себя параметр полосы высоких частот; если число битов SID превышает предварительно установленное первое пороговое значение и меньше предварительно установленного второго порогового значения, определять то, что SID включает в себя параметр полосы низких частот; и если число битов SID превышает предварительно установленное второе пороговое значение и меньше предварительно установленного третьего порогового значения, определять то, что SID включает в себя параметр полосы высоких частот и параметр полосы низких частот; или

- второй блок определения, сконфигурированный с возможностью: если SID включает в себя первый идентификатор, определять то, что SID включает в себя параметр полосы высоких частот; если SID включает в себя второй идентификатор, определять то, что SID включает в себя параметр полосы низких частот; и если SID включает в себя третий идентификатор, определять то, что SID включает в себя параметр полосы низких частот и параметр полосы высоких частот.

[0140] В этом варианте осуществления первый модуль 602 декодирования включает в себя:

- первый блок получения, сконфигурированный с возможностью отдельно получать средневзвешенную энергию шумового сигнала полосы высоких частот и коэффициент синтезирующей фильтрации шумового сигнала полосы высоких частот в момент, соответствующий SID; и

- второй блок получения, сконфигурированный с возможностью получать шумовой сигнал полосы высоких частот согласно полученной средневзвешенной энергии шумового сигнала полосы высоких частот и полученному коэффициенту синтезирующей фильтрации шумового сигнала полосы высоких частот в момент, соответствующий SID.

[0141] Необязательно, первый блок получения включает в себя:

- первый субблок получения, сконфигурированный с возможностью получать энергию сигнала полосы низких частот первого CN-кадра согласно шумовому параметру полосы низких частот, полученному посредством декодирования;

- субблок вычисления, сконфигурированный с возможностью вычислять отношение энергии шумового сигнала полосы высоких частот к энергии шумового сигнала полосы низких частот в момент, когда SID, включающий в себя параметр полосы высоких частот, принимается перед SID, чтобы получать первое отношение;

- второй субблок получения, сконфигурированный с возможностью получать, согласно энергии сигнала полосы низких частот первого CN-кадра и первому отношению, энергию шумового сигнала полосы высоких частот в момент, соответствующий SID; и

- третий субблок получения, сконфигурированный с возможностью осуществлять взвешенное усреднение для энергии шумового сигнала полосы высоких частот в момент, соответствующий SID, и энергии сигнала полосы высоких частот локально буферизованного CN-кадра, получать средневзвешенную энергию шумового сигнала полосы высоких частот в момент, соответствующий SID, причем средневзвешенная энергия шумового сигнала полосы высоких частот в момент, соответствующий SID, представляет собой энергию сигналов полосы высоких частот первого CN-кадра.

[0142] Субблок вычисления, в частности, сконфигурирован с возможностью:

- вычислять отношение мгновенной энергии шумового сигнала полосы высоких частот к мгновенной энергии шумового сигнала полосы низких частот в момент, когда SID, включающий в себя параметр полосы высоких частот, принимается перед SID, чтобы получать первое отношение; или

- вычислять отношение средневзвешенной энергии шумового сигнала полосы высоких частот к средневзвешенной энергии шумового сигнала полосы низких частот в момент, когда SID, включающий в себя параметр полосы высоких частот, принимается перед SID, чтобы получать первое отношение.

[0143] Когда энергия шумового сигнала полосы высоких частот в момент, соответствующий SID, превышает энергию сигнала полосы высоких частот предыдущего CN-кадра, который локально буферизуется, энергия сигнала полосы высоких частот предыдущего CN-кадра, который локально буферизуется, обновляется на первой скорости; в противном случае, энергия сигнала полосы высоких частот предыдущего CN-кадра, который локально буферизуется, обновляется на второй скорости, причем первая скорость превышает вторую скорость.

[0144] Необязательно, первый блок получения включает в себя:

- первый субблок выбора, сконфигурированный с возможностью выбирать сигнал полосы высоких частот речевого кадра с минимальной энергией сигналов полосы высоких частот из речевых кадров в пределах предварительно установленного периода времени перед SID и получать, согласно энергии сигнала полосы высоких частот речевого кадра с минимальной энергией сигналов полосы высоких частот из речевых кадров, средневзвешенную энергию шумового сигнала полосы высоких частот в момент, соответствующий SID, причем средневзвешенная энергия шумового сигнала полосы высоких частот в момент, соответствующий SID, представляет собой энергию сигналов полосы высоких частот первого CN-кадра; или

- второй субблок выбора, сконфигурированный с возможностью выбирать сигналы полосы высоких частот N речевых кадров с энергией сигналов полосы высоких частот, меньшей предварительно установленного порогового значения, из речевых кадров в пределах предварительно установленного периода времени перед SID; и получать, согласно средневзвешенной энергии сигналов полосы высоких частот N речевых кадров, средневзвешенную энергию шумового сигнала полосы высоких частот в момент, соответствующий SID, причем средневзвешенная энергия шумового сигнала полосы высоких частот в момент, соответствующий SID, представляет собой энергию сигналов полосы высоких частот первого CN-кадра.

[0145] Необязательно, первый блок получения включает в себя:

- субблок распределения, сконфигурированный с возможностью распределять M коэффициентов спектральной частоты ISF иммитанса, или коэффициентов спектральной пары ISP иммитанса, или коэффициентов частоты LSF спектральной линии, или коэффициентов пары LSP спектральных линий в частотном диапазоне, соответствующем сигналу полосы высоких частот;

- первый субблок обработки рандомизации, сконфигурированный с возможностью осуществлять обработку рандомизации для M коэффициентов, причем признак рандомизации заключается в следующем: инструктирование каждому коэффициенту из M коэффициентов постепенно приближаться к целевому значению, соответствующему каждому коэффициенту, причем целевое значение является значением в предварительно установленном диапазоне, смежном со значением коэффициента, и целевое значение каждого коэффициента из M коэффициентов изменяется после каждых N кадров, где M и N являются натуральными числами; и

- четвертый субблок получения, сконфигурированный с возможностью получать, согласно коэффициентам фильтрации, полученным посредством обработки рандомизации, коэффициент синтезирующей фильтрации шумового сигнала полосы высоких частот в момент, соответствующий SID.

[0146] Необязательно, первый блок получения включает в себя:

- пятый субблок получения, сконфигурированный с возможностью получать M ISF-коэффициентов или ISP-коэффициентов, или LSF-коэффициентов, или LSP-коэффициентов локально буферизованного шумового сигнала полосы высоких частот;

- второй субблок обработки рандомизации, сконфигурированный с возможностью осуществлять обработку рандомизации для M коэффициентов, причем признак рандомизации заключается в следующем: инструктирование каждому коэффициенту из M коэффициентов постепенно приближаться к целевому значению, соответствующему каждому коэффициенту, причем целевое значение является значением в предварительно установленном диапазоне, смежном со значением коэффициента, и целевое значение каждого коэффициента из M коэффициентов изменяется после каждых N кадров; и

- шестой субблок получения, сконфигурированный с возможностью получать, согласно коэффициентам фильтрации, полученным посредством обработки рандомизации, коэффициент синтезирующей фильтрации шумового сигнала полосы высоких частот в момент, соответствующий SID.

[0147] Ссылаясь на фиг.8, необязательно, устройство дополнительно включает в себя:

- модуль 605 оптимизации, сконфигурированный с возможностью: до того, как первый модуль 602 декодирования получает первый CN-кадр, когда кадры предыстории, смежные с SID, представляют собой кодированные речевые кадры, если средняя энергия сигналов полосы высоких частот или части сигналов полосы высоких частот, которые декодируются из кодированных речевых кадров, меньше средней энергии шумовых сигналов полосы высоких частот или части шумовых сигналов полосы высоких частот, которые формируются локально, умножать шумовые сигналы полосы высоких частот последующих L кадров, начиная с SID, на коэффициент сглаживания, меньший 1, чтобы получать новую средневзвешенную энергию локально сформированных шумовых сигналов полосы высоких частот.

[0148] Соответственно первый модуль 602 декодирования, в частности, сконфигурирован с возможностью получать четвертый CN-кадр согласно шумовому параметру полосы низких частот, полученному посредством декодирования, коэффициенту синтезирующей фильтрации шумового сигнала полосы высоких частот в момент, соответствующий SID, и новой средневзвешенной энергии локально сформированных шумовых сигналов полосы высоких частот.

[0149] Вариант осуществления устройства, предоставленный посредством настоящего изобретения, обеспечивает следующие преимущества. Декодер получает кадр SID дескриптора вставки молчания и определяет то, включает SID в себя параметр полосы низких частот или параметр полосы высоких частот; если SID включает в себя параметр полосы низких частот, декодирует SID, чтобы получать шумовой параметр полосы низких частот, локально формирует шумовой параметр полосы высоких частот и получает первый кадр комфортного шума CN согласно шумовому параметру полосы низких частот, полученному посредством декодирования, и локально сформированному шумовому параметру полосы высоких частот; если SID включает в себя параметр полосы высоких частот, декодирует SID, чтобы получать шумовой параметр полосы высоких частот, локально формирует шумовой параметр полосы низких частот и получает второй CN-кадр согласно шумовому параметру полосы высоких частот, полученному посредством декодирования, и локально сформированному шумовому параметру полосы низких частот; и если SID включает в себя параметр полосы высоких частот и параметр полосы низких частот, декодирует SID, чтобы получать шумовой параметр полосы высоких частот и шумовой параметр полосы низких частот, и получает третий CN-кадр согласно шумовому параметру полосы высоких частот и шумовому параметру полосы низких частот, полученным посредством декодирования. Таким образом, различные способы обработки используются для сигнала полосы высоких частот и сигнала полосы низких частот, может уменьшаться вычислительная сложность, и кодированные биты могут экономиться при допущении непонижения субъективного качества кодека, и биты, которые экономятся, помогают достигать цели уменьшения полосы пропускания передачи или повышения общего качества кодирования, за счет этого решая проблему при сверхширокополосном кодировании и передаче.

Вариант 8 осуществления

[0150] Ссылаясь на фиг.9, этот вариант осуществления предоставляет систему для обработки аудиоданных, причем система включает в себя вышеприведенное устройство 500 для кодирования аудиоданных и вышеприведенное устройство 600 для декодирования аудиоданных.

[0151] Технические решения, предоставляемые посредством вариантов осуществления настоящего изобретения, обеспечивают следующие преимущества. Получается текущий шумовой кадр аудиосигнала, и текущий шумовой кадр раскладывается на шумовой сигнал полосы низких частот и шумовой сигнал полосы высоких частот; затем шумовой сигнал полосы низких частот кодируется и передается посредством использования первого механизма прерывистой передачи, и шумовой сигнал полосы высоких частот кодируется и передается посредством использования второго механизма прерывистой передачи. Декодер получает кадр SID дескриптора вставки молчания и определяет то, включает SID в себя параметр полосы низких частот и/или параметр полосы высоких частот; если SID включает в себя параметр полосы низких частот, декодирует SID, чтобы получать шумовой параметр полосы низких частот, локально формирует шумовой параметр полосы высоких частот и получает первый кадр комфортного шума CN согласно шумовому параметру полосы низких частот, полученному посредством декодирования, и локально сформированному шумовому параметру полосы высоких частот; если SID включает в себя параметр полосы высоких частот, декодирует SID, чтобы получать шумовой параметр полосы высоких частот, локально формирует шумовой параметр полосы низких частот и получает второй CN-кадр согласно шумовому параметру полосы высоких частот, полученному посредством декодирования, и локально сформированному шумовому параметру полосы низких частот; и если SID включает в себя параметр полосы высоких частот и параметр полосы низких частот, декодирует SID, чтобы получать шумовой параметр полосы высоких частот и шумовой параметр полосы низких частот, и получает третий CN-кадр согласно шумовому параметру полосы высоких частот и шумовому параметру полосы низких частот, полученным посредством декодирования. Таким образом, различные способы обработки используются для сигнала полосы высоких частот и сигнала полосы низких частот, может уменьшаться вычислительная сложность, и кодированные биты могут экономиться при допущении непонижения субъективного качества кодека, и биты, которые экономятся, помогают достигать цели уменьшения полосы пропускания передачи или повышения общего качества кодирования, за счет этого решая проблему при сверхширокополосном кодировании и передаче.

[0152] Устройство и система, предоставляемые посредством вариантов осуществления, в частности, могут применять концепцию, идентичную концепции в качестве вариантов осуществления способа. Конкретный процесс реализации устройства и системы описан подробно в вариантах осуществления способа, и подробности не описываются повторно в данном документе.

[0153] Способ и устройство для обработки аудиоданных в вышеприведенных вариантах осуществления могут применяться к аудиокодеру или к аудиодекодеру. Аудиокодеки могут широко применяться к различным электронным устройствам, таким как мобильный телефон, беспроводное устройство, персональное цифровое устройство (PDA), карманный или портативный компьютер, приемное GPS-устройство или навигационное устройство, камера, аудио/видеопроигрыватель, записывающая видеокамера, записывающее видеоустройство и устройство наблюдения. В общем, такое электронное устройство включает в себя аудиокодер или аудиодекодер. Аудиокодер или декодер может быть непосредственно реализован посредством использования цифровой схемы либо кристалла, например, DSP (процессор цифровых сигналов), либо реализован посредством использования программного кода, чтобы управлять процессором с возможностью выполнять процедуру в программном коде.

[0154] Специалисты в данной области техники могут понимать, что все или часть этапов вариантов осуществления могут быть реализованы посредством аппаратных средств или программы, инструктирующей релевантным аппаратным средствам. Программа может сохраняться на машиночитаемом носителе хранения данных. Носитель хранения данных может включать в себя: постоянное запоминающее устройство, магнитный диск или оптический диск.

[0155] Вышеприведенное описание представляет собой просто примерные варианты осуществления настоящего изобретения и не имеет намерение ограничивать настоящее изобретение. Все модификации, эквивалентные замены и улучшения, выполняемые без отступления от сущности и принципа настоящего изобретения, должны попадать в объем охраны настоящего изобретения.

1. Способ для обработки аудиоданных, содержащий этапы, на которых:

получают текущий шумовой сигнал полосы низких частот и текущий шумовой сигнал полосы высоких частот текущего шумового кадра;

формируют отклонение, основываясь на первом отношении и втором отношении, причем первое отношение представляет собой отношение энергии текущего шумового сигнала полосы низких частот к энергии текущего шумового сигнала полосы высоких частот, причем второе отношение представляет собой отношение энергии предыдущего шумового сигнала полосы низких частот в предыдущий момент к энергии предыдущего шумового сигнала полосы высоких частот в предыдущий момент, и при этом предыдущий момент соответствует последнему разу, когда кадр дескриптора вставки молчания (SID) аудиосигнала, содержащего шумовой параметр полосы высоких частот, был отправлен перед текущим шумовым кадром;

определяют, больше ли сформированное отклонение, чем предварительно установленное пороговое значение;

кодируют первый SID, содержащий шумовой параметр полосы низких частот текущего шумового сигнала полосы низких частот и шумовой параметр полосы высоких частот текущего шумового сигнала полосы высоких частот, когда сформированное отклонение больше, чем предварительно установленное пороговое значение;

передают первый SID, когда сформированное отклонение больше, чем предварительно установленное пороговое значение;

кодируют второй SID, содержащий шумовой параметр полосы низких частот текущего шумового сигнала полосы низких частот и не содержащий шумовой параметр полосы высоких частот текущего шумового сигнала полосы высоких частот, когда сформированное отклонение не больше, чем предварительно установленное пороговое значение; и

передают второй SID, когда сформированное отклонение не больше, чем предварительно установленное пороговое значение.

2. Способ по п. 1, в котором энергия текущего шумового сигнала полосы низких частот представляет сглаженную среднюю энергию текущего шумового сигнала полосы низких частот, при этом энергия текущего шумового сигнала полосы высоких частот представляет сглаженную среднюю энергию текущего шумового сигнала полосы высоких частот, при этом энергия предыдущего шумового сигнала полосы низких частот в предыдущий момент представляет сглаженную среднюю энергию предыдущего шумового сигнала полосы низких частот в предыдущий момент, и при этом энергия предыдущего шумового сигнала полосы высоких частот в предыдущий момент представляет сглаженную среднюю энергию предыдущего шумового сигнала полосы высоких частот в предыдущий момент.

3. Способ по п. 2, в котором сглаженную среднюю энергию текущего шумового сигнала полосы низких частот получают, основываясь на сглаженной средней энергии предыдущего шумового сигнала полосы низких частот в предыдущий момент и средней энергии текущего шумового сигнала полосы низких частот, и сглаженную среднюю энергию текущего шумового сигнала полосы высоких частот получают, основываясь на сглаженной средней энергии предыдущего шумового сигнала полосы высоких частот в предыдущий момент и средней энергии текущего шумового сигнала полосы высоких частот.

4. Способ по п. 3, в котором сглаженную среднюю энергию текущего шумового сигнала полосы низких частот получают в log-области и в котором сглаженную среднюю энергию текущего шумового сигнала полосы высоких частот получают в log-области.

5. Способ по п. 1, в котором формирование отклонения, основанное на первом отношении и втором отношении, содержит:

по отдельности расчет логарифмического значения первого отношения и расчет логарифмического значения второго отношения; и

расчет абсолютного значения разности между логарифмическим значением первого отношения и логарифмическим значением второго отношения для получения отклонения.

6. Способ по п. 5, в котором логарифмическое значение первого отношения рассчитывают путем:

получения логарифмического значения сглаженной средней энергии текущего шумового сигнала полосы низких частот;

получения логарифмического значения сглаженной средней энергии текущего шумового сигнала полосы высоких частот; и

получения логарифмического значения первого отношения путем расчета разницы между логарифмическим значением сглаженной средней энергии текущего шумового сигнала полосы низких частот и логарифмическим значением сглаженной средней энергии текущего шумового сигнала полосы высоких частот.

7. Способ по п. 5, в котором логарифмическое значение второго отношения рассчитывают путем:

получения логарифмического значения сглаженной средней энергию предыдущего шумового сигнала полосы низких частот в предыдущий момент;

получения логарифмического значения сглаженной средней энергии предыдущего шумового сигнала полосы высоких частот в предыдущий момент; и

получения логарифмического значения второго отношения путем расчета разницы между логарифмическим значением сглаженной средней энергии предыдущего шумового сигнала полосы низких частот в предыдущий момент и логарифмическим значением сглаженной средней энергии предыдущего шумового сигнала полосы высоких частот в предыдущий момент.

8. Способ для обработки аудиоданных, содержащий этапы, на которых:

получают текущий кадр дескриптора вставки молчания (SID), при этом текущий SID содержит шумовой параметр полосы низких частот;

определяют, содержит ли текущий SID шумовой параметр полосы высоких частот;

декодируют текущий SID, чтобы получать шумовой параметр полосы низких частот, когда текущий SID не содержит шумовой параметр полосы высоких частот;

формируют шумовой параметр полосы высоких частот, когда текущий SID не содержит шумовой параметр полосы высоких частот;

получают первый кадр комфортного шума (CN) согласно декодированному шумовому параметру полосы низких частот и сформированному шумовому параметру полосы высоких частот;

декодируют текущий SID, чтобы получать шумовой параметр полосы высоких частот, и шумовой параметр полосы низких частот, когда текущий SID содержит шумовой параметр полосы высоких частот;

получают второй CN-кадр согласно декодированному шумовому параметру полосы высоких частот и декодированному шумовому параметру полосы низких частот.

9. Способ по п. 8, в котором определение того, содержит ли текущий SID шумовой параметр полосы низких частот, содержит:

определение того, что текущий SID содержит шумовой параметр полосы высоких частот, когда текущий SID содержит первый идентификатор;

определение того, что текущий SID не содержит шумовой параметр полосы высоких частот, когда текущий SID содержит второй идентификатор; и

при этом первый идентификатор и второй идентификатор указаны одним битом текущего SID.

10. Способ по п. 8, в котором экстраполирование шумового параметра полосы высоких частот содержит:

получение взвешенной средней энергии шумового сигнала полосы высоких частот в текущий момент, соответствующий текущему SID;

получение коэффициента синтезирующей фильтрации шумового сигнала полосы высоких частот в текущий момент; и

получение шумового сигнала полосы высоких частот, основываясь на полученной взвешенной средней энергии шумового сигнала полосы высоких частот в текущий момент и полученном коэффициенте синтезирующей фильтрации шумового сигнала полосы высоких частот в текущий момент.

11. Способ по п. 10, в котором получение взвешенной средней энергии шумового сигнала полосы высоких частот в текущий момент содержит:

получение энергии сигнала полосы низких частот первого CN-кадра, основываясь на декодированном шумовом параметре полосы низких частот;

расчет первого отношения, причем первое отношение представляет отношение энергии сигнала полосы высоких частот в предыдущий момент к энергии сигнала полосы низких частот в предыдущий момент, при этом предыдущий момент соответствует последнему разу, когда предыдущий SID, содержащий шумовой параметр полосы высоких частот, был принят до текущего SID;

получение, основываясь на энергии сигнала полосы низких частот первого CN-кадра и первом отношении, энергии сигнала полосы высоких частот в текущий момент; и

выполнение взвешенного усреднения энергии сигнала полосы высоких частот в текущий момент и энергии сигнала полосы высоких частот локально буферизованного CN-кадра для получения средневзвешенной энергии шумового сигнала полосы высоких частот в текущий момент, соответствующий энергии сигнала полосы высоких частот первого CN-кадра.

12. Способ по п. 11, в котором получение первого отношения содержит этапы, на которых осуществляют:

расчет отношения средневзвешенной энергии шумового сигнала полосы высоких частот в предыдущий момент к средневзвешенной энергии шумового сигнала полосы низких частот в предыдущий момент; или

расчет отношения мгновенной энергии шумового сигнала полосы высоких частот в предыдущий момент к мгновенной энергии шумового сигнала полосы низких частот в предыдущий момент.

13. Способ по п. 10, в котором перед получением первого CN-кадра:

умножают шумовые сигналы полосы высоких частот последующих L кадров, начиная с текущего SID, на коэффициент сглаживания, для получения новой средневзвешенной энергии экстраполированных шумовых сигналов полосы высоких частот, когда кадры предыстории, смежные с текущим SID, представляют собой кодированные речевые кадры, при этом коэффициент сглаживания больше чем 0 и меньше чем 1, когда часть сигналов полосы высоких частот декодирована из кодированных речевых кадров или средняя энергия сигналов полосы высоких частот меньше, чем часть сигналов полосы высоких частот, которые экстраполированы, или средней энергии сигналов полосы высоких частот, при этом получение первого CN-кадра содержит получение первого CN-кадра, основываясь на декодированном шумовом параметре полосы низких частот, коэффициенте синтезирующей фильтрации шумового сигнала полосы высоких частот в текущий момент и новой средневзвешенной энергии экстраполированных шумовых сигналов полосы высоких частот.

14. Устройство для кодирования аудиоданных, содержащее:

энергонезависимую память для хранения машиночитаемых инструкций; и

процессор, функционально связанный с энергонезависимой памятью, причем процессор сконфигурирован с возможностью исполнять машиночитаемые инструкции, чтобы:

получать текущий шумовой сигнал полосы низких частот и текущий шумовой сигнал полосы высоких частот текущего шумового кадра;

формировать отклонение, основываясь на первом отношении и втором отношении, причем первое отношение представляет собой отношение энергии текущего шумового сигнала полосы низких частот к энергии текущего шумового сигнала полосы высоких частот, причем второе отношение представляет собой отношение энергии предыдущего шумового сигнала полосы низких частот в предыдущий момент к энергии предыдущего шумового сигнала полосы высоких частот в предыдущий момент, и при этом предыдущий момент соответствует последнему разу, когда кадр дескриптора вставки молчания (SID) аудиосигнала, содержащего шумовой параметр полосы высоких частот, был отправлен перед текущим шумовым кадром;

определять, больше ли сформированное отклонение, чем предварительно установленное пороговое значение;

кодировать первый SID, содержащий шумовой параметр полосы низких частот текущего шумового сигнала полосы низких частот и шумовой параметр полосы высоких частот текущего шумового сигнала полосы высоких частот, когда сформированное отклонение больше, чем предварительно установленное пороговое значение;

передавать первый SID, когда сформированное отклонение больше, чем предварительно установленное пороговое значение;

кодировать второй SID, содержащий шумовой параметр полосы низких частот текущего шумового сигнала полосы низких частот и не содержащий шумовой параметр полосы высоких частот текущего шумового сигнала полосы высоких частот, когда сформированное отклонение не больше, чем предварительно установленное пороговое значение; и

передавать второй SID, когда сформированное отклонение не больше, чем предварительно установленное пороговое значение.

15. Устройство по п. 14, в котором энергия текущего шумового сигнала полосы низких частот представляет сглаженную среднюю энергию текущего шумового сигнала полосы низких частот, при этом энергия текущего шумового сигнала полосы высоких частот представляет сглаженную среднюю энергию текущего шумового сигнала полосы высоких частот, при этом энергия предыдущего шумового сигнала полосы низких частот в предыдущий момент представляет сглаженную среднюю энергию предыдущего шумового сигнала полосы низких частот в предыдущий момент, и при этом энергия предыдущего шумового сигнала полосы высоких частот в предыдущий момент представляет сглаженную среднюю энергию предыдущего шумового сигнала полосы высоких частот в предыдущий момент.

16. Устройство по п. 15, в котором сглаженную среднюю энергию текущего шумового сигнала полосы низких частот получают, основываясь на сглаженной средней энергии предыдущего шумового сигнала полосы низких частот в предыдущий момент и средней энергии текущего шумового сигнала полосы низких частот, и сглаженную среднюю энергию текущего шумового сигнала полосы высоких частот получают, основываясь на сглаженной средней энергии предыдущего шумового сигнала полосы высоких частот в предыдущий момент и средней энергии текущего шумового сигнала полосы высоких частот.

17. Устройство по п. 16, в котором сглаженную среднюю энергию текущего шумового сигнала полосы низких частот получают в log-области и в котором сглаженную среднюю энергию текущего шумового сигнала полосы высоких частот получают в log-области.

18. Устройство по п. 14, в котором процессор также сконфигурирован с возможностью:

по отдельности рассчитывать логарифмическое значение первого отношения и логарифмическое значение второго отношения; и

рассчитывать абсолютное значение разности между логарифмическим значением первого отношения и логарифмическим значением второго отношения для получения отклонения.

19. Устройство по п. 18, в котором процессор также сконфигурирован с возможностью:

20. Устройство по п. 18, в котором процессор также сконфигурирован с возможностью:

получения логарифмического значения сглаженной средней энергии предыдущего шумового сигнала полосы низких частот в предыдущий момент;

21. Устройство для декодирования аудиоданных, содержащее:

энергонезависимую память для хранения машиночитаемых инструкций; и

получать текущий кадр дескриптора вставки молчания (SID), при этом текущий SID содержит шумовой параметр полосы низких частот;

определять, содержит ли текущий SID шумовой параметр полосы высоких частот;

декодировать текущий SID, чтобы получать шумовой параметр полосы низких частот, когда текущий SID не содержит шумовой параметр полосы высоких частот;

формировать шумовой параметр полосы высоких частот;

получать первый кадр комфортного шума (CN) согласно декодированному шумовому параметру полосы низких частот и сформированному шумовому параметру полосы высоких частот;

декодировать текущий SID, чтобы получать шумовой параметр полосы высоких частот и шумовой параметр полосы низких частот; и

получать второй CN-кадр согласно декодированному шумовому параметру полосы высоких частот и декодированному шумовому параметру полосы низких частот.

22. Устройство для декодирования аудиоданных по п. 21, в котором процессор также сконфигурирован с возможностью:

определения того, что текущий SID содержит шумовой параметр полосы высоких частот, когда текущий SID содержит первый идентификатор; и

определения того, что текущий SID не содержит шумовой параметр полосы высоких частот, когда текущий SID содержит второй идентификатор; и

при этом первый идентификатор и второй идентификатор указаны одним битом текущего SID.

23. Устройство для декодирования аудиоданных по п. 21, в котором процессор также сконфигурирован с возможностью:

получения взвешенной средней энергии шумового сигнала полосы высоких частот в текущий момент, соответствующий текущему SID;

получения коэффициента синтезирующей фильтрации шумового сигнала полосы высоких частот в текущий момент; и

получения шумового сигнала полосы высоких частот, основываясь на полученной взвешенной средней энергии шумового сигнала полосы высоких частот в текущий момент и полученном коэффициенте синтезирующей фильтрации шумового сигнала полосы высоких частот в текущий момент.

24. Устройство для декодирования аудиоданных по п. 23, в котором процессор также сконфигурирован с возможностью:

получения энергии сигнала полосы низких частот первого CN-кадра, основываясь на декодированном шумовом параметре полосы низких частот;

получения первого отношения, причем первое отношение представляет отношение энергии сигнала полосы высоких частот в предыдущий момент к энергии сигнала полосы низких частот в предыдущий момент, и при этом предыдущий момент соответствует последнему разу, когда предыдущий SID, содержащий шумовой параметр полосы высоких частот, был принят до текущего SID;

получения, основываясь на энергии сигнала полосы низких частот первого CN-кадра и первом отношении, энергии сигнала полосы высоких частот в текущий момент; и

выполнения взвешенного усреднения энергии сигнала полосы высоких частот в текущий момент и энергии сигнала полосы высоких частот локально буферизованного CN-кадра для получения средневзвешенной энергии шумового сигнала полосы высоких частот в текущий момент, соответствующий энергии сигнала полосы высоких частот первого CN-кадра.

25. Устройство для декодирования аудиоданных по п. 24, в котором процессор также сконфигурирован с возможностью:

расчета отношения средневзвешенной энергии шумового сигнала полосы высоких частот в предыдущий момент к средневзвешенной энергии шумового сигнала полосы низких частот в предыдущий момент как первого отношения; или

26. Устройство для декодирования аудиоданных по п. 23, в котором процессор также сконфигурирован с возможностью:

умножения шумовых сигналов полосы высоких частот последующих L кадров, начиная с текущего SID, на коэффициент сглаживания, для получения новой средневзвешенной энергии экстраполированных шумовых сигналов полосы высоких частот, когда кадры предыстории, смежные с текущим SID, представляют собой кодированные речевые кадры, при этом коэффициент сглаживания больше чем 0 и меньше чем 1, когда часть сигналов полосы высоких частот декодирована из кодированных речевых кадров или средняя энергия сигналов полосы высоких частот меньше, чем часть сигналов полосы высоких частот, которые экстраполированы, или средней энергии сигналов полосы высоких частот; и

получения первого CN-кадра, основываясь на декодированном шумовом параметре полосы низких частот, коэффициенте синтезирующей фильтрации шумового сигнала полосы высоких частот в текущий момент и новой средневзвешенной энергии экстраполированных шумовых сигналов полосы высоких частот.

Изобретение относится к области электроники, в частности к электронным устройствам для организации общения между людьми, говорящими на разных языках. Технический результат заключается в повышении точности и скорости перевода устной речи с одного языка на другой.

Извлечение реверберирующего звука с использованием микрофонных массивов // 2640742

Изобретение относится к области акустического анализа. Технический результат – обеспечение захвата рассеянного звука, поступающего на микрофонный массив со всех направлений, путем получения лучшей диаграммы направленности фильтра рассеянного звука.

Гибридное усиление речи с кодированием формы сигнала и параметрическим кодированием // 2639952

Изобретение относится к средствам для гибридного усиления речи. Технический результат заключается в повышении слышимости речевого содержимого звукового сигнала относительно неречевого звукового содержимого.

Гармоническое преобразование, усовершенствованное перекрестным произведением // 2638748

Изобретение относится к системам звукового кодирования, которые используют способ гармонического преобразования для высокочастотной реконструкции (HFR). Технический результат заключается в повышении качества кодируемого аудиосигнала.

Устройство и способ для уменьшения шума квантования в декодере временной области // 2638744

Изобретение относится к средствам для уменьшения шума квантования в сигнале, содержащемся в возбуждении во временной области, декодируемом декодером временной области.

Способ и устройство для осуществления записи объектного аудиосигнала и электронная аппаратура // 2630187

Изобретение относится к электронной аппаратуре и предназначено для записи объектного аудиосигнала. Технический результат – возможность осуществления прямой записи объектного аудиосигнала.

Способ и устройство для оптимизации звукового сигнала // 2628473

Изобретение относится к области обработки речевого сигнала. Технический результат – улучшение результата улавливания звукового сигнала терминалом.

Способ декодирования и устройство декодирования // 2628159

Изобретение относится к области кодирования и декодирования. Техническим результатом является способ декодирования и устройство декодирования, которые позволяют предотвращать или уменьшать явление шума во время обработки потерь кадров, за счет этого повышая качество речи.

Система и способ ослабления звука в транспортном средстве для прослушивания указаний от мобильных приложений // 2627127

Изобретение относится к области микширования звука, передаваемого в потоковом режиме мобильным устройством. Технический результат заключается в обеспечении приглушения аудиоданных транспортного средства для звуковых указаний от мобильных приложений.

Эффективное ослабление опережающего эха в цифровом звуковом сигнале // 2622863

Изобретение относится к передаче цифровых звуковых сигналов по телекоммуникационным сетям и предназначено для обработки ослабления опережающего эха при декодировании цифрового звукового сигнала.

Структура декоррелятора для параметрического восстановления звуковых сигналов // 2641463

Изобретение относится к области кодирования и декодирования звуковых сигналов. Технический результат – повышение точности восстановления звуковых сигналов.

Аудиокодер, аудиодекодер, способ обеспечения кодированной аудиоинформации, способ обеспечения декодированной аудиоинформации, компьютерная программа и кодированное представление с использованием сигнально-адаптивного расширения полосы пропускания // 2641461

Изобретение относится к области аудиокодирования и аудиодекодирования для обеспечения кодированной и декодированной аудиоинформации соответственно на основании входной аудиоинформации и на основании кодированной аудиоинформации.

Звуковые кодирующее устройство и декодирующее устройство // 2641265

Изобретение относится к области многоканального звукового кодирования. Техническим результатом является декодирование кодированного битового аудиопотока в системе обработки звуковых сигналов.

Устройство и способ для обработки звукового сигнала с использованием сигнала ошибки вследствие наложения спектров // 2641253

Изобретение относится к средствам для обработки звукового сигнала с использованием сигнала ошибки вследствие наложения спектров. Технический результат заключается в повышении эффективности обработки аудиосигнала.

Адаптивное расширение полосы пропускания и устройство для этого // 2641224

Изобретение относится к области техники обработки речи, в частности к адаптивному расширению полосы пропускания. Технический результат – обеспечение формирования расширенной полосы пропускания частот в декодере.

Устройство кодирования аудио, способ кодирования аудио, программа кодирования аудио, устройство декодирования аудио, способ декодирования аудио и программа декодирования аудио // 2640743

Изобретение относится к средствам для маскирования ошибок при кодировании/декодировании аудио. Технический результат заключается в восстановлении качества звучания без увеличения алгоритмической задержки, когда происходит потеря пакета при кодировании аудио.

Извлечение реверберирующего звука с использованием микрофонных массивов // 2640742

Усовершенствованный квантователь // 2640722

Настоящее изобретение относится к системе звукового кодирования и декодирования. Технический результат заключается в повышении гибкости в отношении допущения разных скоростей передачи данных и разных уровней искажений.

Устройство для кодирования аудио сигнала, имеющего множество каналов // 2640650

Изобретение относится к области обработки и декодирования аудио сигнала, содержащего переходные процессы. Технический результат заключается в повышении скорости передачи данных за счет различной обработки сигнала переходного процесса и сигнала, не содержащего переходный процесс.

Устройство и способ преобразования первого и второго входных каналов, по меньшей мере, в один выходной канал // 2640647

Изобретение относится к области кодирования аудиосигналов и предназначено для преобразования первого и второго входных каналов в один выходной канал, и в частности, предназначено для использования при преобразовании формата между различными конфигурациями каналов громкоговорителей.

Способ и устройство обработки сигналов // 2641466

Изобретение относится к области кодирования и декодирования аудио сигналов. Технический результат – повышение качества кодирования и декодирования аудио сигналов и исключение потери битов. Способ включает в себя: определение общего количества битов, которые должны быть выделены, соответствующих подполосам частот текущего кадра; выделение первичных битов для подполос частот согласно общему количеству битов; определение количества первичных информационных единиц для каждой подполосы частот, которая подвергнута выделению первичных битов, для получения общего количества избыточных битов текущего кадра и количества информационных единиц, соответствующих каждой подполосе частот; выбор подполосы частот для выделения вторичных битов из подполос частот, согласно параметру выделения вторичных битов, содержащему одно из общего количества избыточных битов или характеристики подполосы частот для каждой подполосы частот; выделение вторичных битов для подполос частот для выделения избыточных битов и получения количества вторично выделенных битов для каждой подполосы частот; и определение количества вторичных информационных единиц для каждой подполосы частот для того, чтобы повторно получать количество информационных единиц, соответствующих каждой подполосе частот из подполос частот для выделения вторичных битов. 2 н. и 18 з.п. ф-лы, 14 ил.