Способ и устройство для способствования определению ограничивающих частот сигнала

Авторы патента:

G10L21/02 - усиление речи, например подавление шума, нейтрализация эхо-сигнала (подавление эхо-сигнала в громкоговорящих телефонных системах H04M 9/08, в аппаратах для людей с дефектами слуха H04R 15/00)

Владельцы патента RU 2485608:

МОТОРОЛА МОБИЛИТИ, ИНК. (US)

Изобретение в целом относится к обработке сигналов, а более конкретно к обработке аудио сигналов. Платформа (300) обработки сигналов представляет (101) сигнал для обработки и идентифицирует (102) части сигнала со специфическими характеристиками, которые используются (103), чтобы автоматически определять по меньшей мере одну ограничивающую частоту, которая может быть использована, чтобы содействовать расширению ширины полосы частот для сигнала. Идентификация этих частей сигнала может содержать идентификацию частей сигнала, которые демонстрируют по меньшей мере предопределенный уровень энергии. Этап определения ограничивающей частоты может содержать вычисление амплитудного спектра для каждой из идентифицированных частей сигнала, который может быть использован, чтобы определить соответствующую меру плоскостности спектра внутри полосы пропускания, которая относится к соответствующей нормированной части сигнала, чтобы таким образом предоставить соответствующие проверенные части сигнала. Определение ограничивающей частоты может затем содержать накопление амплитудного спектра для этих проверенных частей сигнала и использование накопленного амплитудного спектра, чтобы оценить соответствующую огибающую сигнала. Эта огибающая сигнала затем может быть использована, чтобы определить по меньшей мере одну ограничивающую частоту. Технический результат - возможности улучшения качества звука. 5 з.п. ф-лы, 3 ил.

ОБЛАСТЬ ТЕХНИКИ

Изобретение в целом относится к обработке сигналов, а более конкретно к обработке аудио сигналов.

УРОВЕНЬ ТЕХНИКИ

Различные устройства служат, по меньшей мере частично, для обработки сигналов, которые ограничиваются, тем или иным образом, заданной шириной полосы частот. Во многих случаях это делается, чтобы гарантировать, что сигнал находится в пределах некоторых ограниченных возможностей обработки, соответствующей обрабатывающей платформе и/или настройке приложения. Например, некоторые обрабатывающие платформы (такие как сотовые телефоны) часто ограничивают аудио сигнал, который будет обрабатываться, некоторой предопределенной шириной полосы частот, как, например, от 300 до 3400 Гц, даже если изначальное речевое содержимое может включать в себя частоты, которые находятся вне этого диапазона.

В знак признания того факта, что такие ограничения могут ограничивать качество звука, некоторые платформы дополнительно обрабатывают такой сигнал, используя искусственное расширение ширины полосы частот. Вообще говоря, искусственное расширение ширины полосы частот типично содержит добавление искусственно сформированного содержимого вне вышеупомянутой предопределенной ширины полосы частот к обработанному сигналу, чтобы по возможности улучшить итоговое качество звука.

К сожалению, успех такого подхода может сам быть достаточно случайным и непредсказуемым. В некоторых случаях соответствующим результатом может быть естественное звучание и относительно приятное для пользователя. В других случаях, однако, результат расширения полосы частот может быть достаточно неестественным и неприятным. В худшем случае введение этого искусственно сформированного содержимого может затруднить распознавание основного содержания изначального звукового содержимого.

КРАТКОЕ ОПИСАНИЕ ЧЕРТЕЖЕЙ

Вышеуказанные потребности, по меньшей мере частично, удовлетворяются с помощью предоставления способа и устройства для способствования определению ограничивающих частот сигнала, описанных в нижеследующем подробном описании, в частности при изучении в сочетании с чертежами, в которых:

фиг.1 содержит блок-схему последовательности операций, сконфигурированную в соответствии с различными вариантами осуществления изобретения;

фиг.2 содержит блок-схему последовательности операций, сконфигурированную в соответствии с различными вариантами осуществления изобретения; и

фиг.3 содержит структурную схему, сконфигурированную в соответствии с различными вариантами осуществления изобретения.

Специалисты в данной области техники поймут, что элементы на фигурах проиллюстрированы для простоты и ясности и не обязательно изображены в масштабе. Например, размеры и/или относительное расположение некоторых элементов на фигурах могут быть преувеличены относительно других элементов, чтобы помочь улучшить понимание различных вариантов осуществления настоящего изобретения. Также, общие, но хорошо понимаемые элементы, которые являются полезными или необходимыми в коммерчески выполнимом варианте осуществления, часто не изображаются, чтобы способствовать менее затрудненному рассмотрению этих различных вариантов осуществления настоящего изобретения. Далее будет понятно, что определенные действия и/или этапы могут быть описаны или изображены в конкретном порядке наступления, в то время как специалисты в данной области техники будут понимать, что такая специфичность по отношению к последовательности в действительности не требуется. Также будет понятно, что термины и выражения, используемые в материалах настоящей заявки, имеют обычное техническое значение, как согласовано с такими терминами и выражениями специалистами в области техники, как изложено выше, за исключением тех, в которых разные специфические значения были изложены иным образом в материалах настоящей заявки.

ПОДРОБНОЕ ОПИСАНИЕ

Вообще говоря, согласно этим различным вариантам осуществления, платформа обработки сигналов представляет сигнал для обработки (как, например, оцифрованный аудио сигнал), а затем идентифицирует части сигнала со специфическими характеристиками, чтобы предоставить соответствующие идентифицированные части сигнала. Последние затем используются, чтобы автоматически определить по меньшей мере одну ограничивающую частоту для сигнала. Эта (или эти) ограничивающая частота(ы) затем может использоваться, чтобы способствовать расширению ширины полосы частот для сигнала. В соответствии с одним из подходов этот этап идентификации частей сигнала со специфическими характеристиками может содержать идентификацию частей сигнала, которые демонстрируют по меньшей мере предопределенный уровень энергии. В таком случае этап определения ограничивающей частоты может содержать, по меньшей мере частично, вычисление амплитудного спектра для каждой из идентифицированных частей сигнала.

В соответствии с одним из подходов, если требуется, вышеупомянутый амплитудный спектр может быть использован, чтобы определить соответствующую меру плоскости внутри полосы пропускания, как относится к соответствующей нормированной части сигнала, чтобы таким образом предоставить соответствующие рассмотренные части сигнала. В таком случае и вновь если требуется, этап определения ограничивающей частоты(т) может содержать накопление амплитудного спектра для этих рассмотренных частей сигнала, чтобы таким образом предоставить накопленный амплитудный спектр, и затем, используя последний, оценить соответствующую огибающую сигнала. Эта огибающая сигнала может затем быть использована, чтобы определить ограничивающую частоту(ы).

В соответствии с одним из подходов, например, эти идеи затем обеспечат выполнение расширения ширины полосы частот для сигнала, используя обнаружение верхней границы полосы для сигнала, по меньшей мере частично, путем автоматического осуществления расширения ширины полосы частот для сигнала, используя самое низкое ожидаемое значение верхней границы полосы, затем используя доступный узкополосный сигнал до обнаруженной верхней границы полосы пропускания, и затем используя сигнал расширенной ширины полосы частот над обнаруженной верхней границей полосы, чтобы представить сигнал.

В качестве другого примера в этом отношении эти идеи обеспечат выполнение расширения ширины полосы частот для сигнала путем обнаружения нижней границы полосы пропускания, которая находится ниже самого высокого ожидаемого значения нижней границы полосы, чтобы предоставить соответствующую обнаруженную нижнюю границу полосы. Характеристика повышения нижней полосы может затем быть настроена на основании этой обнаруженной нижней границы полосы, чтобы предоставить соответствующую настроенную характеристику повышения нижней полосы. Эта настроенная характеристика повышения нижней полосы затем может быть применена к сигналу, чтобы получить итоговый сигнал с повышенной нижней границей полосы пропускания.

Специалисты в данной области техники признают и примут во внимание, что эти идеи предназначены для обнаружения границ полосы для заданного сигнала. Эти идеи затем рассматривают и легко обеспечивают использование этой информации, чтобы выполнить расширение ширины полосы частот. Сами результаты расширения ширины полосы частот могут быть в значительной степени лучше в терминах качества звучания по сравнению с многочисленными подходами известного уровня техники. Это происходит, по меньшей мере частично, благодаря лучшему приспособлению и использованию существующего содержимого в изначальном сигнале. Это, в свою очередь, во многих случаях сокращает количество придуманного содержимого, которое необходимо включить в итоговый сигнал расширенной полосы частот.

Дополнительно будет принято во внимание, что этим идеям легко и экономически выгодно помогает использование доступных обрабатывающих платформ. Соответствующие вычислительные запросы относительно скромны, таким образом, делая эти идеи подходящими для обрабатывающих платформ (таких как, но не в качестве ограничения, сотовые телефоны или тому подобное), имеющих ограниченные локальные ресурсы обработки (такие как доступные запасы энергии, вычислительные способности и тому подобное). Дополнительно будет принято во внимание, что эти идеи весьма расширяемы и могут быть с пользой использованы с разнообразными сигналами, требованиями к ширине полосы частот и/или возможностями и тому подобным.

Эти и другие преимущества могут стать более ясными с помощью основательного обзора и изучения следующего подробного описания. Теперь со ссылкой на чертежи и, в частности, на фиг.1 будет представлен иллюстративный процесс, который совместим со многими из этих идей. Этот процесс 100 может быть выполнен выбранной платформой обработки сигналов. Примеры в этом смысле включают, но безусловно не в качестве ограничения, сотовые телефоны, беспроводные устройства двусторонней поочередной связи (такие, как так называемые портативные рации), телефоны наземной линии связи, так называемые Интернет телефоны, и тому подобное.

Этот процесс 100 включает в себя этап 101 представления сигнала для обработки. Для многих интересующих настроек приложения этот сигнал будет содержать звуковое содержимое. Во многих случаях этот этап представления этого сигнала будет содержать представление множества последовательных отсчетов (таких как цифровые отсчеты) звукового содержимого. Этот этап может содержать, например, представление кадра такой информации, которая содержит 1024 последовательных отсчетов, которые были получены, используя частоту выборки 8 КГц. Этот этап может также содержать, например, представление окна содержимого, которое содержит множество таких кадров. Окно, имеющее длительность примерно от 1 до 3 секунд, например, может быть очень полезным для широкого разнообразия общих настроек приложения, содержащих аудио сигналы, которые включают человеческую речь.

Этот процесс 100 затем представляет этап 102 идентификации частей сигнала у сигнала со специфическими характеристиками, чтобы таким образом предоставить соответствующие идентифицированные части сигнала. В соответствии с одним из подходов, например, эта часть сигнала может содержать предопределенную временную или информационную величину, как, например, вышеупомянутые кадры. В таком случае этот этап может содержать идентификацию специфических кадров, которые демонстрируют интересующие специфические характеристики.

В соответствии с одним из подходов эта специфическая характеристика может содержать предопределенный уровень энергии. В таком случае этот этап идентификации частей сигнала у сигнала, имеющего интересующую специфическую характеристику, может содержать идентификацию частей сигнала, которые демонстрируют, например, по меньшей мере этот предопределенный уровень энергии.

Этот процесс 100 затем представляет этап 103 использования этих идентифицированных частей сигнала, чтобы автоматически определить по меньшей мере одну ограничивающую частоту для сигнала. Это может содержать, например, определение нижней ограничивающей частоты, верхней ограничивающей частоты или обеих верхней и нижней ограничивающих частот для сигнала, если требуется. В соответствии с одним из подходов этот этап может содержать автоматическое определение по меньшей мере одной ограничивающей частоты для сигнала, как относится к каждой из по меньшей мере нескольких последовательных серий групп последовательных отсчетов для звукового содержимого, которое может содержать сигнал. Например, и как упоминалось выше, во многих настройках приложения может быть полезно сделать это определение для групп последовательных отсчетов звукового содержимого с каждой группой, представляющей от примерно одной секунды до примерно трех секунд звукового содержимого.

В этом отношении специалисты в данной области техники могут отметить и принять во внимание, что вышеупомянутые группы и вышеупомянутые части сигнала могут быть, а могут и не быть, сильно коррелированы друг с другом в зависимости от потребностей и/или возможностей, склонных характеризовать заданную настройку приложения. В соответствии с одним из подходов, например, вышеупомянутые идентифицированные части сигнала могут попадать в вышеупомянутую группу. Будет понятно, что группы, которые выбираются для определения ограничивающей частоты, тем не менее, не обязательно должны быть выбраны из последовательных серий групп. Возможно, например, что выбранные группы будут пересекаться друг с другом со временем.

Этот процесс 100 будет легко обеспечивать выполнение этих этапов, если требуется, любым из множества способов. В соответствии с одним из подходов, например, эти этапы могут включать вычисление амплитудного спектра для каждой из идентифицированных частей сигнала. Этот амплитудный спектр может затем быть использован, чтобы определить соответствующую меру плоскости внутри полосы пропускания, как относится к соответствующей нормированной части сигнала, чтобы таким образом предоставить рассмотренные части сигнала. Такой подход будет обеспечивать, например, дополнительные этапы накопления амплитудного спектра для рассмотренных частей сигнала, чтобы предоставить соответствующий накопленный амплитудный спектр, использования этого накопленного амплитудного спектра, чтобы оценить огибающую сигнала, соответствующую рассмотренным частям сигнала, и затем использования этой огибающей сигнала, чтобы определить вышеупомянутую ограничивающую частоту(ы).

В качестве другого примера в этом отношении, если требуется, этот процесс 100 будет легко обеспечивать использование преобразованных версий амплитудного спектра для воздействия на вышеупомянутое накопление. Такие преобразования могут быть основаны на самом амплитудном спектре, но в таком случае будет накапливаться не сам амплитудный спектр. Полезные преобразования в этом отношении включают, но не в качестве ограничения, возведение амплитудного спектра в степень, отличную от единицы (такую как, но не в качестве ограничения, степень больше единицы), выполнение операции логарифмирования над амплитудным спектром, за которой следует этап умножения (например, чтобы перевести результаты в децибелы) и тому подобное.

Для иллюстрации, дополнительные подробности, относящиеся к конкретному примеру, теперь будут предоставляться в этом отношении. Специалисты в данной области техники отметят и поймут, что особенности этого примера служат только иллюстративной цели и не предлагаются с каким-либо предположением или замыслом, что эти особенности содержат исчерпывающий список всех таких возможностей в этом отношении.

В ненетипичной системе искусственного расширения ширины полосы частот (BWE) речи входная узкополосная речь (содержащаяся в пределах, например, 300-3400 Гц) преобразуется в соответствующую выходную широкополосную речь (такую как 100-8000 Гц) путем синтезирования недостающей информации на основании параметров, полученных из самой узкополосной речи. Эта входная узкополосная (NB) речь сначала анализируется, используя анализ коэффициентов линейного предсказания (LP), чтобы получить спектральную огибающую. Из NB коэффициентов оцениваются коэффициенты широкополосного LP (используя, например, отображение словаря кодов, известное в данной области техники). Коэффициенты узкополосного LP также используются, чтобы обратно фильтровать входную речь, чтобы получить NB сигнал возбуждения в области с (1:2) увеличенной частотой отсчетов.

Из этого сигнала синтезируется широкополосный (WB) сигнал возбуждения (используя, например, нелинейную операцию, такую как выпрямление). Фильтр LP (использующий оцененные WB коэффициенты) затем используется, чтобы отфильтровывать WB возбуждение и синтезировать широкополосную речь. Итоговая синтезированная широкополосная речь подвергается фильтрации в фильтре верхних частот и добавляется (версии с 1:2 увеличенной частотой отсчетов) к входной NB речи, чтобы получить оцененную широкополосную выходную речь.

Типичный сценарий приложения для такой системы BWE - сотовые телефоны, в которых такая система может использоваться, чтобы расширить ширину полосы частот принятого звука, чтобы улучшить впечатление пользователя. При проектировании системы BWE для такого приложения, в целом предполагается, что входной NB сигнал имеет характерную ширину полосы частот, такую как 300-3400 Гц. Во многих настройках приложения, однако, ширина полосы частот канала не фиксируется, но может и будет изменяться от звонка к звонку (или даже в течение одного звонка).

Настоящие идеи позволяют обнаружить границы полосы принятого сигнала, так что изначальная информация сохраняется в значительной степени (например, от около 200 до 3600 Гц), а искусственно сформированная информация добавляется только, где требуется или, где по меньшей мере вероятно будет полезна (например, примерно от 100 до 200 Гц и примерно от 3600 до 8000 Гц).

Теперь со ссылкой на фиг.2 показан один из иллюстративных примеров алгоритма обнаружения границы полосы в соответствии с этими идеями. На первом этапе 201 входная NB речь составляется в блоки последовательных отсчетов, указываемых ссылкой в материалах настоящей заявки как кадры. Например, k-й кадр может быть выражен как

где - отсчет речи с индексом отсчета , ограниченным [-1,1), где индекс отсчета, соответствующий первому отсчету кадра , - , а - длина кадра.

Последовательные кадры могут пересекаться друг с другом, и количество новых отсчетов в относительно указано ссылкой как приращение. Для целей этого иллюстративного примера выбрано как 1024 (128 мс при частоте выборки 8 кГц), а приращение выбрано как 120 (15 мс при частоте выборки 8 кГц). Каждый кадр речи затем умножается поточечно на соответствующее окно , чтобы получить обработанный окном кадр речи. Подходящими окнами являются окна Хэмминга, Хана и так далее. В данном примере в качестве окна используется косинус на пьедестале, определяемый как

Обработанный окном кадр речи может быть выражен как

После составления обработанного окном кадра речи, как указано выше, на втором этапе 202 его энергия вычисляется как

и когда энергия превышает определенный порог, кадр обрабатывается далее. В противном случае поток возвращается на первый этап 201, чтобы составить следующий кадр. В этом иллюстративном примере используемый энергетический порог -50 дБ при номинальном уровне сигнала -26 дБ. Этот этап 202 гарантирует, что только кадры с достаточной энергией используются при определении границ полосы частот.

Когда кадр имеет достаточно энергии, этот процесс обеспечивает третий этап 203, чтобы нормировать кадр делением каждого из его отсчетов на квадратный корень из его энергии. Нормирование гарантирует, что каждому кадру, используемому при обнаружении границ полосы частот, придан одинаковый вес. Специалисты в данной области техники заметят, что возможны альтернативные схемы взвешивания. Упрощая запись, нормированный кадр может быть выражен как

Амплитудный спектр М(l) нормированного кадра затем получают с помощью быстрого преобразования Фурье как

где l - индекс частоты, a . Для N=1024 каждый индекс частоты является кратным числом величины шага 8000/1024=7.8125 Гц.

На четвертом этапе 204 амплитудный спектр проверяется на его плоскостность. Это может быть сделано, например, оценкой меры плоскостности спектра (sfm) внутри полосы пропускания (например, 300 - 3400 Гц). Мера плоскостности спектра определяется в этом примере, как отношение среднего геометрического к среднему арифметическому спектральных значений. Диапазон sfm изменяется от 0 для имеющего пики, то есть не плоского спектра, до 1 для идеально плоского спектра.

В этом иллюстративном примере вычисляется, используя 12 полос частот равной ширины внутри полосы пропускания (300-3400 Гц), как изложено ниже.

Когда больше порога, амплитудный спектр кадра используется для дальнейшей обработки. В противном случае поток возвращается обратно на первый этап 201. В этом иллюстративном примере порог выбирается равным 0,5. Этот этап гарантирует, что кадры, используемые для обнаружения границы полосы, имеют достаточно плоский спектр в полосе пропускания. Специалисты в данной области техники снова поймут, что имеются альтернативные способы выполнения этого. Например, можно вычислять предсказанное усиление кадра, используя LP моделирование, и выбирать кадр для использования при обнаружении границы полосы, только если предсказанное усиление ниже порога.

Когда кадр имеет достаточно плоский спектр, на пятом этапе 205 накапливается амплитудный спектр кадра, и счетчик кадров, используемых в накоплении, увеличивается. Также можно накапливать энергетический спектр, если требуется (например, возведением амплитудного спектра во вторую степень или возведением амплитудного спектра в некоторую другую степень).

На шестом этапе 206 отсчет кадра для накопленного амплитудного спектра проверяется, чтобы увидеть, равен ли он по меньшей мере заданному порогу (такому как, в этом иллюстративном примере, 100). В противном случае поток возвращается обратно на первый этап.

Когда накапливается достаточное количество амплитудных спектров, накопленный спектр обрабатывается далее на седьмом этапе 207. Сначала линейные частотные коэффициенты косинусного преобразования Фурье (LFCC) вычисляются осуществлением IFFT (быстрого обратного преобразования Фурье) логарифма спектра

где представляет накопленный амплитудный спектр, представляет LFCC, а .

Огибающая логарифма спектра получается установкой всех значений LFCC, кроме набора, представленного , на ноль и осуществлением быстрого преобразования Фурье (БПФ, FFT) следующим образом:

где отрицательные значения могут быть преобразованы в положительные значения добавлением . В данном иллюстративном примере выбран равным 14.

Из огибающей логарифма спектра можно оценить нижнюю и верхнюю границы полосы. Например, среднее значение логарифма спектра внутри полосы пропускания может быть оценено как

где и представляют нижний и верхний индексы внутри полосы пропускания. В этом иллюстративном примере =51, а =422.

Нижняя граница полосы частот может быть оценена как индекс , при котором огибающая логарифма спектра на дБ ниже, чем . Это легко обнаружить поиском внутри подходящего диапазона, такого как 115-265 Гц, и выбором индекса, при котором значение огибающей логарифма спектра наиболее близко к . В качестве альтернативы можно обнаружить два индекса, содержащих требуемое значение огибающей, и использовать линейную интерполяцию, чтобы получить значение дробного индекса для нижней границы полосы.

Верхняя граница полосы частот находится схожим образом путем поиска внутри подходящего диапазона, такого как 3450-3750 Гц, чтобы найти индекс, при котором равно дБ. Подходящее значение для порогов и составляет около 10 дБ. Отметим, что выборы диапазонов поиска, а также порогов и для обнаружения как нижней, так и верхней границ полосы частот зависит от входной NB речи; а именно чиста ли речь или закодирована, какой тип кодировщика используется, отношение сигнал-шум и другие факторы, которые могут однозначно применяться в данной настройке приложения. Они могут быть выбраны эмпирически для наилучшей эффективности в требуемом приложении. Также может быть полезно обрабатывать входную NB речь, используя пару узкополосных режекторных фильтров с областями режекции примерно около 0 Гц и 4000 Гц соответственно, чтобы гарантировать, что огибающая логарифма спектра затухает на обеих границах.

Обнаруженные границы полосы, например, и затем преобразуются в соответствующие значения частоты и Гц, соответственно, используя обнаруженные границы полосы сигналов с заранее установленной шириной полосы частот для калибровки.

Как только границы полосы обнаружены, включение их в BWE, чтобы улучшить ее эффективность, довольно прямолинейно. Например, предположим в качестве примера, что система BWE была разработана для ширины полосы частот 300-3400 Гц, но фактическая ширина полосы частот сигнала, обнаруженная алгоритмом обнаружения границ полосы, составляет 200-3600 Гц. Чтобы включить дополнительную ширину полосы частот сигнала в верхней границе, можно просто передвинуть граничную частоту HPF (верхней границы частоты) с 3400 Гц до 3600 Гц. В качестве альтернативы можно также постепенно комбинировать изначальный сигнал и искусственно сформированный сигнал внутри полосы 3400-3600 Гц. Подобным образом, на нижней границе характеристика повышения нижней полосы может быть сдвинута ниже на 100 Гц (с 300 Гц до 200 Гц).

Специалисты в данной области техники примут во внимание, что вышеописанные процессы легко осуществить, используя любую из широкого множества доступных и/или легко конфигурируемых платформ, включая частично или полностью программируемые платформы, известные в данной области техники, или платформы специального назначения, которые могут требоваться для некоторых приложений. Теперь со ссылкой на фиг.3 будет предоставлен иллюстративный подход к такой платформе.

В данном примере устройство 300 содержит процессор 301, который оперативно соединен с памятью 302, которая хранит в себе вышеупомянутый сигнал для обработки. Специалисты в данной области техники заметят и примут во внимание, что такой процессор может содержать жестко смонтированную платформу фиксированного назначения или может содержать частично или полностью программируемую платформу. Все из этих архитектурных вариантов хорошо известны и понимаемы в данной области техники и не требуют дополнительного описания в материалах настоящей заявки.

Этот процессор 301 может быть сконфигурирован (посредством, например, соответствующего программирования, как будет хорошо понято специалистами в данной области техники), чтобы выполнять один или более из этапов, действий и/или функций, изложенных в материалах настоящей заявки. В соответствии с одним из подходов, например, это может содержать конфигурирование процессора 301 для выполнения расширения ширины полосы частот для сигнала, используя обнаружение верхней полосы пропускания (как показано в материалах настоящей заявки, путем обнаружения соответствующей ограничивающей частоты для сигнала, как относится к каждой из по меньшей мере некоторых последовательных серий групп последовательных отсчетов сигнала), путем по меньшей мере частичного автоматического выполнения расширения ширины полосы частот для сигнала, используя наименьшее ожидаемое значение верхней границы полосы, используя доступный узкополосный сигнал до обнаруженной верхней границы полосы и используя сигнал расширенной полосы частот над обнаруженной верхней границей полосы, чтобы представить сигнал.

Почти то же самое может быть, конечно, сделано, чтобы обеспечивать содержимое нижней полосы. Например, в соответствии с одним из подходов процессор 301 может быть запрограммирован, чтобы обнаруживать нижнюю границу полосы ниже самого высокого ожидаемого значения нижней границы полосы, чтобы предоставить соответствующую обнаруженную нижнюю границу полосы, настроить характеристику повышения нижней полосы на основании обнаруженной нижней границы полосы, чтобы предоставить настроенную характеристику повышения нижней полосы, и применить настроенную характеристику повышения нижней полосы к сигналу, чтобы получить повышенный сигнал нижней полосы.

Специалисты в данной области техники заметят и поймут, что такое устройство 300 может состоять из множества физически отдельных элементов, как предложено иллюстрацией, показанной на фиг.3. Также возможно, однако, рассмотреть эту иллюстрацию как содержащую логический обзор, в таком случае один или более из этих элементов могут быть осуществлены и реализованы с помощью платформы совместного использования. Также будет понято, что такие платформы совместного использования могут содержать полностью или, по меньшей мере частично, программируемую платформу, известную в данной области техники.

Сконфигурированные таким образом, эти идеи легко применяются в сочетании со способами расширения ширины полосы частот, чтобы в лучшей степени способствовать таким процессам. Эти идеи также весьма расширяемы и могут быть использованы со множеством таких подходов и в сочетании с широким множеством сигналов для обработки.

Специалисты в данной области техники заметят, что широкое множество модификаций, изменений и комбинаций может быть сделано по отношению к вышеописанным вариантам осуществления без отклонения от сущности и объема изобретения, и что такие модификации, изменения и комбинации должны рассматриваться, как находящиеся в пределах идеи изобретения.

1. Способ, содержащий этапы, на которых:
на платформе обработки сигналов:
представляют сигнал, подлежащий обработке;
идентифицируют части сигнала, которые демонстрируют, по меньшей мере, предопределенный уровень энергии, чтобы предоставить идентифицированные части сигнала;
используют идентифицированные части сигнала, чтобы автоматически определить, по меньшей мере, одну ограничивающую частоту для сигнала путем вычисления амплитудного спектра для каждой из идентифицированных частей сигнала, и используют амплитудный спектр, чтобы определить соответствующую меру плоскостности спектра внутри полосы пропускания, которая относится к соответствующей нормированной части сигнала, чтобы таким образом предоставить проверенные части сигнала, причем мера плоскостности спектра есть отношение среднего геометрического к среднему арифметическому спектральных значений внутри полосы пропускания.

2. Способ по п.1, в котором представление сигнала, подлежащего обработке, содержит представление аудио контента.

3. Способ по п.2, в котором представление сигнала дополнительно содержит представление множества последовательных выборок аудио контента.

4. Способ по п.3, в котором автоматическое определение, по меньшей мере, одной ограничивающей частоты для сигнала содержит автоматическое определение, по меньшей мере, одной ограничивающей частоты для сигнала, которая относится к каждой из, по меньшей мере, некоторых последовательных серий групп последовательных выборок аудио контента.

5. Способ по п.4, в котором каждая группа последовательных выборок аудио контента представляет от примерно 1 секунды до примерно 3 секунд аудио контента.

6. Способ по п.1, дополнительно содержащий после автоматического определения, по меньшей мере, одной ограничивающей частоты для сигнала этапы, на которых:
накапливают амплитудный спектр для проверенных частей сигнала, чтобы предоставить накопленный амплитудный спектр;
используют накопленный амплитудный спектр, чтобы оценить огибающую сигнала, соответствующую проверенным рассмотренным частям сигнала;
используют огибающую сигнала, чтобы определить, по меньшей мере, одну ограничивающую частоту.

Изобретение относится к устройствам и способам расчета коэффициентов пропускания адаптивного фильтра, предназначенного для подавления эха микрофонного сигнала, возбуждаемого сигналом громкоговорителя.

Кодер // 2483368

Изобретение относится к устройствам кодирования. .

Способ и устройство для обеспечения звукового, визуального или тактильного уведомления обратной связи в форме местного эффекта пользователю устройства связи с множеством микрофонов // 2482617

Изобретение относится к области предоставления обратной связи, а именно обратной связи в форме местного эффекта пользователю устройства связи с множеством микрофонов.

Устройство обработки звукового сигнала и способ обработки звукового сигнала // 2479117

Изобретение относится к устройству обработки звукового сигнала (аудиосигнала) и способу обработки звукового сигнала. .

Устройство и способ кодирования и воспроизведения звука // 2477532

Изобретение относится к устройству и способу кодирования и воспроизведения звука, в частности, не ограничиваясь указанным, к устройству для кодированных речевых сигналов и аудио-сигналов.

Способ и устройство для оценивания энергии полосы высоких частот в системе расширения полосы частот // 2471253

Изобретение относится к воспроизведению слышимого контента, в частности к методикам расширения полосы частот. .

Система и способ улучшения декодированного тонального звукового сигнала // 2470385

Изобретение относится к системе и способу улучшения декодированного тонального звукового сигнала, в частности музыкального сигнала, закодированного с использованием речевого кодека, посредством подавления уровня шума квантования в областях спектра, в которых наблюдается малая энергия.

Повышение разборчивости речи с помощью четкости голоса // 2469423

Изобретение относится к обработке аудиосигнала, в частности к процессору или способу обработки для повышения разборчивости речи и очистки зашумленного речевого аудиосигнала.

Способ и устройство для управления сглаживанием стационарного фонового шума // 2469419

Изобретение относится к кодированию речевого сигнала в телекоммуникационных системах, в частности, к способам и устройствам для управления сглаживанием стационарного фонового шума в таких системах.

Способ и устройство для поддержки воспринимаемости речи в многоканальном звуковом сопровождении с минимальным влиянием на систему объемного звучания // 2467406

Изобретение относится к обработке звуковых сигналов, в частности, к улучшению четкости диалога и устной речи, например, в объемном развлекательном звуковом сопровождении.

Устройство и способ для вычисления числа огибающих спектра // 2487428

Изобретение относится к области вычисления числа огибающих спектра, а именно к кодированию звуковых сигналов

Эффективное комбинированное гармоническое преобразование // 2490728

Изобретение относится к системам кодирования звукового сигнала, которые используют способ гармонического преобразования для высокочастотной реконструкции (HFR)

Синтезатор аудиосигнала и кодирующее устройство аудиосигнала // 2491658

Изобретение относится к области синтезаторов звукового (аудио) сигнала, кодирующих устройств звукового сигнала и потоков данных, содержащих закодированный звуковой сигнал

Устройство и способ генерирования выходных данных расширения полосы пропускания // 2494477

Изобретение относится к устройству и способу генерирования выходных данных расширения полосы пропускания (BWE), к звуковому кодирующему устройству и звуковому декодеру. Техническим результатом является обеспечение эффективного кодирования без заметных артефактов, особенно для речевых сигналов. Устройство (100) для генерирования выходных данных расширения полосы пропускания (102) для звукового сигнала (105) включает измеритель минимального уровня шума (ПО), энергетическую характеристику сигнала (120) и процессор (130). Звуковой сигнал (105) включает компоненты в первом частотном диапазоне (105а) и компоненты во втором частотном диапазоне (105b); выходные данные расширения полосы пропускания (102) приспособлены, чтобы управлять синтезом компонентов во втором частотном диапазоне (105b). Измеритель минимального уровня шума (ПО) измеряет данные минимального уровня шума (115) второго частотного диапазона (105b) для временной части (T) звукового сигнала (105). Энергетическая характеристика сигнала (120) получает данные распределения энергии (125); данные распределения энергии (125) характеризуют распределение энергии в спектре временной части (Т) звукового сигнала (105). Процессор (130) объединяет данные минимального уровня шума (115) и данные распределения энергии (125), чтобы получить выходные данные расширения полосы пропускания (102). 8 н. и 8 з.п. ф-лы, 9 ил.

Передискретизация в комбинированном банке фильтров транспозитора // 2494478

Изобретение относится к кодированию звуковых сигналов, а именно к способам восстановления высоких частот, включая гармонический транспозитор частотной области. Техническим результатом является повышение качества звучания посредством восстановления высоких частот звукового сигнала усовершенствованной гармонической транспозицией при низкой дополнительной вычислительной сложности. Система содержит банк фильтров анализа (501), содержащий модуль преобразования анализа (601), имеющий коэффициент разрешения по частоте Δf; и окно анализа (611), имеющее длительность DA; причем банк фильтров анализа (501) сконфигурирован с возможностью создания набора сигналов субполос анализа из низкочастотной компоненты сигнала; модуль нелинейной обработки (502, 650), сконфигурирован с возможностью определять набор сигналов субполос синтеза по части набора сигналов субполос анализа, причем часть набора сигналов субполос анализа сдвинута по фазе на порядок транспозиции Т; и банк фильтров синтеза (504), содержащий модуль преобразования синтеза (602), имеющий разрешение по частоте QΔf, и окно синтеза (612), имеющее длительность DS; причем банк фильтров синтеза (504) сконфигурирован с возможностью создавать высокочастотную компоненту сигнала по набору сигналов субполос синтеза; где Q - коэффициент разрешения по частоте, такой, что Q≥1 и меньше порядка транспозиции Т; и при этом значение произведения разрешения по частоте Δf и длительности DA для банка фильтров анализа выбирается, исходя из коэффициента разрешения по частоте Q. 6 н. и 19 з.п. ф-лы, 12 ил.

Гармоническое преобразование, усовершенствованное перекрестным произведением // 2495505

Изобретение относится к системам звукового кодирования, которые используют способ гармонического преобразования для высокочастотной реконструкции (HFR). Описана система и способ генерирования высокочастотной составляющей сигнала из низкочастотной составляющей сигнала. Система включает блок анализирующих фильтров, создающий набор сигналов анализируемых поддиапазонов низкочастотной составляющей сигнала. Она также включает блок нелинейной обработки, предназначенный для генерирования сигнала синтезируемого поддиапазона с синтезируемой частотой путем модификации фазы первого и второго сигналов анализируемых поддиапазонов из набора сигналов анализируемых поддиапазонов и комбинирования сигналов анализируемых поддиапазонов с модифицированной фазой. В конечном счете, она включает блок синтезирующих фильтров, предназначенный для генерирования высокочастотной составляющей сигнала из сигнала синтезируемого поддиапазона. Технический результат - улучшение эффективности кодирования традиционных кодеков воспринимаемых цифровых аудиосигналов. 4 н. и 25 з.п. ф-лы, 30 ил.

Устройство и способ расчета параметров управления фильтра эхоподавления и устройство и способ расчета величины задержки // 2495506

Изобретение относится к устройствам и способам расчета параметров управления заграждающим фильтром. Техническим результатом является улучшение качества звучания акустических систем за счет подавления отраженных сигналов пропорционально уровню шумов. Устройство (200) для расчета параметров управления фильтром подавления шума (210), предназначенное для фильтрования второго аудиосигнала с целью устранения эхосигнала на основании первого аудиосигнала, включает в себя вычислитель (220), имеющий в своей конструкции определитель значения (230) для вычисления, по меньшей мере, одного энергопоказателя для полосового сигнала, по меньшей мере, двух последовательных во времени блоков данных, по меньшей мере, одного сигнала из группы сигналов. Вычислитель (220) также включает в себя определитель среднего значения (250) для определения, по меньшей мере, одного среднего значения, по меньшей мере, одного рассчитанного энергопоказателя для полосового сигнала. Вычислитель (220) также включает в себя модификатор (260) для корректировки, по меньшей мере, одного энергопоказателя для полосового сигнала на базе рассчитанного среднего значения для полосового сигнала. Вычислитель (220) также включает в себя устройство расчета параметров управления (270) для фильтра подавления (210) на базе, по меньшей мере, одного скорректированного энергопоказателя. 8 н. и 24 з.п. ф-лы, 14 ил., 2 прилож.

Устройство кодирования речи, устройство декодирования речи, способ кодирования речи, способ декодирования речи, программа кодирования речи и программа декодирования речи // 2498420

Изобретение относится к устройству кодирования речи, к устройству декодирования речи, к способам кодирования и декодирования речи и к программе кодирования и декодирования речи. Сущность изобретения состоит в том, что коэффициент линейного предсказания сигнала, представленного в частотной области, получают путем выполнения анализа по частоте с линейным предсказанием с использованием метода ковариации или метода автокорреляции. После того как скорректирована сила фильтра полученного коэффициента линейного предсказания, выполняют фильтрацию сигнала по частоте с использованием скорректированного коэффициента, посредством чего формируют временную огибающую сигнала. Технический результат - уменьшение возникающего опережающего эха и запаздывающего эха, что улучшает субъективное качество декодированного сигнала без значительного увеличения скорости передачи битов в способе расширения полосы частот в частотной области, представленном способом репликации спектральных полос (SBR). 6 н. и 1 з.п. ф-лы, 50 ил.

Изобретение относится к устройствам кодирования речи и декодирования речи, к способам кодирования речи и декодирования речи, к программам кодирования речи и декодирования речи. Сущность изобретения состоит в том, что коэффициент линейного предсказания сигнала, представленного в частотной области, получают путем выполнения анализа по частоте с линейным предсказанием с использованием метода ковариации или метода автокорреляции. После того как скорректирована сила фильтра полученного коэффициента линейного предсказания, выполняют фильтрацию сигнала по частоте с использованием скорректированного коэффициента, посредством чего формируют временную огибающую сигнала. Технический результат - уменьшение возникающего опережающего эха и запаздывающего эха и улучшение субъективного качества декодированного сигнала без значительного увеличения скорости передачи битов в способе расширения полосы частот в частотной области, представленном способом репликации спектральных полос (SBR). 13 н. и 26 з.п. ф-лы, 50 ил.

Изобретение относится к устройствам кодирования и декодирования речи, к способам кодирования и декодирования речи, к программам кодирования и декодирования речи. Сущность изобретения состоит в том, что коэффициент линейного предсказания сигнала, представленного в частотной области, получают путем выполнения анализа по частоте с линейным предсказанием с использованием метода ковариации или метода автокорреляции. После того как скорректирована сила фильтра полученного коэффициента линейного предсказания, выполняют фильтрацию сигнала по частоте с использованием скорректированного коэффициента, посредством чего формируют временную огибающую сигнала. Технический результат - уменьшение возникающего опережающего эха и запаздывающего эха, что улучшает субъективное качество декодированного сигнала без значительного увеличения скорости передачи битов в способе расширения полосы частот в частотной области, представленном способом репликации спектральных полос (SBR). 6 н. и 4 з.п ф-лы, 50 ил.