Системы и способы затенения первого пакета, соответствующего первой битовой скорости, во втором пакете, соответствующем второй битовой скорости

Изобретение относится к технологии обработки речи, в частности к затенению первого пакета. Описан способ затенения первого пакета, соответствующего первой битовой скорости, во втором пакете, соответствующем второй битовой скорости. Принимается первый пакет. Первый пакет анализируется для определения первой битовой скорости, соответствующей первому пакету. Биты, соответствующие, по меньшей мере, одному параметру, отбрасываются из первого пакета. Оставшиеся биты, соответствующие одному или нескольким параметрам, и специальный идентификатор упаковываются во второй пакет, соответствующий второй битовой скорости. Передается второй пакет. Технический результат - обеспечение повышения качества восстановленных речевых сигналов по сравнению со стиранием полноскоростных пакетов и снижения сетевого трафика. 8 н. и 14 з.п. ф-лы, 14 ил.

 

Область техники, к которой относится изобретение

Настоящие системы и способы, в целом, относятся к технологии обработки речи. Более определенно, настоящие системы и способы относятся к затенению первого пакета, соответствующего первой битовой скорости, во втором пакете, соответствующем второй битовой скорости.

Предшествующий уровень техники

Передача речи посредством цифровых технологий стала широко распространенной, в частности, в областях удаленной телефонной связи и цифровой радиотелефонии. Это, в свою очередь, породило интерес в определении наименьшего количества информации, которое может быть послано по каналу с поддержкой удовлетворительного качества восстановленной речи. Аппаратам для компрессии речи находят применение во многих областях телекоммуникации. Примером телекоммуникации является радиосвязь. Область радиосвязи включает в себя множество применений, таких как, например, радиотелефоны, пейджеры, средства местной радиосвязи, средства радиотелефонной связи, такие как сотовые и переносные системы связи (PCS), системы телефонной связи, мобильные системы телефонной связи, использующие Интернет-протокол (IP), и системы спутниковой связи. В частности, важной областью применения является радиотелефонная связь для подвижных абонентов.

Краткое описание чертежей

Фиг.1 изображает одну конфигурацию беспроводной системы связи.

Фиг.2 изображает блок-схему, иллюстрирующую одну конфигурацию среды передачи сигналов.

Фиг.3 изображает блок-схему, иллюстрирующую одну конфигурацию многорежимного кодера, взаимодействующего с многорежимным декодером.

Фиг.4 изображает блок-схему, иллюстрирующую одну конфигурацию функции межсетевого обмена (IWF).

Фиг.5 изображает схему последовательности операций, иллюстрирующую одну конфигурацию способа кодирования речи с переменной скоростью.

Фиг.6 изображает схему последовательности операций, иллюстрирующую одну конфигурацию способа затенения пакета.

Фиг.6A изображает схему последовательности операций, иллюстрирующую одну конфигурацию декодирования пакета.

Фиг.7A изображает диаграмму, иллюстрирующую кадр вокализированной речи, разделенный на подкадры.

Фиг.7B изображает диаграмму, иллюстрирующую кадр невокализированной речи, разделенный на подкадры.

Фиг.7C изображает диаграмму, иллюстрирующую кадр переходной речи, разделенный на подкадры.

Фиг.8 изображает график, иллюстрирующий принципы технологий кодирования с использованием прототипного периода основного тона (PPP).

Фиг.9 изображает таблицу, иллюстрирующую количество битов, выделенных пакетам различных типов.

Фиг.10 изображает блок-схему, иллюстрирующую одну конфигурацию конвертации полноскоростного пакета РРР в специальный полускоростной пакет PPP.

Фиг.11 изображает блок-схему конкретных компонентов в одной конфигурации аппарата связи.

Подробное описание

Описывается способ затенения первого пакета, соответствующего первой битовой скорости, во втором пакете, соответствующем второй битовой скорости. Принимается первый пакет. Первый пакет анализируется для определения первой битовой скорости, соответствующей первому пакету. Биты, соответствующие, по меньшей мере, одному параметру, отбрасываются из первого пакета. Оставшиеся биты, соответствующие одному или нескольким параметрам, и специальный идентификатор упаковываются во второй пакет, соответствующий второй битовой скорости. Передается второй пакет.

Также описывается устройство для затенения первого пакета, соответствующего первой битовой скорости, во втором пакете, соответствующем второй битовой скорости. Устройство включает в себя процессор и память, находящуюся в электронной связи с процессором. Команды сохраняются в памяти. Команды являются выполнимыми для приема первого пакета, анализа первого пакета для определения первой битовой скорости, соответствующей первому пакету, отбрасывания битов, соответствующих, по меньшей мере, одному параметру из первого пакета, упаковки оставшихся битов, соответствующих одному или нескольким параметрам и специального идентификатора, во второй пакет, соответствующий второй битовой скорости, и передачи второго пакета.

Также описывается система, сконфигурированная с возможностью затенения первого пакета, соответствующего первой битовой скорости, во втором пакете, соответствующем второй битовой скорости. Система включает в себя средство для обработки и средство для приема первого пакета. Описывается средство для анализа первого пакета для определения первой битовой скорости, соответствующей первому пакету, и средство для отбрасывания битов, соответствующих, по меньшей мере, одному параметру, из первого пакета. Описывается средство для упаковки оставшихся битов, соответствующих одному или нескольким параметрам, и специального идентификатора, во второй пакет, соответствующий второй битовой скорости, а также средство для передачи второго пакета.

Также описывается машиночитаемый носитель. Носитель сконфигурирован с возможностью сохранения набора команд, выполнимых для приема первого пакета, анализа первого пакета для определения первой битовой скорости, соответствующей первому пакету, отбрасывания битов, соответствующих, по меньшей мере, одному параметру, из первого пакета, упаковки оставшихся битов, соответствующих одному или нескольким параметрам, и специального идентификатора, во второй пакет, соответствующий второй битовой скорости, и передачи второго пакета.

Также описывается способ декодирования пакета. Принимается пакет. Считывается специальный идентификатор, включенный в пакет. Определяется, был ли пакет затенен из первого пакета, соответствующего первой битовой скорости, во втором пакете, соответствующем второй битовой скорости. Выбирается режим декодирования для пакета.

Также описывается способ затенения пакета из полноскоростного в полускоростном. Принимается полноскоростной пакет. Полноскоростной пакет затеняется в полускоростном пакете посредством отбрасывания битов, соответствующих параметру, из полноскоростного пакета. Полускоростной пакет упаковывается битами, соответствующими сигнальной информации. Полускоростной пакет передается на декодер.

Далее различные конфигурации систем и способов описываются со ссылкой на чертежи, на которых одинаковые ссылочные номера указывают на идентичные или функционально подобные элементы. Элементы настоящих систем и способов, как в целом описано и иллюстрировано на чертежах настоящего документа, могут быть расположены и спроектированы с использованием широкого разнообразия различных конфигураций. Следовательно, нижеизложенное подробное описание не предназначено для ограничения заявленного объема систем и способов и попросту является иллюстрацией конфигураций систем и способов.

Многие элементы раскрытых в настоящем документе конфигураций могут быть реализованы в качестве программного обеспечения, электронных аппаратных средств или с использованием их комбинации. Для четкой иллюстрации этой взаимозаменяемости аппаратных средств и программного обеспечения различные компоненты будут, в целом, описываться в контексте их функциональных возможностей. Вариант реализации таких функциональных возможностей, то есть в качестве аппаратных средств или в качестве программного обеспечения, зависит от конкретной области применения, а также от конструктивных ограничений, наложенных на всю систему. Специалисты в данной области техники могут реализовать описанные функциональные возможности различными способами для каждой конкретной области применения, но такие реализационные решения не должны интерпретироваться в качестве выходящих за пределы объема настоящих систем и способов.

При реализации описанных функциональных возможностей в качестве программного обеспечения такое программное обеспечение может включать в себя любой тип машинной команды или машинно-исполнимого кода, находящегося в запоминающем аппарате и/или переданного посредством электронных сигналов по системной шине или сети. Программное обеспечение, которое реализует описанные в настоящем документе функциональные возможности, соответствующие компонентам, может содержать одну или множество команд, а также может быть распределено среди нескольких различных кодовых сегментов, среди различных программ, а также среди нескольких запоминающих аппаратов.

Используемые в настоящем документе термины «конфигурация», «конфигурации», «одна или несколько конфигураций», «некоторые конфигурации», «конкретные конфигурации», «одна конфигурация», «другая конфигурация» и т.п. обозначают одну или несколько (но не обязательно все) конфигураций раскрытых систем и способов, если явно не определено иначе.

Термин «определение» (и его грамматические варианты) используется в достаточно широком смысле. Термин «определение» охватывает широкое разнообразие действий и, следовательно, термин «определение» может включать в себя действие вычисления, подсчета, обработки, получения, исследования, поиска (например, поиска в таблице, в базе данных или в другой структуре данных), выявления и т.п. Кроме того, термин «определение» может включать в себя действие приема (например, приема информации), организации доступа (например, организации доступа к данным в памяти) и т.п. Кроме того, термин «определение» может включать в себя действие решения, отбора, выбора, установления и т.п.

Фраза «на основе…» не обозначает «исключительно на основе…», если явно не определено иначе. Другими словами, фраза «на основе» описывает как «исключительно на основе…», так и «по меньшей мере, на основе…».

Сеть сотовой связи может включать в себя сеть радиосвязи, состоящую из множества сот, каждая из которых обслуживается посредством фиксированного передатчика. Это множество передатчиков может называться площадкой базовых станций или базовыми станциями. Сота может взаимодействовать с другими сотами в сети посредством передачи речевых сигналов на базовую станцию по каналу связи. Сота может разделить речевой сигнал на множество кадров (например, размером в 20 миллисекунд (мсек) речевого сигнала). Каждый кадр может быть закодирован в пакет. Пакет может включать в себя определенное количество битов, которые затем передаются по каналу связи на приемную базовую станцию или на приемную соту. Приемная базовая станция или приемная сота может распаковать пакет и декодировать различные кадры для восстановления сигнала.

Функция межсетевого обмена (IWF) на базовой станции может «затенять» полноскоростные пакеты (состоящие из 171 бита) в полускоростных пакетах (состоящих из 80 битов) перед передачей пакета по каналу связи. Затенение может быть реализовано для пакетов различных типов, включающих в себя полноскоростные пакеты прототипного периода основного тона (PPP), и полноскоростные пакеты с линейным предсказанием с кодовым возбуждением (CELP).

После затенения полноскростного пакета в полускоростном пакете в полускоростной пакет может быть добавлена сигнальная информация. Биты, которые могут быть незанятыми после затенения, могут быть использованы для передачи дополнительной сигнальной информации, такой как передача управления, сообщения для повышения мощности передачи и т.д. Результирующий пакет, который может включать в себя затененную речевую информацию и сигнальную информацию, может быть послан на декодер в качестве полноскоростного пакета.

Кроме того, пакеты, которые передаются с большим количеством битов, могут понизить производительность сети сотовой связи. Качество восстановленных речевых сигналов может быть повышено посредством выполнения на базовой станции затенения уровня пакетов. Конвертация (или затенение) полноскоростных пакетов РРР и CELP в специальные полускоростные пакеты РРР и CELP, а также передача этих специальных полускоростных пакетов на декодер могут повысить качество восстановленных речевых сигналов на декодере по сравнению со стиранием полноскоростных пакетов РРР и CELP. Затенение полноскоростных пакетов также может снизить сетевой трафик.

Фиг.1 иллюстрирует систему 100 радиотелефонной связи с множественным доступом с кодовым разделением каналов (CDMA), которая может включать в себя множество мобильных абонентских модулей 102 или мобильных станций 102, множество базовых станций 104, контроллер 106 базовой станции (BSC) и мобильный коммутационный центр 108 (MSC). Центр 108 MSC может быть сконфигурирован с возможностью взаимодействия с обычной коммутируемой телефонной сетью 110 общего пользования (PSTN). Центр 108 MSC также может быть сконфигурирован с возможностью взаимодействия с контроллером 106 BSC. Система 100 может включать в себя несколько контроллеров 106 BSC. Каждая базовая станция 104 может включать в себя, по меньшей мере, один сектор (не показан), причем каждый сектор может иметь всенаправленную антенну или антенну, наведенную в конкретном радиальном направлении от базовых станций 104. Альтернативно, каждый сектор может включать в себя две антенны для разнесенного приема. Каждая базовая станция 104 может быть сконфигурирована с возможностью поддержки множества назначений частот. Пересечение сектора и назначения частоты может называться каналом CDMA. Мобильные абонентские модули 102 могут включать в себя сотовую или портативную систему радиотелефонной связи (PCS).

В процессе работы сотовой системы 100 радиотелефонной связи базовые станции 104 могут принимать наборы сигналов обратной линии связи от наборов мобильных станций 102. Мобильные станции 102 могут осуществлять телефонные вызовы или связь другого типа. Каждый сигнал обратной линии связи, принятый посредством конкретной базовой станции 104, может быть обработан на этой базовой станции 104. Конечные данные могут быть пересланы на контроллер 106 BSC. Контроллер 106 BSC может выполнить распределение ресурсов вызова и функциональных возможностей управления мобильностью, включающих в себя взаимодействие мягкой передачи обслуживания между базовыми станциями 104. Контроллер 106 BSC также может маршрутизировать принятые данные центру 108 MSC, который оказывает дополнительные услуги маршрутизации для взаимодействия с сетью 110 PSTN. Подобным образом сеть 18 PSTN может взаимодействовать с центром 108 MSC, а центр 108 MSC может взаимодействовать с контроллером 106 BSC, который в свою очередь может управлять базовыми станциями 104 для передачи наборов сигналов прямой линии связи группам мобильных станций 102.

Фиг.2 изображает среду 200 передачи сигналов, включающую в себя кодер 202, декодер 204, среду 206 передачи и функцию 208 межсетевого обмена (IWF). Кодер 202 может быть реализован в мобильной станции 102 или же в базовой станции 104. Функция 208 IWF может быть реализована в базовой станции 104. Декодер 204 может быть реализован в базовой станции 104 или же в мобильной станции 102. Кодер 202 может кодировать речевой сигнал s(n) 210, формируя кодированный речевой сигнал 212 senc(n). Кодированный речевой сигнал 212 может быть конвертирован в специальный кодированный пакет 214 spenc(n) для передачи через среду 206 передачи на декодер 204. Декодер 204 может распаковать пакет 214 spenc(n) и декодировать сигнал 212 senc(n), таким образом формируя синтезированный речевой сигнал 216 s(n).

Используемый в настоящем документе термин «кодирование», в целом, может применяться к способам, относящимся как к кодированию, так и к декодированию. В целом системы, устройства и способы кодирования стремятся минимизировать количество битов, передаваемых через среду 206 передачи (то есть минимизировать полосу частот сигнала 214 spenc(n)), сохраняя поддержку приемлемого воспроизведения речи (то есть сигнал 210 s(n) ~ сигналу 216 s(n)). Устройство может являться мобильным телефоном, личным цифровым ассистентом (PDA), портативным компьютером, цифровой камерой, музыкальным плейером, игровым аппаратом, базовой станцией или любым другим аппаратом с процессором. Состав кодированного речевого сигнала 212 может меняться согласно конкретному режиму кодирования речи, используемому посредством кодера 202. Различные режимы кодирования описаны ниже.

Нижеописанные компоненты кодера 202, декодера 204 и функции 208 IWF 208 могут быть реализованы в качестве электронных аппаратных средств, в качестве программного обеспечения или с использованием их комбинации. Эти компоненты описываются ниже в контексте своих функциональных возможностей. Вариант реализации функциональных возможности, а именно в качестве аппаратных средств или в качестве программного обеспечения, может зависеть от конкретной области применения, а также от конструктивных ограничений, наложенных на всю систему. Среда 206 передачи может представлять собой множество различных информационных носителей, включающих в себя, в числе прочего, наземную линию связи, линию связи между базовой станцией и спутником, линию радиосвязи между сотовым телефоном и базовой станцией, или линию радиосвязи между сотовым телефоном и спутником.

Каждая взаимодействующая сторона может как передавать, так и принимать данные. Каждая сторона может использовать кодер 202 и декодер 204. Однако среда 200 передачи сигналов будет описана ниже в качестве включающей в себя кодер 202 на одном конце среды 206 передачи и декодер 204 - на другом конце.

Для целей этого описания сигнал 210 s(n) может включать в себя цифровой речевой сигнал, полученный в течение обычного сеанса связи, включающего в себя различные вокальные звуки и периоды тишины. Речевой сигнал 210 s(n) может быть разделен на кадры, а каждый кадр может быть дополнительно разделен на подкадры. Эти произвольно выбранные границы кадра/подкадра могут быть использованы после выполнения некоторой обработки кадров. Операции, описанные в качестве выполняемых применительно к кадрам, также могут быть выполнены применительно к подкадрам, в этом смысле в настоящем документе кадр и подкадр используются взаимозаменяемо. Однако сигнал 210 s(n) может не разделяться на кадры/подкадры, если выполняется непрерывная (поточная) обработка вместо обработки кадров. В силу этого, нижеописанные способы могут быть расширены до непрерывной (поточной) обработки.

Сигнал 210 s(n) может быть дискретизирован в цифровой форме на частоте 8 килогерц (кГц). Каждый кадр может включать в себя 20 миллисекунд (мсек) данных или 160 отсчетов при частоте дискретизации 8 кГц. Каждый подкадр может включать в себя 53 или 54 отсчета данных. Несмотря на то, что эти параметры могут являться предназначенными для кодирования речи, они являются простыми примерами, а также могут быть использованы другие подходящие альтернативные параметры.

Фиг.3 изображает блок-схему, иллюстрирующую одну конфигурацию многорежимного кодера 302, взаимодействующего с многорежимным декодером 304 по каналу 306 связи. Канал 306 связи может включать в себя радиочастотный (RF) интерфейс. Кодер 302 может включать в себя соответствующий декодер (не показан). Кодер 302 и его соответствующий декодер могут сформировать первый речевой кодер. Декодер 304 может включать в себя соответствующий кодер (не показан). Декодер 304 и его соответствующий кодер могут сформировать второй речевой кодер.

Кодер 302 может включать в себя модуль 318 вычисления начальных параметров, модуль 320 определения скорости, модуль 322 классификации режимов, множество режимов (средств) 324, 326, 328 кодирования и модуль 330 форматирования пакетов. Количество режимов 324, 326, 328 кодирования изображено с помощью величины N, которая может отображать любое количество режимов 324, 326, 328 кодирования. Для простоты три режима 324, 326, 328 кодирования изображены пунктиром, указывающим на существование других режимов кодирования.

Декодер 304 может включать в себя модуль 332 распаковки (разбора) пакетов, множество режимов 334, 336, 338 декодирования и постфильтр 340. Количество режимов 334, 336, 338 декодирования изображено с помощью величины N, которая может отображать любое количество режимов 334, 336, 338 декодирования. Для простоты три режима 334, 336, 338 декодирования изображены пунктиром, указывающим на существование других режимов декодирования.

Речевой сигнал 310 s(n) может быть подан на модуль 318 вычисления начальных параметров. Речевой сигнал 310 может быть разделен на группы отсчетов, называемые кадрами. Величина n может указывать номер кадра или номер отсчета в кадре. В альтернативной конфигурации вместо речевого сигнала 310 может быть использован сигнал необнаруженных ошибок линейного предсказания (LP). Сигнал необнаруженных ошибок линейного предсказания (LP) может быть использован посредством речевых кодеров, таких как кодер с линейным предсказанием с кодовым возбуждением (CELP).

Модуль 318 вычисления начальных параметров может получить различные параметры на основе текущего кадра. В одном аспекте эти параметры включают в себя, по меньшей мере, один из следующих параметров: коэффициенты фильтра кодирования с линейным предсказанием (LPC), коэффициенты при гармониках с частотой (LSP), функции нормализованной автокорреляции (NACF), задержка открытой петли, частоты переходов через нуль, энергия полосы и остаточный сигнал форманта.

Модуль 318 вычисления начальных параметров может быть соединен с модулем 322 классификации режимов. Модуль 322 классификации режимов может выполнять динамическое переключение режимов 324, 326, 328 кодирования. Модуль 318 вычисления начальных параметров может передать параметры модулю 322 классификации режимов. Модуль 322 классификации режимов может быть соединен с модулем 320 определения скорости. Модуль 320 определения скорости может принять сигнал управления скоростью. Сигнал управления скоростью может побудить кодер 302 к выполнению кодирования речевого сигнала 310 на конкретной скорости. В одном аспекте конкретная скорость включает в себя полную скорость, которая может указывать на то, что речевой сигнал 310 будет кодироваться с использованием ста семидесяти одного бита. В другом примере конкретная скорость включает в себя половинную скорость, которая может указывать на то, что речевой сигнал 310 будет кодироваться с использованием восьмидесяти битов. В дополнительном примере конкретная скорость включает в себя одну восьмую от скорости, которая может указывать на то, что речевой сигнал 310 будет кодироваться с использованием шестнадцати битов.

Как было заявлено ранее, модуль 322 классификации режимов может быть соединен с динамическим переключателем режимов 324, 326, 328 кодирования на основе последовательности кадров для выбора наиболее подходящего режима 324, 326, 328 кодирования для текущего кадра. Модуль 322 классификации режимов может выбрать конкретный режим 324, 326, 328 кодирования для текущего кадра посредством сравнения параметров с предварительно определенными пороговыми и/или предельными значениями. Кроме того, модуль 322 классификации режимов может выбрать конкретный режим 324, 326, 328 кодирования на основе сигнала управления скоростью, принятого от модуля 320 определения скорости. Например, режим А 324 кодирования может кодировать речевой сигнал 310 с использованием ста семидесяти одного бита, между тем, как режим В 326 кодирования может кодировать речевой сигнал 310 с использованием восьмидесяти битов.

На основе энергоемкости кадра модуль 322 классификации режимов может классифицировать кадр в качестве неречевого, неактивного речевого (например, тишина, фоновый шум или паузы между словами) или речевого. На основе частоты кадра модуль 322 классификации режимов может классифицировать речевые кадры в качестве речи конкретного типа, например вокализированной, невокализированной или переходной.

Вокализированная речь может включать в себя речь, которая показывает относительно высокую степень периодичности. Сегмент вокализированной речи 702 изображен на диаграмме, иллюстрированной на фиг.7A. Как иллюстрировано, период основного тона может являться компонентом речевого кадра, который может быть использован для анализа и восстановления информационного содержания кадра. Невокализированная речь может включать в себя согласные звуки. Сегмент невокализированной речи 704 изображен на диаграмме, иллюстрированной на фиг.7B. Переходные речевые кадры могут включать в себя переходы между вокализированной и невокализированной речью. Сегмент переходной речи 706 изображен на диаграмме, иллюстрированной на фиг.7С. Кадры, которые не были классифицированы ни в качестве вокализированной, ни в качестве невокализированной речи, могут быть классифицированы в качестве переходной речи. Диаграммы, иллюстрированные на фиг.7A, 7B и 7С, будут более подробно обсуждаться ниже.

Классификация речевых кадров может позволить различным режимам 324, 326, 328 кодирования использоваться для кодирования речи различных типов, приводя к более эффективному использованию полосы пропускания в совместно используемом канале, таком как канал 306 связи. Например, поскольку вокализированная речь является периодической и, следовательно, наиболее прогнозируемой, для кодирования вокализированной речи может быть использован низкоскоростной наиболее прогнозирующий режим 324, 326, 328 кодирования.

Модуль 322 классификации режимов может выбрать режим 324, 326, 328 кодирования для текущего кадра на основе классификации кадра. Различные режимы 324, 326 328 кодирования могут быть связаны параллельно. Один или несколько режимов 324, 326, 328 кодирования могут быть использованы в любой момент времени. В одной конфигурации, согласно классификации текущего кадра, выбирается один режим 324, 326, 328 кодирования.

Различные способы кодирования 324, 326, 328 могут работать согласно различным битовым скоростям кодирования, различным схемам кодирования или различным комбинациям битовой скорости кодирования и схемы кодирования. Как было заявлено ранее, различные используемые скорости кодирования могут являться полной битовой скоростью, половинной битовой скоростью, четвертной битовой скоростью и/или одной восьмой от скорости. Различные используемые схемы кодирования могут являться кодированием CELP, кодированием с прототипным периодом основного тона (PPP) (или кодирование с интерполяцией сигнала (WI)) и/или кодирование с линейным предсказанием с шумовым возбуждением (NELP). Следовательно, например, конкретный режим 324, 326, 328 кодирования может являться кодированием CELP на полной скорости, другой режим 324, 326, 328 кодирования может являться кодированием CELP на половинной скорости, еще один режим 324, 326, 328 кодирования может являться кодированием РРР на четверной скорости и еще один режим 324, 326, 328 кодирования может являться кодированием NELP.

В соответствии с режимом 324, 326, 328 кодирования CELP модель речевого тракта с линейным предсказанием может быть возбуждена с помощью квантованной версии остаточного сигнала LP. В режиме кодирования CELP может квантоваться весь текущий кадр. Режим 324, 326, 328 кодирования CELP может обеспечить относительно точное воспроизведение речи, но ценой относительно высокой битовой скорости кодирования. Режим 324, 326, 328 кодирования CELP может быть использован для кодирования кадров, классифицированных в качестве переходной речи.

В соответствии с режимом 324, 326, 328 кодирования NELP фильтрованный псевдослучайный шумовой сигнал может быть использован для моделирования остаточного сигнала LP. Режим 324, 326, 328 кодирования NELP может являться относительно простой технологией, при которой достигается низкая битовая скорость. Режим 324, 326, 328 кодирования NELP может быть использован для кодирования кадров, классифицированных в качестве невокализированной речи.

В соответствии с режимом 324 326, 328 кодирования PPP в пределах каждого кадра может быть закодировано поднабор периодов основного тона. Оставшиеся периоды речевого сигнала могут быть восстановлены посредством интерполяции между этими прототипнами периодами. При реализации кодирования PPP во временной области может быть вычислен первый набор параметров, которые описывают способ изменения предыдущего прототипного периода для аппроксимации текущего прототипного периода. Может быть выбран один или несколько кодовых векторов, которые при суммировании аппроксимируют разность между текущим прототипным периодом и измененным предыдущим прототипным периодом. Второй набор параметров описывает эти выбранные кодовые векторы. При реализации кодирования PPP в частотной области может быть вычислен набор параметров для описания амплитуды и фазы спектра прототипа. В соответствии с реализацией кодирования PPP декодер 304 может синтезировать выходной речевой сигнал 316 посредством восстановления текущего прототипа на основе наборов параметров, описывающих амплитуду и фазу. Речевой сигнал может быть интерполирован в область между восстановленным прототипным периодом и предыдущим восстановленным прототипным периодом. Прототип может включать в себя часть текущего кадра, который будет линейно интерполирован с прототипами из предыдущих кадров, которые были также установлены в пределах кадра для восстановления речевого сигнала 310 или остаточного сигнала LP в декодере 304 (то есть предыдущий прототипный период используется в качестве предсказателя текущего прототипного периода).

Кодирование прототипного периода вместо целого речевого кадра может сократить скорость кодирования. Кадры, классифицированные в качестве вокализированной речи, могут быть успешно закодированы с использованием режима 324, 326, 328 кодирования PPP. Как иллюстрировано на фиг.7A, вокализированная речь может включать в себя медленно изменяемые во времени колебательные компоненты, которые используются режимом 324, 326, 328 кодирования PPP. Посредством использования колебаний вокализированной речи режим 324, 326, 328 кодирования РРР может достигнуть битовой скорости, меньшей по сравнению с режимом 324, 326, 328 кодирования CELP.

Выбранный режим 324, 326, 328 кодирования может быть связан с модулем 330 форматирования пакетов. Выбранный режим 324, 326, 328 кодирования может кодировать или квантовать текущий кадр, а также предоставлять квантованные параметры 312 кадра модулю 330 форматирования пакетов. Модуль 330 форматирования пакетов может собрать квантованные параметры 312 кадра в отформатированный пакет 313. Модуль 330 форматирования пакетов может быть связан с функцией 308 IWF. Модуль 330 форматирования пакетов может предоставить отформатированный пакет 313 функции 308 IWF. Функция 308 IWF может конвертировать отформатированный пакет 313 в специальный пакет 314. В одном примере отформатированный пакет 313 включает в себя полноскоростной пакет, кодированный посредством режимов 324, 326, 328 кодирования CELP, PPP или NELP. Функция 308 IWF может конвертировать полноскоростной отформатированный пакет 313 в специальный полускоростной пакет 314. Другими словами, отформатированный полноскоростной пакет 313 (171 бит) может быть конвертирован в полускоростной пакет, который включает в себя 80 битов. Полускоростной пакет не должен включать себя точно половину количества битов полноскоростного пакета. Функция 308 IWF может передать специальный полускоростной пакет 314 на передатчик (не показан), и специальный пакет 314 может быть конвертирован в аналоговый формат, модулирован и передан по каналу 306 связи на приемник (также не показан), который принимает, демодулирует и оцифровывает специальный пакет 314, и передает пакет 314 на декодер 304.

В декодере 304 модуль 332 распаковки (разбора) пакетов принимает специальный пакет 314 от приемника. Модуль 332 распаковки пакетов может распаковать специальный пакет 314 и обнаружить, что специальный пакет 314 был конвертирован из полноскоростного пакета в полускоростной пакет. Модуль 332 может обнаружить, что специальный пакет был конвертирован посредством считывания специального идентификатора, включенного в специальный пакет. Модуль 332 распаковки пакетов также может быть соединен с динамическим переключателем режимов 334, 336, 338 декодирования на основе последовательности пакетов. Количество режимов 334, 336, 338 декодирования может равняться количеству режимов 324, 326, 328 кодирования. Каждый пронумерованный режим 324, 326, 328 кодирования может быть связан с соответствующим пронумерованным режимом 334, 336, 338 декодирования, сконфигурированным для использования одинаковой скорости и схемы кодирования.

Если модуль 332 распаковки пакетов обнаруживает пакет 314, то пакет 314 распаковывается и предоставляется подходящему режиму 334, 336, 338 декодирования. Если модуль 332 распаковки не обнаруживает пакет, то объявляется потеря пакета, и декодер со стиранием (не показан) может выполнить обработку по стиранию кадра. Параллельное множество режимов 334, 336, 338 декодирования может быть связано с постфильтром 340. Подходящий режим 334, 336, 338 декодирования может декодировать или деквантовать пакет 314 и передать информацию на постфильтр 340. Постфильтр 340 может восстановить или синтезировать речевой кадр выводя синтезированный речевой кадр 316 s(n).

В одной конфигурации сами квантованные параметры не передаются. Вместо этого передаются индексы кодовой книги, определяющие адреса в различных поисковых таблицах (LUT) (не показаны) в декодере 304. Декодер 304 может принять индексы кодовой книги, а также выполнить поиск по различным таблицам LUT кодовой книги для нахождения подходящих значений параметра. Соответственно, индексы кодовой книги для параметров, такие как, например, задержка основного тона, адаптивный коэффициент кодовой книги и коэффициент LSP, могут быть переданы, а посредством декодера 304 по трем соответствующим таблицам LUT кодовой книги может быть выполнен поиск.

В соответствии с режимом кодирования CELP могут быть переданы параметры основного тона, амплитуды, фазы, а также параметры коэффициента LSP. Индексы кодовой книги LSP передаются в связи с тем, что на декодере 304 может быть синтезирован остаточный сигнал LP. Кроме того, может быть передана разность между значением задержки основного тона для текущего кадра и значением задержки основного тона для предыдущего кадра.

В соответствии с режимом кодирования PPP, в котором речевой сигнал 310 синтезируется на декодере 304, передаются параметры задержки основного тона, амплитуды и фазы. Меньшая битовая скорость, используемая посредством режима кодирования речи PPP, может не разрешить передачу как информации абсолютной задержки основного тона, так и относительных значений разности задержек основного тона.

В соответствии с одним примером кадры с большей периодичностью, такие как вокализированные речевые кадры, передаются с помощью низкоскоростного режима кодирования PPP, который квантует разность между значением задержки основного тона для текущего кадра и значением задержки основного тона для предыдущего кадра для передачи, и не квантует значение задержки основного тона для текущего кадра для передачи. Поскольку вокализированные кадры являются наиболее периодичными по природе, передача значения разности вместо абсолютного значения задержки основного тона может привести к достижению меньшей скорости кодирования. В одном аспекте эта квантизация обобщена так, что вычисляется взвешенная сумма значений параметра для предыдущих кадров, причем сумма показателей является одной (равна 1), а взвешенная сумма вычитается из значения параметра для текущего кадра. Затем разность может квантоваться.

Фиг.4 изображает блок-схему, иллюстрирующую один пример функции 408 IWF. Функция 408 IWF может конвертировать полноскоростной отформатированный пакет 413 в специальный полускоростной пакет 414. Функция 408 IWF может принять отформатированный пакет 413, а блок 450 анализа битовой скорости может определить количество битов, включенных в отформатированный пакет 413. В одном аспекте полноскоростной отформатированный пакет 413 включает в себя сто семьдесят один бит. Модуль 452 отбрасывания может исключить определенное количество битов, соответствующих квантованному параметру, включенному в отформатированный пакет 413. В одной конфигурации блок 456 определения битов определяет, какие биты отброшены из отформатированного пакета 413. Например, блок 456 определения битов может определить, что нужно отбросить биты, соответствующие параметру выравнивания полосы. Также модуль 452 отбрасывания может исключить количество битов, соответствующих этому параметру.

Функция 408 IWF также может включать в себя модуль 454 упаковки. Модуль 454 упаковки может упаковать оставшиеся биты, которые не были отброшены посредством модуля 452 отбрасывания, в специальный пакет 414. В одном аспекте модуль 452 отбрасывания исключает примерно половину битов, включенных в отформатированный пакет 413. Также модуль 454 упаковки может упаковать оставшиеся биты в специальный пакет 414, который включает в себя половину количества битов, которые были включены в отформатированный пакет 413. Генератор 458 идентификаторов может передать специальный идентификатор на модуль 454 упаковки. Модуль 454 упаковки может включать биты, соответствующие специальному идентификатору, в специальный пакет 414. Специальный идентификатор может указать декодеру 304 на то, что входящий пакет является специальным полускоростным пакетом 414. Специальный идентификатор может включать в себя 7-битовое значение, которое колеблется между значениями 101 и 127. Специальный идентификатор может являться недопустимым значением в том смысле, что кодер обычно назначает пакетам 7-битовое значение, которое колеблется от 0 до 100. Пакет с 7-битовым значением, колеблющимся между 101 и 127, может указать декодеру 304 на то, что пакет был конвертирован из полноскоростного в специальный полускоростной после процесса кодирования.

Фиг.5 изображает схему последовательности операций, иллюстрирующую один пример способа 500 кодирования речи с переменной битовой скоростью. В одном аспекте способ 500 реализован посредством одной мобильной станции 102, которой может быть разрешен прием полноскоростного пакета, а также конвертация этого пакета в специальный полускоростной пакет. В других аспектах способ 500 может быть реализован посредством нескольких мобильных станций 102. Другими словами, одна мобильная станция 102 может включать в себя кодер для кодирования полноскоростного пакета в то время, как отдельная мобильная станция 102, базовая станция 104 и т.д., включает в себя функцию IWF, которая может конвертировать полноскоростной пакет в специальный полускоростной пакет. Могут быть вычислены (этап 502) начальные параметры текущего кадра. В одной конфигурации модуль 318 вычисления начальных параметров вычисляет (этап 502) параметры. Параметры могут включать в себя один или несколько нижеперечисленных параметров: коэффициенты фильтра кодирования с линейным предсказанием (LPC), коэффициенты пары спектральных линий (LSP), функции нормализованной автокорреляции (NACF), задержка открытой петли, энергия полосы, частоты переходов через нуль и остаточный сигнал форманты.

Текущий кадр может быть классифицирован (этап 504) в качестве активного или неактивного. В одной конфигурации модуль 322 классификации классифицирует текущий кадр в качестве включающего в себя либо «активную», либо «неактивную» речь. Как было описано выше, сигнал 310 s(n) может включать в себя речевые периоды и периоды тишины. Активная речь может включать в себя произносимые слова, тогда как неактивная речь может включать в себя все остальное, например фоновый шум, тишину, паузы.

На этапе 506 выполняется определение того, в качестве активного или неактивного был классифицирован текущий кадр. Если текущий кадр был классифицирован в качестве активного, то активная речь дополнительно классифицируется (этап 508) в качестве вокализированных, невокализированных или переходных кадров. Человеческая речь может быть классифицирована многими различными способами. Две классификации речи могут включать в себя вокализированные и невокализированные звуки. Речь, которая не является ни вокализированной, ни невокализированной, может быть классифицирована в качестве переходной речи.

Режим кодера/декодера может быть выбран (этап 510) на основе классификации кадра, выполненной на этапах 506 и 508. Различные режимы кодера/декодера могут быть связаны параллельно, как показано на фиг.3. Различные режимы кодера/декодера функционируют согласно различным схемам кодирования. Определенные режимы могут быть более эффективными при кодировании частей речевого сигнала 310 s(n), проявляющего определенные свойства.

Как разъяснялось ранее, режим CELP может быть выбран для кодирования кадров, классифицированных в качестве переходной речи. Режим PPP может быть выбран для кодирования кадров, классифицированных в качестве вокализированной речи. Режим NELP может быть выбран для кодирования кадров, классифицированных в качестве невокализированной речи. Зачастую одной технологией кодирования можно управлять на различных битовых скоростях с переменными уровнями производительности. Различные режимы кодера/декодера, изображенные на фиг.3, могут представлять различные технологии кодирования, подобную технологию кодирования, функционирующую на различных битовых скоростях, или же комбинации вышеупомянутого.

Выбранный режим кодера может кодировать (этап 512) текущий кадр и форматировать (этап 514) кодированный кадр в пакет согласно первой скорости. На этапе 516 выполняется определение того, требуется ли пакетный сигнал или сигнальная информация. Кроме того, на этапе 516 выполняется определение того, требуется ли дополнительная пропускная способность сети. Если передача сигналов или же дополнительная пропускная способность сети не требуется, то пакет может быть послан (этап 520) на декодер. Если требуется передача сигналов или дополнительная пропускная способность сети, то на базовой станции пакет может быть затенен (этап 518) из первой скорости во вторую скорость, а затем может быть упакован с сигнальной информацией перед передачей (этап 520) на декодер. Первая скорость может включать в себя большее количество битов по сравнению со второй скоростью. В одном аспекте затенение (этап 518) пакета включает в себя отбрасывание определенного количества битов из пакета для передачи на декодер меньшего количества битов или для освобождения битов, которые могут быть использованы для передачи сигнальной информации на декодер.

Фиг.6 изображает схему последовательности операций, иллюстрирующую один пример способа 600 затенения пакета. Способ 600 может быть реализован посредством функции 208 IWF. На этапе 602 может быть принят первый пакет. Первый пакет может являться отформатированным пакетом 313, принятым от кодера 302. Первый пакет может быть проанализирован (этап 604) для определения первой битовой скорости, соответствующей первому пакету. Первая битовая скорость может указывать количество битов, включенных в первый пакет. В одном аспекте блок 450 анализа битовой скорости анализирует первый пакет для определения битовой скорости. Биты, соответствующие, по меньшей мере, одному параметру, могут быть отброшены (этап 606) из первого пакета. В одной конфигурации модуль 452 отбрасывания отбрасывает биты, соответствующие параметру выравнивания полосы. При реализации кодирования РРР в частотной области многополосный подход может быть адаптирован для кодирования фазового спектра, где квантование фазы преобразовывается в квантование серии линейных фазовых сдвигов. Серия дискретных преобразований Фурье (DFS) может быть использована для преобразования прототипного периода основного тона (PPP) в частотную область. Сдвиг глобального выравнивания может быть вычислен между DFS неквантованной фазы квантованной амплитуды и DFS нулевой фазы квантованной амплитуды. DFS нулевой фазы квантованной амплитуды может быть сдвинута посредством отрицания этого глобального выравнивания, что может соответствовать применению ожидаемого линейного фазового сдвига к PPP, представленного посредством DFS нулевой фазы квантованной амплитуды для максимального выравнивания PPP, что может соответствовать DFS правильной фазы квантованной амплитуды. В одном аспекте линейный фазовый сдвиг может быть недостаточным для захвата правильной фазы всех гармоник, сосредоточенного на полосе выравнивания в дополнение к глобальному выравниванию, вычисленных во множестве полос. Это может соответствовать параметрам глобального выравнивания полосы, которые могут быть отброшены.

Оставшиеся биты первого пакета, соответствующие одному или нескольким параметрам, могут быть упакованы (этап 608) со специальным идентификатором во второй пакет. В одном аспекте второй пакет соответствует второй битовой скорости. Вторая битовая скорость цифрового потока может включать в себя меньше битов по сравнению с первой битовой скоростью. Специальный идентификатор может идентифицировать второй пакет в качестве включающего в себя вторую битовую скорость. Второй пакет может быть передан (этап 610) на декодер. В одном примере второй пакет может быть передан (этап 610) с первой базовой станции на вторую базовую станцию. В другом примере второй пакет может быть передан (этап 610) с первой базовой станции на другую мобильную станцию 102.

Фиг.6A изображает схему последовательности операций, иллюстрирующую одну конфигурацию способа 601 декодирования пакета. На этапе 603 может быть принят пакет, а на этапе 605 может быть считан специальный идентификатор, включенный в пакет. В одном аспекте специальный идентификатор является идентификатором недопустимой задержки. На этапе 607 может быть выполнено определение того, что пакет был конвертирован из первого пакета, соответствующего первой битовой скорости, во второй пакет, соответствующий второй битовой потока. На этапе 609 для пакета может быть выбран способ декодирования, и пакет может быть декодирован.

Фиг.7A изображает иллюстративную часть сигнала 310 s(n), включающую в себя вокализированную речь 702. Вокализированные звуки могут быть воспроизведены посредством пропускания воздуха через голосовую щель с помощью напряжения приспособленных голосовых связок так, чтобы они вибрировали в непринужденном колебании, благодаря чему воспроизводя квазипериодические воздушные импульсы, которые побуждают речевой тракт. Одной характеристикой измерения вокализированной речи является период основного тона, как показано на фиг.7A.

Фиг.7B изображает иллюстративную часть сигнала 310 s(n), включающую в себя невокализированную речь 704. Невокализированные звуки могут быть сгенерированы посредством сужения в некоторый момент вокального тракта (обычно в горле) и пропускания воздуха через сужение с достаточно высокой скоростью для воспроизведения вихревого потока. Конечный невокализированный речевой сигнал напоминает цветной шум.

Фиг.7С изображает иллюстративную часть сигнала 310 s(n), включающую в себя переходную речь 706 (то есть речь, которая не является ни вокализированной, ни невокализированной). Иллюстративную переходную речь 706, изображенную на фиг.7С, может представить сигнал 310 s(n), переходящий между невокализированной и вокализированной речью. Для достижения сопоставимых результатов может использоваться множество различных классификаций речи согласно описанным в настоящем документе технологиям.

Изображенная на фиг.8 диаграмма иллюстрирует принципы технологии кодирования PPP. Один кадр 800 может включать в себя исходный сигнал 860 s(n). Периоды основного тона 862 (или прототипные формы сигнала) могут быть извлечены из исходного сигнала 860 и закодированы. Кодированные периода основного тона 862 могут быть использованы для формирования восстановленного сигнала 864. Восстановленный сигнал 864 может являться реконструкцией исходного сигнала 860. Части 866 исходного сигнала 860, которые не были закодированы, могут быть восстановлены посредством интерполяции между периодами основного тона 862.

Фиг.9 изображает диаграмму 900, иллюстрирующую количество битов, распределенных пакетам различным типов. Диаграмма 900 включает в себя множество параметров 902. Каждый параметр из множества параметров 902 может использовать определенное количество битов. Пакеты различных типов, иллюстрированные в диаграмме 900, могут быть закодированы с использованием одного из ранее обсужденных различных режимов кодирования. Типы пакетов могут включать в себя полноскоростной пакет 904 CELP (FCELP), полускоростной пакет 906 CELP (HCELP), специальный полускоростной пакет 908 CELP (SPLHCELP), полноскоростной пакет 910 PPP (FPPP), специальный полускоростной пакет 912 PPP (SPLHPPP), пакет 914 PPP (QPPP), соответствующий четверти скорости, специальный полускоростной пакет 916 NELP (SPLHNELP), пакет 918 NELP (QNELP), соответствующий четверти скорости и кодер 920 тишины.

Пакеты 904 FCELP и пакеты 910 FPPP могут включать в себя 171 бит. Пакет 904 FCELP может быть конвертирован в пакет 908 SPLHCELP. В одном аспекте пакет 904 FCELP распределяет биты для параметров, таких как фиксированный индекс кодовой книги (индекс FCB) и фиксированный коэффициент кодовой книги (коэффициент FCB). Как изображено, когда пакет 904 FCELP конвертируется в пакет 908 SPLHCELP, нулевые биты распределяются для параметров, таких как индекс FCB, коэффициент FCB и задержка дельта. Другими словами, пакет 908 SPLHCELP передается на декодер без этих битов. Пакет 908 SPLHCELP включают в себя биты, которые распределены для параметров, таких как коэффициенты при гармониках с частотой (LSP), адаптивный коэффициент кодовой книги (ACB), специальный идентификатор (ID), специальный индикатор пакета, информация задержки основного тона и информация режима. Общее количество передаваемых на декодер битов может быть сокращено со 171 до 80.

Подобным образом пакет 910 FPPP может быть конвертирован в пакет 912 SPLHPPP. Как изображено, пакет 910 FPPP распределяет биты для параметров выравнивания полосы. Когда пакет 910 FPPP конвертируется в пакет 912 SPLHPPP, биты, распределенные для выравнивания полосы, могут быть отброшены. Другими словами, пакет 912 SPLHPPP передается на декодер без этих битов. Общее количество передаваемых на декодер битов может быть сокращено со 171 до 80. В одной конфигурации биты, распределенные для параметров амплитуды и глобального выравнивания, включаются в пакет 912 SPLHPPP. Параметр амплитуды может указать амплитуду спектра сигнала 310 s(n), а параметр глобального выравнивания, как было упомянуто ранее, может представить линейный фазовый сдвиг, который может гарантировать максимальное выравнивание. В одном аспекте весь сигнал 310 s(n) находится в частотном диапазоне от 50 Гц до 4 кГц.

Кроме того, пакеты 908 SPLHCELP, пакеты 912 SPLHPPP и пакеты 916 SPLHNELP могут включать в себя биты, распределенные для параметра недопустимой задержки. Параметр недопустимой задержки может представлять собой специальный идентификатор, который позволяет декодеру распознавать пакеты 908 SPLHCELP и пакеты 912 SPLHPPP в качестве пакетов, которые были конвертированы из полноскоростных в полускоростные после кодирования, или же в качестве полускоростного кадра, включающего в себя кадр NELP.

Различные конфигурации иллюстрированы в настоящем документе с использованием различного количества битов для различных параметров и пакетов. В настоящем документе конкретное количество битов, соответствующих каждому параметру, является иллюстративным, и не предназначено для ограничения. Параметры могут включать в себя большее или меньшее количество битов, сравнительно с примерами, использованными в настоящем документе.

Фиг.10 изображает блок-схему, иллюстрирующую конвертацию полноскоростного пакета 1002 прототипного периода основного тона (РРР) в специальный полускоростной пакет 1020 PPP (SPLHPPP). Конвертация может быть реализована посредством функции 1008 IWF. Пакет 1002 FPPP может включать в себя несколько параметров, которые соответствуют определенному количеству битов. Параметры, включенные в пакет 1002 FPPP, могут включать в себя режимный бит 1004, которому может быть распределен один бит, пары спектральных линий 1006 (LSP), которым может быть распределено 28 битов, задержку 1010 основного тона, которой может быть распределено 7 битов, амплитуду 1012, которой может быть распределено 28 битов, глобальное выравнивание 1014, которому может быть распределено 7 битов, выравнивание 1016 полосы, которому может быть распределено 99 битов и зарезервированный параметр 1018, которому может быть распределен 1 бит. В одном аспекте пакет 1002 FPPP включает в себя в общей сложности 171 бит.

Функция 1008 IWF может конвертировать пакет 1002 FPPP в пакет 1020 SPLHPPP, как обсуждалось ранее. После конвертации пакет 1020 SPLHPPP может включать в себя в общей сложности 80 битов. Функция 1008 IWF может отбросить биты, распределенные выравниванию 1016 полосы. Кроме того, функция 1008 IWF может включать специальный полускоростной идентификатор 1022 (ID) в пакет 1020 SPLHPPP, которому может быть распределено 2 бита. Кроме того, функция 1008 IWF может включать идентификатор 1024 недопустимой задержки в пакет 1020 SPLHPPP, который может служить в качестве специального идентификатора пакета. Идентификатору 1024 недопустимой задержки может быть распределено 7 бит, а также он может позволить декодеру распознать пакет в качестве пакета, который был конвертирован из пакета 1002 FPPP в пакет 1020 SPLHPPP. В дополнительной конфигурации 7 бит, распределенных идентификатору 1024 недопустимой задержки, могут представлять значение в диапазоне от 101 до 127. Кроме того, функция 1008 IWF может включать в себя дополнительную задержку, которой может быть распределено 7 бит. Это может являться задержкой основного тона, приходящей из пакета FPPP.

Несмотря на то, что иллюстрированный на фиг.10 пример включает в себя конвертацию пакета 1002 FPPP в пакет 1020 SPLHPPP, следует понимать, что полноскоростной пакет с линейным предсказанием с кодовым возбуждением (FCELP) также может быть конвертирован в специальный полускоростной пакет CELP (SPLHCELP). Конвертация из пакета FCELP в пакет SPLHCELP может быть выполнена способом, подобным описанному со ссылкой на конвертацию пакета FPPP в пакет SPLHPPP. Пакет FCELP может включать в себя 171 бит, а пакет SPLHCELP может включать в себя 80 битов.

Фиг.11 изображает блок-схему конкретных компонентов в примере аппарата 1102 связи. В изображенном на фиг.11 примере аппарат 1102 связи может являться базовой станцией и/или мобильной станцией. Настоящие системы и способы могут быть реализованы в аппарате связи.

Как изображено, аппарат 1102 может включать в себя процессор 1160, который управляет работой аппарата 1102. Память 1162, которая может включать в себя как постоянную память (ROM), так и оперативную память (RAM), может передать команды и данные на процессор 1160. Часть памяти 1162 также может включать в себя энергонезависимую оперативную память (NVRAM).

Аппарат 1102 также может включать в себя передатчик 1164 и приемник 1166 для приема и передачи данных 220 между аппаратом 1102 и удаленным местоположением, таким как контроллер площадки базовых станций или мобильная станция 102. Передатчик 1164 и приемник 1166 могут быть объединены в приемопередатчик 1168. Антенна 1170 электрически соединяется с приемопередатчиком 1168.

Аппарат 1102 также может включать в себя детектор 1172 сигналов, используемый для обнаружения и количественного определения уровня сигналов, принятых посредством приемопередатчика 1168. Детектор 1172 сигналов обнаруживает такие сигналы, как полная энергия, энергия пилота каждого псевдошумового (PN) элемента, спектральная плотность мощности и другие сигналы. Аппарат 1102 также может включать в себя блок 1176 определения пакетов, используемый для определения того, какие пакеты должны быть конвертированы из полноскоростного пакета в специальный полускоростной пакет.

Различные компоненты аппарата 1102 соединяются друг с другом посредством магистральной системы 1178, которая может включать в себя шину питания, шину управляющих сигналов и шину сигналов состояния, в дополнение к шине данных. Однако, для ясности, различные шины иллюстрированы на фиг.11 в качестве системы 1178 шин.

Информация и сигналы могут быть переданы с использованием любой технологии и способа из множества различных технологий и способов. Например, данные, команды, информация, сигналы, биты, символы и элементы сигнала, которые упоминаются по всему вышеупомянутому описанию, могут быть представлены посредством напряжения, токов, электромагнитных волн, магнитных полей или частиц, оптических полей или частиц, или посредством любой их комбинации.

Различные иллюстративные логические блоки, модули, схемы и этапы алгоритма, описанные в связи с раскрытыми в настоящем документе конфигурациями, могут быть реализованы в качестве электронных аппаратных средств, программного обеспечения или посредством их комбинации. Для ясной иллюстрации этой взаимозаменяемости аппаратных средств и программного обеспечения различные иллюстративные компоненты, блоки, модули, схемы и этапы описывались выше в контексте их функциональных возможностей. Вариант реализации функциональных возможностей, то есть в качестве аппаратных средств или в качестве программного обеспечения, зависит от конкретной области применения и конструктивных ограничений, наложенных на всю систему. Специалисты в данной области техники могут реализовать описанные функциональные возможности различными способами для каждой конкретной области применения, но такие варианты реализации не должны интерпретироваться в качестве выходящих за пределы объема настоящих систем и способов.

Различные иллюстративные логические блоки, модули и схемы, описанные в связи с раскрытыми в настоящем документе конфигурациями, могут быть реализованы или выполнены с помощью универсального процессора, цифрового сигнального процессора (DSP), специализированной интегральной микросхемы (ASIC), логической матрицы с эксплуатационным программированием (FPGA) или другого программируемого логического аппарата, логического элемента на дискретных компонентах или транзисторной логики, дискретных компонентов аппаратных средств, или посредством любой их комбинации, разработанной для выполнения функций, описанных в настоящем документе. Универсальный процессор может являться микропроцессором, но в альтернативе процессор может являться любым обычным процессором, контроллером, микроконтроллером или конечным автоматом. Процессор также может быть реализован в качестве комбинации вычислительных аппаратов, например в качестве комбинации процессора DSP и микропроцессора, множества микропроцессоров, одного или нескольких микропроцессоров во взаимодействии с ядром процессора DSP, или с помощью любой другой подобной конфигурации.

Этапы способа или алгоритма, описанные в связи с раскрытой в настоящем документе конфигурацией, могут быть воплощены непосредственно в аппаратных средствах, в программном модуле, выполняемом посредством процессора, или в их комбинации. Программный модуль может постоянно находиться в памяти RAM, во флэш-памяти, в памяти ROM, в стираемой программируемой постоянной памяти (EPROM), в электрически стираемой программируемой постоянной памяти (EEPROM), в регистрах, на жестком диске, на сменном диске, в постоянной памяти компакт-диска (CD-ROM) или в любой другой форме, известной в уровне техники информационных носителей. Информационный носитель может быть соединен с процессором таким образом, чтобы процессор мог считать информацию с информационного носителя, а также записать информацию на него. В альтернативе информационный носитель может являться неотъемлемой частью процессора. Процессор и информационный носитель могут постоянно находиться в микросхеме ASIC. Микросхема ASIC может постоянно находиться в пользовательском терминале. В альтернативе процессор и информационный носитель могут постоянно находиться в пользовательском терминале в качестве дискретных компонентов.

Раскрытые в настоящем документе способы содержат один или несколько этапов или действий для достижения результата описанного способа. Этапы и/или действия способа могут меняться друг с другом местами, не выходя за пределы объема настоящих систем и способов. Другими словами, если определенный порядок этапов или действий не определен для надлежащей операции конфигурации, то порядок и/или использование определенных этапов и/или действий может быть изменен, не выходя за пределы объема настоящих систем и способов. Раскрытые в настоящем документе способы могут быть реализованы в аппаратных средствах, программном обеспечении или в их комбинации. Примеры аппаратных средств и памяти могут включать в себя память RAM, память ROM, память EPROM, память EEPROM, флэш-память, оптический диск, регистры, жесткий диск, сменный диск, диск CD-ROM или любые другие типы аппаратных средств и памяти.

Несмотря на то, что были иллюстрированы и описаны определенные конфигурации и области применения настоящих систем и способов, следует подразумевать, что системы и способы не ограничиваются точной конфигурацией и компонентами, раскрытыми в настоящем документе. Различные модификации, изменения и замены, которые будут очевидны специалистам в данной области техники, могут быть сделаны в структуре, операции и деталях способов и систем, раскрытых в настоящем документе, не выходя за пределы сущности и объема заявленных систем и способов.

1. Способ затенения первого пакета, соответствующего первой битовой скорости, во втором пакете, соответствующем второй битовой скорости, содержащий этапы, на которых:
принимают первый пакет;
анализируют первый пакет для определения первой битовой скорости, соответствующей первому пакету;
отбрасывают из первого пакета биты, соответствующие, по меньшей мере, одному параметру;
упаковывают на базовой станции оставшиеся биты, соответствующие одному или более параметрам, и специальный идентификатор во второй пакет, соответствующий второй битовой скорости, причем специальный идентификатор является недопустимым значением параметра за пределами диапазона допустимых значений для одного из параметров, причем недопустимое значение параметра указывает, что второй пакет является специальным типом полускоростного пакета; и
передают второй пакет.

2. Способ по п.1, в котором первый пакет является полноскоростным пакетом прототипного периода основного тона (РРР).

3. Способ по п.1, дополнительно содержащий конвертирование полноскоростного пакета прототипного периода основного тона (РРР) в специальный полускоростной пакет РРР.

4. Способ по п.3, в котором отбрасывают биты и оставшиеся биты упаковывают во второй пакет в ответ на определение, что требуется дополнительная пропускная способность сети.

5. Способ по п.1, в котором первый пакет является полноскоростным пакетом с линейным предсказанием с кодовым возбуждением (CELP).

6. Способ по п.1, дополнительно содержащий конвертирование полноскоростного пакета с линейным предсказанием с кодовым возбуждением (CELP в специальный полускоростной пакет CELP).

7. Способ по п.1, дополнительно содержащий передачу второго пакета с первой базовой станции на вторую базовую станцию.

8. Способ по п.1, дополнительно содержащий передачу второго пакета с первой базовой станции на мобильную станцию.

9. Устройство для затенения первого пакета, соответствующего первой битовой скорости, во втором пакете, соответствующем второй битовой скорости, содержащее:
процессор;
память, находящуюся в электронной связи с процессором;
команды, сохраненные в памяти, причем команды являются выполнимыми для:
приема первого пакета;
анализа первого пакета для определения первой битовой скорости, соответствующей первому пакету;
отбрасывания из первого пакета битов, соответствующих, по меньшей мере, одному параметру;
упаковки на базовой станции оставшихся битов, соответствующих одному или нескольким параметрам, и специального идентификатора во второй пакет, соответствующий второй битовой скорости, причем специальный идентификатор является недопустимым значением параметра за пределами диапазона допустимых значений для одного из параметров, причем недопустимое значение параметра указывает, что второй пакет является специальным типом полускоростного пакета; и передачи второго пакета.

10. Устройство по п.9, в котором первый пакет является полноскоростным пакетом прототипного периода основного тона (РРР).

11. Устройство по п.9, в котором команды являются дополнительно выполнимыми для конвертирования полноскоростного пакета прототипного периода основного тона (РРР) в специальный полускоростной пакет РРР.

12. Устройство по п.14, в котором отбрасывают биты, и оставшиеся биты упаковывают во второй пакет в ответ на определение, что требуется дополнительная пропускная способность сети.

13. Устройство по п.9, в котором первый пакет является полноскоростным пакетом с линейным предсказанием с кодовым возбуждением (CELP).

14. Устройство по п.9, в котором команды являются дополнительно выполнимыми для конвертирования полноскоростного пакета с линейным предсказанием с кодовым возбуждением (CELP) в специальный полускоростной пакет CELP.

15. Система, сконфигурированная с возможностью затенения первого пакета, соответствующего первой битовой скорости, во втором пакете, соответствующем второй битовой скорости, включающая в себя:
средство для обработки;
средство для приема первого пакета;
средство для анализа первого пакета для определения первой битовой скорости, соответствующей первому пакету;
средство для отбрасывания из первого пакета битов, соответствующих, по меньшей мере, одному параметру;
средство для упаковки на базовой станции оставшихся битов, соответствующих одному или нескольким параметрам, и специального идентификатора во второй пакет, соответствующий второй битовой скорости, причем специальный идентификатор является недопустимым значением параметра за пределами диапазона допустимых значений для одного из параметров, причем недопустимое значение параметра указывает, что второй пакет является специальным типом полускоростного пакета; и
средство для передачи второго пакета.

16. Машиночитаемый носитель, сконфигурированный с возможностью сохранения набора команд, выполнимых для:
приема первого пакета;
анализа первого пакета для определения первой битовой скорости, соответствующей первому пакету;
отбрасывания из первого пакета битов, соответствующих, по меньшей мере, одному параметру;
упаковки на базовой станции оставшихся битов, соответствующих одному или нескольким параметрам, и специального идентификатора во второй пакет, соответствующий второй битовой скорости, причем специальный идентификатор является недопустимым значением параметра за пределами диапазона допустимых значений для одного из параметров, причем недопустимое значение параметра указывает, что второй пакет является специальным типом полускоростного пакета; и
передачи второго пакета.

17. Способ декодирования пакета, включающий в себя этапы, на которых:
принимают пакет;
считывают специальный идентификатор, включенный в пакет, причем специальный идентификатор является недопустимым значением параметра за пределами диапазона допустимых значений для одного из параметров, причем недопустимое значение параметра указывает, что второй пакет является специальным типом полускоростного пакета; и
обнаруживают, что пакет был затенен из первого пакета, соответствующего первой битовой скорости, во втором пакете, соответствующем второй битовой скорости, причем затенение выполняют на базовой станции; и
выбирают режим декодирования для пакета.

18. Способ затенения пакета из полноскоростного в полускоростном, включающий в себя этапы, на которых:
принимают полноскоростной пакет;
затеняют полноскоростной пакет в полускоростном пакете посредством отбрасывания битов, соответствующих параметру, из полноскоростного пакета, причем затенение выполняют на базовой станции; и
упаковывают в полускоростной пакет биты, соответствующие сигнальной информации, и специальный идентификатор, причем специальный идентификатор является недопустимым значением параметра за пределами диапазона допустимых значений для одного из параметров, причем недопустимое значение параметра указывает, что второй пакет является специальным типом полускоростного пакета; и
передают полускоростной пакет на декодер.

19. Способ затенения первого пакета, соответствующего первой битовой скорости, во втором пакете, соответствующем второй битовой скорости, содержащий этапы, на которых:
принимают первый пакет;
анализируют первый пакет для определения первой битовой скорости, соответствующей первому пакету;
отбрасывают из первого пакета биты, соответствующие, по меньшей мере, одному параметру, причем, по меньшей мере, один параметр содержит одно из: фиксированный индекс кодовой книги, фиксированный коэффициент кодовой книги, задержку дельта, выравнивание полосы, пару спектральных линий, адаптивный коэффициент кодовой книги, задержку основного тона, информацию режима битов, амплитуду и глобальное выравнивание;
упаковывают оставшиеся биты, соответствующие одному или более параметрам, и специальный идентификатор во второй пакет, соответствующий второй битовой скорости, причем специальный идентификатор является недопустимым значением параметра за пределами диапазона допустимых значений для одного из параметров, причем недопустимое значение параметра указывает, что второй пакет является специальным типом полускоростного пакета; и
передают второй пакет.

20. Способ по п.3, в котором отбрасывают биты, и оставшиеся биты упаковывают во второй пакет в ответ на определение, что требуется дополнительная пропускная способность сети.

21. Устройство для затенения первого пакета, соответствующего первой битовой скорости, во втором пакете, соответствующем второй битовой скорости, содержащее:
процессор;
память, находящуюся в электронной связи с процессором;
команды, сохраненные в памяти, причем команды являются выполнимыми для:
приема первого пакета;
анализа первого пакета для определения первой битовой скорости, соответствующей первому пакету;
отбрасывания из первого пакета битов, соответствующих, по меньшей мере, одному параметру;
упаковки оставшихся битов, соответствующих одному или нескольким параметрам, и специального идентификатора во второй пакет, соответствующий второй битовой скорости, причем специальный идентификатор является недопустимым значением параметра за пределами диапазона допустимых значений для одного из параметров, причем недопустимое значение параметра указывает, что второй пакет является специальным типом полускоростного пакета, причем, по меньшей мере, один параметр содержит одно из: фиксированный индекс кодовой книги, фиксированный коэффициент кодовой книги, задержку дельта, выравнивание полосы, пару спектральных линий, адаптивный коэффициент кодовой книги, задержку основного тона, информацию режима битов, амплитуду и глобальное выравнивание; и
передачи второго пакета.

22. Устройство по п.21, в котором отбрасывают биты, и оставшиеся биты упаковывают во второй пакет в ответ на определение, что требуется дополнительная пропускная способность сети.



 

Похожие патенты:

Изобретение относится к кодированию и декодированию звуковых сигналов с использованием спектральных данных сигнала. .

Изобретение относится к аудиопроцессору и способу для цифровой обработки звукового сигнала в последовательность фреймов посредством дискретизации и повторной дискретизации сигнала в зависимости от частоты основного тона.

Изобретение относится к параметрическим многоканальным декодерам типа стереодекодера, в частности к устройствам и способам для синтезирования звука, который может быть представлен наборами параметров, каждый из которых содержит характеристики синусоид, представляющие синусоидальные составляющие звука, и характеристики, представляющие другие компоненты.

Изобретение относится к банку фильтров анализа, банку фильтров синтеза и системам, включающим в себя любой из вышеупомянутых банков фильтров, которые могут быть применены, например, в современном аудиокодировании, аудиодекодировании или иных областях, связанных с трансляцией звуковых сигналов.

Изобретение относится к обработке аудио- или видеосигналов и, в частности, к банкам фильтров для преобразования сигнала в спектральное представление. .

Изобретение относится к технике цифровой обработки сигналов и может быть использовано в системах сжатия звуковых сигналов. .

Изобретение относится к способам передачи и хранения цифровых звуковых сигналов, в частности, к способам двоичного кодирования показателей квантования, определяющих огибающую сигнала.

Изобретение относится к аудиодекодированию и в особенности к декодированию сигналов MPEG Surround. .

Изобретение относится к технологии обработки речевых сигналов, в частности система и способы относятся к изменению окна с кадром, ассоциированным с аудио сигналом.

Изобретение относится к кодерам и декодерам, в частности, к реализации набора фильтров для перспективного аудиокодирования (ААС) и усовершенствованного с низкой задержкой (ELD) ААС

Изобретение относится к кодированию данных для случаев, когда различные характеристики данных, подлежащих кодированию, используются для кодирования скоростей, как, например, в видео- и звуковом кодировании

Изобретение относится к кодерам и декодерам, в частности к эффективному способу кодирования спектра модифицированного дискретного косинусного преобразования (MDCT) как части масштабируемого речевого и аудиокодека

Изобретение относится к индексации входного вектора, содержащегося в наборе векторов, входящем в множество наборов векторов

Изобретение относится к способам обработки цифровых сигналов, в частности к сжатию сигнала и передаче огибающей спектра

Изобретение относится к устройствам и способам кодирования и декодирования, используемым в системе связи, в которой сообщение кодируется и передается и принимается и декодируется

Изобретение относится к устройству и способу кодирования, используемым в системе связи, которая кодирует и передает входные сигналы, например, речевые сигналы

Изобретение относится к устройствам для микширования множества входных потоков данных для получения потока данных, которые могут применяться, например, в области систем конференц-связи, включая системы видео- и телеконференций
Наверх