Способ и устройство, предназначенные для эффективной передачи сигналов размерности и пачки в полосе частот и работы с максимальной половинной скоростью при широкополосном кодировании речи с переменной скоростью передачи битов для беспроводных систем мдкр



Способ и устройство, предназначенные для эффективной передачи сигналов размерности и пачки в полосе частот и работы с максимальной половинной скоростью при широкополосном кодировании речи с переменной скоростью передачи битов для беспроводных систем мдкр
Способ и устройство, предназначенные для эффективной передачи сигналов размерности и пачки в полосе частот и работы с максимальной половинной скоростью при широкополосном кодировании речи с переменной скоростью передачи битов для беспроводных систем мдкр
Способ и устройство, предназначенные для эффективной передачи сигналов размерности и пачки в полосе частот и работы с максимальной половинной скоростью при широкополосном кодировании речи с переменной скоростью передачи битов для беспроводных систем мдкр
Способ и устройство, предназначенные для эффективной передачи сигналов размерности и пачки в полосе частот и работы с максимальной половинной скоростью при широкополосном кодировании речи с переменной скоростью передачи битов для беспроводных систем мдкр
Способ и устройство, предназначенные для эффективной передачи сигналов размерности и пачки в полосе частот и работы с максимальной половинной скоростью при широкополосном кодировании речи с переменной скоростью передачи битов для беспроводных систем мдкр
Способ и устройство, предназначенные для эффективной передачи сигналов размерности и пачки в полосе частот и работы с максимальной половинной скоростью при широкополосном кодировании речи с переменной скоростью передачи битов для беспроводных систем мдкр
Способ и устройство, предназначенные для эффективной передачи сигналов размерности и пачки в полосе частот и работы с максимальной половинной скоростью при широкополосном кодировании речи с переменной скоростью передачи битов для беспроводных систем мдкр
Способ и устройство, предназначенные для эффективной передачи сигналов размерности и пачки в полосе частот и работы с максимальной половинной скоростью при широкополосном кодировании речи с переменной скоростью передачи битов для беспроводных систем мдкр

 


Владельцы патента RU 2461897:

НОКИА КОРПОРЕЙШН (FI)

Изобретение относится к радиосвязи и предназначено для взаимодействия первой станции, использующей первую схему связи, со второй станцией, использующей вторую схему связи. Связь между первой и второй станциями осуществляют с помощью передачи параметров кодирования сигнала, связанных со звуковым сигналом. Звуковой сигнал классифицируют для определения, должны ли быть переданы параметры кодирования сигнала из одной станции в другую станцию с использованием первого режима связи, в котором используется полная скорость передачи для передачи параметров кодирования сигнала. Если классификация звукового сигнала определит, что параметры кодирования сигнала должны быть переданы с использованием первого режима связи, и, если принят запрос для передачи параметров кодирования сигнала из одной станции в другую станцию с использованием второго режима связи, предназначенного для уменьшения скорости передачи во время передачи параметров кодирования сигнала, часть параметров кодирования сигнала из одной станции удаляют, а остальные параметры кодирования сигнала передают в другую станцию с использованием второго режима связи. Удаленную часть параметров кодирования сигнала регенерируют перед тем, как другая станция декодирует параметры кодирования сигнала. Технический результат - повышение достоверности передачи. 6 н. и 11 з.п. ф-лы, 6 табл., 8 ил.

 

Область техники, к которой относится изобретение

Настоящее изобретение относится к способу, предназначенному для взаимодействия первой станции, использующей первую схему связи, и содержащей первый кодер и первый декодер, со второй станцией, использующей вторую схему связи, и содержащей второй кодер и второй декодер, причем связь между первой и второй станциями проводится с помощью передачи параметров кодирования сигнала из кодера одной из станций первой или второй в декодер другой из упомянутых первой и второй станций.

Уровень техники

Требование эффективных способов цифрового узкополосного и широкополосного кодирования речи с хорошим компромиссом между субъективным качеством и скоростью передачи увеличивается в различных областях применений, таких как проведение телеконференций, передача мультимедиа и беспроводная связь. До сих пор телефонная полоса частот, ограниченная в диапазоне 200-3400 Гц, в основном используется в применениях кодирования речи. Однако широкополосные применения речи обеспечивают увеличенную разборчивость и естественность в связи по сравнению с традиционной телефонной полосой частот. Полоса частот в диапазоне 50-7000 Гц обнаружена достаточной для передачи хорошего качества, создавая впечатление личной связи. Для обычных аудиосигналов эта полоса частот дает приемлемое субъективное качество, но, все же, ниже, чем качество радио FM или CD, которые работают в диапазонах 20-16000 Гц и 20-20000 Гц, соответственно.

Кодер речи преобразует речевой сигнал в цифровой битовый поток, который передается через канал связи или запоминается на носителе информации. Речевой сигнал преобразуется в цифровую форму, то есть подвергается выборке и квантуется, обычно с частотой 16 битов на выборку. Кодер речи имеет функцию представления этих цифровых выборок с помощью меньшего числа бит, в то же время поддерживая хорошее субъективное качество речи. Декодер или синтезатор речи работает относительно переданного или запомненного битового потока и преобразует его обратно в речевой сигнал.

Кодирование с линейным предсказанием с кодовым возбуждением (CELP, ЛПКВ) является одним из самых лучших способов предшествующего уровня техники для достижения хорошего компромисса между субъективным качеством и скоростью передачи. Этот способ кодирования составляет основу нескольких стандартов кодирования речи, как в беспроводных, так и в проводных применениях. При кодировании ЛПКВ выборочный сигнал обрабатывается в последовательных блоках из N выборок, обычно называемых кадрами, где N является заданным числом, обычно соответствующим 10-30 мс. Фильтр линейного предсказания (LP, ЛП) вычисляется и передается каждый кадр. Вычисление фильтра ЛП обычно требует просмотра вперед, т.е. речевого сегмента 5-15 мс от следующего кадра. Кадр из N выборок разделяется на меньшие блоки, называемые подкадрами. Обычно число подкадров в кадре равно трем (3) или четырем (4), в результате получаются подкадры 4-10 мс. В каждом подкадре сигнал возбуждения обычно получается из двух составляющих, прошлое возбуждение и новое возбуждение фиксированной кодовой книги. Составляющая, сформированная из прошлого возбуждения, часто называется возбуждением адаптивной кодовой книги или основного тона. Параметры, характеризующие сигнал возбуждения, кодируются и передаются в декодер, где восстановленный сигнал возбуждения используется в качестве входного сигнала фильтра ЛП.

В беспроводных системах, использующих технологию множественного доступа с кодовым разделением каналов (CDMA, МДКР), использование кодирования речи с управляемой источником переменной скоростью передачи (VBR, ПерСП) существенно улучшает пропускную способность системы. При кодировании с управляемой источником ПерСП кодек работает с несколькими скоростями передачи битов, и модуль выбора скорости передачи используется для выбора скорости передачи битов, используемой для кодирования каждого речевого кадра, на основании характера речевого кадра (например, звонкий (вокализированный), незвонкий (невокализированный, переходный, фоновый шум и т.д.)). Целью является добиться наилучшего качества речи при данной средней скорости передачи битов, также называемой средней скоростью передачи данных (ADR, ССПД). Кодек может работать в разных режимах с помощью настройки модуля выбора скорости передачи, чтобы добиться разных ССПД в разных режимах, причем производительность кодека улучшается с увеличением ССПД. Это обеспечивает кодек механизмом компромисса между качеством речи и пропускной способностью системы. В системах МДКР (например, CDMA-оne и CDMA2000) обычно используются 4 скорости передачи битов, и они называются полной скоростью передачи (FR, ПолнСП), половинной скоростью передачи (HR, ПолСП), одной четвертой скорости передачи (QR, ОЧСП) и одной восьмой скорости передачи (ER, ОВСП). В этой системе поддерживаются два множества скоростей, называемые множеством I скорости и множеством II скорости. В множестве II скорости кодек с переменной скоростью передачи с механизмом выбора скорости передачи работает со скоростями кодирования источника, равными 13,3 (ПолнСП), 6,2 (ПолСП), 2,7 (ОЧСП) и 1,0 (ОВСП) Кбит/с, соответствующими совокупным скоростям передачи битов, равным 14,4, 7,2, 3,6 и 1,8 Кбит/с (с некоторыми битами, добавленными для обнаружения ошибок).

В системах МДКР может быть навязана половинная скорость передачи вместо полной скорости передачи в некоторых речевых кадрах, для того, чтобы посылать сигнальную информацию в полосе частот (называемую передачей сигналов размерности и пачки). Использование половинной скорости передачи в качестве максимальной скорости передачи также может быть навязано системой во время плохих состояний канала (таких как вблизи границ ячеек), для того, чтобы улучшить надежность кодека. Это называется максимальной половинной скоростью передачи. Обычно при кодировании с ПерСП половинная скорость используется, когда кадр является постоянно звонким или постоянно незвонким. Две конструкции кодека используются для каждого типа сигнала (в случае незвонкого сигнала используется модель ЛПКВ без кодовой книги основного тона, а в случае звонкой речи используется модификация сигнала, чтобы улучшить периодичность и уменьшить число битов для индексов основного тона). Полная скорость используется для начальных, переходных кадров и смешанных звонких кадров (обычно используется типичная модель ЛПКВ). Когда модуль выбора скорости выбирает кадр, кодируемый как кадр с полной скоростью передачи, а система навязывает кадр с половинной скоростью передачи, эффективность речи ухудшается, поскольку режимы с половинной скоростью передачи не могут эффективно кодировать начальные и переходные сигналы.

Широкополосный кодек, известный как адаптивный многоскоростной широкополосный (AMR-WB, АМ-Ш) кодек речи, недавно был выбран организацией ITU-T (Международный союз электросвязи - сектор стандартизации электросвязи) для нескольких услуг широкополосной телефонии и услуг передачи речи, а организацией 3GPP (Проект партнерства третьего поколения) для беспроводных систем третьего поколения GSM и W-CDMA, Ш-МДКР. Кодек АМ-Ш содержит девять (9) скоростей передачи битов в диапазоне от 6,6 до 23,85 Кбит/с. Разработка кодека ПерСП, управляемого источником, на основе АМ-Ш для СDMA2000 имеет преимущество в предоставлении возможности взаимодействия между CDMA2000 и другими системами, использующими кодек АМ-Ш. Скорость передачи битов АМ-Ш 12,65 Кбит/с является ближайшей скоростью, которая подходит к полной скорости 13,3 Кбит/с множества II скорости. Эта скорость может быть использована в качестве общей скорости между широкополосным кодеком ПерСП CDMA2000 и АМ-Ш, чтобы обеспечить возможность функциональной совместимости без необходимости в преобразовании кодирования (которое ухудшает качество речи). Половинная скорость 6,2 Кбит/с должна быть добавлена к широкополосному решению ПерСП CDMA2000, чтобы обеспечить возможность эффективной работы в рамках множества II скорости. Тогда кодек может работать в нескольких специфических режимах CDMA2000, и содержит режим, предназначенный для обеспечения возможности функциональной совместимости с системами, использующими кодек АМ-Ш. Однако при работе кросс-системы без последовательного соединения каналов вызов между CDMA2000 и другой системой, использующей АМ-Ш, система CDMA2000 может навязать использование половинной скорости передачи, как объяснено ранее (такое как при передаче сигналов размерности и пачки). Поскольку кодек АМ-Ш не распознает половинную скорость 6,2 Кбит/с широкополосного кодека CDMA2000, навязанные кадры с половинной скоростью передачи интерпретируются как стертые кадры. Это отрицательно влияет на эффективность соединения.

Сущность изобретения

В соответствии с первым аспектом настоящего изобретения предложены:

Способ взаимодействия первой станции, использующей первую схему связи, и содержащей первый кодер и первый декодер, со второй станцией, использующей вторую схему связи, и содержащей второй кодер и второй декодер, причем связь между первой и второй станциями осуществляют с помощью передачи параметров кодирования сигнала из кодера одной из станций первой или второй в декодер другой из упомянутых первой и второй станций, заключающийся в том, что принимают запрос для передачи параметров кодирования сигнала из упомянутой одной станции в другую станцию с использованием режима связи, предназначенного для уменьшения скорости передачи битов во время передачи параметров кодирования сигнала; в ответ на запрос удаляют часть параметров кодирования сигнала из кодера упомянутой одной станции и передают в декодер другой станции остальные параметры кодирования сигнала; и регенерируют часть параметров кодирования сигнала, и декодируют в декодере другой станции параметры кодирования сигнала.

Система для взаимодействия первой станции, использующей первую схему связи, и содержащей первый кодер и первый декодер, со второй станцией, использующей вторую схему связи, и содержащей второй кодер и второй декодер, причем связь между первой и второй станциями осуществляется с помощью передачи параметров кодирования сигнала из кодера одной из станций первой или второй в декодер другой из упомянутых первой и второй станций, содержащая средство, предназначенное для приема запроса для передачи параметров кодирования сигнала из упомянутой одной станции в другую станцию с использованием режима связи, предназначенного для уменьшения скорости передачи битов во время передачи параметров кодирования сигнала; средство, предназначенное для удаления в ответ на запрос части параметров кодирования сигнала из кодера упомянутой одной станции и передачи в декодер другой станции остальных параметров кодирования сигнала; и средство, предназначенное для регенерации части параметров кодирования сигнала, и декодер другой станции, предназначенный для декодирования параметров кодирования сигнала.

В соответствии со вторым аспектом настоящего изобретения предложены:

Способ взаимодействия первой станции, использующей первую схему связи, и содержащей первый кодер и первый декодер, со второй станцией, использующей вторую схему связи, и содержащей второй кодер и второй декодер, причем связь между первой и второй станциями осуществляют с помощью передачи параметров кодирования сигнала, связанных со звуковым сигналом, из кодера одной из станций первой или второй в декодер другой из упомянутых первой и второй станций, заключающийся в том, что классифицируют звуковой сигнал для определения, должны ли быть переданы параметры кодирования сигнала из кодера упомянутой одной станции в декодер другой станции с использованием первого режима связи, в котором используют полную скорость передачи битов для передачи параметров кодирования сигнала; принимают запрос для передачи параметров кодирования сигнала из кодера упомянутой одной станции в декодер другой станции с использованием второго режима связи, предназначенного для уменьшения скорости передачи битов во время передачи параметров кодирования сигнала, если классификация звукового сигнала определяет, что параметры кодирования сигнала должны быть переданы с использованием первого режима связи, и если принят запрос для передачи параметров кодирования сигнала с использованием второго режима связи, удаляют часть параметров кодирования сигнала из кодера упомянутой одной станции, и передают в декодер другой станции остальные параметры кодирования сигнала с использованием второго режима связи.

Система для взаимодействия первой станции, использующей первую схему связи, и содержащей первый кодер и первый декодер, со второй станцией, использующей вторую схему связи, и содержащей второй кодер и второй декодер, причем связь между первой и второй станциями осуществляется с помощью передачи параметров кодирования сигнала, связанных со звуковым сигналом, из кодера одной из станций первой или второй в декодер другой из упомянутых первой и второй станций, содержащая средство, предназначенное для классификации звукового сигнала для определения, должны ли быть переданы параметры кодирования сигнала из кодера упомянутой одной станции в декодер другой станции с использованием первого режима связи, в котором используется полная скорость передачи битов для передачи параметров кодирования сигнала; средство, предназначенное для приема запроса для передачи параметров кодирования сигнала из кодера упомянутой одной станции в декодер другой станции с использованием второго режима связи, предназначенного для уменьшения скорости передачи битов во время передачи параметров кодирования сигнала; средство, предназначенное для удаления части параметров кодирования сигнала из кодера упомянутой одной станции и передачи в декодер другой станции остальных параметров кодирования сигнала с использованием второго режима связи, если классификация звукового сигнала определяет, что параметры кодирования сигнала должны быть переданы с использованием первого режима связи, и если принят запрос для передачи параметров кодирования сигнала с использованием второго режима связи.

В соответствии с третьим аспектом настоящего изобретения предложены:

Способ передачи параметров кодирования сигнала из первой станции во вторую станцию, заключающийся в том, что в одной из станций первой или второй кодируют звуковой сигнал в соответствии с режимом связи с полной скоростью передачи; принимают запрос для передачи параметров кодирования сигнала из упомянутой одной станции в другую станцию из первой и второй станций с использованием второго режима связи, предназначенного для уменьшения скорости передачи битов во время передачи параметров кодирования сигнала; в ответ на запрос преобразуют параметры кодирования сигнала, закодированные в режиме связи с полной скоростью передачи, в параметры кодирования сигнала, закодированные во втором режиме связи; и передают параметры кодирования сигнала, закодированные во втором режиме связи, в другую станцию из первой и второй станций.

Система для передачи параметров кодирования сигнала из первой станции во вторую станцию, содержащая в одной из станций первой или второй кодер, предназначенный для кодирования звукового сигнала в соответствии с режимом связи с полной скоростью передачи; средство, предназначенное для приема запроса для передачи параметров кодирования сигнала из упомянутой одной станции в другую станцию из первой и второй станций с использованием второго режима связи, предназначенного для уменьшения скорости передачи битов во время передачи параметров кодирования сигнала; средство, предназначенное для преобразования, в ответ на запрос, параметров кодирования сигнала, закодированных в режиме связи с полной скоростью передачи, в параметры кодирования сигнала, закодированные во втором режиме связи; и средство, предназначенное для передачи параметров кодирования сигнала, закодированных во втором режиме связи, в другую станцию из первой и второй станций.

Вышеупомянутые и другие задачи, преимущества и признаки настоящего изобретения станут более понятными после чтения следующего неограничительного описания его иллюстративных вариантов осуществления, приведенных только в качестве примера, со ссылкой на сопровождающие чертежи.

Краткое описание чертежей

Фиг.1 представляет схематическую блок-схему неограничительного примера системы передачи речи, в которой может быть использовано настоящее изобретение;

фиг.2 представляет функциональную блок-схему неограничительного примера кодека с переменной скоростью передачи, содержащего логические схемы определения скорости;

фиг.3 представляет функциональную блок-схему неограничительного примера кодека с переменной скоростью передачи, включающего в себя логические схемы определения скорости, использующие общую ПолСП для кадров низкой мощности;

фиг.4 представляет функциональную блок-схему неограничительного примера кодека с переменной скоростью передачи, в соответствии с фиг.3, включающего в себя системный запрос половинной скорости передачи в логических схемах определения скорости;

фиг.5 представляет функциональную блок-схему примера кодека с переменной скоростью передачи в соответствии с неограничительным иллюстративным вариантом осуществления настоящего изобретения, включающего в себя системный запрос половинной скорости передачи на пакетном уровне (или уровне битового потока) в логических схемах определения скорости;

фиг.6 представляет пример конфигурации для способа передачи сигналов размерности и пачки в соответствии с неограничительным иллюстративным вариантом осуществления настоящего изобретения в функционально совместимом режиме VBR-WB, Ш-ПерСП при участии в вызове между мобильной станцией и мобильной станцией 3GPP - CDMA2000 или в вызове IP АМ-Ш - Ш-ПерСП;

фиг.7 представляет схематическую блок-схему неограничительного примера широкополосного устройства кодирования, более конкретно кодера АМ-Ш; и

фиг.8 представляет схематическую блок-схему неограничительного примера широкополосного устройства декодирования, более конкретно декодера АМ-Ш.

Подробное описание иллюстративного варианта осуществления

Несмотря на то, что иллюстративный вариант осуществления настоящего изобретения будет описан в следующем описании в связи с речевым сигналом, следует иметь в виду, что концепции настоящего изобретения также применяются к другим типам сигналов, в частности, но не исключительно, к другим типам звуковых сигналов.

Фиг.1 иллюстрирует систему 100 передачи речи, изображающую использование устройств кодирования и декодирования речи. Система 100 передачи речи фиг.1 поддерживает передачу речевых сигналов через канал 101 связи. Несмотря на то, что он может содержать, например, проводную, оптическую линию связи или волоконно-оптическую линию связи, канал 101 связи обычно содержит, по меньшей мере, частично, радиочастотную линию связи. Радиочастотная линия связи часто поддерживает множество одновременных передач речи, требующих совместно используемых ресурсов полосы частот, таких, которые могут быть обнаружены с помощью систем сотовой телефонии. Несмотря на то, что это не изображено, канал 101 связи может быть заменен запоминающим устройством в одной реализации устройства системы 100, которое записывает и запоминает закодированный речевой сигнал для последующего воспроизведения.

В системе 100 передачи речи фиг.1 микрофон 102 создает аналоговый речевой сигнал 103, который подается в аналого-цифровой (A/D, А/Ц) преобразователь 104 для преобразования его в цифровой речевой сигнал 105. Кодер 106 речи кодирует цифровой сигнал 105 для создания множества параметров 107 кодирования сигнала, которые кодируют в двоичном виде и передают в кодер 108 канала. Необязательный кодер 108 канала добавляет избыточность к двоичному представлению параметров 107 кодирования сигнала перед передачей их через канал 101 связи.

В приемнике декодер 109 канала использует избыточную информацию в принятом битовом потоке 111 для обнаружения и исправления ошибок канала, которые появились во время передачи. Декодер 110 речи преобразует битовый поток 112, принятый из декодера 109 канала, обратно в множество параметров кодирования сигнала и создает из восстановленных параметров кодирования сигнала цифровой синтезированный речевой сигнал 113. Цифровой синтезированный речевой сигнал 113, восстановленный в декодере 110 речи, преобразуется в аналоговую форму 114 с помощью цифроаналогового (D/А, Ц/А) преобразователя 115 и воспроизводится через устройство 116 громкоговорителя.

Кодирование речи с переменной скоростью передачи, управляемое источником

Фиг.2 изображает неограничительный пример конфигурации кодека с переменной скоростью передачи, включающей в себя логическую схему определения, предназначенную для управления четырьмя скоростями кодирования. В этом примере множество скоростей передачи битов содержит назначенную скорость передачи битов кодека для неактивных речевых кадров (модуль 208 кодирования одной восьмой скорости передачи (CNG, ГКШ)), скорость передачи битов для незвонких речевых кадров (модуль 207 кодирования половинной скорости передачи незвонких кадров), скорость передачи для стабильных звонких кадров (модуль 206 кодирования половинной скорости передачи звонких кадров) и скорость передачи битов для других типов кадров (модуль 205 кодирования полной скорости).

Логические схемы определения скорости основаны на классификации сигнала, выполняемого на трех этапах (201, 202 и 203) на основании кадра, работа которых хорошо известна обычным специалистам в данной области техники.

Сначала детектор речевой активности (VAD, ДРА) разделяет неактивные и активные речевые кадры. Если обнаружен неактивный речевой кадр (фоновый сигнал шума), тогда цепочка классификации сигнала заканчивается, и кадр кодируется в модуле 208 кодирования как кадр с одной восьмой скорости с помощью генератора комфортного шума (CNG, ГКШ) в декодере (1,0 Кбит/с в соответствии с множеством II скорости CDMA2000). Если обнаружен активный кадр, кадр подлежит второй классификации.

Второй классификатор 202 назначен для принятия решения относительно звучания. Если классификатор 202 классифицирует кадр как незвонкий речевой кадр, цепочка классификации заканчивается, и кадр кодируется в модуле 207 с половинной скоростью, оптимизированной для незвонких сигналов (6,2 Кбит/с в соответствии с множеством II скорости CDMA2000). В противном случае, речевой кадр обрабатывается посредством “стабильного звонкого” классификатора 203.

Если кадр классифицирован как стабильный звонкий кадр, тогда кадр кодируется в модуле 206 с половинной скоростью, оптимизированной для стабильных звонких сигналов (6,2 Кбит/с в соответствии с множеством II скорости CDMA2000). В противном случае кадр, вероятно, должен содержать нестационарный речевой сегмент, такой как звонкий начальный речевой сигнал или быстро изменяющийся звонкий речевой сигнал. Эти кадры обычно требуют высокую скорость передачи для поддержания хорошего субъективного качества. Следовательно, в этом случае речевой кадр кодируется в модуле 205 как кадр с полной скоростью передачи (13,3 Кбит/с в соответствии с множеством II скорости CDMA2000).

В неограничительной альтернативной реализации, изображенной на фиг.2, если кадр не классифицирован как “стабильный звонкий”, он обрабатывается посредством классификатора 311 кадров низкой энергии. Это используется для того, чтобы обнаружить кадры, не учтенные детектором 201 ДРА. Если энергия кадра ниже определенного порога, кадр кодируется с использованием кодера 312 общей половинной скорости, в противном случае кадр кодируется в модуле 205 как кадр с полной скоростью передачи.

Модули 201, 202, 203 и 311 классификации сигнала хорошо известны обычным специалистам в данной области техники и, таким образом, не будут дополнительно описаны в настоящем описании. В неограничительном примере фиг.3 модули кодирования с разными скоростями передачи, а именно модули 205, 206, 207, 208 и 312, основаны на способах кодирования с линейным предсказанием с кодовым возбуждением (ЛПКВ), также хорошо известных обычным специалистам в данной области техники. Например, скорости передачи установлены в соответствии с множеством II скорости системы CDMA2000, описанной в настоящем описании выше.

Неограничительный иллюстративный вариант осуществления настоящего изобретения описан в настоящей заявке со ссылкой на широкополосный кодек речи, который стандартизован международным союзом электросвязи (ITU) в качестве Рекомендации G.722.2, и известен как кодек АМ-Ш (адаптивный многоскоростной широкополосный кодек) [ITU Recommendation G.722.2 “Wideband coding of speech at around 16 kbit/s using Adaptive Multi-Rate Wideband (AMR-WB)”, Geneva, 2002]. Этот кодек также выбран Проектом партнерства третьего поколения (3GPP) для широкополосной телефонии в беспроводных системах третьего поколения [3GPP TS 26.190, “AMR Wideband Speech Codec: Transcoding Functions”, 3GPP Technical

Specification]. АМ-Ш может работать с 9-ью скоростями передачи от 6,6 до 23,85 Кбит/с. В настоящем описании используется скорость передачи 12,65 Кбит/с в качестве примера полной скорости.

Конечно, неограничительный иллюстративный вариант осуществления настоящего изобретения мог бы быть применен к другим типам кодеков.

Ради удобства читателя ниже в настоящем описании приведен обзор кодека АМ-Ш.

Обзор кодера АМ-Ш

Ссылаясь на фиг.7, выборочный речевой сигнал кодируется последовательно блок за блоком с помощью устройства 700 кодирования фиг.7, которое разбито на одиннадцать модулей, пронумерованных от 701 до 711.

Следовательно, входной речевой сигнал 712 обрабатывается последовательно блок за блоком, т.е. в упомянутых выше блоках L выборок, называемых кадрами.

Ссылаясь на фиг.7, выборочный входной речевой сигнал 712 подвергается выборке с понижением частоты в модуле 701 устройства выборки. Сигнал подвергается выборке с понижением частоты от 16 кГц до 12,8 кГц, с использованием способов, хорошо известных обычным специалистам в данной области техники. Выполнение выборки с понижением частоты увеличивает эффективность кодирования, поскольку кодируется меньшая ширина полосы частот. Это также уменьшает алгоритмическую сложность, поскольку уменьшается число выборок в кадре. После выполнения дискретизации с понижением частоты кадр из 320 выборок 20 мс уменьшается до кадра из 256 выборок (коэффициент выполнения дискретизации с понижением частоты 4/5).

Затем входной кадр подается в необязательный модуль 702 предварительной обработки. Модуль 702 предварительной обработки может состоять из фильтра верхних частот с частотой отсечки 50 Гц. Фильтр 702 верхних частот удаляет нежелательные звуковые составляющие ниже 50 Гц.

Дискретизированный с понижением частоты, предварительно обработанный сигнал обозначен с помощью Sp(n), n=0, 1, 2, …, L-1, где L - длина кадра (256 при частоте дискретизации 12,8 кГц). Этот сигнал Sp(n) предварительно выделяется с использованием фильтра 703 предварительного выделения, имеющего следующую передаточную функцию:

P(z)=1-µz-1,

где µ - коэффициент предварительного выделения с величиной, находящейся между 0 и 1 (типичная величина равна µ=0,7). Функцией фильтра 703 предварительного выделения является увеличение высокочастотных составляющих входного речевого сигнала. Он также уменьшает динамический диапазон входного речевого сигнала, что делает его более подходящим для реализации с фиксированной запятой. Предварительное выделение также играет важную роль в выполнении соответствующего взвешивания общего восприятия ошибки квантования, что способствует улучшенному качеству звука.

Выходной сигнал фильтра 703 предварительного выделения обозначен s(n). Этот сигнал используется для выполнения анализа ЛП в модуле 704. Анализ ЛП является способом, хорошо известным обычным специалистам в данной области техники. В примере фиг.7 используется подход автокорреляции. В подходе автокорреляции сигнал s(n) сначала стробируется, обычно с использованием окна Хэмминга, имеющего длительность порядка 30-40 мс. Автокорреляция вычисляется из стробированного сигнала, и используется рекурсия Левинсона-Дурбина для вычисления коэффициентов фильтра ЛП, ai, где i=1, …, p, и где p - порядок ЛП, который обычно равен 16 при широкополосном кодировании. Параметры ai являются коэффициентами передаточной функции A(z) фильтра ЛП, которая задается следующей зависимостью:

Анализ ЛП выполняется в модуле 704, который также выполняет квантование и интерполяцию коэффициентов фильтра ЛП. Коэффициенты фильтра ЛП сначала преобразуются в другую эквивалентную область, более подходящую для целей квантования и интерполяции. Области линейной спектральной пары (LSP, ЛСП) и спектральной пары иммитанса (ISP, СПИ) являются двумя областями, в которых может быть эффективно выполнено квантование и интерполяция. 16 коэффициентов фильтра ЛР ai могут быть квантованы с помощью числа бит порядка 30-50 бит с использованием раздельного или многоэтапного квантования или их комбинации. Целью интерполяции является дать возможность обновления коэффициентов фильтра ЛП в каждом подкадре, в то же время передавая их один раз в каждом кадре, что улучшает эффективность кодера, не увеличивая скорость передачи. Предполагается, что квантование и интерполяция коэффициентов фильтра ЛП в других отношениях хорошо знакомы обычным специалистам в данной области техники и, таким образом, не будут дополнительно описаны в настоящем описании.

Следующие параграфы будут описывать остальные операции кодирования, выполняемые на основе подкадров. Входной кадр разделяется на 4 подкадра, равные 5 мс (64 выборки с частотой дискретизации, равной 12,8 кГц). В следующем описании фильтр A(z) обозначает неквантованный интерполированный фильтр ЛП подкадра, а фильтр В(z) обозначает квантованный интерполированный фильтр ЛП подкадра. Фильтр В(z) подает каждый подкадр в мультиплексор 713 для передачи через канал связи.

В кодерах анализа с помощью синтеза поиск оптимального основного тона и новых параметров выполняется с помощью минимизации среднеквадратичной ошибки между входным речевым сигналом 712 и синтезированным речевым сигналом в области взвешенного восприятия. Взвешенный сигнал Sw(n) вычисляется в фильтре 705 взвешивания восприятия в ответ на сигнал S(n) из фильтра 703 предварительного выделения. Используется фильтр 705 взвешивания восприятия с фиксированным знаменателем, подходящий для широкополосных сигналов. Пример передаточной функции для фильтра 705 взвешивания восприятия задается следующей зависимостью:

W(z)=A(z/y1)/(1-y2z-1), где 0<y2<y1≤1

Для того, чтобы упростить анализ основного тона, сначала оценивается задержка TOL основного тона с открытым контуром в модуле 706 поиска основного тона с открытым контуром из взвешенного речевого сигнала Sw(n). Затем анализ основного тона с замкнутым контуром, который выполняется в модуле 707 поиска основного тона с замкнутым контуром на основе подкадров, ограничивается около задержки TOL основного тона с открытым контуром, что существенно уменьшает сложность параметров T (задержка основного тона) и b (усиление основного тона) LTP, ДП (долгосрочное предсказание). Анализ основного тона с открытым контуром обычно выполняется в модуле 706 один раз каждые 10 мс (два подкадра) с использованием способов, хорошо известных обычным специалистам в данной области техники.

Сначала вычисляется вектор x цели для ДП (долгосрочного предсказания). Это обычно выполняется с помощью вычитания нулевого входного отклика s0 взвешенного фильтра синтеза W(z)/В(z) из взвешенного речевого сигнала sw(n). Этот нулевой входной отклик s0 вычисляют с помощью устройства 708 вычисления нулевого входного отклика в ответ на фильтр ЛП квантованной интерполяции В(z) из анализа ЛП, модуля 704 квантования и интерполяции и на начальные состояния взвешенного фильтра синтеза W(z)/В(z), хранимого в модуле 711 обновления памяти, в ответ на фильтры НЧ A(z) и В(z) и вектор u возбуждения. Эта операция хорошо известна обычным специалистам в данной области техники и, таким образом, не будет дополнительно описана.

Вектор h импульсного отклика размерности N взвешенного фильтра синтеза W(z)/В(z) вычисляется в генераторе 709 импульсного отклика с использованием коэффициентов фильтра ЛП A(Z) и В(z) из модуля 704. Опять эта операция хорошо известна обычным специалистам в данной области техники и, таким образом, не будет дополнительно описана в настоящем описании.

Параметры b, T и j основного тона с замкнутым контуром (или кодовая книга основного тона) вычисляются в модуле 707 поиска основного тона с замкнутым контуром, который использует вектор x цели, вектор h импульсного отклика и задержку TOL основного тона с открытым контуром в качестве входных сигналов.

Поиск основного тона состоит в нахождении наилучшей задержки Т, которая минимизирует среднеквадратичную взвешенную ошибку предсказания основного тона, например,

е(j)=||x-b(j)y(j)||2, где j=1, 2, …, k

между вектором х цели и масштабированным отфильтрованным вариантом прошлого возбуждения by.

Более конкретно поиск основного тона (кодовой книги основного тона) состоит из трех этапов.

На первом этапе оценивается задержка TOL основного тона с открытым контуром в модуле 706 поиска основного тона с открытым контуром в ответ на взвешенный речевой сигнал sw(n). Как указано в приведенном выше описании, этот анализ с открытым контуром обычно выполняется один раз каждые 10 мс (два подкадра) с использованием способов, хорошо известных обычным специалистам в данной области техники.

На втором этапе ищется критерий С поиска в модуле 707 поиска основного тона с замкнутым контуром для целых задержек основного тона около оцененной задержки TOL основного тона с открытым контуром (обычно +5), что существенно упрощает процедуру поиска. Простая процедура используется для обновления отфильтрованного кодового вектора yT (этот вектор определен в дальнейшем описании) без необходимости вычислять свертку для каждой задержки основного тона. Пример критерия С поиска задается с помощью

С=, где t обозначает транспортирование вектора

Когда найдена оптимальная целая задержка основного тона на втором этапе, третий этап поиска (модуль 707) проверяет, посредством критерия С поиска, дробные части около оптимальной целой задержки основного тона. Например, стандарт АМ-Ш использует разрешение подвыборки 1/4 и 1/2.

В широкополосных сигналах структура гармоник существует только до определенной частоты, зависящей от речевого сегмента. Следовательно, для того чтобы достичь эффективного представления вклада основного тона в звонкие сегменты широкополосного речевого сигнала, необходима гибкость, чтобы изменять величину периодичности в широкополосном спектре. Это достигается с помощью обработки кодового вектора основного тона посредством множества частотных формирующих фильтров (например, фильтров нижних частот и полосовых фильтров). И выбирается частотный формирующий фильтр, который минимизирует определенную выше среднеквадратичную взвешенную ошибку е. Выбранный частотный формирующий фильтр идентифицируется с помощью индекса j.

Индекс Т кодовой книги основного тона кодируется и передается в мультиплексор 713 для передачи через канал связи. Коэффициент усиления b основного тона квантуется и передается в мультиплексор 713. Используется дополнительный бит, чтобы кодировать индекс j, причем этот дополнительный бит также подается в мультиплексор 713.

Когда определен основной тон или параметры b, T и j ДП (долгосрочного предсказания), следующий этап состоит из поиска оптимального нового возбуждения посредством модуля 710 поиска нового возбуждения фиг.7. Сначала обновляется вектор х c помощью вычитания вклада ДП:

х'=x-byT

где b - коэффициент усиления основного тона, а yT - отфильтрованный вектор кодовой книги основного тона (прошлое возбуждение с задержкой Т, отфильтрованной с помощью частотного формирующего фильтра (индекс j) и свернутой с помощью импульсного отклика h).

Процедура поиска нового возбуждения в ЛПКВ выполняется в новой кодовой книге, чтобы найти оптимальный кодовый вектор ck возбуждения и коэффициент усиления b, которые минимизируют среднеквадратичную ошибку между вектoром х цели и масштабированным отфильтрованным вариантом кодового вектора ck, например,

E=||x'-gHck||2

где H - нижняя треугольная матрица свертки, полученная из вектора h импульсного отклика. Индекс k новой кодовой книги, соответствующей найденному оптимальному кодовому вектору ck, и коэффициент усиления g подаются в мультиплексор 213 для передачи через канал связи.

Следует заметить, что использованная новая кодовая книга может быть динамической кодовой книгой, состоящей из алгебраической кодовой книги, за которой следует адаптивный предварительный фильтр F(z), который расширяет данные спектральные составляющие для того, чтобы улучшить качество синтеза речи, в соответствии с патентом США 5444816, выданным Адоул и др. 22 августа 1995 г. Более конкретно поиск новой кодовой книги может быть выполнен в модуле 710 посредством алгебраической кодовой книги, как описано в патентах США, номера: 5444816 (Адоул и др.), выданном 22 августа 1995 г.; 5699483, выданном Адоул и др. 17 декабря 1997 г.; 5754976, выданном Адоул и др. 19 мая 1998 г.; и 5701392 (Адоул и др.), датированном 23 декабря 1997 г.

Обзор декодера АМ-Ш

Декодер 800 речи фиг.8 иллюстрирует различные этапы, выполняемые между цифровым входным сигналом 822 (входным битовым потоком в демультиплексор 817) и выходным выборочным речевым сигналом 823 (выходной сигнал сумматора 821).

Демультиплексор 817 извлекает параметры кодирования сигнала из двоичной информации (входного битового потока 822), принятой из цифрового входного канала. Из каждого принятого двоичного кадра, извлеченными параметрами кодирования сигнала являются:

- квантованные интерполированные коэффициенты ЛП В(z) (линия 825), также называемые параметрами краткосрочного предсказания (STP, КП), создаваемые один раз за кадр;

- параметры T, b и j долгосрочного предсказания (ДП) (для каждого подкадра); и

- новый индекс k возбуждения и коэффициент g усиления (для каждого подкадра).

Текущий речевой сигнал синтезируется на основании этих параметров, как будет объяснено ниже в настоящем описании.

Новая кодовая книга 818 возбуждения реагирует на индекс k для создания нового кодового вектора ck, который масштабируется с помощью декодированного нового коэффициента усиления g возбуждения посредством усилителя 824. Эта новая кодовая книга 818, как описано в вышеупомянутых патентах США, номера: 5444816; 5699482; 5754976 и 5701392, используется для создания нового кодового вектора ck.

Сгенерированный масштабированный кодовый вектор gck на выходе усилителя 824 обрабатывается посредством зависимого от частоты устройства 805 расширения основного тона.

Расширение периодичности сигнала u возбуждения улучшает качество звонких сегментов. Расширение периодичности достигается с помощью фильтрации нового кодового вектора ck из новой (фиксированной) кодовой книги возбуждения посредством фильтра F(z) нововведения (устройства 805 расширения основного тона), частотная характеристика которого выделяет высокие частоты более, чем низкие частоты. Коэффициенты фильтра F(z) нововведения связаны с величиной периодичности в сигнале u возбуждения.

Эффективным возможным способом, чтобы получить коэффициенты фильтра F(z) нововведения, является осуществление связи их с величиной вклада основного тона в полный сигнал u возбуждения. Это имеет результатом частотную характеристику, зависящую от периодичности подкадра, где высокие частоты более сильно выделяются (более сильная общая кривая) для более высоких коэффициентов усиления основного тона. Фильтр 805 нововведения имеет действие понижения энергии кодового вектора ck нововведения на низких частотах, когда сигнал u возбуждения является более периодичным, что расширяет периодичность сигнала u возбуждения на низких частотах больше, чем на высоких частотах. Предложенный вид для фильтра 805 нововведения является следующим:

F(z)=-αz + 1 - αz-1,

где α - коэффициент периодичности, полученный из уровня периодичности сигнала u возбуждения. Коэффициент α периодичности вычисляется в генераторе 804 коэффициента звучания. Сначала коэффициент rv звучания вычисляется в генераторе 804 коэффициента звучания с помощью:

rv=(Ev - Ec)/(Ev + Ec)

где Еv - энергия масштабированного кодового вектора bvT основного тона, а Ес - энергия масштабированного нового кодового вектора gck. То есть:

и

Заметим, что величина rv находится между -1 и 1 (1 соответствует чисто звонким сигналам, а -1 соответствует чисто незвонким сигналам).

Вышеупомянутый масштабированный кодовый вектор bvT основного тона создается с помощью подачи задержки Т основного тона в кодовую книгу 801 основного тона, чтобы создать кодовый вектор основного тона. Затем кодовый вектор основного тона обрабатывается посредством фильтра нижних частот или полосового фильтра 802, частота отсечки которого выбирается в связи с индексом j из демультиплексора 817, чтобы создать отфильтрованный кодовый вектор vT основного тона. Затем отфильтрованный кодовый вектор vT основного тона усиливается на коэффициент b усиления с помощью усилителя 826, чтобы создать масштабированный кодовый вектор vT основного тона.

Затем вычисляется коэффициент α звучания в генераторе 804 коэффициента звучания с помощью:

α=0,125(1 + r v )

который соответствует величине 0 для чисто незвонких сигналов и 0,25 для чисто звонких сигналов.

Следовательно, расширенный сигнал cf вычисляется с помощью фильтрации масштабированного нового кодового вектора gck посредством фильтра 805 (F(z)) нововведения.

Расширенный сигнал u' возбуждения вычисляется с помощью сумматора 820 как:

u' = c f + bv T

Следует заметить, что этот процесс не выполняется в кодере 700. Следовательно существенным является обновление содержимого кодовой книги 801 основного тона с использованием прошлой величины сигнала u возбуждения без расширения, запомненного в памяти 803, чтобы поддерживать синхронность между кодером 700 и декодером 800. Следовательно, сигнал u возбуждения используется, чтобы обновить память 803 кодовой книги 801 основного тона, а расширенный сигнал u возбуждения используется на входе фильтра 804 синтеза ЛП.

Синтезированный сигнал s' вычисляется с помощью фильтрации расширенного сигнала u' возбуждения посредством фильтра 806 синтеза ЛП, который имеет вид 1/В(z), где В(z) квантованный интерполированный фильтр ЛП в текущем подкадре. Как видно на фиг.8, квантованные интерполированные коэффициенты В(z) ЛП на линии 825 из демультиплексора 817 подаются в фильтр 806 синтеза ЛП, чтобы соответствующим образом настроить параметры фильтра 806 синтеза ЛП. Фильтр 807 отмены выделения является обратным фильтру 703 предварительного выделения фиг.7. Передаточная функция фильтра 807 отмены выделения задается с помощью

D(z)=1/(1 - µz-1)

где µ - коэффициент предварительного выделения с величиной, находящейся между 0 и 1 (типичная величина равна µ=0,7). Также мог бы быть использован фильтр более высокого порядка.

Вектор s' фильтруется посредством фильтра D(z) 807 отмены выделения, чтобы получить вектор sd, который обрабатывается посредством фильтра 808 верхних частот, чтобы удалить нежелательные частоты ниже 50 Гц и дополнительно получить sh.

Устройство 809 дискретизации с повышением частоты проводит обратный процесс устройства 701 дискретизации с понижением частоты фиг.7. Например, дискретизация с повышением частоты преобразует частоту дискретизации 12,8 кГц обратно в исходную частоту дискретизации 16 кГц с использованием способов, хорошо известных обычным специалистам в данной области техники. Дискретизированный с повышением частоты сигнал синтеза обозначен s. Сигнал s также называется синтезированным широкополосным промежуточным сигналом.

Дискретизированный с повышением частоты сигнал ŝ синтеза не содержит высокочастотные составляющие, которые были потеряны во время процесса дискретизации с понижением частоты (модуль 701 фиг.7) в кодере 700. Это дает восприятие нижних частот в синтезированном речевом сигнале. Чтобы восстановить полную полосу частот исходного сигнала, выполняется процедура генерирования высокой частоты в модуле 819, и требует входной сигнал из генератора 804 голосового коэффициента (фиг.8).

Результирующая, отфильтрованная с помощью полосового фильтра, шумовая последовательность z из модуля 310 генерирования высокой частоты суммируется с помощью сумматора 821 с дискретизированным с повышением частоты синтезированным речевым сигналом ŝ, чтобы получить окончательный восстановленный выходной речевой сигнал sout на выходе 823. Пример процесса генерирования высокой частоты описан в международной заявке на патент PCT, опубликованной под № WO 00/25305 в мае 2000 г.

Ссылаясь опять на фиг.3, в режиме связи с полной скоростью передачи кодек, в соответствии со стандартом АМ-Ш, работает с 12,65 Кбит/с и используется с распределением бит, приведенным в таблице 1. Использование скорости 12,65 Кбит/с кодека АМ-Ш дает возможность конструирования кодека с переменной скоростью передачи для системы CDMA2000, которая может взаимодействовать с другими системами, использующими стандарт кодека АМ-Ш. Дополнительные 13 бит добавляются, чтобы помещаться в полную скорость 13,3 Кбит/с множества II скорости CDMA2000. Эти биты используются, чтобы улучшить надежность кодека в случае стертых кадров. Большие подробности о кодеке АМ-Ш можно найти в ссылке “ITU-T Recommendation G.722.2 ”Wideband coding of speech at around 16 kbit/s using Adaptive Multi-Rate Wideband (AMR-WB)”, Geneva, 2002”. Кодек основан на модели алгебраического линейного предсказания с кодовым возбуждением (ACELP, АЛПКВ), оптимизированной для широкополосных сигналов. Он работает с речевыми кадрами 20 мс с частотой дискретизации 18 кГц. Параметры фильтра НЧ кодируются один раз за кадр с использованием 46 бит. Затем кадр разделяется на четыре подкадра, где индексы адаптивной и фиксированной кодовой книги и коэффициенты усиления кодируются один раз за кадр. Фиксированная кодовая книга составлена с использованием структуры алгебраической кодовой книги, где 64 позиции в подкадре разделены на четыре дорожки перемежающихся позиций, и где два импульса со знаком размещены на каждой дорожке. Два импульса каждой дорожки кодируются с использованием девяти бит, давая всего 36 бит на подкадр.

Таблица 1
Распределение бит стандарта АМ-Ш с 12,65 Кбит/с
(кадры 20 мс содержат четыре подкадра)
Параметр Бит/Кадр
Флаг ДРА 1
Параметры НЧ 46
Задержка основного тона 30=9+6+9+6
Фильтрация основного тона 4=1+1+1+1
Коэффициенты усиления 28=7+7+7+7
Алгебраическая кодовая книга 144=36+36+36+36
Всего 253 бита

На основании АМ-Ш с 12,65 Кбит/с широкополосное с переменной скоростью передачи (VBR-WB, Ш-ПерСП) решение может работать в соответствии с несколькими режимами передачи, из которых один режим является функционально совместимым с АМ-Ш с 12,65 Кбит/с. Следовательно, используются два варианта полной скорости (ПолнСП), функционально совместимая ПолнСП, где добавляются 13 неиспользованных бит, чтобы получить 13,3 Кбит/с, и общая или специфическая для МДКР ПолнСП, где используются биты ДРА и дополнительные имеющиеся 13 бит, чтобы передавать информацию, которая улучшает надежность кодека против стираний кадров (FER, СК). Распределение бит двух вариантов кодирования с ПолнСП показано в таблице 2. Следует отметить, что никакие дополнительные биты не требуются для информации классификации кадров. Защита СК из 14 бит содержит информацию энергии из 6 бит. Следовательно, только 63 уровня используются, чтобы квантовать энергию, и последний уровень, соответствующий величине 63, зарезервирован для того, чтобы указывать использование функционально совместимого режима. Следовательно, в случае функционально совместимой ПолнСП индекс информации энергии устанавливается в 63.

Таблица 2
Распределение бит общей и функционально совместимой полной скорости передачи множества II скорости CDMA2000, основанное на стандарте АМ-Ш с 12,65 Кбит/с
Бит в кадре
Параметр Общая ПолнСП Функционально совместимая ПолнСП
Информация классификации - -
Бит ДРА - 1
Параметры НЧ 46 46
Задержка основного тона 30 30
Фильтрация основного тона 4 4
Коэффициенты усиления 28 28
Алгебраическая кодовая книга 144 144
Бит защиты СК 14 -
Неиспользованные биты - 13
Всего 266 266

В случае стабильных звонких кадров используется модуль 206 кодирования половинной скорости звонких кадров. Распределение битов звонких кадров с половинной скоростью дано в таблице 3. Поскольку кадры, кодируемые в этом режиме передачи, являются типично очень периодическими, существенно более низкая скорость передачи достаточна для поддерживания хорошего субъективного качества, например, по сравнению с переходными кадрами. Используется модификация сигнала, что дает возможность эффективного кодирования информации задержки с использованием только девяти бит в кадре 20 мс, сохраняя значительную часть запаса бит для других параметров кодирования сигнала. При модификации сигнала сигнал заставляют следовать определенному контуру основного тона, который может быть передан с помощью 9 бит в кадре. Хорошая эффективность долгосрочного предсказания позволяет использовать только 12 бит в подкадре из 5 мс для возбуждения фиксированной кодовой книги без ухудшения субъективного качества речи. Фиксированная кодовая книга является алгебраической кодовой книгой и содержит две дорожки, по одному импульсу в каждой, при этом каждая дорожка имеет 32 возможные позиции.

Таблица 3
Распределение бит общей половинной скорости звонких кадров, незвонких кадров в соответствии с множеством II скорости CDMA2000
Бит в кадре
Параметр Общая ПолнСП ПолСП звонких кадров ПолСП незвонких кадров
Информация классификации 1 3 2
Бит ДРА - - -
Параметры НЧ 36 36 46
Задержка основного тона 13 9 -
Фильтрация основного тона - 2 -
Коэффициенты усиления 26 26 24
Алгебраическая кодовая книга 48 48 52
Бит защиты СК - - -
Неиспользованные биты - - -
Всего 124 124 124

В случае незвонких кадров адаптивная кодовая книга (или кодовая книга основного тона) не используется. Гауссова кодовая книга из 13 бит используется в каждом подкадре, где коэффициент усиления кодовой книги кодируется с помощью 6 бит в кадре. Заметим, что в случаях, когда требуется дополнительно уменьшить среднюю скорость передачи, четверть скорости передачи для незвонких кадров может быть использована в случае стабильных незвонких кадров.

Режим (312) общей половинной скорости передачи используется для сегментов низкой энергии, как изображено на фиг.3. Этот режим (312) общей ПолСП также может использоваться при работе с максимальной половинной скоростью, как будет объяснено позже. Распределение бит для общей ПолСП показано в представленной выше таблице 3.

В качестве примера, для информации классификации для разных кодеров ПолСП в случае общей ПолСП 1 бит используется, чтобы указать, является ли кадр общей ПолСП или другим ПолСП. В случае ПолСП незвонких кадров 2 бит используются для классификации: первый бит для указания, что кадр не является общей ПолСП, а второй бит для указания, что он является ПолСП незвонких кадров, а не ПолСП звонких кадров или функционально совместимой ПолСП (объясняемых позже). В случае ПолСП звонких кадров используются 3 бита: первые два бита указывают, что кадр не является общей ПолСП или ПолСП незвонких кадров, а третий бит указывает, является ли кадр ПолСП незвонким или функционально совместимой ПолСП.

Модуль 208 кодирования с одной восьмой скорости передачи (ГКШ) используется, чтобы кодировать неактивные речевые кадры (молчание или фоновый шум). В этом случае кодируются только параметры фильтра ЛП с помощью 14 бит в кадре, а коэффициент усиления кодируется с помощью 6 бит в кадре. Распределение бит указано в таблице 4.

Таблица 4
Распределение бит одной восьмой скорости передачи с 1,0 Кбит/с для кадра 20 мс
Параметр Бит/Кадр
Параметры ЛП 14
Коэффициенты усиления 6
Всего 20 бит/кадр = 1,0 Кбит/с

Работа с половинной скоростью передачи, навязанной системой

В соответствии со схемой кодирования МДКР система может навязать использование половинной скорости передачи вместо полной скорости передачи в некоторых речевых кадрах, для того чтобы послать сигнальную информацию по каналам сети. Это называется передачей сигналов размерности и пачки. Использование половинной скорости передачи в качестве максимальной скорости передачи также может быть навязано системой во время плохих состояний канала (таких как около границ ячейки), для того чтобы улучшить надежность кодека. Это называется максимумом половинной скорости. В конфигурации кодирования с ПерСП, описанной выше, половинная скорость используется, когда кадр является стационарным звонким или стационарным незвонким. Полная скорость передачи используется для начальных, переходных кадров и смешанных звонких кадров. Когда модуль выбора скорости выбирает кадр, кодируемый как кадр с полной скоростью передачи, а система навязывает кадр с половинной скоростью передачи, эффективность речи ухудшается, поскольку режимы передачи с половинной скоростью передачи не могут эффективно кодировать начальные и переходные кадры.

Кроме того, при вызове операции без последовательного соединения каналов в кросс-системе между CDMA2000, использующей решение множества II скорости ПерСП, основанное на АМ-Ш, и другой системой, использующей стандарт АМ-Ш, система CDMA2000, в конечном итоге, может навязать половинную скорость передачи, как объяснено ранее (такую как передача сигналов размерности и пачки). Поскольку кодек АМ-Ш не распознает половинную скорость передачи 6,2 Кбит/с широкополосного кодека CDMA2000, следовательно, кадры с половинной скоростью передачи интерпретируются как стертые кадры. Это ухудшает эффективность соединения.

Неограничительный иллюстративный вариант осуществления настоящего изобретения реализует новый способ, чтобы улучшить эффективность кодеков с переменной скоростью передачи, работающих в беспроводных системах МДКР, в ситуациях, когда половинная скорость навязана системой. Кроме того, этот новый способ улучшает эффективность в случае работы кросс-системы без последовательного соединения каналов между CDMA2000, использующей решение множества II скорости ПерСП, основанное на АМ-Ш, и другой системой, использующей кодек АМ-Ш, когда система CDMA2000, в конечном итоге, может навязать использование половинной скорости передачи.

При управлении размерностью и пачками или работе с максимумом половинной скорости передачи, когда система запрашивает использование половинной скорости передачи, в то время как выбрана полная скорость передачи с помощью механизма классификации, это указывает, что кадр не является ни незвонким, ни стабильным звонким, и кадр, вероятно, должен содержать нестационарный речевой сегмент, такой как звонкий начальный или быстро изменяющийся звонкий речевой сигнал. Следовательно, использование половинной скорости передачи, оптимизированной для незвонких или стабильных звонких сигналов, ухудшает эффективность речи. В этом случае необходим новый режим с половинной скоростью передачи, и введена общая ПолСП, которая может использоваться в таких случаях. Следовательно, в случае максимума половинной скорости передачи или операции размерности и пачки кодер использует общую ПолСП, если не классифицирован как ПолСП звонких кадров или незвонких кадров. Однако в системах CDMA2000 имеется операция, известная как передача сигналов на пакетном уровне, посредством чего сигнальная информация не передается в кодер, и система может навязать использование ПолСП после того, как кадр закодирован. Следовательно, если кадр закодирован как ПолнСП, а система требует использования ПолСП, тогда кадр будет объявлен как стертый. Кроме того, в случае максимума половинной скорости передачи или операции размерности и пачки в функционально совместимом режиме, когда кодер с ПерСП взаимодействует с АМ-Ш с 12,65 Кбит/с, тогда общая ПолСП не может быть использована, поскольку она не является частью АМ-Ш. Чтобы избежать стирания кадра в этих ситуациях (передача сигналов на пакетном уровне, или размерность и пачки и максимум половинной скорости передачи в режиме функциональной совместимости), неограничительный иллюстративный вариант осуществления настоящего изобретения использует режим половинной скорости передачи, непосредственно полученный из режима полной скорости с помощью удаления части параметров кодирования сигнала, например индексов фиксированной кодовой книги, после того, как кадр закодирован как кадр с полной скоростью передачи. На стороне декодера удаленная часть параметров кодирования сигнала, например индексы фиксированной кодовой книги, могут быть произвольно сгенерированы, и декодер будет работать так, как будто он находится на полной скорости передачи. Этот режим половинной скорости передачи называется сигнальной ПолСП или функционально совместимой ПолСП, поскольку как кодирование, так и декодирование выполняется с полной скоростью передачи. Распределение бит режима функционально совместимой половинной скорости передачи в соответствии с неограничительным иллюстративным вариантом осуществления настоящего изобретения дано в таблице 5. В этом неограничительном иллюстративном варианте осуществления полная скорость передачи основана на стандарте АМ-Ш с 12,65 Кбит/с, и половинная скорость получается с помощью удаления 144 битов, необходимых для индексов алгебраической фиксированной кодовой книги. Различие между сигнальной ПолСП и функционально совместимой ПолСП заключается в том, что сигнальная ПолСП используется в операции передачи сигналов на пакетном уровне в системе CDMA2000, а биты защиты СК, все же, могут быть использованы. Сигнальная ПолСП получается непосредственно из общей ПолнСП, изображенной в таблице 1, с помощью удаления 144 бит для индексов алгебраической кодовой книги. Три индекса добавлены для информации класса, и только шесть индексов используются для защиты СК, что оставляет пять неиспользованных бит. Функционально совместимая ПолСП получается из функционально совместимой ПолнСП с помощью удаления 144 бит для индексов алгебраической кодовой книги. Три индекса добавлены для информации класса, что оставляет 12 неиспользованных бит. Как объяснено ранее при обсуждении информации классификации в случае разных половинных скоростей, три бита используются в случае ПолСП звонких кадров или функционально совместимой ПолСП. Никакая дополнительная информация не посылается, чтобы различать сигнальную ПолСП и функционально совместимую ПолСП. Подобно случаю ПолнСП, последний уровень информации энергии из 6 бит используется для этой цели. Только 63 уровня используются, чтобы квантовать энергию, а последний уровень, соответствующий величине 63, зарезервирован, чтобы указывать использование функционально совместимого режима. Следовательно, в случае функционально совместимой ПолСП индекс информации энергии устанавливается в 63.

Таблица 5
Распределение бит сигнальной и функционально совместимой половинной скорости передачи с 6,2 Кбит/с
Бит в кадре
Параметр Сигнальная ПолСП Функционально совместимая ПолСП
Информация классификации 3 3
Бит ДРА - 1
Параметры НЧ 46 46
Задержка основного тона 30 30
Фильтрация основного тона 4 4
Коэффициенты усиления 28 28
Алгебраическая кодовая книга - -
Бит защиты СК 8 -
Неиспользованные биты 5 12
Всего 124 124

Фиг.4 изображает функциональную схематическую блок-схему фиг.3 с помощью добавления системного запроса для использования половинной скорости в логических схемах определения скорости. Конфигурация фиг.3 подходит для работы в системе CDMA2000. В конце цепочки определения скорости модуль 404 проверяет, присутствует ли системный запрос половинной скорости передачи. Если логическая схема определения скорости указывает, что кадр является активным речевым кадром (модуль 201), и он не является ни незвонким (модуль 202), ни стабильным звонким (модуль 203), ни кадром с низкой энергией (модуль 311), а система запрашивает работу с половинной скоростью передачи (модуль 404), тогда используется общая половинная скорость передачи, чтобы кодировать кадр в модуле 312.

В противном случае (не присутствует системный запрос половинной скорости передачи) речевой кадр кодируется в модуле 205 как кадр с полной скоростью передачи (13,3 Кбит/с в соответствии с множеством II скорости CDMA2000).

В неограничительном иллюстративном варианте осуществления настоящего изобретения, как изображено на фиг.5, логические схемы определения скорости и кодирование с переменной скоростью являются теми же самыми, что и на фиг.3. Однако после того как кадр закодирован и бит переданы, выполняется тест, чтобы проверить, запрашивает ли система работу с половинной скоростью передачи, в модуле 514. Если это справедливо и переданный кадр является кадром с ПолнСП, тогда часть параметров кодирования сигнала, например индексы фиксированной кодовой книги, удаляется, для того чтобы получить кадр с сигнальной половинной скоростью передачи (модуль 510). Заметим, что в этом неограничительном иллюстративном варианте осуществления от одного до трех бит используются для режима с половинной скоростью передачи (общей, звонких кадров, незвонких кадров или функционально совместимой). Следовательно, 3 бита, указывающие сигнальную или функционально совместимую половинную скорость передачи, добавляются после того, как удалена часть параметров кодирования сигнала (индексы фиксированной кодовой книги). Биты в кадре распределены в соответствии с таблицей 5.

Выбор удаления индексов фиксированной кодовой книги является благодаря тому факту, что эти биты наименее чувствительны к ошибкам, и произвольное их генерирование имеет малое влияние на эффективность. Однако следует иметь в виду, что могут быть удалены другие биты, чтобы получить функционально совместимую или сигнальную половинную скорость без потери общности.

В этом неограничительном иллюстративном варианте осуществления при работе с сигнальной или функционально совместимой половинной скоростью передачи на стороне кодера кодер работает как кодер с полной скоростью передачи. Поиск фиксированной кодовой книги выполняется как обычно, и определенное возбуждение фиксированной кодовой книги используется при обновлении содержимого адаптивной кодовой книги и памяти фильтров для следующих кадров в соответствии со стандартом АМ-Ш с 12,65 Кбит/с [ITU-T Recommendation G.722.2 “Wideband coding of speech at around 12,65 kbit/s using Adaptive Multi-Rate Wideband (AMR-WB)”, Geneva, 2002] [3GPP TS 26.190, “AMR Wideband Codec: Transcoding Functions,” 3GPP Technical Specification]. Следовательно, никакие индексы произвольной кодовой книги не используются в работе кодера. Это очевидно в реализации фиг.5, где системный запрос половинной скорости передачи (модуль 514) проверяется после того, как кадр закодирован при нормальной работе с полной скоростью передачи.

При работе с сигнальной или функционально совместимой половинной скоростью передачи на стороне декодера удаленная часть параметров кодирования сигнала, например индексы фиксированной кодовой книги, произвольно генерируется. Затем декодер работает, как при работе с полной скоростью передачи. Могут быть использованы другие способы для генерирования удаленной части параметров кодирования сигнала. Например, удаленные параметры могут быть получены с помощью копирования частей принятого битового потока. Заметим, что может случаться несоответствие между памятью на стороне кодера и стороне декодера, поскольку удаленная часть параметров кодирования сигнала, например возбуждение кодовой книги, является разной. Однако такое несоответствие не оказывает влияния на эффективность, особенно в случае передачи сигналов размерности пачки при взаимодействии между CDMA ПерСП и АМ-Ш, где типичные скорости передачи находятся около 2%.

Эффективность предложенного подхода в операции размерности и пачки является почти прозрачной по сравнению со случаем, когда нет системного запроса половинной скорости передачи. Во многих случаях логические схемы определения скорости передачи уже определяет кадр, кодируемый либо с одной восьмой скорости передачи, одной четвертой скорости передачи, либо с половинной скоростью передачи (общей, звонких кадров или незвонких кадров). В таком случае запросом системы половинной скорости передачи пренебрегают, поскольку она уже адаптирована с помощью кодера, и тип сигнала в кадре подходит для кодирования с половинной скоростью передачи или более низкой скоростью передачи.

Следует заметить, что логические схемы классификации является настраиваемой с режимом работы. Следовательно, для того чтобы улучшить эффективность в режиме максимума половинной скорости передачи и передачи сигналов размерности и пачки, эти логические схемы классификации могут быть сделаны более уменьшенными для использования конкретных кодеков с половинной скоростью передачи (половинная скорость передачи звонких и незвонких кадров используется относительно более часто, чем нормальная работа). Это является видом возбуждения для многорежимной работы, где логическая схема классификации более уменьшена, и используются режимы с более низкими средними скоростями передачи.

Работа без последовательного соединения каналов между системой CDMA2000 и другими системами с использованием стандарта АМ-Ш

Как упомянуто ранее, конструирование широкополосного с переменной скоростью передачи (Ш-ПерСП) кодека для системы CDMA2000, основанного на кодеке АМ-Ш, имеет преимущество в предоставлении возможности работы без последовательного соединения каналов (TFO, РБПСК) или работы с коммутацией пакетов между системой CDMA2000 и другими системами, использующими стандарт АМ-Ш (такими как мобильная система GSM или беспроводная система третьего поколения Ш-МДКР). Однако при вызове операции без последовательного соединения каналов в кросс-системе между CDMA200 и другой системой, использующей АМ-Ш, система CDMA2000 может навязать использование половинной скорости передачи, как объяснено ранее (такой как передача сигналов размерности и пачки). Поскольку кодек АМ-Ш не распознает половинную скорость передачи 6,2 Кбит/с широкополосного кодека CDMA2000, следовательно, навязанные кадры с половинной скоростью передачи интерпретируются как стертые кадры. Это ухудшает эффективность соединения. Использование режима функционально совместимой половинной скорости передачи, раскрытого ранее, значительно улучшит эффективность, поскольку этот режим может взаимодействовать со скоростью передачи 12,65 Кбит/с стандарта AM-Ш.

Как раскрыто в настоящем описании ранее, функционально совместимая половинная скорость передачи, по существу, является псевдополной скоростью передачи, где кодек работает, как будто он находится в режиме с полной скоростью передачи. Отличие заключается в том, что часть параметров кодирования сигнала, например индексы алгебраической кодовой книги, удаляется в конце и не передается. На стороне декодера удаленная часть параметров кодирования сигнала, например индексы алгебраической кодовой книги, произвольно генерируется, а затем декодер работает, как будто он находится в режиме с полной скоростью передачи.

Фиг.6 иллюстрирует конфигурацию в соответствии с неограничительным иллюстративным вариантом осуществления настоящего изобретения, демонстрирующую использование режима функционально совместимой половинной скорости передачи во время передачи по каналам сети сигнальной информации (т.е. состояния размерности и пачки) на стороне системы CDMA2000. На этой фигуре другой стороной является система, использующая стандарт АМ-Ш, и в качестве примера дана беспроводная система 3GPP.

По линии связи с направлением из CDMA2000 в 3GPP или другую систему, использующую АМ-Ш, когда подуровень мультиплексора указывает запрос режима с половинной скоростью передачи (см. запрос 601 системы размерности и пачки), кодер 602 Ш-ПерСП будет работать с функционально совместимой половинной скоростью передачи (I-HR, ФС-ПолСП), описанной ранее. В системном интерфейсе 604, когда принят кадр ФС-ПолСП, произвольно сгенерированные индексы алгебраической кодовой книги вставляются с помощью модуля 603 в битовый поток через системный интерфейс 604, основанный на IP, чтобы вывести скорость передачи 12,65 Кбит/с. Декодер 605 на стороне 3GPP будет интерпретировать его как обычный кадр 12,65 Кбит/с.

В другом противоположном направлении, то есть по линии связи из 3GPP или другой системы, использующей AM-Ш, в CDMA2000, если в системном интерфейсе 606 принят запрос половинной скорости передачи (см. запрос 607 системы размерности и пачки), тогда модуль 608 удаляет индексы алгебраической кодовой книги и вставляет 3 бит, указывающих тип кадра ФС-ПолСП. Декодер 609 на стороне CDMA2000 будет работать как тип кадра ФС-ПолСП, который является частью решения Ш-ПерСП.

Это предложение требует минимальных логических схем в системном интерфейсе, и оно существенно улучшает эффективность посредством навязывания кадров размерности и пачки как кадров пропуска и пачки (стертых кадров).

Другим вопросом при взаимодействии является обработка кадров фонового шума. На стороне АМ-Ш кодер 610 поддерживает работу DTX, ИП (импульсная передача) и CNG, ГКШ (генерирование комфортного шума). Неактивные речевые кадры (молчание или фоновый шум) либо кодируются как кадры SID, ОМ (описание молчания) с использованием 35 бит, либо они не передаются (нет данных). На стороне CDMA2000 неактивные речевые кадры кодируются с использованием одной восьмой скорости передачи (ОВСП). Поскольку 35 бит для ОМ не могут быть посланы с использованием ОВСП, используется одна четвертая скорости передачи (ОЧСП) ГКШ, чтобы послать кадры ОМ из стороны АМ-Ш в сторону CDMA2000. Не переданные кадры без данных на стороне АМ-Ш преобразуются в кадры ОВСП (в иллюстративном варианте осуществления все бит устанавливаются в 1). На стороне CDMA2000 в функционально совместимом режиме кадры ОВСП обрабатываются с помощью декодера как стирания кадров.

При взаимодействии из CDMA2000 со стороной АМ-Ш в начале неактивных речевых сегментов используется ОЧСП ГНШ, затем используются кадры ОВСП. В неограничительном иллюстративном варианте осуществления изобретения работа подобна работе ДРА/ИП/ГКШ в АМ-Ш, где кадр ОМ посылается один раз в каждые восемь кадров. В этом случае первый неактивный речевой кадр кодируется как кадр ОЧСП ГКШ, а следующие 7 кадров кодируются как кадры ОВСП. В системном интерфейсе кадры ОЧСП ГКШ преобразуются в кадры ОМ АМ-Ш, а кадры ОВСП не передаются (нет кадров данных).

Распределение бит кадров ОЧСП ГКШ и ОВСП ГКШ показано в таблице 6.

Таблица 6
Распределение бит ОЧСП ГКШ с 2,7 Кбит/с и ОВСП ГКШ с 1 Кбит/с для кадра 20 мс
Бит в кадре
Параметр ОЧСП ГКШ ОВСП ГКШ
Информация классификации 1 -
Параметры НЧ 28 14
Коэффициенты усиления 6 6
Неиспользованные биты 19 -
Всего 54 20

Несмотря на то, что настоящее изобретение описано в вышеприведенном описании в связи с его неограничительным вариантом осуществления, этот иллюстративный вариант осуществления по желанию может быть модифицирован, в рамках объема прилагаемой формулы изобретения, не выходя за рамки объема и сущности изобретения. В качестве примера, биты, отличные от битов, связанных с индексами фиксированной кодовой книги, в частности, биты с меньшей чувствительностью к ошибкам бит, могут быть опущены, для того чтобы получить кадр с функционально совместимой половинной скоростью передачи.

1. Способ передачи параметров кодирования сигнала, включающий прием параметров кодирования сигнала, характеризующих звуковой сигнал, кодированный в соответствии с режимом связи с полной скоростью передачи схемы связи CDMA2000 VBR-WB (широкополосная схема связи с переменной скоростью передачи для множественного доступа с кодовым разделением каналов-2000);
прием запроса на передачу параметров кодирования сигнала с использованием режима связи с половинной скоростью передачи схемы связи CDMA2000 VBR-WB для уменьшения скорости передачи битов во время передачи параметров кодирования сигнала;
вставку идентификации режима связи, подлежащей передаче вместе с остальными параметрами кодирования сигнала, и,
в ответ на упомянутый запрос, удаление части параметров кодирования сигнала для обеспечения передачи упомянутых остальных параметров кодирования сигнала с использованием режима связи с половинной скоростью передачи схемы связи CDMA2000 VBR-WB, при этом удаленная часть параметров кодирования сигнала представляет собой индексы фиксированной кодовой книги для алгебраической кодовой книги.

2. Способ по п.1, включающий
генерирование заменяющих параметров кодирования сигнала для замены удаленных индексов фиксированной кодовой книги.

3. Способ по п.2, в котором на этапе генерирования заменяющих параметров кодирования сигнала произвольно регенерируют индексы фиксированной кодовой книги.

4. Способ по п. 1, включающий
передачу остальных параметров кодирования сигнала с использованием режима связи с половинной скоростью передачи схемы связи CDMA2000 VBR-WB;
генерирование заменяющих параметров кодирования сигнала для замены удаленной части параметров кодирования сигнала и
декодирование параметров кодирования сигнала, включающих удаленную часть параметров кодирования сигнала в соответствии с режимом связи с полной скоростью передачи схемы связи AMR-WB (адаптивная многоскоростная широкополосная схема связи).

5. Способ по п.1, включающий первоначальное кодирование звукового сигнала в соответствии с режимом связи с полной скоростью передачи схемы связи AMR-WB.

6. Способ по п.1 или 4, включающий передачу упомянутых остальных параметров кодирования сигнала с использованием режима связи с половинной скоростью передачи схемы связи CDMA2000 VBR-WB.

7. Способ передачи параметров кодирования сигнала, включающий прием индикации того, что параметры кодирования сигнала были переданы с использованием режима связи с половинной скоростью передачи схемы связи CDMA2000 VBR-WB вместо режима связи с полной скоростью передачи схемы связи CDMA2000 VBR-WB для уменьшения скорости передачи битов во время передачи упомянутых параметров кодирования сигнала, при этом параметры кодирования сигнала характеризуют звуковой сигнал, кодированный в соответствии с режимом связи с полной скоростью передачи схемы связи CDMA2000 VBR-WB, и,
в ответ на упомянутую индикацию, генерирование заменяющих параметров кодирования сигнала для замены части параметров кодирования сигнала, удаленной для уменьшения скорости передачи битов во время передачи, чтобы создать вторые параметры кодирования сигнала в соответствии с режимом связи с полной скоростью передачи схемы связи AMR-WB, при этом удаленная часть параметров кодирования сигнала представляет собой индексы фиксированной кодовой книги для алгебраической кодовой книги.

8. Способ по п.7, включающий прием параметров кодирования сигнала и декодирование звукового сигнала с использованием вторых параметров кодирования сигнала.

9. Способ по п.8, включающий передачу вторых параметров кодирования сигнала в соответствии с режимом связи с полной скоростью передачи схемы связи AMR-WB.

10. Машиночитаемый носитель, содержащий программные инструкции, используемые компьютерным устройством для выполнения способа по любому из пп.1-9.

11. Система для взаимодействия первой станции, использующей схему связи CDMA2000 VBR-WB, со второй станцией, использующей схему связи AMR-WB, причем режим связи с полной скоростью передачи схемы связи CDMA2000 VBR-WB функционально совместим с режимом связи с полной скоростью передачи схемы связи AMR-WB, при этом первая станция содержит
средство для кодирования звукового сигнала для генерирования параметров кодирования сигнала в соответствии с режимом связи с полной скоростью передачи схемы связи CDMA2000 VBR-WB,
средство для приема запроса для передачи параметров кодирования сигнала с использованием режима связи с половинной скоростью передачи схемы связи CDMA2000 VBR-WB,
средство для удаления, в ответ на упомянутый запрос, части параметров кодирования сигнала, закодированных в соответствии с режимом связи с полной скоростью передачи схемы связи CDMA2000 VBR-WB, при этом удаленная часть параметров кодирования сигнала представляет собой индексы фиксированной кодовой книги для алгебраической кодовой книги,
средство для передачи остальных параметров кодирования сигнала с использованием режима связи с половинной скоростью передачи схемы связи CDMA2000 VBR-WB;
а вторая станция содержит
средство для приема остальных параметров кодирования сигнала;
средство для генерирования заменяющих параметров кодирования сигнала для замены удаленной части параметров кодирования сигнала;
средство для декодирования параметров кодирования сигнала с использованием остальных параметров кодирования сигнала и сгенерированных заменяющих параметров кодирования сигнала.

12. Устройство для передачи параметров кодирования сигнала, содержащее:
средство для приема параметров кодирования сигнала, характеризующих звуковой сигнал, кодированный в соответствии с режимом связи с полной скоростью передачи схемы связи CDMA2000 VBR-WB;
средство для приема запроса на передачу параметров кодирования сигнала с использованием режима связи с половинной скоростью передачи схемы связи CDMA2000 VBR-WB для уменьшения скорости передачи битов во время передачи параметров кодирования сигнала;
средство для удаления части параметров кодирования сигнала для обеспечения передачи упомянутых остальных параметров кодирования сигнала с использованием режима связи с половинной скоростью передачи схемы связи CDMA2000 VBR-WB, при этом удаленная часть параметров кодирования сигнала представляет собой индексы фиксированной кодовой книги для алгебраической кодовой книги,
средство для вставки идентификации режима связи, подлежащей передаче вместе с остальными параметрами кодирования сигнала;
средство для передачи остальных параметров кодирования сигнала в соответствии с режимом связи с половинной скоростью передачи схемы связи CDMA2000 VBR-WB.

13. Устройство для передачи параметров кодирования сигнала, содержащее:
средство для приема индикации того, что параметры кодирования сигнала были переданы с использованием режима связи с половинной скоростью передачи схемы связи CDMA2000 VBR-WB вместо режима связи с полной скоростью передачи схемы связи CDMA2000 VBR-WB для уменьшения скорости передачи битов во время передачи упомянутых параметров кодирования сигнала, при этом параметры кодирования сигнала характеризуют звуковой сигнал,
средство для генерации, в ответ на упомянутую индикацию, заменяющих параметров кодирования сигнала для замены части параметров кодирования сигнала, удаленной для уменьшения скорости передачи битов во время передачи, чтобы создать вторые параметры кодирования сигнала в соответствии с режимом связи с полной скоростью передачи схемы связи AMR-WB, при этом удаленная часть параметров кодирования сигнала представляет собой индексы фиксированной кодовой книги для алгебраической кодовой книги.

14. Устройство по п.13, в котором средство для генерации заменяющих параметров кодирования сигнала приспособлено для произвольной генерации замены параметров кодирования сигнала.

15. Устройство по п.14, в котором на этапе генерирования заменяющих параметров кодирования сигнала произвольно регенерируются индексы фиксированной кодовой книги.

16. Устройство по п.15, дополнительно содержащее средство для передачи параметров кодирования сигнала, включающих замененную часть параметров кодирования сигнала, в соответствии с режимом связи с полной скоростью передачи схемы связи AMR-WB.

17. Устройство по п.13, дополнительно содержащее средство для приема параметров кодирования сигнала и средство для декодирования звукового сигнала с использованием вторых параметров кодирования сигнала.



 

Похожие патенты:

Изобретение относится к области обработки звука, в частности к обнаружению голосовой активности с использованием нескольких микрофонов. .

Изобретение относится к обработке сигналов звукозаписи, в частности к повышению разборчивости звукозаписи развлекательных программ, таких как телевизионная звукозапись.

Изобретение относится к технике цифровой обработки речевых сигналов. .

Изобретение относится к обработке аудиосигналов, в частности к измерению воспринимаемой громкости аудиосигнала. .

Изобретение относится к области психофизиологии, а именно к психофизиологии речи, и может быть использовано при анализе характеристик голосового аппарата человека для диагностики различных видов патологии голосоведения и объективной оценки эффективности проведения лечения.

Изобретение относится к оценке периода основного тона в аудиосигналах. .

Изобретение относится к области анализа речевых сигналов, а именно к анализу и разложению на составляющие джиттера периода основного тона речевого сигнала. .

Изобретение относится к обработке речевых сигналов. .

Изобретение относится к методу анализа речи, обнаруживающему частоту основного тона голоса, а также к методу обнаружения эмоций, оценивающему эмоцию на основании частоты основного тона голоса.

Изобретение относится к обработке аудиосигнала, в частности к процессору или способу обработки для повышения разборчивости речи и очистки зашумленного речевого аудиосигнала
Наверх