Устройство и способ речевой модуляции

Авторы патента:

КИМ Ки Су (KR)

G10L21 - Обработка сигналов речи для получения иного слышимого или неслышимого сигнала, например визуального, осязаемого, для того, чтобы модифицировать их качество или их разборчивость (G10L 19/00 имеет преимущество)

Владельцы патента RU 2333546:

Эл Джи Электроникс Инк. (KR)

Изобретение относится к способу и устройству речевой модуляции для использования в устройствах речевой связи, таких как проводные или радиотелефоны, для модификации голоса путем модификации высоты основного тона голоса. Устройство речевой модуляции включает в себя LPC анализатор для получения коэффициентов фильтра голосового тракта, отражающих характеристики входного речевого сигнала; устройство выделения высоты основного тона для определения высоты основного тона и половой принадлежности речевого сигнала; модулятор высоты основного тона для модулирования речевого сигнала путем умножения заданной величины на высоту основного тона, выделенную устройством выделения высоты основного тона; и кодер для кодирования входного сигнала от LPC анализатора и модулятора высоты основного тона и для выдачи кодированного сигнала. В соответствии со способом речевой модуляции устройство выделения высоты основного тона определяет половую принадлежность и высоту основного тона входного речевого сигнала, а модулятор высоты основного тона умножает определенное значение на заданную величину речевой модуляции. Технический результат - обеспечение возможности применения функции идентификации вызывающего абонента по голосу вызывающего абонента и, следовательно, защиты частной жизни вызываемого абонента. 3 н. и 8 з.п. ф-лы, 9 ил.

1. Область техники, к которой относится изобретение

[1] Настоящее изобретение относится к устройству и способу речевой модуляции в средствах голосовой связи, таких как проводной телефон или радиотелефон.

2. Уровень техники

[2] В общем случае телефон является устройством для голосовой связи по проводам или без проводов между двумя удаленными сторонами и самым главным видом связи в современном обществе.

[3] В последние годы, с развитием технологии сетей мобильной связи, резко возросла популярность радиотелефонов, а именно терминалов мобильной связи.

[4] Роль терминала мобильной связи расширилась от передачи речи до передачи или приема данных, обмена знаковыми (текстовыми) сообщениями, предоставления услуг, таких как прогноз погоды, фондовые сделки, перечисление денег на счет или снятие с него, выпуски новостей, дистанционное считывание показаний измерительных приборов по электронной почте.

[5] Кроме услуг по передаче знаковых (текстовых) сообщений, теперь с помощью терминала мобильной связи можно пользоваться услугами по передаче мультимедийных сообщений (MMS).

[6] Мультимедийные сообщения включают в себя неподвижные изображения, речевые сообщения, сообщения голосовой почты и движущиеся изображения, закодированные в формате MPEG4.

[7] Поэтому для терминалов мобильной связи постоянно ведутся разработки по множеству прикладных технологий, поддерживающих услуги по передаче мультимедийных сообщений. Например, при передаче неподвижного изображения пользователь может добавить к нему разнообразные эффекты, превращая изображение в черно-белое или инвертируя его.

[8] Однако для передачи речевых сообщений кроме почтового ящика голосовой почты почти нет прикладных программ, а упомянутые выше специальные эффекты трудно использовать.

[9] Когда абонент хочет послать речевое сообщение или речевую корреспонденцию другому абоненту, вокодер преобразует голос в соответствующие цифровые сигналы для их передачи.

[10] Обычно в телефонах используются вокодеры типа AMR (адаптивный многоскоростной), EVRC (усовершенствованный вокодер с переменной скоростью кодирования), QCELP (вокодер, осуществляющий кодирование методом линейного предсказания с кодовым возбуждением - разработка компании Qualcomm) и др. В целом, вокодеры можно разделить на три вида: кодеры источника, использующие речевую модель, кодеры формы сигналов и гибридные кодеры, являющиеся комбинацией кодера источника и кодера формы сигналов.

[11] Кодер источника анализирует модель голоса (или речи) вместо формы сигнала и модулирует анализируемые данные.

[12] К кодерам источника относятся LPC вокодер источника (LPC - сокращ. от linear-predictive coding (англ.) - кодирование с линейным предсказанием, примеч. перевод.), канальный вокодер источника, формантный вокодер источника, фазовый вокодер источника и т.д.

[13] Кодер источника выделяет характеристический параметр из речевого сигнала, используя генерируемую модель речевого сигнала, а декодер восстанавливает речь, используя этот характеристический параметр.

[14] Другими словами, кодер источника представляет речевые сигналы путем моделирования процесса генерирования речи человека. Он генерирует не форму речевого сигнала, а звуки, близкие к оригинальному речевому сигналу, которые способно воспринять ухо человека.

[15] Кодер источника использует вокодер с низкой скоростью передачи данных, обычно около 4,8-13,2 кбит/с.

[16] Обычно применяют вокодер типа LPC.

[17] С другой стороны, кодер формы сигнала типа ИКМ (с импульсно-кодовой модуляцией) модулирует форму речевого сигнала. При этом его основной целевой функцией является обеспечение восстановления сигнала в приемнике данных в таком же виде, какой он имел в источнике данных.

[18] Соответственно, кодер формы сигнала применим не только к речевым сигналам, но и к другим сигналам ограниченной величины (например, ФМн-сигналам (сигналам с фазовой манипуляцией), используемым в линиях связи с ПК (персональными компьютерами).

[19] По этой же причине кодер формы сигнала обычно работает в отдельном элементе выборки, а его функционирование может оцениваться по шкале типа отношения сигнала к шуму.

[20] Примерами кодеров формы сигнала могут служить кодеры типа ИКМ (с импульсно-кодовой модуляцией), ДМ (с дельта-модуляцией), АИКМ (с адаптивной ИКМ), ДИКМ (с дифференциальной ИКМ), АДИКМ (с адаптивной дифференциальной ИКМ) и т.д.

[21] Первым коммерчески используемым вокодером был ИКМ вокодер на 64 кбит/с, принятый в качестве международного стандарта в 1972 году. Этот кодер все еще широко используется во многих цифровых системах, особенно в обычных телефонах. Через двенадцать лет, в 1984 году, ИКМ вокодер на 64 кбит/с был заменен АДИКМ кодером на 32 кбит/с. По сравнению с ИКМ кодером на 64 кбит/с АДИКМ кодер на 32 кбит/с имеет меньшую скорость передачи данных и поэтому часто используется в качестве критерия качества речи для кодеров с низкой скоростью передачи данных.

[22] Недостаток кодера формы сигнала заключается в том, что качество речи сильно ухудшается при скорости ниже 16 кбит/с. Однако поскольку форма сигнала относительно просто реализуема и ее получали при небольшом объеме вычислений, кодер формы сигнала до сих пор применяется во многих разнообразных областях.

[23] Наконец, гибридный кодер, имеющий все преимущества кодера формы сигнала и кодера источника, кодирует разность между исходным звуком и восстановленным звуком.

[24] Гибридный кодер преобразует речевой сигнал в цифровую ИКМ, а вокодер выделяет лишь характеристики речи с помощью ИКМ на 64 кбит/с.

[25] Таким образом, гибридный кодер может поддерживать лучшее качество речи даже при низких скоростях передачи данных около 8 кбит/с.

[26] В соответствии с моделированием сигнала рассогласования гибридные кодеры можно разделить на следующие типы: RELP (с линейным предсказанием и усеченным возбуждением), MPLPC (с линейным предсказанием и многоимпульсным возбуждением), CELP (с линейным предсказанием и кодовым возбуждением), VSELP (с линейным предсказанием и возбуждением векторной суммой), RPE-LTP (с долговременным линейным предсказанием и возбуждением регулярной последовательностью импульсов) и IMBE (с улучшенным многополосным возбуждением).

[27] Гибридный кодер кодирует сигнал рассогласования между исходным звуком и восстановленным сигналом и передает кодированный сигнал. С этой целью используется векторное квантование.

[28] В процессе векторного квантования находят индекс таблицы кодирования, имеющий минимальную среднеквадратическую ошибку между исходным сигналом и реконструированным сигналом, и передают индекс с целью получения в результате этого эффекта сжатия.

[29] На фиг.1 в общих чертах изображена блок-схема речевого кодека и системы передачи речи, известных из уровня техники.

[30] В общем случае речь состоит из вокализованных звуков и невокализованных звуков, в зависимости от того, вибрируют или нет голосовые связки.

[31] Вокализованные звуки образуются, когда воздушный поток с периодичностью, задаваемой вибрацией голосовых связок, проходит через голосовой тракт, который колеблется между голосовой щелью и губами. Невокализованные звуки образуются при возникновении некоторой структуры в какой-то точке голосового тракта и принудительного пропускания воздуха через эту структуру для создания турбулентности при отсутствии вибрации голосовых связок.

[32] Когда человек говорит, физическая форма голосового тракта изменяется во времени. Следовательно, речевые сигналы являются нестационарными.

[33] В примере модели генерации речи используется изменяющийся во времени цифровой фильтр, чтобы продемонстрировать характеристики голосового тракта, причем в зависимости от того, является ли звук вокализованным или невокализованным, возбуждается входной сигнал для элемента периодической последовательности импульсов или белого шума.

[34] Как показано на фиг.1, система передачи речи, в которой пользователь передает свою речь другой стороне, используя устройство речевой связи, включает в себя LPC (сокращ. от Linear Predictive Coding (англ.) - кодирование с линейным предсказанием) анализатор 100, на вход которого поступает речевой сигнал, показанный на фиг.3, устройство выделения высоты основного тона 110, кодер 120, декодер 130 и LPC синтезатор 140.

[35] Для декодирования речевого сигнала система передачи речи представляет речевой сигнал перед его передачей на основе высоты основного тона и огибающей.

[36] LPC анализатор 100, на вход которого поступает речевой сигнал, получает коэффициент фильтра, отражающий характеристики огибающей речевого спектра.

[37] Устройство выделения высоты основного тона 110 определяет, является ли речевой сигнал вокализованным или невокализованным, и если речевой сигнал является вокализованным, высоту основного тона выбирают в качестве входного сигнала, но если речевой сигнал является невокализованным, в качестве входного сигнала выбирают белый шум.

[38] Кодер 120 кодирует речевой сигнал на основе коэффициента фильтра и переменной, полученной от LPC анализатора 100 и устройства выделения высоты основного тона 110, и передает сигнал другой стороне по проводному или беспроводному каналу.

[39] Декодер 130 демультиплексирует и декодирует поток, переданный по каналу.

[40] LPC синтезатор 140 преобразует декодированный речевой поток в речь и выдает синтезированную речь.

[41] Известный вокодер описанной выше структуры служит просто для усиления аналогового речевого сигнала или для преобразования аналогового речевого сигнала в цифровой сигнал и обеспечивает возможность обмена сигналами через интерфейс по проводам или без проводов. Его основная роль заключается в минимизации звуковых искажений и шумов и, таким образом, восстановлении оригинального звучания, насколько это возможно.

[42] Однако, учитывая, что большинство людей в настоящее время используют телефон очень часто, обычного речевого общения недостаточно, чтобы удовлетворить разнообразные потребности пользователей.

[43] Например, поскольку в современном мире женщины чувствуют себя неуверенными и незащищенными, то они часто хотят отвечать по телефону мужским голосом, особенно, когда находятся дома одни.

[44] Кроме того, имеются люди, которые хотят создавать речевые сообщения или сообщения голосовой почты, используя отличный от их собственного голос, надеясь, что их собеседникам эти сообщения понравятся.

КРАТКОЕ ИЗЛОЖЕНИЕ СУЩЕСТВА ИЗОБРЕТЕНИЯ

[45] Целью настоящего изобретения является решение, по меньшей мере, рассмотренных выше проблем и/или устранение указанных недостатков и обеспечение, по меньшей мере, преимуществ, описываемых ниже.

[46] Соответственно, одной из целей настоящего изобретения является решение вышеупомянутых проблем путем создания устройства и способа речевой модуляции, которые позволили бы пользователю изменить основной тон своего голоса, когда пользователь хочет передать речевое сообщение или сообщение голосовой почты, используя устройство речевой связи, и тем самым обеспечили бы защиту частной жизни пользователя.

[47] Вышеупомянутые и другие цели и преимущества достигаются путем разработки устройства речевой модуляции, включающего LPC анализатор для получения коэффициентов фильтра голосового тракта, отражающих характеристики входного речевого сигнала; устройство выделения высоты основного тона для определения высоты основного тона и половой принадлежности речевого сигнала; модулятор высоты основного тона для модулирования речевого сигнала путем применения заданной величины к значению, определенному устройством выделения высоты основного тона; кодер для кодирования входного сигнала от LPC анализатора и модулятора высоты основного тона и для выдачи кодированного сигнала.

[48] В предпочтительном примере осуществления изобретения устройство выделения высоты основного тона включает в себя устройство определения половой принадлежности для идентификации половой принадлежности входного речевого сигнала по высоте основного тона и/или частоте входного речевого сигнала.

[49] В предпочтительном примере осуществления изобретения устройство выделения высоты основного тона содержит запоминающее устройство для хранения результата умножения значения высоты основного тона, выдаваемого устройством выделения высоты основного тона, на заданную величину; и умножитель для умножения величины, выдаваемой запоминающим устройством, на значение, выдаваемое устройством выделения высоты основного тона.

[50] В предпочтительном примере осуществления изобретения в запоминающем устройстве сохраняется, по меньшей мере, две величины для использования с целью изменения сигнала, выдаваемого устройством выделения высоты основного тона.

[51] Другой стороной настоящего изобретения является способ речевой модуляции, включающий следующие операции: анализ входного речевого сигнала от пользователя и определение высоты его основного тона; принятие решения в отношении выбора пользователем функции речевой модуляции; изменение периода основного тона речевого сигнала и модуляция высоты основного тона голоса, если пользователь выбирает функцию речевой модуляции; и кодирование входного сигнала и выдача кодированного сигнала.

[52] Еще одной стороной изобретения является способ речевой модуляции, включающий следующие операции: определение половой принадлежности и высоты основного тона входного сигнала в устройстве выделения высоты основного тона; умножение определенного значения на заданную величину в модуляторе высоты основного тона для речевой модуляции речи; преобразование в кодере выдаваемого модулятором высоты основного тона значения и выдача кодированного значения.

[53] Дополнительно способ речевой модуляции включает в себя операцию сохранения в запоминающем устройстве, по меньшей мере, двух весовых коэффициентов с учетом входного речевого сигнала и выходного речевого сигнала.

[54] При адаптации настоящего изобретения к устройству речевой связи высоту основного тона голоса можно изменять по желанию. Таким образом, пользователь может передавать другой стороне сообщение голосовой почты или речевое сообщение собственным голосом или другим голосом, в зависимости от его желания. Следовательно, настоящее изобретение может с успехом использоваться для удовлетворения разнообразных запросов.

[55] Кроме того, настоящее изобретение может быть также адаптировано к устройству речевой связи, поддерживающему передачу MMS-сообщений в формате IMT-2000 (международной системы мобильной связи 2000, примеч. перевод.), благодаря чему обеспечивается выполнение функции идентификации вызывающего абонента с использованием голоса вызывающего абонента и тем самым защищается частная жизнь вызываемого абонента.

[56] Другие преимущества, цели и признаки изобретения будут отчасти изложены в представленном ниже описании и отчасти будут понятны специалистам в данной области техники при изучении нижеследующего или могут быть определены при применении изобретения на практике. Цели и преимущества настоящего изобретения могут быть реализованы и достигнуты особенно в соответствии с приведенной формулой изобретения.

КРАТКОЕ ОПИСАНИЕ ЧЕРТЕЖЕЙ

[57] Настоящее изобретение будет подробно описано со ссылками на следующие чертежи, на которых одни и те же номера позиций относятся к одним и тем же элементам.

[58] На фиг.1 представлена в общих чертах блок-схема речевого кодека и системы передачи речи, известных из уровня техники.

[59] На фиг.2 представлена блок-схема, иллюстрирующая структуру устройства речевой модуляции в соответствии с настоящим изобретением;

[60] на фиг.3 показаны частотный спектр и высота основного тона входного речевого сигнала (вокализованный звук);

[61] на фиг.4 показана упрощенная блок-схема модулятора высоты основного тона и его периферийных устройств;

[62] фиг.5а и 5b иллюстрируют предпочтительные примеры осуществления модулятора высоты основного тона в соответствии с настоящим изобретением;

[63] фиг.6 иллюстрирует состояние, в котором модулированный вокализованный сигнал согласно фиг.5а или невокализованный немодулированный сигнал согласно фиг.5b подают на вход кодера;

[64] фиг.7 иллюстрирует другой пример осуществления модулятора высоты основного тона в соответствии с настоящим изобретением;

[65] фиг.8 иллюстрирует состояние, в котором модулированный речевой сигнал согласно фиг.7 подают на вход кодера; и

[66] на фиг.9 показана схема последовательности операций способа речевой модуляции в соответствии с настоящим изобретением.

ПОДРОБНОЕ ОПИСАНИЕ ПРЕДПОЧТИТЕЛЬНЫХ ПРИМЕРОВ ОСУЩЕСТВЛЕНИЯ ИЗОБРЕТЕНИЯ

[67] Ниже будет представлено подробное описание устройства и способа речевой модуляции в соответствии с предпочтительным примером осуществления изобретения со ссылками на сопроводительные чертежи.

[68] На фиг.2 представлена блок-схема, иллюстрирующая структуру устройства речевой модуляции в соответствии с настоящим изобретением.

[69] Как показано на фиг.3, устройство речевой модуляции включает в себя LPC анализатор 200, устройство выделения высоты основного тона 210, модулятор высоты основного тона 220 и кодер 230.

[70] Внутри устройства выделения высоты основного тона 210 находится устройство определения половой принадлежности 210а для определения половой принадлежности по частоте или высоте основного тона входного речевого сигнала.

[71] Кроме того, модулятор высоты основного тона 220 содержит запоминающее устройство 220а, в котором хранится заданная величина для умножения на значение высоты основного тона, выдаваемое устройством выделения высоты основного тона 210, и умножитель, который умножает выходное значение запоминающего устройства на выходное значение устройства выделения высоты основного тона 210.

[72] На фиг.3 показаны частотный спектр и высота основного тона речевого сигнала, подаваемого на вход LPC анализатора 200 и устройства высоты основного тона 210.

[73] На фиг.3 F0 означает частоту основной гармоники, а F1, F2, F3 и F4 - формантные частоты. С помощью этих элементов устройство способно идентифицировать голоса.

[74] Здесь термин 'формантные частоты' означает частоты настройки фильтра речевого тракта.

[75] На фиг.4 представлена упрощенная блок-схема модулятора высоты основного тона и его периферийных устройств. Внутренняя структура модулятора высоты основного тона та же самая, что и показана выше.

[76] Модулятор высоты основного тона голоса преобразует высоту основного тона голоса пользователя (т.е. говорящего), которую выдавает устройство выделения высоты основного тона, в желаемую высоту основного тона голоса. Это достигается путем умножения значения высоты основного тона исходного речевого сигнала на весовые коэффициенты.

[77] Заданные весовые коэффициенты хранятся в базе данных.

[78] Более конкретно, в базе данных весовых коэффициентов содержатся заданные величины в диапазоне от 0,8 до 1,2, и когда пользователь выбирает конкретное значение, то оно умножается на Т0 (исходный сигнал) и сохраняется в потоковом формате вокодера для передачи.

[79] Весовые коэффициенты тщательно определяются с учетом желаемого речевого выходного сигнала, получающегося из входного речевого сигнала.

[80] Например, разные весовые коэффициенты применяются в разных случаях, т.е. при модуляции женского голоса в другой женский голос или мужской голос и при модуляции мужского голоса в другой мужской голос или женский голос.

[81] Весовые коэффициенты для речевой модуляции подбираются так, чтобы они были больше, когда выдаваемый на выходе модулированный голос является скорее мужским, чем женским.

[82] На фиг.5а показан один пример осуществления модулятора высоты основного тона в соответствии с настоящим изобретением, в котором высота тона женского голоса модулируется путем умножения на весовой коэффициент в высоту основного тона другого женского голоса или высоту основного тона мужского голоса.

[83] Как показано на фиг.5а, когда входной сигнал вокализован, определяют высоту основного тона и для речевой модуляции ее умножают на весовой коэффициент. С другой стороны, когда входной сигнал невокализован, входной сигнал выдается как он есть, без речевой модуляции.

[84] На фиг.6 показано состояние, в котором модулированный вокализованный сигнал согласно фиг.5а или невокализованный сигнал без модуляции согласно фиг.5b подают на вход кодера.

[85] Как показано на фиг.6, имеется два типа элементов для подачи на вход кодера: один представляет собой последовательность импульсов, являющуюся результатом умножения выходного значения (Т0) устройства выделения высоты основного тона на весовой коэффициент (W_K), хранящийся в базе данных запоминающего устройства, а другой представляет собой белый шум, который подают в обход модулятора высоты основного тона.

[86] Кроме того, на фиг.6 показана внутренняя структура кодера 230.

[87] На фиг.7 представлен пример осуществления модулятора высоты основного тона в соответствии с настоящим изобретением, в котором женский голос модулируется в мужской голос.

[88] Как показано на фиг.7, когда входной сигнал вокализован, определяют высоту основного тона голоса (Т0) входного речевого сигнала и умножают ее на соответствующий весовой коэффициент для речевой модуляции.

[89] На фиг.8 показано состояние, в котором модулированный речевой сигнал согласно фиг.7 или немодулированный речевой сигнал подают на вход кодера.

[90] Как показано на фиг.8, на вход кодера могут подаваться элементы двух типов. Один представляет собой последовательность импульсов, являющуюся результатом умножения выходного значения (ТО) устройства выделения высоты основного тона на весовой коэффициент (W_N), хранящийся в базе данных запоминающего устройства, а другой представляет собой белый шум, который подают в обход модулятора высоты основного тона.

[91] Далее описывается работа устройства речевой модуляции со ссылками на соответствующие чертежи.

[92] Как показано на фиг.3, входной речевой сигнал проходит через LPC анализатор 200 и устройство выделения высоты основного тона 210 согласно фиг.2.

[93] С помощью LPC анализатора 200, на вход которого подают речевой сигнал, получают коэффициенты фильтра, отражающие характеристики огибающей речевого спектра.

[94] LPC анализатор 200 дает коэффициенты фильтра, отражающие характеристики огибающей речевого спектра, на основе LPC (кодирования с линейным предсказанием), что позволяет предсказывать текущий сигнал по прошлым сигналам.

[95] Устройство выделения высоты основного тона 210, включающее устройство определения половой принадлежности 210а, определяет, является речевой сигнал вокализованным или невокализованным. Как показано на фиг.6 и фиг.8, если входной речевой сигнал вокализован, в качестве входного сигнала для речевой модуляции выбирают высоту основного тона голоса, а если входной речевой сигнал невокализован, в качестве входного сигнала модулятора высоты основного тона выбирают белый шум.

[96] На основе частоты или высоты основного тона входного сигнала определяют, является ли говорящий мужчиной или женщиной.

[97] Что касается генерирования вокализованного звука, то сигналом возбуждения может быть модулированный воздушный поток, обусловленый вибрацией голосовых связок.

[98] Сигнал возбуждения является периодическим в соответствии с периодом основного тона, а его спектр содержит гармоники периодических сигналов.

[99] Что касается генерирования невокализованного звука, то в какой-то точке голосового тракта формируется некоторая структура, и воздух для создания турбулентности принудительно пропускается через эту структуру, чтобы получить при этом сигнал возбуждения. Указанный сигнал возбуждения по своей природе подобен шумам.

[100] Основной тон вокализованного звука представляют в виде последовательности импульсов. Период последовательности импульсов называется высотой основного тона речи, дающей представление о высоких и низких звуках.

[101] Различие между мужским голосом и женским голосом также выявляется благодаря разности частот гармоник основного тона.

[102] Модулятор 220 высоты основного тона изменяет высоту основного тона входного речевого сигнала, получаемого от устройства выделения высоты основного тона 210 с использованием периода основного тона. Кодер 230 кодирует модулированную речь с помощью переменных, полученных от LPC анализатора 200 и модулятора высоты основного тона 220, и в конце выдает поток битов.

[103] Вышеупомянутая процедура модуляции применяется, когда пользователь выбирает функцию речевой модуляции. Если пользователь не выбирает функцию речевой модуляции, речевой сигнал кодируют без модуляции.

[104] Кодированный речевой сигнал, сопровождающийся процедурой модуляции, передают затем другой стороне по проводному или беспроводному каналу.

[105] Устройство речевой связи другой стороны включает в себя декодер и LPC синтезатор. Декодер демультиплексирует переданный по каналу поток данных и находит переданную переменную; используя эту переменную LPC синтезатор синтезирует речь вызывающего абонента и выдает на выходе синтезированную речь.

[106] Работа вышеописанного устройства речевой модуляции ниже обсуждается на примере.

[107] Как показано на фиг.7, предположим, что пользователь, молодая женщина, вводит свою речь в терминал мобильной связи для отправки сообщения голосовой почты своему другу и выбирает функцию речевой модуляции с целью преобразования своего голоса в мужской голос.

[108] Голос молодой женщины является периодической вокализованной речью, и период основного тона вокализованной речи становится высотой основного тона голоса молодой женщины.

[109] Для женского голоса выдаваемое устройством выделения высоты основного тона значение (переменную) умножают на соответствующий весовой коэффициент, что дает в результате элемент последовательности импульсов, как это показано на фиг.8.

[110] Затем сообщение голосовой почты с модулированной речью молодой женщины передают другой стороне, и друг молодой женщины слышит мужской голос, как и желает вызывающий абонент.

[111] На фиг.9 приведена последовательность операций способа речевой модуляции в соответствии с настоящим изобретением.

[112] При вводе речевого сигнала пользователя речевой сигнал анализируют с помощью LPC анализатора и устройства автокорреляции при разделении на высоту основного тона и параметр фильтра голосового тракта, отражающий характеристики огибающей (S100).

[113] Принимают решение, выбирает ли пользователь функцию речевой модуляции (S110), и если это так, то высоту основного тона голоса модулируют, как желает пользователь (S120).

[114] Речевая модуляция возможна за счет изменения периода последовательности импульсов речевого сигнала. То есть выходное значение (переменную) устройства выделения высоты основного тона умножают на заданный весовой коэффициент для речевой модуляции.

[115] После речевой модуляции речь подвергают обработке. Обработка речи включает кодирование модулированной речи (S130) и выдачу потока битов из кодированной речи (S140). Затем выданный поток битов передают по каналу, декодируют и осуществляют процесс LPC синтеза перед выдачей другой стороне.

[116] Однако, если пользователь не выбирает функцию речевой модуляции, речь пользователя не модулируют, но речевой сигнал пользователя кодируют (S130). Опять из кодированного речевого сигнала получают поток битов и передают его другой стороне по каналу (S140).

[117] В заключение, при адаптации настоящего изобретения к устройству речевой связи высоту основного тона голоса пользователя можно изменять по желанию. Следовательно, пользователь может передавать другой стороне сообщение голосовой почты или речевое сообщение с его собственным голосом или измененным голосом, по своему желанию. Следовательно, настоящее изобретение можно с успехом использовать для удовлетворения разнообразных запросов.

[118] Кроме того, настоящее изобретение можно адаптировать к устройству речевой связи, поддерживающему передачу MMS-сообщений в формате IMT-2000, тем самым обеспечивается возможность применения функции идентификации вызывающего абонента по голосу вызывающего абонента и, следовательно, защиты частной жизни вызываемого абонента.

[119] Хотя настоящее изобретение показано и описано со ссылками на предпочтительные примеры его осуществления, специалисту в данной области техники очевидно, что могут быть внесены различные изменения в форму выполнения и детали без отступления от сущности и объема настоящего изобретения, как это определено в приведенной формуле изобретения.

[120] Вышеупомянутые примеры осуществления и преимущества приведены лишь в качестве частных случаев и не могут рассматриваться как ограничивающие настоящее изобретение. Настоящие положения могут быть легко применены к другим типам устройств. Описание настоящего изобретения имеет пояснительный характер и не ограничивает объем формулы изобретения. Специалистам в данной области техники очевидно, что возможны альтернативы, модификации и изменения. В формуле изобретения признаки, характеризующие средство и его функцию, предназначены для обобщения структур, описанных здесь, как осуществляющих указанные функции, причем не только как структурных эквивалентов, но также и эквивалентных структур.

1. Устройство речевой модуляции, содержащее:

предназначенный для кодирования с линейным предсказанием анализатор (LPC анализатор) для получения коэффициентов фильтра голосового тракта, отражающих характеристики входного речевого сигнала;

устройство выделения высоты основного тона для определения высоты основного тона и половой принадлежности речевого сигнала;

модулятор высоты основного тона для модулирования речевого сигнала путем умножения заданной величины на высоту основного тона, выделенную устройством выделения высоты основного тона; и

кодер для кодирования входного сигнала от LPC анализатора и модулятора высоты основного тона и для выдачи кодированного сигнала.

2. Устройство по п.1, отличающееся тем, что устройство выделения высоты основного тона содержит устройство идентификации половой принадлежности входного речевого сигнала на основании, по меньшей мере, одной из следующих величин: высота основного тона и частота входного речевого сигнала.

3. Устройство по п.1, отличающееся тем, что модулятор высоты основного тона содержит запоминающее устройство для хранения результата умножения значения высоты основного тона, выдаваемого устройством выделения высоты основного тона, на заданную величину; и умножитель для умножения величины, выдаваемой запоминающим устройством, на значение, выдаваемое устройством выделения высоты основного тона.

4. Устройство по п.3, отличающееся тем, что запоминающее устройство хранит, по меньшей мере, две величины для использования с целью изменения сигнала, выдаваемого устройством выделения высоты основного тона.

5. Способ речевой модуляции, содержащий следующие операции:

анализ входного речевого сигнала от пользователя и определение высоты его основного тона;

принятие решения в отношении выбора пользователем функции речевой модуляции;

изменение периода основного тона речевого сигнала и модулирование высоты основного тона голоса, если пользователь выбирает функцию речевой модуляции; и

кодирование входного сигнала и выдача кодированного сигнала.

6. Способ речевой модуляции, содержащий следующие операции:

определение половой принадлежности и высоты основного тона входного сигнала в устройстве выделения высоты основного тона;

умножение выделенной высоты основного тона на заданную величину в модуляторе высоты основного тона для речевой модуляции;

преобразование в кодере значения, выданного модулятором высоты основного тона, и выдача кодированного значения.

7. Способ по п.6, отличающийся тем, что дополнительно включает операцию сохранения в запоминающем устройстве, по меньшей мере, двух весовых коэффициентов с учетом входного речевого сигнала и выходного речевого сигнала.

8. Способ по п.7, отличающийся тем, что, если модулированная речь на выходе соответствует говорящему, то заданная величина, сохраняемая для речевой модуляции, больше для говорящего, чем для говорящей.

9. Способ по п.6, отличающийся тем, что анализ половой принадлежности для определения половой принадлежности речевого сигнала осуществляют путем использования частоты и/или периода основного тона входного речевого сигнала.

10. Способ по п.9, отличающийся тем, что результат умножения выходного значения устройства выделения высоты основного тона на заданный весовой коэффициент выдают на кодер.

11. Способ по п.6, отличающийся тем, что речевую модуляцию осуществляют путем изменения периода последовательности импульсов речевого сигнала.

Изобретение относится к технике улучшения речевых сигналов для улучшения связи в присутствии фонового шума. .

Способ и устройство для частотно-избирательного выделения основного тона синтезированной речи // 2327230

Изобретение относится к способу и устройству для последующей обработки декодированного звукового сигнала, причем декодированный звуковой сигнал делят на совокупность сигналов частотных поддиапазонов и последующую обработку применяют к, по меньшей мере, одному из совокупности сигналов частотных поддиапазонов.

Способ и устройство сжатия спектра речевых сигналов // 2320028

Изобретение относится к области временного сжатия речевых сигналов. .

Способ сжатия и восстановления речевых сообщений // 2320027

Изобретение относится к области электросвязи, а именно к области, связанной с сокращением избыточности передаваемой информации, в частности к способу сжатия и восстановления речевого сигнала.

Корректор речи водолаза // 2275693

Изобретение относится к водолазной технике, а именно к корректорам (преобразователям) речи водолазов-глубоководников. .

Способ распознавания речевых команд управления // 2271578

Изобретение относится к анализу речи в неблагоприятных условиях окружения. .

Способ сжатия и восстановления речевых сообщений // 2216791

Изобретение относится к области электросвязи, а именно к области, связанной с сокращением избыточности передаваемой информации. .

Система адаптивной фильтрации аудиосигналов для улучшения разборчивости речи при наличии шума // 2163032

Изобретение относится к передаче речи. .

Способ сжатия и восстановления речевых сообщений // 2152646

Изобретение относится к области электросвязи, а именно к области связанной с сокращением избыточности передаваемой информации. .

Имитатор шума, управляемый детектированием активности речи // 2151430

Способ сжатия и восстановления речевых сообщений // 2343565

Изобретение относится к системам передачи информации по цифровым каналам связи

Способ и устройство формирования изображения для распознавания направления распространения звука речи // 2345422

Изобретение относится к техническим средствам для распознавания направления распространения звука речи и ориентации глухонемых людей в пространстве

Система и способ обработки звукового сигнала // 2347282

Изобретение относится к цифровой обработке аудиосигнала

Блок разрешения диалога голосового браузера для системы связи // 2349970

Изобретение относится к управлению режимом работы устройства радиосвязи, более конкретно к способу работы многорежимного устройства радиосвязи в различных системах

Способ и устройство для восстановления речи в системе распределенного распознавания речи // 2366007

Изобретение относится к восстановлению речи, более конкретно к способу и устройству для восстановления речи в системе распределенного распознавания речи

Способ и устройство для повышения разборчивости речи с использованием нескольких датчиков // 2373584

Изобретение относится к устранению шума из речевых сигналов

Системы, способы и устройства для высокополосного предыскажения шкалы времени // 2376657

Изобретение относится к речевой связи по коммутируемой телефонной сети общего пользования

Способ многосенсорного улучшения речи на мобильном ручном устройстве и мобильное ручное устройство // 2376722

Изобретение относится к удалению шума из сигналов речи, принятых мобильными ручными устройствами

Синтезирование монофонического звукового сигнала на основе кодированного многоканального звукового сигнала // 2381571

Изобретение относится к способу синтезирования монофонического звукового сигнала на основе имеющегося кодированного многоканального звукового сигнала

Системы, способы и устройство широкополосного речевого кодирования // 2381572

Изобретение относится к обработке широкополосных речевых сигналов