Устройство для ввода и вывода речевой информации

Авторы патента:

СВИРИДЕНКО ВЛАДИМИР АЛЕКСАНДРОВИЧ

ЗВЕЗДИН ВИКТОР СЕРГЕЕВИЧ

G06F3/16 - ввод с помощью звука; вывод в виде звука (преобразование речи в дискретную информацию или наоборот G10L)

С Ж" -и й

Союз Советскня

Соцналнстнческнк

Раснублнк

ОПИ

ИЗОБРЕТЕНИЯ

<11>792247.Ф .т

Х АВТОРСКОМУ СВИДЕТЕЛЬСТВУ (61) Дополнительное к авт. саид-ву (22) Заявлено 2 1277 (21) 2562179/18-24 (51)М. К> з

G 06 F 3/16 с присоединением заявнм М (23) ПриоритетвЂ”

Госудавственный комитет

СССР яо делам нзобретеннй я открытнй

Опубликовано ЗЫ28сс. Бюллетень No 48

Дата опубликования описания 3(11280 (53) УДК 681 ° 327..11(088 ° 8) (72) Авторы изобретения.

В. A. Свириденко и В. С. Эвездин (71) Заявитель

Московский институт инженеров гражданской авиации (54) УСТРОИСТВО ДЛЯ ВВОДА И ВЫВОДА РЕЧЕВОЯ

ИНФОРМАЦИИ

Изобретение относится к области речевой связи человека с машинами.

Известны устройства для передачи и приема речевых сигналов на основе идентификации параметров речеобраэующего тракта (1, 2) методами линейного предсказания по критерию минимума дисперсии ошибки предскаэ ания „ 13 и 12) Наиболее близким по технической сущности является вокодерное устройство, в котором предполагается, что модель речеобразующего тракта, структура которой одновременно является и структурой синтезатора речи на приемной стороне, содержит генератор возбуждающей функции e(t), которая может быть или шумовой (е(с)=е !с,) .для невокализованных участков речи или квазипериодической импульсной последовательностью (е(t) е (с)) с м частотой основного тока Г т для невокализованных участков речи (3) .

В соответствии с этим такой синтезатор состоит из генератора белого шума с равномерным спектром и генератора квазипериодических импульсов.

В зависимости от вида возбуждающей функции к одному из укаэанных генераторов подключается с помощью .переключателя "тон-шум" усилитель, .регулируемый коэффициент A усиления которого определяет интенсивность соответствующих участков речи. Выходной сигнал усилителя Е(t)=А е(t) подается па первый вход сумматора, выход которого через линейный фильтр с регулируемыми параметрами Ch =

t,d,....д. ) подключен ко входу второго сумматора. Указанные сумматор и фильтр образуют линейную систему с переменными параметрами, модулирующу:о речеобразующий голосовой

15 тракт. Выходной сигнал этой линейной

I системы является речевым сигналом

5(с).

На передающей стороне анализатор

2Р речевого сигнала по его дискритизированной копии (S;j дает оченки ряда параметров, что выполняет специальные оцениватели, функционирующие по известному алгоритму. В их число

25 входит устройс;.во оценки соотношения "тон-шум",устройство оценки интенсивности A участка речи, выделитель основного тона, идентификатор вектора параметров. Последний опреЗр деляет оценку d, вектора d. в соот792247 ветствии с алгоритмом минимума среднеквадратической ошибки.

С выхода анализатора через уплотнитель в канал (далее он предполагается дискретным) передаются сигнал классификации "тон-шум" (например 0 вЂ” тон, 1 вЂ” шум) оценка А ин+ 5 тенсивности анализируемого участка речи, оценка fzt на выходе блока выделения основного тона, оценка d вектора с с выхода блока идентификации параметров, на вход которого подается сигнал $S„$ и ошибка е; .

На приемной стороне принятые оценки тон-шум А, t „, d. после их разот деления в блоке разделения сигналов подаются в соответствующие блоки 1$ синтезатора: на переключатель "тоншум", усилитель с регулируемым коэффициентом усиления, генератор квазипериодических импульсов, линейный фильтр с регулируемыми параметрами. ро

Структура синтезатора, как указывалось, полностью повторяет модель речеобраэующего тракта.

Такой вокодер не позволяет добиться высокого качества системы р5 синтЕтической телефонии в силу отсутствия в ней компонента моделирующих участков речевого сигнала, соответствующих носовым звукам. Это снижает узнаваемость говорящего, речевое со- З общение которого передается по такой системе синтетической телефонии.

Целью изобретения является улуч.шение качества вводимой и выводимой информации путем повышения степени идентификации сигналов.

Поставленная цель достигается тем, что в устройство для ввода и вывода речевой информации, содержащее первый линейный фильтр, подключенный к первому вычитателю, и последователь- 40 но соединенные преобразователь речевых сигналов, микрофон, аналого-цифровой преобразователь, первый дискриминатор, блок уплотнения сигналов, параллельно подключенный через блоки 45 измерения интенсивности речевого сигнала и выделения основного тона к аналого-цифровому преобразователю, блок сопряжения, блок разделения сигналов, подключенный через второй линейный фильтр к первому сумматору, первый генератор, первый переключатель, подключенный ко второму генератору и блоку разделения сигналов, и усилитель, подключенный к блоку разделения сигналов, дополнительно вве55 дены последовательно соединенные второй переключатель, подключенный к аналого-цифровому преобразователю и блоку уплотнения сигналов, второй вычитатель, третий вычитатель, тре- go тий линейный фильтр, первый блок идентификации параметров, подкопоченный к третьему вычитателю и первому блоку идентификации параметров, второй дискриминатор, подключенный к 65 аналого-цифровому реобразователю и блоку уплотнения сигналов, третий переключатель, подключенный ко второму переключателю, второй блок идентификации параметров, подключенный к первому линейному фильтру, блоку уплотнения сигналов и второму вычитателю, четвертый линейный фильтр, подключенный к первому вычитателю, четвертый вычитатель, подключенный ко второму переключателю, второму вычитателю и первому блоку идентификации параметров, второй сумматор, подключенный к третьему переключателю, и пятый линейный фильтр, подключенный ко второму дискриминатору, и последовательно соединенные четвертый переключатель, подключенный к усилителю, блоку разделения сигналов и первому сумматору, третий сумматор, шестой линейный фильтр, подключенный к блоку разделения сигналов, четвертый сумматор, подключенный к выходной шине, и седьмой линейный фильтр, подключенный к блоку разделения сигналов, первому сумматору и второму линейному фильтру.

Предлагаемое устройство, блоксхема которого представлена на чертеже, содержит аналого-цифровой преобразователь 1, второй переключатель

2, четвертый:вычитатель 3, четвертый линейный фильтр 4, первый вычитатель 5, первый линейный фильтр 6, третий переключатель 7, пятый линейный фильтр 8, второй блок 9 идентификации параметров, второй вычитатель

10, третий вычитатель 11, третий линейный фильтр 12, первый блок 13 идентификации параметров, первый дискриминатор 14, блок 15 измерения интенсивности сигнала, блок 16 выделения основного тока, второй дискриминатор 17, блок 18 сопряжения, второй генератор 19, первый генератор

20, первый переключатель 21, усилитель 22, четвертый переключатель 23, первый сумматор 24, второй линейный фильтр 25, седьмой линейный фильтр

26, четвертый сумматор 27, шестой линейный фильтр 28, блок 29 уплотнения сигналов, блок 30 разделения сигналов, второй сумматор 31, третий сумматор 32, выходная шина 33 и микрофон 34.

Предложенное устройство работает следующим образом.

Речевой сигнал S(t) подвергается обработке на приемной стороне в анализаторе с целью оценки по нему параметров модели речеобразующего тракта. При цифровой реализации предлагаемого устройства сигнал S(t) проходит блок 1, где дискредитируется с частотой 1 (обычно 6-20 кГц) и квантуется. Полученная последовательЭ ность IS j проходит через схему об1 аэования оценки функции возбуждения

jt) для случая прохождения E(с) че792247 рез модель голосового тракта или E(t) для случая прохождения Е(t) через модель носового тракта.

Рассмотрим ((t). Переключатель 2 стоит в положении голосовой тракт. В вычитателе 3 образуется y(t) вЂ” оценка у(t)=,S(1)-X(t), а 1() вЂ” оценка Z(t), образуемая на выходе сумматора 31.

Вычитание E(с) необходимо для устранения влияния отключенного носового тракта. Сигнал 7(t) проходит линейный фильтр 4. Далее полученный на выходе фильтра сигнал x(t) проходит вычитатель 5 и линейный фильтр б цепи обратной связи. Вычитатель 5 и линейный фильтр б выполняют роль линейного предсказателя. Точно такую же роль играют вычитатель 11 и линейный фильтр 12. В вычитателе 10 образуется сигнал Z(t) = S(t) - g(t), где устраняется влияние отключенного голосового тракта.

Блоки 9 и 13 идентификации параметров на основе анализа соответственно сигналов y(t) и Z(t), а также E(t) и Е(с) производят оценки параметров линейных фильтров К», 5» и

j ». Эти оценки управляют параметрами линейных фильтров 4 и 6 (для d.» и 5») и линеных фильтров 8 и 12 (для ») .

Новым является второй дискриминатор

17, Его работа в простейшем случае: может быть основана на том, что непосредственно перед лицом говорящего ставят специальный микрофон с двумя раздельными секциями, направленными на нос и рот. Более интенсивный сигнал в одной из секций и определяет положение переключателя. Другое решение вЂ” включение избирательного фильтра в схему переключателя (такой случай изображен на чертеже), характеристика которого моделирует Носовую полость, (фильтр, согласованный с линейной системой, образующий сигнал у(t) из Е(t)). Превышение эа интервал анализа уровнем сигнала заданного порога показывает, что E(t) про.ходит в течение этого интервала через носовую область. Выходной сигнал дискриминатора 17 подается на спаренные переключатели 2 и 7.

Оценки векторов (., 5 и ф, а также выходные сигналы дискриминаторов

14 и 17, а также блоков 15 и 16 подаются в блок 18 сопряжения через блок

29 уплотнения сигналов.

Рассмотрим работу синтезатора на приемной стороне, параметры которого изменяются под воздействием соответствующих сигналов, принимаемых из канала.

Функция возбуждения e (t), соответствующая вокализованнйм участкам речи, генерируется блоком 20. Частота следования импульсов Г соответствует частоте основного тона и может меняться в требуемых пределах.

Параметрами генератора 20, поло4р жением переключателей 21 и 23, уси лением блока 22, фильтров 26, 27 и

28 управляют соответственно переданные через блок 18 выходные сигналы блока 16, дискриминаторов 14 и 17, блока 15, блоков идентификации параметров 9 (оценки d.» и p,+) и 13 (оценка у») . Указанные сигналы подаются в соответствующие блоки после их разделения в блоке 30 разделения сигналов.

55 бО

5 !

Функция возбуждения е (t) для невокалиэованных участков речи формируется генератором 19, на выходе которого появляется случайный процесс с равномерным спектром. Переключатель 21 выбирает в соответствии с участком речи тип функции возбуждения е(t) путем подключения к формирователю речевого сигнала генераторов 19 или 20. После усиления в блоке 22 функция E(t) = А e(t) подается на переключатель 23. Он выполняет роль мягкого неба, отключая блоки, моделирующие голосовой тракт в момент произнесения носовых звуков.

Функция E(t) с выхода сумматора 24 подается на линейный фильтр 8, вектор параметров 5 =®pi,,...(„ ) которого подбирается так, чтобы корректировать требуемым образом сквозную характеристику., моделирующую форму голосового тракта. Параметры d u отражают положение артикуляционных органов, причем вектор j3 определяет в .некоторой мере характер коартикуляции и взаимодействие голосового и носового трактов. В другом положении переключателя 23 (стрелка вниз) сигнал Е(t) подается на линейный фильтр образованный сумматором 32 и фильтром с параметрами =(Т„,...I) ) в петле обратной связи (фильтр 28).

В простейшем случае параметры 1. постоянны, если считать, что форма носовой полости неизменна. На выходе сумматора 27 образуется речевой сигнал 5 (t) - Z (t) + у (t), где 2 (t) сигнал на выходе линейного фильтра, моделирующего носовой тракт,а у(t) выходной сигнал фильтра 26.

Предложенное устройство для ввода и вывода речевых сообщений позволяет существенно повысить качество системы при незначительном увеличении скорости передачи цифровой информации об оценках параметров модели речеобраэующего тракта, что обес" печит более высокую степень идентификации говорящего. При использовании предложенного устройства в системах речевого общения человека и 3ВМ значительно расширяются возможности систем путем улучшения характеристик идентификации дикторов или их верификации.

792247

Формула изобретения

Устройство для ввода и вывода ре4евой инфоРмации, содержащее первый линейный фильтр, подключенный к первому вычитателю, и последовательно соединенные преобразователь речевых сигналов, микрофон, аналого-цифровой преобразователь, первый дискриминатор, блок уплотнения сигналов, параллельно подключенный через блоки fg измерения интенсивности речевого сигнала и выделения основного тона к аналого-цифровому преобразователю, блок сопряжения, блок разделения сигналов, подключенный через второй линейный фильтр к первому сумматору, 15 первый генератор, первый переключатель, подключенный ко второму генератору и блоку разделения сигналов, и усилитель, подключенный .к блоку разделения сигналов, о т л и ч а ю щ е ес я тем, что, с целью улучшения качества вводимой и выводимой информации путем повышения степени идентификации сигналов, в устройство введены последовательно соединенные вто- 25 рой переключатель, подключенный к аналого-цифровому преобразователю и блоку уплотнения сигналов, второй вычитатель, третий вычитатель, третий линейный фильтр, первый блок 30 идентификации параметров, подключенный к третьему вычитателю и первому блоку идентификации параметров, второй дискриминатор, подключенный к аналого-цифровому преобразователю и блоку уплотнения сигналов, третий переключатель, подключенный ко второму переключателю, второй блок идентификации параметров, подключенный к первому линейному фильтру, блоку уплотнения сигналов и второму вычитателю, четвертый линейный фильтр, подключенный к первому вычитателю, четвертый вычитатель, подключенный ко второму переключателю, второму вычитателю и первому блоку идентификации параметров, второй сумматор, подключенный к третьему переключателю, и пятый линейный фильтр, подключенный ко второму дискриминатору, и последовательно соединенные четвертый переключатель, подключенный к усилителю, блоку разделения сигналов и первому сумматору, третий сумматор, шестой линейный фильтр, подключенный к блоку разделения сигналов, четвертый сумматор, подключенный к выходной шине, и седьмой линейный фильтр, подключенный к блоку разделения сигналов, первому сумматору и второму линейному фильтру. И ст оч ни к и инфо рмации, принятые во внимание при экспертизе

1. Шефер, Рабинер. Цифровое представление речевых сигналов. вЂ” "ТИИЭР". т.63, Р 4,1975. с.141-159..

2 Шредер Вокодеры анализ и син тез речи. вЂ” "ТИИЭР", т. 54, Р 5, 1966.

3. Flanagan i.L. Speech Analysis, Synthesis and Perception, 2-nd

ed. Springer-Ver1og. Ser1iп, 1972 (прототип).

ВНИИПИ Заказ 9434/48

Тираж 751 Подписное

Филиал ППП Патент, r, Ужгород, ул. Проектная, 4

Устройство для ввода и вывода речевой информации

Устройство для ввода-вывода речевой информации // 737946

Устройство для ввода информации // 666537

Устройство для ввода информации // 661546

Устройство для вывода информации из электронной вычислительной машины // 613318

Устройство для вывода речевой информации // 607211

Устройство для ввода-вывода информации // 577523

Устройство для формирования речевых сообщений // 560221

Устройство для ввода информации // 551637

Устройство для вывода речевых сигналов // 533925

Устройство для звукового управления игрушкой // 2218202

Изобретение относится к дистанционно управляемым игрушкам, реагирующим на речевое или звуковое воздействие

Утройство и способ приготовления и/или обработки продуктов // 2258250

Изобретение относится к устройствам для воспроизведения информации и управления процессом приготовления и/или обработки продуктов

Способ и устройство ввода пароля для доступа в компьютерные базы данных // 2263341

Изобретение относится к средствам ввода пароля для доступа в компьютерные базы данных

Устройство речевого управления автоматизированным рабочим местом отработки антенного блока радиолокационной станции // 2340930

Изобретение относится к области средств ввода информации в виде речи, преобразования речи в цифровую форму и распознавания речевых сигналов, а также к области средств управления аппаратурой, применяемой в различных сферах практической деятельности: радиоэлектронике, медицине, робототехнике и т.д

Синхронное понимание семантических объектов для высокоинтерактивного интерфейса // 2352979

Изобретение относится к доступу к информации в компьютерной системе с использованием распознавания и понимания

Звуковая обратная связь при навигации по меню // 2421779

Изобретение относится к устройствам для представления информации с навигацией в структуре меню

Улучшение сигнала вектора ближнего поля // 2434262

Изобретение относится к сенсорным системам ближнего поля

Устройство и способ аудио-визуального поиска и просмотра интерфейса, машиночитаемый носитель // 2453899

Изобретение относится к обеспечению возможности поиска и просмотра аудио и видео контента (AVSBI)

Устройство для ввода речевойинформации // 847317

Устройство для синтеза речи // 1095167