Устройство для синтеза речи

 

О П И С А Я И Е

ИЗОБРЕТЕ Н ИЯ

Союз Советских

Социалистических

Реслублик >669381

К АВТОРСКОМУ СВИДВТЕЛЬСТВУ (61) Дополнительное к авт. свид-ву— (22) Заявлено 15.04.77 (21) 2476670/18 — 10 с присоединением заявки № (23) Приоритет—

Опубликовано 25.06.79. Бюллетень № 23

Дата опубликования описания 05.07.79 (51) М.Кл. т

С 10L1/10

Госудврствеиный комитет

СССР оо делам изооретеиий и открытий (53) ДК 621 391.19 (088.8) (72) Автор изобретения

Е. А. Синебоков (23) Заявитель (54) УСТРОЙСТВО ДЛЯ СИНТЕЗА РЕЧИ

Изобретение относится к аппаратам для синтеза речевых сигналов по буквенной последовательности фонем и может быть применено, например, в педагогике, в частности в лингафонных кабинетах при обучении произношению слов и фраз на иностранном языке, в качестве вспомогательных технических средств для установления контактов между лицами с поражением голосовых связок и окружающими людьми, не знакомыми с системой Брейля, в качестве выводных устройств вычислительных машин специа- т0 лизированного назначения и т. д.

Известны устройства для синтеза речи, предназначенные, в основном для вывода информации специализированных вычислительньтх машин в звуковом виде (1).

Однако эти устройства сложны и не могут быть использованы для высококачественного синтеза речевых сигналов, например, при обучении иностранному языку в лингафонных кабинетах, поскольку речевой сигнал формируется из набора служебных слов, что не позволяет оперативно строить произвольные фразы.

Известен способ синтеза речевой информации из интонационно цельных фрагментов (синтагм), который позволяет при наличии

200 — 500 эталонов синтагм (в зависимости от сложности изучаемого языка) путем коммутации строить произвольные фразы любой сложности с весьма высоким качеством звучания речевого сигнала (2).

Известно устройство для синтеза речи, реализующее данный способ, содержащее телетайп, фиксирующий последовательность слов, предназначенных для синтеза, преобразователь буквенной информации в фонетическую, блок выбора пар фонем (диад), дешифратор диад, блок памяти эталонов диад (синтагм), преобразователь код-аналог, управляющий амплитудой выходного напряжения генераторов синусоидального напряжения с частотами от 100 Гц до 4 кГц с интервалом между соседними частотами

100 Гц, и воспроизводящее устройстго (динамик) (3) .

Однако, несмотря на целый ряд преимуществ перед другими известными устройствами для синтеза речевых сигналов (компактность аппаратуры, невысокая стоимость, хорошая разборчивость воспроизводимых

669381 з рс и н;Äx cnl H I.1ov), это устройство Hcnpnxleнимо для использования в качестве обучающих средств липгафонных кабинетов прн изучении иностранных языков и для использования в качестве вспомогательных Трхппческих средств общения лицами с пора кениями гoJloconl lx связок по следующим причинам.

Темп выдачи отдельных фонем телетайпом постоянен. В то же время, длительность звучания каждой из диад (сингагм) индивидуален, что приводит либо к накладке соседних синтагм в сложном слове, при длительности данной синтагмы больше, нежели темп выдачи диад телетайпом, либо к разрядке синтагм в сложном слове (к4провалам между отдельными слогами»), при длительности соседних синтагм меньше темпа выдачи диад телетайпом. И в том и в другом случае внятность синтезированного речевого сигнала снижается.

В большинстве наиболее распространенных языков правильность расстановки ударений в словах имеет весьма большое значение. Вследствие полного отсутствия ударений в синтезированном речевом сигнале известное устройство не может найти практического применения в лингафонных кабинетах.

В разговорной челевеческой речи смысловую нагрузку несет не только наличие тех илп иных синтагм, но и интонация их произношения. В известных технических решениях, направлеHHhlx на решение задачи синтеза речевых сигналов, интонационная составляющая речевых информаций полностью отсутствует, что существенно сужает область применения данных устройств как в процессе обучения иностранным языкам в лингафонных кабинетах, так и при использовании в качестве протезирующих устройств лицами с заболеваниями и поражениями голосовых связок.

Цель изобретения — — повышение разборчивости синтезируемого речевого сигнала, его информационной насыщенности и фонетической правильности произношения.

Это достигается тем, что выходы программирующего устройства дополнительно подклк1чены к управляющим входам допол,Inre.sI Ho установленных переключателя интон;1ций речевого сигнала, интегратора, операционного усилителя и блока памяти синтезируемого речевого сигнала, управляющие выходы блоков памяти эталонов диад доIIoëHHòåëьно подключеHы к управляющему входу программирующего устройства, интегратора и блока памяти синтезируемого рек вого сигнала. информационные выходы блоков памяти эталонов диад подключены к информационным входам переключателя интонаций речевого сигнала, его информационный выход подкл1очен к информационному входу операционного усилителя, выход которого соединен со входом блока памяти

4 синтезируемого речевого сигнала, а его выход соединен с информационным входом воспроизводящего устройства.

На чертеже дана структурная схе»a устройства для синтеза речи.

Выходы программирующего устройства 1 соединены с управляющими входами блока 2 выбора пар диад, переключателя 3 интонации, интегратора 4, onepawoHHoI-o усилителя 5 и блока 6 памяти синтезируемого речевого сигнала. Выходы блока 2 выбора и Ip диад соединены со входами дешифратора 7 диад, выходы которого napaллельно подключены к управляющим входам блоков

8 памяти эталонов диад. Управляющие входы блоков 8 памяти эталонов диад подключены к управляющим входам программирующего устройства 1, интегратора 4 и блока

6 памяти синтезируемого речевого сигнала.

Информационные выходы блоков 8 памяти эталонов диад подключены к информационным входам переключателя 3 интонаций, информационный выход которого подключен к информационному входу операционного усилителя 5. К управляющим входам операционного усилителя 5 подключены управляющие выходы программирующего устройства

1 и интегратора 4. Информационный выход операционного усилителя 5 подключен к информационному входу блока 6 памяти синтезируемого речевого сигнала, выход которого подключен ко вхо;1у воспроизводя снего устройства 9.

Синтезатор речевых сигналов работает следующим образом.

Перед началом набора фонетических составляющих речевого сигнала (букв фразы! программирующим устройством 1 кодируется интонация произношения, после чего one3s ратор начинает буквенный набор фразы с помощью программирующего устройства.

Например, фраза «Холодно?» набирается следующим образом:««? холодна»», фраза

«Холодно» набирается следующим образом:

««,холодна>»> и т. д. При кодировании HHтонации произношения фразы программирующим устройством 1, переключатель 3 интонации произношения подключает к информационному входу операционного усилителя 5 блок 8 памяти эталонов диад с соот4s ветствующей интонацией произношения. Одновременно программирующим устройством

1 задается режим интегрирования интегратора 4 и его знак. По мере набора фразы программирующим устройством 1 блок 2 выбора

$0 пар диад выдает команды на дешифратор7 диад, который выбирает адрес соответствующих диад в параллельно работающих блоках 8 памяти эталонов диад.

В качестве блоков 8 памяти эталонов диад может быть использован, например. четы рехдорожечный магнитофон (на трех дорожках синхронно, по началу диад, записаны аналогичные диады повелительной, повествовательной и вопросительной интонации, 669381

Фор,иула изобретения

5 на четвертой служебной дорожке записаны начала диад соответствующего адреса и концы каждой из диад).

При поступлении на управляющий вход блоков 8 памяти эталонов диад адреса выбранной диады с выхода дешифратора 7 диад, 5 блок 8 памяти эталонов диад блокирует программируюшее устройство 1, запрещая дальнейший набор программы до окончания записи выбранной диады. Это исключает как «накладку» диад, так и их «разрядку» в сложных словах при любой длине диад 10 и изменении их интонации.

Одновременно с началом «выдачи» диады соответствующей интонации с выхода блоков 8 памяти эталонов диад через переключатель 3 интонации на информационный вход операционного усилителя 5 управляюший выход блоков 8 памяти эталонов диад вчключает на запись блок 6 памяти синтезируемого речевого сигнала и подключает ко входу интегратора 4 опорное напряжение интегрирования. Отметим, что несмотря 20 на то обстоятельство, что программируюшим устройством 1 в начале составления фразы (при выборе интонации) дано разрешение на интегрирование интегратору 4 на протяжении всей фразы, интегратор 4 факти25 чески осуществляет интегрирование только в моменты «выдачи» информации блоками 8 памяти эталонов диад через переключатель

3 на вход операционного усилителя 5. Это обеспечивает, несмотря на произвольные разрывы между кодированием оператором на щ программирующем устройстве 1 соседних пар диад (длительность «пауз» между кодированием соседних диад зависит, в основном, от профессиональной тренировки программиста), плавное увеличение (уменьшение) выходного сигнала интегратора 4 от фактической длительности звучания синтезированного речевого сигнала. Скорость интегрирования интегратора 4 (отношение длительности звучания диады к изменению выходного напряжения интегратора 4) и знак интегрирова- gy ния задается программирующим устройством 1 при выборе интонации синтезируемой фразы (или участка фразы, например при обращении типа ««!гражданин,передайте...»»). Поскольку выход интегратора 4 под45 ключен к одному из управляющих входов операционного усилителя 5,например к затвору полевого транзистора, установленного в цепи обратной связи операционного усилителя, изменение выходного напряжения интегратора 4 приводит к соответствующим so изменениям коэффициента усиления операционного усилителя 5, что приводит либо к подчеркиванию отдельного фрагмента фразы (например, обращения), либо плавному снижению громкости звучания синтезированного речевого сигнала (повествовательное предложение) и т. д.

При кодировании программирующим устройством 1 ударного слога (например, б

««! впереди»>) программирующее устройство

1 релейно изменяет коэффициент усиления операционного усилителя 5 на время записи ударного слога (что может достигаться, например, подключением управляюгцего выихода программирующего устройства 1 к затвору полевого транзистора операционного усилителя 5,сток и исток которого использованы в качестве масштабирующего сопротивления на входе операционного усилителя).

Поскольку применение полевых транзисторов для управления коэффициентом усиления операционного усилителя 5 является лишь одним из возможных и широко применяемых вариантов изменения коэффициента усилинения операционных усltëèòåëåé, конкретные схемы включения lit приведены.

При окончании кодирования речевого сигнала программирующее устройство 1 запускает на воспроизведение блок 6 памяти синтезируемого речевого сигнала, который через воспроизводящее устройство 9 транслирует синтезированный речевой сигнал.

В качестве блока 8 памяти синтезированного речевого сигнала и восп роиз водя гцеГО устройства 9 может использоваться, например, серийный однодорожечны Й магнитофон («Десна», «Спутник», «Легенда» и т. д.).

Использование малогабаритных серийных магнитофонов в данном случае позволяет расширить применение устройства, например

«для записи на дом», синтезированных в лингафонных кабинетах фраз и т. д.

Устройство для синтеза речи, содержашее программирующее устройство, блок выбора пар диад, дешифратор диад, блоки памяти эталонов диад и воспроизводящее устройство, отличающееся тем, что, с целью повышения разборчивости синтезируемого речевого сигнала и его информационной насыщенности, выходы программирующего устройства дополнительно подключены к управляющим входам дополнительно установленных переключателя интонаций речевого сигнала, интегратора, операционного усилителя и блока памяти синтезируемого речевого сигнала, управляющие выходы блоков памяти эталонов диад дополнительно подключены к управляющему входу программирующего устройства, интегратора и блока памяти синтезируемого речевого сигнала, информационные выходы блоков памяти эталонов диад подключены к информационным входам переключателя интонаций речевого сигнала, его информационный выход подключеH к информационному входу операционного усилителя, выход которого соединен со входом блока памяти синтезируемого речевого сигнала, а его выход соединен с информационным входом воспроизводящего устройства.

669381

Составитель В. Ванторин

Редактор Т. Клюкина Техред О. Луговая Корректор Н. Стен

Заказ 3666/42 Тираж 808 Подписное

ЦН И И П И Государственного комитета СССР по делам изобретений н открытий

113035, Москва, Ж вЂ” 35, Раушская наб., д. 4/5

Филиал П П П «Патент>, r. Ужгород, ул. Проектная, 4

Источники информации, принятые во внимание при экспертизе

1. Авторское свидетельство СССР № 485492, кл. С 10 1 1/10, 1968.

2. Авторское свидетельство СССР № 195725, кл. С 09 В 1/00, 1965.

3. Патент СССР № 401062, кл. С 10-1 1/10, 1968.

Устройство для синтеза речи Устройство для синтеза речи Устройство для синтеза речи Устройство для синтеза речи 

 

Похожие патенты:
Наверх