Устройство для синтеза речевых сигналов

 

СОЮЗ СОВЕТСКИХ

СОЦИАЛИСТИЧЕСКИХ

РЕСПУБЛИК (я)ю G 10 1 9/18

ГОСУДАРСТВЕННОЕ ПАТЕНТНОЕ

8ЕДОМСТ80 СССР (ГОСПАТЕНТ СССР) ОПИСАНИЕ ИЗОБРЕТЕНИЯ

К АВТОРСКОМУ СВИДЕТЕЛЬСТВУ (21) 4901706/24 . (22) 11.01.91 (46) 28.02.93. Бюл. ¹ 8 (71) Особое конструкторско-технологическое бюро "Орбита" (72) А,И,Евченко и А.И.Горемыкин (56) Авторское свидетельство СССР

¹ 1408450, кл, 6 101 9/18, 1986. (54) УСТРОЙСТВО ДЛЯ СИНТЕЗА РЕЧЕВЫХ СИГНАЛОВ.„„59„„1798814 А1 (57) Предлагаемое устройство относится к речевой информатике, а также может быть использовано в различных системах речевого взаимодействия человека с ЭВМ. Цель изобретения — увеличение объема синтезируемой речевой информации. Устройство для синтеза речевых сигналов содержит генератор адреса 1, запоминающее устройство 2, блок управления. 4, элемент И 5, реверсивный счетчик 6, ключ 8, элемент HE

9. 7 — 6 — 9 — 1 — 2 — 5 — 4 — 6 — 4 — 8, 2-4. 7 ил.

1798814

Изобретение относится к речевой информатике и может быть использовано в различных системах речевого взаимодействия человека с ЭВМ.

Целью изобретения является увеличение обьема хранимой речевой информации и упрощения устройства.

На фиг. 1 изображена структурная схема устройства для синтеза речевых сигналов; на фиг. 2 — вариант реализации блока 10 управления; на фиг. 3 — фрагмент реальной речи (кривая А) и ее модернизация (кривая

В); на фиг. 4 —; на фиг, 5 — временные графики работы устройства; на фиг. 6— структура буфера, задающего последовательность выводимых в устройство кодов; на фиг. 7 — алгоритм вывода речевой единицы в режиме ожидания готовности.

Устройство для синтеза речевых сигналов содержит последовательно соединен- 20 ные генератор адреса 1, запоминающее устройство 2, вход которого является входом устройства, связанный с интерфейсной магистралью ЭВМ, блок сопряжения 3, блок управления 4, элемент И 5. реверсивный счетчик 6, тактовый генератор 7; ключ 8, выход которого является выходом устройства, инвертор 9.

Первый выход блока управления 4 подключенн к входу записи реверсивного счетчи- 30 ка 6, а второй выход — ко входу ключа 8, третий выход блока управления 4 соединен с интерфейсной магистралью, а первый вход блока управления 4 соединен с первым выходом блока сопряжения 3, второй выход которого соединен со входом записи генератора адреса 1 и со вторым входом блока управления 4, третий вход которого соединен с выходом элемента И 5. Первый выход запоминающего устройства 2 соединен со 40 входом элемента И 5 и с информационным входом реверсивного счетчика 6, вычитающий вход которого соединен с выходом тактового генератора 7. Второй выход запоминающего устройства 2 подключен к 45 четвертому входу блока управления 4, а выход реверсивного счетчика 6 подключен к пятому входу блока управления через инвертор 9, к суммирующему входу генератора адреса, шестой вход блока управления 4 соединен с интерфейсной магистралью

ЭВМ, На фиг, 2 изображен блок управления 4, который содержит элемент И-НЕ 10, D-триггер 11, инвертор 12, диод 13, конденсатор 55

14, элемент И-НЕ 15. элемент И 16, элемент

И-НЕ 17.

На фиг, 4 изображен ключ, который содержит резистор 18. резистор 19, транзистор 20.

На фиг. 5 изображены временные графики работы устройства, где а — выход Dтриггера; б — инверсный вход 0-триггера 11; в — сигнал Выв.Н; r — выход 1 блока управления 4; д — тактовые синхроимпульсы тактового генератора 7; е-и — выходы реверсивного счетчика 6; л — о — выходы генератора адреса 1.

Рассмотрим работу предлагаемого устройства, В одном состоянии, в которое устройство приводится по сигналу "СБРОС Н"

D-триггер 11 устанавливается в единичное состояние, нуль с его инверсного выхода запирает элемент И-НЕ 10 блока управления 4, и поэтому на выходе элемента И-НЕ

15 устанавливается низкий уровень сигнала, который удерживает реверсивный счетчик 6 в режиме занесения информации. Это запрещает счет импульсов и импульсы обнуления на выходе реверсивного счетчика отсутствуют, так как на первом входе элемента И-НЕ 17 высокий .уровень, то по приходу сигнала "ВВ Н" с первого входа блока управления 4 в ЭВМ читается низким уровнем (т.е. единицей) сигнал готовности устройства. Для того, чтобы воспроизвести требуемую речевую единицу, необходимо с помощью ЭВМ записать через блок сопряжения 3 в генератор адреса 1 код, который задает начальный адрес записанной в запоминающем устройстве 2 речевой единицы.

Запись кода в генератор адреса 1 осуществляется по сигналу "Bbl8 со второго. выхода блока сопряжения 3, по нему же

D-триггер 11 сбрасывается (см. фиг. 3, 4, 5) и на третьем входе элемента И-НЕ 10 устанавливается высокий уровень сигнала, Так как у 0-триггера 11 конечное время срабатывания, то высокий уровень на выходе элемента И-НЕ снимается (а на выходе элемента И-НЕ 15 появится) по снятию сигнала "ВЫВ", что осуществит запись младших разрядов числа с выхода запоминающего устройства 2 в реверсивный счетчик 6 и разрешит счет.

К моменту поступления заднего фронта сигнала ВЫВ" данные уже установлены на выходах постоянного запоминающего устройства 2.

Старший разряд числа со второго выхода запоминающего устройства 2 через блок

4 управляет состоянием ключа 8 (ключ 8 подает на выход устройство постоянное высокое напряжение или нуль).

После установления на входе записи V реверсивного счетчика 6 высокого уровня он начинает работать в режиме вычитания. отсчитывая длину полуволны звукового сигнала. Импульс обнуления, который формирует сигнал нулевого уровня с выхода

1798814 речевых единиц, хранящихся в запоминаю-. 55 щем устройстве 2. Для воспроизведения речи в диапазоне 5 кГц, частота тактового генератора 7 должна быть порядка 20 кГц, При этом для кодирования длины импульса достаточно 4 — 5 разрядных кодов. хранимых реверсивного счетчика 6 (он сигнализирует о том, что вычитание завершено), поступает через инвертор НЕ 9 на суммирующий вход генератора адреса 1 и на пятый вход блока управления 4. Передний фронт импульса обнуления изменит адрес ячейки запоминающего устройства 2 и через задержку времени на элементах 13, 14, 15, которая необходима для уверенного считывания данных по новому адресу, заносит новый код времени в реверсивный счетчик 6, Занесение кода времени приводит к снятию сигнала обнуления. Поэтому импульс обнуления получается значительно короче, чем полупериод тактовой частоты, и следующий положительный фронт тактовой частоты вызывает вычитание единицы из счетчика 6 и не происходит потери импульса (см, фиг, 5). Как только в реверсивном счетчике 6 будет нулевой код. появится следующий импульс обнуления и весь цикл воспроизведения речи повторяется до тех пор. пока на первом выходе запоминающего устройства 2 не появится код N, имеющий единицы во всех разрядах. который опознается схемой И 5. Этот код отмечает конец вывода речевой единицы. Сигнал с выхода элемента И 5 поступает в блок управления

4, который по этому сигналу выдает низкий уровень на своем выходе 1 и этим запрещает работу реверсивного счетчика 6. Одновременно блок 4 устанавливает постоянный высокий уровень на втором выходе, прекращая этим вывод звука и подготавливает элемент И-НЕ 17 для формирования на третьем выходе блока управления 4 сигнала готовности в ЭВМ.

При подготовке информации для записи в запоминающее устройство 2 необходимо предусмотреть, чтобы не произошло случайное совпадение длительности импульса или паузы с кодом N, являющимся признаком конца речевой единицы. Большие временные интервалы при записи должны разбиваться на несколько интервалов длиной не более N-1.

По сигналу готовности ЭВМ может выдать новый код в генератор адреса 1 через блок сопряжения 3 и работа устройства повторится. ЭВМ читает сигнал готовности, выдавая через блок сопряжения 3 сигнал

"ВВ" на первый вход блока управления 4.

Управляющей ЭВМ необходимо знать только последовательность начальных адресов

50 в запоминающем устройстве 2. Следует заметить, что длительность первого импульса может увеличиваться устройством на длину сигнала "ВЫВ", однако это не влияет на качество речи, На базе предлагаемого устройства могут строиться различные системы речевого вывода. отличающиеся программой ЭВМ и содержимым запоминающего устройства 2.

В запоминающем устройстве 2 могут храниться законченные фразы, отдельные слова, фонемы или пары фонем.

В первом случае паузы между словами будут закодированы s речевой единице аналогично словам — пауза будет представлять собой последовательность ячеек памяти с нулевым значением старшего разряда.

Во втором случае программа ЭВМ строит фразы, последовательно передавая адреса нужных слов. Момент задания адреса следующего слова определяется по наличию сигнала готовности на 3-M выходе блока управления 4. Пауза может быть закодирована в начале или в конце каждого слова, При этом ЭВМ не участвует в отсчете пауз, так как эта функция полностью реализуется устройством. Это позволяет расширить общий объем сообщений за счет повторного использования одной речевой единицы (слова) в нескольких фразах. Для снижения необходимого объема памяти паузы разной длительности могут быть закодированы в блоке 2 как отдельные речевые единицы.

При построении фразы из ЭВМ должны быть последовательно выведены вустройство адреса требуемых слов и пауз между ними. Структура фразы при этом может быть задана в памяти ЭВМ таблицей (фиг. 6), первый элемент которой содержит длину табли- цы. а последующие элементы — значения выводимых в устройство кодов. Таблица кодирует фразу из четырех слов, причем паузы между словами одинаковы и задаются кодом Т1, а после вывода последнего слова (выводом в устройство кода А4) задается пауза кодом Т2. отделяющая данную фразу от последующих. В данном случае ЭВМ также не отсчитывает величину временных интервалов, но задает величину паузы выводом соответствующего кода Ti.

Если в блоке 2 устройства не закодированы паузы или в имеющемся наборе пауз нет интервалов требуемой длительности. отсчет временных интервалов может быть возможен на ЭВМ. Таблица, кодирующая фразу, при этом может иметь ту же структуру, которая приведена на фиг. 6, но элементы Ti будут означать не код (адрес паузы в блоке 2), подлежащий выводу в устройство. а величину интервалов времени. которые

1798814 должны быть считаны ЭВМ между операциями вывода в устройство кодов Aj.

Отсчет временных интервалов обычно осуществляется операционной системой

ЭВМ при помощи времязадающего устройства — таймера и системных программ, т,е. от прикладного программиста не требуется значение алгоритмов организации счета времени.

В третьем случае (при хранении в запоминающем устройстве полного набора диоронов) могут генерироваться сообщения неограниченного объема. Кроме того, можно воспроизводить голосом вводимой с клавиатуры произвольный текст.

Существуют различные алгоритмы управления периферийными устройствами.

Указаны четыре возможных способа обмена: синхронный, асинхронный (в режиме ожидания готовности). по прерыванию и с использованием прямого доступа в памяти.

При работе с устройством может быть использован синхронный обмен, если рече вая единица представляет собой законченную фразу и заведомо известно, что предыдущий вывод завершен, Если вывод фразы может интерпретироваться до завершения вывода предыдущей или фраза составляется из нескольких речевых единиц, как показано на фиг. б, то необходимо применять алгоритм асинхронного вывода, показанный на фиг. 7.

Чтением сигнала готовности устройства в ЭВМ вводится значение логического нуля с выхода 3 блока 4. Этот сигнал является признаком завершения вывода речевой единицы, т.е. признаком готовности к следующему выводу.

Если устройство не готово, чтение повторяется, а если готово — осуществляется вывод следующей речевой единицы, Блок 3 сопряжения с ЭВМ может обеспечивать также работу с устройством по прерываниям, Возможна также и модификация блока сопряжения. при которой он осуществляет не только передачу адреса в запоминающее устройство 2. но и запись в него данных из ЭВМ, Появляющиеся при этом дополнительные связи не изменяют сущности изобретения. Обмен по прерываниям может реализоваться путем использования сигнала с 3-го выхода блока 4 в качестве сигнала. осуществляющего требование прерывания.

Реализация блока сопряжения 3 зависит от типа интерфейса. используемого в

ЭВМ, с которым должно рабо1ать устройство. Один из возможных вариантов реализации блока сопряжения для работы с магистральным интерфейсом МПИ пг ОСТ

11.305.903-80 в режим ожидания готовности реализуется одной микросхемой К 588 В Т

1.

Интерфейсная магистраль в этом случае

5 содержит шестнадцать шин АД1...АД16 для передачи адреса и обмена данными между

ЭВМ и периферийными устройствами, т.е. по шинам АД поочередно подаются код

"АДРЕС" и код "ДАННЫЕ". Кроме того, при

10 обращении к периферийному устройству (т,е. по адресу. большему 160.0008) одновременно с адресом устройства ЭВМ вырабатывает сигнал BY. В блок. сопряжения 3 поступают из ЭВМ также управляющие сиг15 налы интерфейса; сигнал СИА, указывающий, что ЭВМ выставила на шинах АД адрес абонента, ВЫВОД, указывающий, что

ЭВМ выставила на шинах АД данные для занесения по ранее заданному адресу и сиг20 нал "ВВОД", по которому периферийное усЪ тройство должно выставить данные для ввода в ЭВМ, Процессор, работающий с интерфейсом

МПИ (например, микропроцессоры К

1801ВМ1, К1801ВМ2), фиксирует вводимые данные перед концом выдаваемого им сигнала "ВВОД", Поэтому сигнал данных из. интерфейсной магистрали должен осуществляться с задержкой по отношению к снятию сигнала "ВВОД". Эта задержка обычно осуществляется не в периферийных устройствах, а в процессорном блоке. Формируемый в магистрали сигнал "ВВОД" задержан по отношению к сигналу "В ВОД" на контакте микропроцессора

После приема данных из ЭВМ по сигналу "ВЫВОД" или передачи данных в ЭВМ по сигналу "ВВОД" блок сопряжения 3 передает в ЭВМ сигнал "СИП", разрешающий ЭВМ начать новый цикл обмена данными. Активные уровни всех сигналов — низкие, Следует отметить, что адрес, передаваемый по магистрали МПИ в блоке сопряжения 3. — это код, идентифицирующий данное периферийное устройство. Адрес речевого сообщения записывается в генератор адреса 1 через блок сопряжения 3 интерфейсным кодом "ДАННЫЕ".

Устройство для синтеза речевых сигналов может быть реализовано на следующих типах микросхем: блоки 1. б — К 1 55 И Е 7. блок,2 — К573 Р Ф 6А, блок 5 — К555Л Иб. блок 9 — К155 ЛН1, бл о к 10 — К 1 55 Л А4. блок 11 — К155ТМ2. блок 12 — К155ЛН1, блок 13 — диод КД 522А. блок 15 -- К155 ЛАЗ.

1798814

10 блок 16 -- К155 ЛИ1. блок 17 — К155 ЛАЯ. блок 20 — КТ315Г.

Итак, суть изобретения заключается в следующем. В предлагаемом устройстве на каждую полуволну речевого сигнала в памяти хранится только одно число, кодирующее ее длительность. Старший разряд этого числа указывает уровень выводимого на ключ сигнала (1 — высокий, 0 — низкий). Это позволяет увеличить суммарный объем хранимой речи без увеличения емкости памяти. Сигнал, выводимый на ключ, при этом принимает только два значения — высокий уровень во время положительной полуволны и низкий — so время отрицательной. Таким образом, на кодирование каждой полуволны требуется одно число малой разрядности.

Экспериментально проверено, что представление речевого сигнала (фрагмент которого приведен на фиг. 3, кривая А) в виде, показанном на фиг, 3, кривая В, не влияет на разборчивость речи. На фиг. 3 все значения сигнала больше некоторого уровня Н, заменены постоянным высоким уровнем, а меньше — Н вЂ”. постоянным низким уровнем, т.е. речевой сигнал заменяется последовательностью прямоугольных импульсов. При этом, если такой сигнал подать на громкоговоритель, то сохраняется не только разборчивость речи, но (за счет длительности импульсов) воспроизводится различная громкость речи. Также экспериментально установлено, что для кодирования длительности импульсов и расстояний между ними достаточно четырех разрядных кодов, Кроме того. устройство является очень простым в технической реализации, так как собрано на дискретных элементах.

Формула изобретения

5 Устройство для синтеза речевых сигналов, содержащее блок памяти. генератор адреса, выходы которого соединены с адресными входами блока памяти, и генератор импульсов, о т л и ч а ю щ е е с я тем, что, 10 с целью увеличения объема синтезируемой речевой информации, в него введены эле менты И и НЕ, ключ, реверсивный счетчик и блок управления, первые вход и выход которого являются соответственно входом на15 чальной установки и выходом готовности устройства, второй и третий входы являются управляющими входами устройства, а второй выход соединен с входом ключа, выход которого является информационным выхо20 дом устройства, информационными входами которого являются соответственно информационные входы генератора адреса, управляющий вход которого соединен с вторым входом блока управления, а информа25 ционный вход соединен с выходом элемента

НЕ. вход которого соединен с четвертым входом блока управления, и выходом реверсивного счетчика, информационные входы которого соединены с выходами блока па30 мяти и входами элемента И. выход которого соединен с пятым входом блока управления, третий выход которого соединен с управляющим входом реверсивного счетчика, счетный вход которого соединен с выходом

35 генератора импульсов, один из выходов блока памяти соединен с шестым входом блока управления.

1798814

1798814

1798814

Риа 1

Составитель А.Евченко

Техред M.Moðãåí Tàë Корректор Н.Кешеля

Редактор

Заказ 774 Тираж Подписное

ВНИИПИ Государственного комитета по изобретениям и открытиям при ГКНТ СССР

113035, Москва, Ж-35, Раушская наб.; 4/5

Производственно-издательский комбинат "Патент", г, Ужгород, ул.Гагарина, 101

Устройство для синтеза речевых сигналов Устройство для синтеза речевых сигналов Устройство для синтеза речевых сигналов Устройство для синтеза речевых сигналов Устройство для синтеза речевых сигналов Устройство для синтеза речевых сигналов Устройство для синтеза речевых сигналов Устройство для синтеза речевых сигналов 

 

Похожие патенты:

Изобретение относится к маскированию потери кадров в системе связи, например в системе радиосвязи, и касается, в частности, устройства и способа улучшения декодирования фоновых шумов в таких системах

Изобретение относится к маскированию отброшенных кадров в системе радиосвязи и касается, в частности, устройства и способа для улучшения декодирования сигналов звуковой частоты в таких системах

Изобретение относится к маскированию ошибок передачи в системе радиосвязи и касается, в частности устройства и способа для улучшения декодирования фоновых шумов в такой системе

Изобретение относится к способам регистрации речевых сообщений и может найти применение при фоностенографировании

Изобретение относится к речевой информатике и может быть использовано в различных системах речевого взаимодействия человека с ЭВМ
Наверх