Способ компиляционного синтеза речи и устройство для его осуществления

 

СОЮЗ СОВЕТСКИХ

СОЦИАЛИСТИЧЕСКИХ

РЕСПУБЛИК (51) э G 10 (5/02

ГОСУДАРСТВЕННЫЙ КОМИТЕТ

ПО ИЗОБРЕТЕНИЯМ И ОТКРЫТИЯМ

ПРИ ГКНТ СССР

ВЙОЮЗМЯ 1

ЫЙПП- УБИТ!%%.". ., ОПИСАНИЕ ИЗОБРЕТЕНИЯ

К АВТОРСКОМУ СВИДЕТЕЛЬСТВУ

1 (21) 4459706/10 (22) 14.07.88 (46) 07.10.91. Бюл. М 37 (71) Инспптут технической кибернетики АН БССР (72) Б.M. Лобанов (53) 534.78(088.8) (56) Патент США N. 4398059, кл. G 10 L 5/00, 1983.

Авторское свидетельство СССР и 1599888, кл. G 10 1 5/02, 1990. (54) СПОСОБ КОМПИЛЯЦИОННОГО СИН-

ТЕЗА РЕЧИ И УСТРОЙСТВО ДЛЯ ЕГО ОСУ- .

ЩЕСТВЛЕНИЯ (57) Изобретение относится к речевой информатике и может быть использовано для

„„5Q„„1683063 А1 сжатия информации, используемой при синтезе слитной речи по тексту. Цель изобретения — сжатие запоминаемой информации и упрощение устройства. Текст, вводимый в текстовый процессор 1, далее преобразуется в последовательность слогов-дифонов и отдельных звуков. Параметры звуков и переходов между ними заранее запоминают в постоянных запоминающих устройствах 2 и

3 и считывают по мере преобразования текста в звуки выходным цифроаналоговым преобразователем 7, выполненным формантным звуковым интерфейсом, нагруженным на электроакустический агрегат 8.

2 с.п. ф-лы, 1 ил.

1683063

Составитель В. Махонин

Техред M.Ìoðãåíòàë Корректор С. Кравцова

Редактор Е. Савина

Заказ 3416 Тираж Подписное

ВНИИПИ Государственного комитета по изобретениям и открытиям при ГКНТ СССР

113035, Москва, Ж-35, Раушская наб., 4/5

Производственно-издательский комбинат "Патент", r, Ужгород, ул.Гагарина, 101

Изобретение относится к речевой информатике и приборостроению для синтеза речевых сообщений по тексту в системах акустического общения человека с автоматическими устройствами.

Цель изобретения — сжатие заранее запоминаемой информации и упрощение устройства.

При запоминании дифонные переходы кодируют постоянными времени коартикуляции этих переходов в дикторской речи, При воспроизведении текущие параметры звуков, котооые восстанавливают формантны в)новым интерфейсом, устанавливают линейнь м комбинированием параметров, соответствующих текущей, предшествующей и последующей фонемам, получаемых при последовательном транскрибировании текста. Результаты линейного комбинирования сглаживают на интервале, длительность которого не превышает длительность последующей фонемы, На чертеже показана блок-схема описываемого устройства для компиляционного синтеза речи.

Устройство содержит текстовый процессор 1, постоянные запоминающие устройства 2 и 3, буферное запоминающее устройство 4, интерполирующий процессор

5, формирователь 6, выходной цифроаналоговый преобразователь 7 и электроакустический агрегат 8. Входом устройства является вход текстового процессора 1, соединенного с постоянными запоминающими устройствами 2 и 3 и буферным оперативным запоминающим устройством 4. Интерполирующий процессор 5 и формирователь 6 связаны с буферным оперативным запоминающим устройством 4, которое через выходной цифроаналоговый преобразователь 7, выполненный формантным звуковым интерфейсом, нагруженном на электроакустический агрегат 8.

Вводимый в текстовой процессор текст преобразуется им в последовательность слогов-дифонов и отдельных звуков, Формантные параметры, элементов дифонов и звуков из постоянного запоминающего устройства 2 пересылаются в буферное запоминающее устройство 4, куда из посто5

50 янного запоминающего устройства 3 вызываются также сведения о постоянных времени коартикуляции и длительностях звуков, необходимые для комбинирования и сглаживания параметров звуков, имитирующих натуральную слитную речь, благодаря этой связанной с текстом и звуками вариации темпа и гладкости переходов от звука к звуку и от слова к слову.

Экономия в объемах запоминаемой информации по отношению к запоминанию волн переходных процессов от одного звука дифона к другому позволяет снизить потребляемую электроэнергию, рассеиваемую постоянными запоминающими устройствами синтезатора речи.

Формула изобретения

1, Способ компиляционного синтеза речи, включающий предварительное запоминание параметров отдельных звуков речи и всевозможных переходов между звуками речи и трансрибирование текста в последовательность воспроизводимых дифонов и отдельныхзвуков, отличающийся тем, что, с целью сжатия запоминаемой информации, при запоминании дифонные переходы кодируют постоянными времени коартикуляции этих переходов, а при воспроизведе —.ии параметры воспроизводимых звуков устанавливают линейным комбинированием параметров, соответствующих текущей, предшествующей и последующей фонемам, причем результаты комбинирования сглаживают на интервале длительностью последующей фонемы.

2, Устройство для компиляционного синтеза речи, содержащее текстовый процессор, соединенный с постоянными запоминающими устройствами и буферным оперативным запоминающим устройством, соединенным через выходной цифроаналоговый преобразователь с электроакустическим агрегатом, о т л и ча ю щ ее с я тем, что, с целью упрощения, в него введены интерполирующий процессор и формирователь, связанные соответствующими шинами с буферным оперативным запоминающим устройством, а выходной цифроаналоговый преобразователь выполнен формантным звуковым интерфейсом.

Способ компиляционного синтеза речи и устройство для его осуществления Способ компиляционного синтеза речи и устройство для его осуществления 

 

Похожие патенты:

Изобретение относится к речевой информатике и может быть использовано в системах взаимодействия человека и компьютера

Изобретение относится к речевой информатике

Изобретение относится к технике синтеза речевой информации, выводимой из ЭВМ, и может быть использовано в информаторах - синтезаторах на транспорте, связи, измерительных и технологических комплексах

Изобретение относится к речевой информатике и может быть использовано в вычислительной технике и технике связи для выделения и реконструкции речевых сообщений

Изобретение относится к речевой информатике и может быть использовано в системах речевого взаимодействия человека с ЭВМ

Изобретение относится к технике обработки сигналов для речевой информатики и синтеза речевых сообщений для абонентов телефонных связей.Цель изобретения - повышение качества звучания речи, синтезируемой под контролем компьютера, обслуживающего сеть цифровых абонентских синтезаторов речи

Изобретение относится к радиотехнике и связи и может быть использовано в системах передачи и приема речевых и музыкальных сигналов

Изобретение относится к технике цифровой обработки речевых сигналов, передаваемых по линиям связи методом импульсно-кодовой модуляции (ИКМ), и может быть использовано для повышения помехозащищенности многоканальных систем передачи цифровой телефонии

Изобретение относится к средствам цифрового кодирования речевых сигналов и предназначено для их компактного представления в целях передачи и хранения

Изобретение относится к технике цифровой обработки речевых сигналов, передаваемых по линии связи методом ИКМ

Изобретение относится к мобильным устройствам

Изобретение направлено на формирование речевого сигнала с заданными характеристиками. Технический результат заключается в повышении естественности, разборчивости речи и ее эмоциональной окраски при генерации речевого сигнала при уменьшении вычислительной сложности за счет усовершенствования структуры элементов системы синтеза речи и разделения используемых баз данных. Устройство синтеза речи на основе текста, содержит блок, принимающий текстовую строку и формирующий из нее последовательность идентификаторов звуковых единиц, подаваемую в блок формирования звукового сигнала, а затем в блок воспроизведения. В блок формирования звукового сигнала параллельно подаются дополнительные команды управления, вырабатываемые из сформированной последовательности идентификаторов звуковых единиц блоком формирования управляющих команд, зависящих от языка, блоком формирования управляющих команд, зависящих от моделируемых параметров диктора, а именно параметров голоса и/или его физических и физиологических параметров, и блоком формирования управляющих параметров окраса голоса, настроенных на определенное психофизиологическое состояние, предназначенных для формирования управляющих параметров для коррекции интенсивности речевого сигнала. 1 з.п. ф-лы, 1 ил.
Наверх