Способ кодирования (распознавания) смысловой информации устной речи

 

ОПИСАН И Е

ИЗОБРЕТЕНИЯ

К АВТОР ЖОМУ СВИДЕТЕЛЬСТВУ

Союз Советских

Социалистических

Республик

Зависимое от авт. свидетельства №

Заявлено 13.II I.1965 (№ 946957/26-25) с присоединением заявки №

Приоритет

Опубликовано 21.IV.1966. Бюллетень № 10

Кл. 42m, 14/04

МПК G 061

УДК 681.142-523.8 (083.73) . (088.8) Комитет по делам изобретений и открытий при Совете Министров

СССР

Дата опубликования описания 16.VII 1966

Автор изобретения

Е. Т. Семенова

Заявитель

СПОСОБ КОДИРОВАНИЯ (РАСПОЗНАВАНИЯ)

СМЫСЛОВОЙ ИНФОРМАЦИИ УСТНОЙ РЕЧИ

Известны способы распознавания звуков речи, в которых за единицу распознавания взяты фонема, слог или слово. Исследование устйой речи сводится к определению спектральных, временных характеристик звукового сигнала. Распознаваемое слово произносят перед микрофоном и пропускают через схему автоматической регулировки громкости. Но надежность этих способов низка из-за различного произношения фонем, что связано со спецификой голосового тракта диктора.

Особенность предлагаемого способа заключается в том, что за единицу распознавания выбрано слово, и распознавание слов ведется по смысловым признакам, которые зависят только от смысловой информации речи и пе зависят от голоса диктора, акустики помещений, грамматического и синтаксического построения фразы.

Звуковую информацию пропускают через систему анализирующих блоков. Число блоков зависит от состава и объема словаря. Блоки осуществляют параллельное кодирование распознаваемых слов по смысловым признакам и образуют из кодов, выработанных по этим признакам, составной равномерный код распознаваемого слова, который подают на воспринимающую автоматическую систему.

Процесс кодирования выполняется по смысловым признакам целых слов путем следующей последовательности операций: определяют число «машинных слогов» в слове путем подсчета числа горбов в огибаю5 щей звукового сигнала; определяют номер ударного слога в слове, как слога со звуковой энергией в несколько раз большей, чем энергия безударного слога; определяют количество глухих взрывных со10 гласных и африкатов по числу разрывов в огибающей звукового сигнала; определяют особенности переднего фронта слова по присутствию сигнала малой амплитуды, соответствующей определенным соглас15 иым, перед полной амплитудой гласного зву»а; определяют число высокочастотных звуков по числу горбов в огибающей сигнала после прохождения распознаваемого слова через си20 стему фильтров верхних частот (j 5500—

7000 eu); определяют количество двухформантных гласных по числу горбов в огибающей сигнала после прохождения распознаваемого слова

25 через ограничитель по амплитуде и через полосовой фильтр с полосой пропускания 2000—

4000 гтт; определяют номер слога, в котором имеется разрыв в огибающей звукового сигнала, путсм

30 совместного рассмотрения сигналов, возника181882

IDIJIHx на выходе олока для подсчета числа слогов и на выходе блока для подсчета числа разрывов в огибающей; определяют номер слога, в котором имеется высокочастотный звук, путем совместного рассмотрения сигналов, возникающих на выходе блока для подсчета числа слогов и на выходе блока для определения числа высокочастотн ы х звуков.

Это дает возможность повысить надежность кодирования сигнала и выполнять этот процесс в реальном масштабе времени.

На чертеже изображена схема, с помощью которой осуществляется описываемый спосоо.

Распознаваемое слово произносится перед микрофоном 1 и поступает на входной блок 2, в котором усиливается, проходит через систему автоматической регулировки громкости и демодулируется, С выхода блока 2 с игнал подается на входы анализирующих олоков

3, 4, 5, б, 7, 8 для выработки кодов ?Io смысловым признакам.

1 оды, выработанные по отдельным смысловым признакам, подаются на логические схемы совпадений «И» 9 и схемы индикации

10. На выходе схемы устанавливается код, соответствующий распознаваемому слову.

Описываемый спосоо кодирования (распознавания) устной речи по смысловым признакам приводит к компактным кодам изображения слов и позволит создать устройства со словарем распознавания любого объема.

Работающие с такими словарями устройства могут быть использованы как входные устроиства современных вычислительных машин и систем автоматического управления, Предмет изобр етения

1. Способ кодирования (распознавания} смысловой информации устной речи, при котором распознаваемое слово произносят перед микрофоном и пропускают через схему автоматической регулировки громкости, отличаь1п щийся тем, что, с целью надежного однозначного безошибочного кодирования устной речи независимо от особенностей голоса диктора, исключения статистической и вероятностнои обработки сигнала и выполнения процесса кодирования в реальном масштабе времени, звуковую информацию пропускают через систему анализирующих блоков, число которых зависит от состава и объема словаря, осуществляюших параллельное кодирование распознава20 емых слов по смысловым признакам, и образуют из кодов, выработанных по этим признакам, составной равномерный код распознаваемого слова, который подают на воспринимающую автоматическую систему.

25 2. Спосоо по п. 1, отличающийся тем, что при параллельном кодировании распознаваемых слов по смысловым признакам определяют: число «машинных слогов» в слове, номер ударного слога, количество глухих взрыв30 пых согласных, особенности переднего фронта огибающей звукового сигнала, число высокочастотных звуков, количество двухформантных гласных, номер слога, в котором имеет место разрыв в огибающей, номер слога, в котором

35 имеет место высокочастотный звук.

Способ кодирования (распознавания) смысловой информации устной речи Способ кодирования (распознавания) смысловой информации устной речи 

 

Похожие патенты:

Изобретение относится к цифровой обработке речи

Изобретение относится к распознаванию и идентификации сигналов

Изобретение относится к области информационных технологий - обработки аудио сигналов, в частности к способу распознавания музыкальных произведений и устройству для его осуществления

Изобретение относится к автоматике и вычислительной технике

Изобретение относится к области передачи и хранения акустической информации и может быть использовано при проектировании систем цифровой радиосвязи, радио и телевидения, телефонии, систем цифровой звукозаписи и звуковоспроизведения

Изобретение относится к технике цифровой обработки речевых сигналов, передаваемых по линиям связи методом импульсно-кодовой модуляции (ИКМ) , и может быть использовано для повышения помехозащищенности многоканальных систем передачи цифровой телефонии

Изобретение относится к технике цифровой обработки речевых сигналов, передаваемых по линиям связи методом импульсно-кодовой модуляции (ИКМ), и может быть использовано для повышения помехозащищенности многоканальных систем передачи цифровой телефонии
Наверх