Способ кодирования (распознавания) смысловой информации устной речи

Авторы патента:

G10L19/02 - с использованием спектрального анализа, например преобразовательные вокодеры, вокодеры с поддиапазонами

G10L15/02 - выделение признаков для распознавания речи; выбор блока распознавания

ОПИСАН И Е

ИЗОБРЕТЕНИЯ

К АВТОР ЖОМУ СВИДЕТЕЛЬСТВУ

Союз Советских

Социалистических

Республик

Зависимое от авт. свидетельства №

Заявлено 13.II I.1965 (№ 946957/26-25) с присоединением заявки №

Приоритет

Опубликовано 21.IV.1966. Бюллетень № 10

Кл. 42m, 14/04

МПК G 061

УДК 681.142-523.8 (083.73) . (088.8) Комитет по делам изобретений и открытий при Совете Министров

СССР

Дата опубликования описания 16.VII 1966

Автор изобретения

Е. Т. Семенова

Заявитель

СПОСОБ КОДИРОВАНИЯ (РАСПОЗНАВАНИЯ)

СМЫСЛОВОЙ ИНФОРМАЦИИ УСТНОЙ РЕЧИ

Известны способы распознавания звуков речи, в которых за единицу распознавания взяты фонема, слог или слово. Исследование устйой речи сводится к определению спектральных, временных характеристик звукового сигнала. Распознаваемое слово произносят перед микрофоном и пропускают через схему автоматической регулировки громкости. Но надежность этих способов низка из-за различного произношения фонем, что связано со спецификой голосового тракта диктора.

Особенность предлагаемого способа заключается в том, что за единицу распознавания выбрано слово, и распознавание слов ведется по смысловым признакам, которые зависят только от смысловой информации речи и пе зависят от голоса диктора, акустики помещений, грамматического и синтаксического построения фразы.

Звуковую информацию пропускают через систему анализирующих блоков. Число блоков зависит от состава и объема словаря. Блоки осуществляют параллельное кодирование распознаваемых слов по смысловым признакам и образуют из кодов, выработанных по этим признакам, составной равномерный код распознаваемого слова, который подают на воспринимающую автоматическую систему.

Процесс кодирования выполняется по смысловым признакам целых слов путем следующей последовательности операций: определяют число «машинных слогов» в слове путем подсчета числа горбов в огибаю5 щей звукового сигнала; определяют номер ударного слога в слове, как слога со звуковой энергией в несколько раз большей, чем энергия безударного слога; определяют количество глухих взрывных со10 гласных и африкатов по числу разрывов в огибающей звукового сигнала; определяют особенности переднего фронта слова по присутствию сигнала малой амплитуды, соответствующей определенным соглас15 иым, перед полной амплитудой гласного зву»а; определяют число высокочастотных звуков по числу горбов в огибающей сигнала после прохождения распознаваемого слова через си20 стему фильтров верхних частот (j 5500вЂ”

7000 eu); определяют количество двухформантных гласных по числу горбов в огибающей сигнала после прохождения распознаваемого слова

25 через ограничитель по амплитуде и через полосовой фильтр с полосой пропускания 2000вЂ”

4000 гтт; определяют номер слога, в котором имеется разрыв в огибающей звукового сигнала, путсм

30 совместного рассмотрения сигналов, возника181882

IDIJIHx на выходе олока для подсчета числа слогов и на выходе блока для подсчета числа разрывов в огибающей; определяют номер слога, в котором имеется высокочастотный звук, путем совместного рассмотрения сигналов, возникающих на выходе блока для подсчета числа слогов и на выходе блока для определения числа высокочастотн ы х звуков.

Это дает возможность повысить надежность кодирования сигнала и выполнять этот процесс в реальном масштабе времени.

На чертеже изображена схема, с помощью которой осуществляется описываемый спосоо.

Распознаваемое слово произносится перед микрофоном 1 и поступает на входной блок 2, в котором усиливается, проходит через систему автоматической регулировки громкости и демодулируется, С выхода блока 2 с игнал подается на входы анализирующих олоков

3, 4, 5, б, 7, 8 для выработки кодов ?Io смысловым признакам.

1 оды, выработанные по отдельным смысловым признакам, подаются на логические схемы совпадений «И» 9 и схемы индикации

10. На выходе схемы устанавливается код, соответствующий распознаваемому слову.

Описываемый спосоо кодирования (распознавания) устной речи по смысловым признакам приводит к компактным кодам изображения слов и позволит создать устройства со словарем распознавания любого объема.

Работающие с такими словарями устройства могут быть использованы как входные устроиства современных вычислительных машин и систем автоматического управления, Предмет изобр етения

1. Способ кодирования (распознавания} смысловой информации устной речи, при котором распознаваемое слово произносят перед микрофоном и пропускают через схему автоматической регулировки громкости, отличаь1п щийся тем, что, с целью надежного однозначного безошибочного кодирования устной речи независимо от особенностей голоса диктора, исключения статистической и вероятностнои обработки сигнала и выполнения процесса кодирования в реальном масштабе времени, звуковую информацию пропускают через систему анализирующих блоков, число которых зависит от состава и объема словаря, осуществляюших параллельное кодирование распознава20 емых слов по смысловым признакам, и образуют из кодов, выработанных по этим признакам, составной равномерный код распознаваемого слова, который подают на воспринимающую автоматическую систему.

25 2. Спосоо по п. 1, отличающийся тем, что при параллельном кодировании распознаваемых слов по смысловым признакам определяют: число «машинных слогов» в слове, номер ударного слога, количество глухих взрыв30 пых согласных, особенности переднего фронта огибающей звукового сигнала, число высокочастотных звуков, количество двухформантных гласных, номер слога, в котором имеет место разрыв в огибающей, номер слога, в котором

35 имеет место высокочастотный звук.

Способ кодирования (распознавания) смысловой информации устной речи

Похожие патенты:

Патент 181330 // 181330

Патент 168488 // 168488

Патент 161527 // 161527

Способ синтеза формант дискретных составляющих звуков речи // 149239

Способ анализа и синтеза речи формантного или вокадерного типа // 120658

Способ гармонического анализа огибающей текущего спектра речевого сигнала // 118630

Способ синтеза формант дискретных составляющих звуков речи // 149239

Говорящая машина для перевода слов с одного языка на другой // 25297

Способ сжатия изолированных слов // 2180974

Изобретение относится к цифровой обработке речи

Маркерный способ идентификации сигнала // 2189075

Изобретение относится к распознаванию и идентификации сигналов

Способ распознавания музыкальных произведений и устройство для его осуществления // 2295163

Изобретение относится к области информационных технологий - обработки аудио сигналов, в частности к способу распознавания музыкальных произведений и устройству для его осуществления

Способ распознавания слов в слитной речи // 2297676

Изобретение относится к автоматике и вычислительной технике

Патентно- ^.'" техкичесиай ''библиотека // 254897

Устройство для распознавания речевых образов // 290186

Ячейка для вычисления меры подобия речевых // 383078

Устройство для распознавания слов // 392521

Способ обработки речевого сигнала // 404122

Устройство, выделяющее сигналы речи из вещательного сигнала // 416733

Способ сжатия звуковой информации и система для его реализации // 2144222

Изобретение относится к области передачи и хранения акустической информации и может быть использовано при проектировании систем цифровой радиосвязи, радио и телевидения, телефонии, систем цифровой звукозаписи и звуковоспроизведения

Способ обнаружения и коррекции аномальных цифровых ошибок при передаче речи методом импульсно-кодовой модуляции // 2148277

Изобретение относится к технике цифровой обработки речевых сигналов, передаваемых по линиям связи методом импульсно-кодовой модуляции (ИКМ) , и может быть использовано для повышения помехозащищенности многоканальных систем передачи цифровой телефонии

Устройство обнаружения и коррекции аномальных цифровых ошибок при передаче речи методом импульсно-кодовой модуляции // 2159470

Изобретение относится к технике цифровой обработки речевых сигналов, передаваемых по линиям связи методом импульсно-кодовой модуляции (ИКМ), и может быть использовано для повышения помехозащищенности многоканальных систем передачи цифровой телефонии