Устройство для распознавания речи

 

паты:-: ..:о- ..:..:.,. - ;3al б юб llai э — .... с,.« r

О П И С А Н И Е 27I92l

ИЗОБРЕТЕНИЯ

К АВТОРСКОМУ СВИДЕТЕЛЬСТВУ

Союз Советских

Социалистических

Республик

Зависимое от авт. свидетельства №

Заявлено 17 111.1969 (№ 1311704i18-24) с присоединением заявки ¹

Приоритет

Опубликовано 26.V.1970. Ьюллетень ¹ 18

I ë. 42шо, 9/00

Комитет по делам изобретений и открытий при Совете Министров

СССР

МП1 Ci 05k 9,00

G 101 1/02

УД 1; 621.391.19(088.8) Дата опубликования описания 9.1Х.1970.л вторы изобретения А. M. Заездный, Е. И. Плоткин, О. H. Работкин, В. Ю. Трахтман и О. Л. Сирота

Заявитель

УСТРОИСТВО ДЛЯ РАСПОЗНАВАНИЯ РЕЧИ

Изобретение относится к технике для распознавания речевых сигналов, может быть использовано для непосредственной печати устного текста, ввода команд в исполняющие автоматы, ввода информации в вычислительные машины, автоматического перевода с одного языка на другой и т. д.

Известны устройства для распознавания ðåчи, содержащие анализатор, блок принятия решения и блок логической обработки.

Эти устройства недостаточно достоверно распознают речь и не могут быть перестроень: для распознавания разных языков, разных типов речевых единиц (фонема, слог, слово), разных словарей речевых единиц вследствие того, что в них исгользуются анализаторы контурных свойств речевых сигналов, выделяющие некоторые особенности, отраженные во временной картине (осциллограмме процесса) или спектральной (спектрограмме). Использовать всю информацию, содер>кащуюся в контурных свойствах сигналов, в реальном масштабе времени с помощью известных устройств практически невозможно. Поэтому с помощью логического устройства выделяют совокупность некоторых характерных признаков, присущих именно данному сигналу, что лишает устройство универсальности.

Применение спектр-анализаторов в свою очередь исключает из рассмотрения информацию, содержащуюся в фазовых соотношениях спектральных составляющих. В то же время отдельные звуки речи наиболее сильно отличаются в переходном режиме. когда учет фа5 зовых соотношений обязателен.

Повышение достоверности распознавания речи в предлагаемом устройстве основано на следуюшпх предпосылках. Описание речевого сигнала его многомерным фазовым портретом, 10 т. е. завнспмосттпо производных (или функций от них) одного порядка от производных (или функций ог ппх) другого порядка, полученных для заданного речевого процесса (осцпл 10Граммы), и также для ОГ!1Оаю1101х па Вь!ходе

15 спектр-анализатора, позволяет сохранить всю информацию о речевом процессе в реальном масштабе времени.

Для дискретного съема информации о мпо20 гомерпой фазовой траектории предлагается нанести на многомерное фазовое пространство набор граничных гиперповерхпостей, в моменты пересечения которы. текущей траекторией ее координаты фикспре|отся в логическом уст25 ройстве в виде двумерной таблицы координат.

При оптимальном выборе гпперповерхностей и соответствующей настройке блока принятия решения в логическое устройство поступают данные ооо всех характерных участках

30 многомерной фазой траектор ш.

271921

Составитель В. А. Кудрявцев

Редактор Б. Б. Федотов Текред Т, П. Курилко Корректор И. С. Хлыстова

Заки» 2423у!2 Тираж 480 Подписное

ЦЬИИПИ Комитета но делам изобретений и открытий при Совете Министров СССР

Москва,, гК-35, Раушская паб., д. 4,5

Типография, пр. Сапунова, 2

Предлагаемое устройство отличается от известных тем, что в него донолнительно введены последовательно соединенные блок формирования фазовых координат и блок моделирования граничных гиперповерхностей, причем входы блока формирования фазовых координат подключены ко входам и выходам анализатора, а выходы блока моделирования граничных гиперповерхностей — ко входам блока принятия решения.

На чертеже представлена блок-схема устройства.

Устройство содержит микрофон 1, усилитель 2, анализатор 3, блок 4 формирования фазовых координат, блок 5 моделирования граничных гиперповерхностей, блок б принятия решения, блок 7 логической обработки.

Сигнал, пропорциональный речевому объекту, поступает с микрофона 1 на усилитель 2 и в анализатор о. С выходов анализатора сигналы поступают на часть входов блока 4 формирования фазовых координат. На другую часть входов поступают сигналы, пропорциональные непосредственно речевым объектам.

Блок формирования фазовых координат выполняет различные математические преобразования (дифференцирование, интегрирование и другую функциональную обработку).

С выходов блока формирования фазовых координат сигналы (например, пропорциональные производным высоких порядков) поступают на входы 5 моделирования граничных гнперповерхностей. В этом блоке моделируются различные равнения гиперповерхностей (в общем случае нелинейные, интегродифферен5 циальные и пр.), определяющие связи между координатами многомерного фазового пространства и отражающие основные структурные закономерности речевого объекта.

Сигналы с блока моделирования граничных

Тп гиперповерхностей поступают в блок б принятия решений, который анализирует текущую траекторию фазового пространства и вырабатывает сигналы, управляющие записью координат фазовой траектории в логический

15 блок 7, классифицирующий их путем сравнения с эталонами.

Предмет изобретения

Устройство для распознавания речи, содер2о жащее анализатор, блоки принятия решения и логической обработки, отлича ощееся тем, что, с целью повышения достоверности распознавания речевых образов, в него дополнительно введены последовательно соединенные блок

25 формирования фазовых координат и блок моделирования граничных гиперповерхностей, причем входы блока формирования фазовых координат подключены ко входам и выходам анализатора, а выходы блока моделирования

3п граничных гиперповерхностей — ко входам блока принятия решения.

Устройство для распознавания речи Устройство для распознавания речи 

 

Похожие патенты:

Изобретение относится к дистанционно управляемым игрушкам, реагирующим на речевое или звуковое воздействие

Изобретение относится к устройствам для воспроизведения информации и управления процессом приготовления и/или обработки продуктов

Изобретение относится к средствам ввода пароля для доступа в компьютерные базы данных

Изобретение относится к области средств ввода информации в виде речи, преобразования речи в цифровую форму и распознавания речевых сигналов, а также к области средств управления аппаратурой, применяемой в различных сферах практической деятельности: радиоэлектронике, медицине, робототехнике и т.д

Изобретение относится к доступу к информации в компьютерной системе с использованием распознавания и понимания

Изобретение относится к устройствам для представления информации с навигацией в структуре меню

Изобретение относится к сенсорным системам ближнего поля

Изобретение относится к обеспечению возможности поиска и просмотра аудио и видео контента (AVSBI)
Наверх