Устройство для орфографического контроля слов русского языка

 

Изобретение относится к автоматике и цифровой вычислительной технике, в частности.к устройствам обработки текстовой информации. Изобретение позволяет повысить оперативность контроля за счет определения нечитаемых полностьк ипи частично слов. Устройство содержит блок дешифраторов 3, состоящий из дешифратора гласных 4, согласных 5, дешифратора запрещенных биграмм 7, символа пробела 6, блока анализа 8, содержащего счетчики гласных 13, согласных 14, длины слова 15, слов 16 и четырех логических элементов ИШi 9, 10, 11, 12, а также выходного блока 17, содержащего счетчик признаков ошибки 20 и два логических элемента 1ШИ 18 и 19. Анализ текста осуществляется на участке длиной в три слова, что обеспечивается введением в блок анализа счетчика количества слов 16. Сигнал о появлении нечитаемого участка текста вырабатывается при появлении на контролируемом участке текста не менее 2-х из 4-х признаков. Признаками является появление в тексте 3-х и более гласных подряд, 4-х и более согласных подряд, биграмм,. не встречающихся в русском языке (вида оь), а также, слов длиной 15 и более символов. Подсчет количества выявленных признаков осуществляется счетчиком признаков 20 ошибки выходного блзока. 1 ил. а (Л

СОЮЗ COBETQHHX

СОЩЕЛИСТИЧЕСНИХ

РЕСПУБЛИН

„„SU„„ 283773 И

G 06 F 11/00

ОПИСАНИЕ ИЗОБРЕТЕНИЯ

Н ABTOPCHOMY СВИДЕТЕЛЬСТВУ

ГОСУДАРСТВЕННЫЙ HOMHTET СССР

ПО ДЕЛАМ ИЗОБРЕТЕНИЙ И ОТКРЫТИЙ (2l) 3971595/24-24 (22) 26.09.85 (46) 15.01.87. Бюл. Ф 2 (72) В.В. Возняк и А,А. Попыркин (53) 681.3 (088,8) (56) Авторское свидетельство СССР

N9 920730, кл. G Об F 11/00, 1980.

Авторское свидетельство СССР

1056198, кл. G 06 F 11/00, 1981 ° (54) УСТРОЙСТВО ДЛЯ ОРФОГРАФИЧЕСКОГО КОНТРОЛЯ СЛОВ РУССКОГО ЯЗЫКА (57) Изобретение относится к автоматике и цифровой вычислительной технике, в частности-к устройствам обработки текстовой информации.

Изобретение позволяет повысить оперативность контроля эа счет определения нечитаемых полностью или частично слов. Устройство содержит блок дешифраторов 3, состоящий из дешифратора гласных 4, согласных 5, дешифратора запрешенных биграмм 7, символа пробела 6, блока анализа 8, содержащего счетчики гласных 13, согласных 14, длины слова 15, слов

16 и четырех логических элементов

ИЛИ 9, 10 ll 12, а также выходного блока 17, содержащего счетчик признаков ошибки 20 и два логических элемента ИЛИ 18 и 19. Анализ текста осуществляется на участке длиной в три слова, что обеспечивается введением в блок анализа счетчика количества слов 16. Сигнал о появлении нечитаемого участка тек ст а выр аб атыв ает ся пр и появлении на контролируемом участке текста не менее 2 — х из 4 — х признаков. Признаками является появление в тексте

3-х и более гласных подряд, 4-х и более согласных подряд, биграмм,. не встречающихся в русском языке (вида оь), а также слов длиной 1 5 и более символов. Подсчет количества выявленных признаков осуществляется счетчиком признаков 20 ошибки выходного блока, 1 ил.

1283773

Изобретение относится к. автоматике и цифровой вычислительной технике и может быть использовано в различного рода электронных информационных системах, а также в системах автоматического орфографического контроля °

Цель изобретения — повышение оперативности контроля путем определения -нечитаемых полностью или частич10 но слов, На чертеже представлена функциональная схема устройства для орфографического контроля слов русского языка, 15

Устройство работает следующим ,образом.

В исходное состояние устройство устанавливается импульсом, подаваемым на вход 2, который приводит в нулевое состояние счетчика 13 - 16 и 20. При поступлении на инф рма- 50 ционнйй вход 1 сигналов первого информационного символа дешифраторы

4 — 7 включаются в работу. При этом дешифратор 4 распознает гласные буквы, дешифратор 5 — согласные, дешифратор 6 — символ пробела, дешифратор 7 .,: — запрещенные биграммы, неиспользуемые в русском языке (например "ьо", ьъ","йъ" и т.д.) С

Устройство содержит информационный вход 1, вход 2 сброса у"тройства, блок 3 дешифраторов, содержащий дешифратор 4 гласных, дешифратор 20

5 согласных, дешифратор 6 символа пробела, дешифратор 7 запрещенных биграмм, блок анализа 8, содержащий второй 9, третий 10, четвертый 11 и пятый 12 элементы ИЛИ, счетчики гласных 13, согласных 14, длины слова 15 и слов 16, выходной блок 17, содержащий первый 18 и шестой .19 элементы илй1 счетчик 20 признаков ошибки и выход 21 устройства. 30

В ус"гройстве используются четыре признака: наличие допустимых биграмм, появление, трех и более гласных,следующих подряд, появление четырех и более согласных, следующих подряд, (35 появление слова длиной более 15 символов. Устройство предназначено не для поиска и локализации отдельных ошибок в словах, а для обнаружения нечитаемых полностью или частично 40

cnoh. поступлением на шину 1 символа гласной счетчик 13 увеличивает свое состояние на единицу, а счетчик 14 обнуляется. С поступлением на вход

l согласной, счетчик 13 обнуляется, а счетчик согласных увеличивает свое состояние на единицу. При поступлении на вход 1 любого символа кроме "Пробел", счетчик 15 увеличивает свое состояние на единицу.

При поступлении на шину 1 символа

"Пробел" счетчики 13 — 15 обнуляются, а счетчик 16 увеличивает свое состояние на единицу. Сигналы-.признаки вырабатываются счетчиком 13 при достижении состояния "311, счетчиком 14 при достижении состояния

11 12

5, счетчиком 15 при достижении состояния "15". Кроме этого,,сигнал-признак вырабатывается дешифратором 7 при обнаружении запрещенной биграммы, не используемой в. русском языке. Значения состояний счетчиков, при которых вырабатываются сигналы †призна, расчитаны исходя из учета комбинаторно-статистических закономерностей и ограничений, определяющихся неравной вероятностью появления символов алфавита русского языка и их сочетаемости в словах сообщений.

Сигнап-признак поступает через логический элемент ИЛИ 18 на счетчик 20 признаков ошибки. Счетчикпризнаков 20 ошибки подсчитывает ко- личество обнаруженных признаков нечитаемости и при достижении состояния 2 выдает сигнал о нечитаемос11 11 ти анализируемого слова . Счетчик 1 6 подсчитывает количество ан ализируемых слов . При достижении состояния

"3 " счетчик 1 6 через элемент ИЛИ 1 2 обнуляется . Через элемент ИЛИ 1 9 обнуляется счетчик - 2 0 . Благодаря счетчику l 6 и е го обратной связи анализ осуществляется на интервале в три слова, причем для контроля о нечитаеяост и необходима фиксация не менее двух приэнако в в любом соче танин . Таким образом уменьшае гся вероятность ложных срабатываний ус т ройства из -эа единичных ошибок в словах, которые вызываютпоявление признаков.

Формула изобретения

Устройство для орфографического контроля слов русского языка, содерСоставитель- Д. Ванюхин

Редактор Л. Пчелинская Техред Д.Олейник

Корректор С. Черни

Заказ 7443/48 Тираж б70

ВНИИПИ Государственного комитета СССР по делам изобретений и открытий

113035, Москва, Ж-35, Раушская наб., д. 4/5

Подписное с.

Производственно-полиграфическое предприятие, г. Ужгород. ул. Проектная, 4

3 12837 жащее дешифратор запрещенных биграмм, дешифратор символа пробела, первый элемент ИЛИ, причем выход дешифратора запрещенных биграмм соединен с первым входом первого элемента ИЛИ, о т л и ч а ю щ е е с я тем, что, с целью повышения оперативности . контроля за счет определения нечи-; таемых или частично слов, устройство содержит дешифратор гласных, де- 10 шифратор согласных, счетчики гласных, согласных, длины слова, слов и признаков ошибки, второй, третий, четвертый, пятый и шестой элементы

ИЛИ, причем информационный вход 15 устройства подключен к входам дешифраторов гласных, согласных, символа пробела и запрещенных биграмм, вход сброса устройства подключен к первым входам второго, третьего, 20 четвертого, пятого и шестого элементов ИЛИ, выход дешифратора гласных соединен с счетным входом счетчика гласных и с вторым входом третьего элемента ИЛИ, выход дешифратора согласных соединен с счетным входом счетчика согласных и с вто73 4 рым входом второго элемента HJIH

HHBepcHbIA выход дешифратора символа пробела соединен с счетным входом счетчика длины слова, прямой выход дешифратора символа пробела соединен с счетным входом счетчика слов, вторым входом четвертого элемента

ИЛИ и третьими входами второго и третьего элементов ИЛИ, выходы второго, третьего, четвертого и пятого элементов ИЛИ соединены с входами сброса соответственно счетчиков гласных, согласных, длины слова и слов, выходы переполнения счетчиков, гласных, согласных и длины слова соединены соответственно с вторым, третьим и четвертым входами первого элемента KIN, выход переполнения счетчика слов соединен с вторыми входами пятого и шестого элементов ИЛИ, выход первого элемента ИЛИ соединен со счетным входом счетчика признаков ошибки, вход сброса которого соединен с выходом шестого элемента ИЛИ, выход переполнения счетчика признаков ошибки является выходом устройства.

Устройство для орфографического контроля слов русского языка Устройство для орфографического контроля слов русского языка Устройство для орфографического контроля слов русского языка 

 

Похожие патенты:

Изобретение относится к вычислительной технике

Изобретение относится к вычислительной технике и может использоваться при вводе информации в вычислительную систему для оперативного орфографического контроля текстов

Изобретение относится к вычислительной технике

Изобретение относится к вычислительной технике

Изобретение относится к вычислительной технике

Изобретение относится к вычислительной технике

Изобретение относится к вычислительной технике и может быть использовано в системах управления реляционными базами данных

Изобретение относится к компьютерной системе создания и перевода документов, к системе подготовки текста на языке ограничений и перевода на иностранный язык

Изобретение относится к вычислительной технике
Изобретение относится к области электроники и предназначено, например, для использования вспомогательных массивов данных в процессе преобразования и/или верификации компьютерных кодов, выполненных в виде символов, и соответствующих им фрагментов изображения
Изобретение относится к вычислительной технике, в частности к работе в сети Интернет

Изобретение относится к обработке информационных естественно-языковых текстовых материалов

Изобретение относится к системам классификации текстовых сообщений

Изобретение относится к автоматизированному синтезу текстовых документов

Изобретение относится к вычислительной технике, в частности к системе идентификации готовности текстовых документов в сети распределенной обработки данных

Изобретение относится к распознаванию образов из графического изображения, и в частности к распознаванию текста на изображении документа в электронном виде

Изобретение относится к устройствам распознавания написанных знаков
Наверх