Система управления идентификацией и конвертацией форматов объектов текстовых документов

 

Изобретение относится к вычислительной технике, в частности к системам управления идентификацией и конвертацией форматов представления объектов текстовых документов в информационной сети Государственной автоматизированной системы (ГАС) “Выборы”. Его использование позволяет получить технический результат в виде повышения быстродействия системы путем селекции признаков объектов текстовых документов в процессе их идентификации и конвертации формата их представления. Технический результат достигается за счет того, что система содержит первый, второй, третий, четвертый, пятый, шестой и седьмой регистры, первый, второй и третий дешифраторы, первый и второй блоки памяти, первый и второй триггеры, первую, вторую, третью, четвертую, пятую и шестую группы элементов И, первый, второй, третий, четвертый, пятый и шестой элементы И, первый, второй, третий, четвертый, пятый и шестой элементы ИЛИ, первый, второй, третий, четвертый, пятый, шестой, седьмой, восьмой элементы задержки. 1 ил.

Изобретение относится к технической кибернетике, в частности к системам управления идентификацией и конвертацией форматов объектов текстовых документов, используемых в государственной автоматизированной системе “Выборы”.

Особенность решаемой технической задачи состоит в том, что объекты текстовых документов, передаваемых (в электронном виде) по информационной сети ГАС “Выборы” от избирательных комиссий различного уровня иерархии в центральную избирательную комиссию, должны иметь установленный формат представления, не допускающий различного толкования их содержания.

К числу таких объектов, например, могут быть отнесены словосочетания типа “дата, месяц, год”, которые независимо от формы представления в исходном текстовом документе должны иметь стандартный вид, например, такой как 09.07.03, вместо исходной записи 9 июля 2003 года.

Действительно, неточность в текстовом представлении месяца в одной букве может привести к грубой ошибке, когда вместо июЛя месяца будет зафиксирован июНь месяц. В связи с этим возникает задача идентификации в текстах документов текстового представления подобных объектов и их конвертации в стандартный цифровой формат прямо в процессе их поступления в ГАС “Выборы” от различных источников.

Известны системы, которые могли бы быть использованы для решения поставленной задачи [1, 2].

Первая из известных систем содержит блок словаря для регистрации частичных форм символьных изображений данных, определяющих направление штрихов, блок словаря для регистрации символов изображений, состоящих из частичных форм символов, блок ввода штрихов символьного изображения, подлежащего распознаванию, блок поиска символов в словаре и блок выдачи найденного символа [1].

Существенный недостаток данной системы состоит в невысокой надежности распознавания символов, форма начертания символов которых отлична от формы шрифтов эталонных символов.

Известна и другая система, содержащая интерактивную обрабатывающую схему для приема и преобразования видеоинформации первого типа для представления текста на документе, устройство для определения изменения расстояния между центрами символов конкретного слова, схему для определения различия в способах расположения символов в данном слове и схему для пошагового распознавания [2].

Последнее из перечисленных выше технических решений наиболее близко к описываемому.

Его недостаток заключается в невысоком быстродействии, обусловленном тем, что выделение признаков объектов в процессе решения задачи распознавания текстовых документов возможно лишь при повторных циклах распознавания, число которых определяется количеством таких признаков на одном листе распознаваемого текстового документа.

Цель изобретения - повышение быстродействия системы путем селекции признаков объектов текстовых документов в процессе их идентификации и конвертации формата их представления.

Поставленная цель достигается тем, что в систему, содержащую первую и вторую группы элементов И, одни входы которых являются первым и вторым информационными входами системы соответственно, а выходы соединены с соответствующими информационными входами первого и второго регистров, выходы которых являются первым и вторым информационными выходами системы, третий регистр, информационный вход которого является третьим информационным входом системы, синхронизирующий вход - первым синхронизирующим входом системы, а выход является третьим информационным выходом системы, первый элемент задержки, вход которого подключен к первому синхронизирующему входу системы, а выход соединен с одними входами первого и второго элементов И, второй элемент задержки, вход которого подключен к выходу первого элемента И, а выход соединен с синхронизирующими входами первого и второго регистров, установочные входы которых подключены к выходу первого элемента ИЛИ, второй элемент ИЛИ, выход которого соединен с установочным входом третьего регистра, третья и четвертая группы элементов И, одни входы которых являются третьим и четвертым информационными входами системы, а выходы соединены с информационными входами четвертого и пятого регистров соответственно, шестой и седьмой регистры, информационные входы которых подключены к выходам первого и второго блоков памяти соответственно, а выходы являются четвертым и пятым информационными выходами системы, третий элемент ИЛИ, выход которого соединен с установочным входом четвертого регистра, третий, четвертый, пятый и шестой элементы задержки, введены первый дешифратор, вход которого соединен с выходом третьего регистра, а выходы подключены к другим входам первого и второго элементов И, первый триггер, единичный вход которого соединен с выходом первого элемента И, установочный вход подключен к выходу первого элемента ИЛИ, а прямой выход соединен с другими входами элементов И первой, второй и третьей групп, третий элемент И, один вход которого является вторым синхронизирующим входом системы, другой вход подключен к прямому выходу первого триггера, а выход соединен с синхронизирующим входом четвертого регистра и с третьим элементом задержки, пятую группу элементов И, одни входы которых подключены к выходу третьего элемента задержки, а выходы соединены с входами считывания первого блока памяти, четвертый элемент И, один вход которого подключен к выходу третьего элемента задержки, а выход соединен с одними входами первого, второго и третьего элементов ИЛИ, второй дешифратор, входы которого подключены к выходам четвертого регистра, а выходы подключены к другим входам элементов И пятой группы и четвертого элемента И соответственно, четвертый элемент ИЛИ, входы которого соединены с входами соответствующих элементов И пятой группы, а выход соединен с входом четвертого элемента задержки, выход которого подключен к синхронизирующему входу шестого регистра, пятый элемент ИЛИ, выход которого подключен к установочному входу шестого регистра и к другим входам первого и второго элементов ИЛИ, второй триггер, единичный вход которого соединен с выходом четвертого элемента ИЛИ, установочный вход подключен к выходу пятого элемента ИЛИ, а прямой выход подключен к другим входам элементов И четвертой группы, пятый элемент И, один вход которого является третьим синхронизирующим входом системы, другой подключен к прямому выходу второго триггера, а выход соединен с синхронизирующим входом пятого регистра и с входом пятого элемента задержки, шестую группу элементов И, одни входы которых подключены к выходу пятого элемента задержки, а выходы соединены с входами считывания второго блока памяти, шестой элемент И, один вход которого подключен к выходу пятого элемента задержки, а выход соединен с другим входом третьего и одним входом пятого элементов ИЛИ, третий дешифратор, входы которого подключены к выходам пятого регистра, а выходы подключены к другим входам элементов И шестой группы и шестого элемента И соответственно, шестой элемент ИЛИ, входы которого соединены с выходами соответствующих элементов И шестой группы, а выход соединен с входом шестого элемента задержки, выход которого подключен к синхронизирующему входу седьмого регистра, седьмой элемент задержки, вход которого соединен с выходом шестого элемента задержки, а выход является сигнальным выходом системы, и восьмой элемент задержки, вход которого подключен к выходу седьмого элемента задержки, а выход соединен с установочными входами пятого и седьмого регистров и с другими входами третьего и пятого элементов ИЛИ, при этом выход второго элемента И соединен с третьим входом второго элемента ИЛИ и является первым синхронизирующим выходом системы, а выход четвертого элемента И является вторым синхронизирующим выходом системы.

Сущность изобретения поясняется чертежом, на котором представлена структурная схема системы.

Система (см. чертеж) содержит первый 1, второй 2, третий 3, четвертый 4, пятый 5, шестой 6 и седьмой 7 регистры, первый 8, второй 9 и третий 10 дешифраторы, первый 11 и второй 12 блоки памяти, выполненные в виде постоянного запоминающего устройства, первый 13 и второй 14 триггеры, первую 15, вторую 16, третью 17, четвертую 18, пятую 19-20 и шестую 21-22 группы элементов И, первый 23, второй 24, третий 25, четвертый 26, пятый 27 и шестой 28 элементы И, первый 29, второй 30, третий 31, четвертый 32, пятый 33 и шестой 34 элементы ИЛИ, первый 35, второй 36, третий 37, четвертый 38, пятый 39, шестой 40, седьмой 41, восьмой 42 элементы задержки.

На чертеже также показаны первый 43, второй 44, третий 45, четвертый 46 и пятый 47 информационные входы системы, первый 48, второй 49 и третий 50 синхронизирующие входы системы, первый 51, второй 52, третий 53, четвертый 54 и пятый 55 информационные выходы системы, сигнальный 56 и синхронизирующие 57, 58 выходы системы.

Все узлы и элементы системы выполнены на стандартных потенциально-импульсных элементах.

Система работает следующим образом.

Идентификация объектов текстовых документов осуществляется сразу же в процессе ввода текстового документа в информационную сеть Государственной автоматизированной системы “Выборы” на любом из объектов системы.

В процессе построчного ввода символов текстовых документов на входы регистров 3, 4 и 5 последовательно, начиная с первого, поступают кодовые слова.

Первое кодовое слово с информационного входа 45 поступает на информационный вход регистра 3, куда и заносится синхроимпульсом с входа 48. К выходам регистра 3 подключен дешифратор 8, фиксирующий на своем первом выходе высокий потенциал, если входное кодовое слово представляет собой код чисел от 1 до 31. Если же входное кодовое слово будет любым другим, дешифратор выдаст высокий потенциал на своем втором выходе.

Другими словами, если входная кодовая комбинация будет соответствовать признаку даты (с 1 по 31 число месяца), то высоким потенциалом дешифратора 8 будет открыт элемент 23 И, на другой вход которого поступает тот же синхроимпульс с входа 48, задержанный элементом 35 на время записи кода в регистр 3. Синхроимпульс проходит через элемент 23 И на единичный вход триггера 13, фиксируя факт наличия признака даты.

Триггер 13, переходя в единичное состояние, открывает высоким потенциалом элементы 15 и 16 первой и второй групп, через которые к информационным входам регистров 1 и 2 подключаются входы 43 и 44 системы, на которые подаются текущие координаты Х и Y кодового слова, соответствующего числовой дате. Текущие координаты Х и Y даты заносятся в регистры 1, 2 синхроимпульсом с выхода элемента 23 И, задержанным элементом 36 на время срабатывания триггера 13.

Кроме того, триггер 13 высоким потенциалом с единичного выхода открывает по одному входу элементы 17 и 25 И, разрешая занесение второго кодового слова в регистр 4.

Если же дешифратор 8 зафиксирует факт отсутствия признака даты в регистре 3, то высоким потенциалом с другого выхода откроет элемент 24 И, через который проходит синхроимпульс с выхода элемента 35 задержки. Этот синхроимпульс проходит далее через элемент 30 ИЛИ на установочный вход регистра 3 и возвращает его в исходное состояние. Триггер 13, который в этом случае останется в исходном состоянии, низким потенциалом с единичного выхода заблокирует прием второго и третьего кодовых слов регистрами 4 и 5.

Кроме того, импульс с выхода элемента 24 И поступает на выход 57 системы в качестве синхронизирующего сигнала о готовности регистра 3 к приему следующего кодового слова.

Допустим, что первым кодовым словом был признак даты (с 1 по 31 число). Тогда триггер 13 открывает элементы 17 и 25 И, обеспечивая прием и занесение кода в регистр 4 с входа 46. К выходам регистра 4 подключен дешифратор 9, фиксирующий факт наличия в кодовом слове буквенных признаков одного из 12 месяцев (января, февраля, марта, апреля, мая, июня, июля, августа, сентября, октября, ноября, декабря). Дешифратор имеет 12 выходов, соответствующих определенным месяцам, и один выход, на котором фиксируется факт отсутствия в кодовом слове признаков месяца.

Если буквенных признаков какого-либо из месяцев в кодовом слове нет, тогда дешифратор открывает элемент 26 И, через который проходит синхроимпульс с выхода элемента задержки 37. Этот импульс через элемент 30 ИЛИ сбрасывает в исходное состояние регистр 3, через элемент 29 ИЛИ сбрасывает в исходное состояние регистры 1, 2 и триггер 13. Кроме того, этот же импульс выдается на выход 58 системы в качестве синхронизирующего сигнала о подаче следующего кодового слова на вход регистра 3.

Если же буквенные признаки месяца в кодовом слове есть, тогда дешифратор выдает высокий потенциал на одном из своих 12 выходов и открывает, например, элемент 20 И, на другой вход которого поступает синхроимпульс с выхода элемента 37 задержки. Этот импульс с выхода элемента 20 И поступает на вход считывания фиксированной ячейки постоянного запоминающего устройства 11, где записан цифровой номер месяца, например, января - 01, который поступает на вход регистра 6.

Одновременно с этим, тот же импульс с выхода элемента 20 И, пройдя элемент 32 ИЛИ и элемент 38 задержки, задерживающий импульс на время считывания кода из блока памяти 11, поступает на синхронизирующий вход регистра 6 и заносит в него код номера месяца. Кроме того, импульс с выхода элемента 32 ИЛИ поступает на единичный вход триггера 14, устанавливая его в единичное состояние, при котором он высоким потенциалом с единичного входа открывает элементы 18 и 27 И, разрешая тем самым прием в регистр 5 третьего кодового слова.

С поступлением в регистр 5 третьего кодового слова с входа 47, оно заносится в регистр синхроимпульсом с входа 50, поступающим на синхронизирующий вход регистра 5 через элемент через элемент 27 И.

К выходам регистра 5 подключен дешифратор 10, фиксирующий на одном из своих выходов факт наличия числового кода, соответствующего признаку года, например 2001.

Если такого признака в регистре 5 нет, то дешифратор выдает высокий потенциал на один вход элемента 28 И, на другой вход которого поступает синхронизирующий импульс с выхода элемента задержки 39, задерживающего синхронизирующий импульс на время занесения кода в регистр 5 и срабатывания дешифратора 10. Этот импульс с выхода элемента 28 И через элемент 31 ИЛИ устанавливает регистр 4 в исходное состояние, через элемент 33 ИЛИ устанавливает регистр 6 и триггер 14 в исходное состояние, через элементы 29 и 30 ИЛИ устанавливает в исходное состояние регистр 3, регистры 1, 2 и триггер 13 соответственно.

Если же числовой признак года зафиксирован дешифратором 10, то на одном из своих выходов он выдаст высокий потенциал и откроет тем самым, например, элемент 21 И, через который импульс с выхода элемента задержки 39 проходит на вход считывания фиксированной ячейки постоянного запоминающего устройства, где хранится стандартное цифровое обозначение соответствующего года, например для года 2001 - 01.

Содержимое фиксированной ячейки считывается в регистр 7, куда оно заносится синхронизирующим импульсом с выхода элемента 21 И, прошедшим элемент 34 ИЛИ и элемент задержки 40, задерживающий этот импульс на время считывания кода из блока памяти 12.

После занесения кода года в регистр 7 тот же импульс, задержанный на время занесения кода в регистр 7 элементом 41, выдается на выход 56 в качестве сигнала готовности стандартного обозначения выделенных признаков. По этому сигналу сервер считывает с выхода 53 дату, с выхода 54 - цифровое обозначение месяца, с выхода 55 - сокращенное цифровое обозначение года, а с выходов 51 и 52 - координаты расположения указанных признаков в выходном текстовом документе.

Таким образом, введение новых конструктивных признаков позволило реализовать процедуру идентификации объектов текстовых документов и конвертации форматов их представления в информационной сети подсистемы автоматизации избирательных процессов ГАС “Выборы”, выполняемую в процессе построчного ввода текстовых документов в ГАС “Выборы”, в результате которой выходной текстовый документ после ввода в информационную сеть ГАС “Выборы” будет иметь единое обозначение даты во всех разделах текстового документа.

Источники информации

1. Патент ЕПВ № 0542566, М. кл. G 06 К 9/46, 9/80, 1993 г.

2. Патент США № 4887301, М. кл. G 06 К 9/34, 1991 (прототип).

Формула изобретения

Система управления идентификацией и конвертацией форматов объектов текстовых документов, содержащая первую и вторую группы элементов И, одни входы которых являются первым и вторым информационными входами системы соответственно, а выходы соединены с соответствующими информационными входами первого и второго регистров, выходы которых являются первым и вторым информационными выходами системы, третий регистр, информационный вход которого является третьим информационным входом системы, синхронизирующий вход - первым синхронизирующим входом системы, а выход является третьим информационным выходом системы, первый элемент задержки, вход которого подключен к первому синхронизирующему входу системы, а выход соединен с одними входами первого и второго элементов И, второй элемент задержки, вход которого подключен к выходу первого элемента И, а выход соединен с синхронизирующими входами первого и второго регистров, установочные входы которых подключены к выходу первого элемента ИЛИ, второй элемент ИЛИ, выход которого соединен с установочным входом третьего регистра, третья и четвертая группы элементов И, одни входы которых являются третьим и четвертым информационными входами системы, а выходы соединены с информационными входами четвертого и пятого регистров соответственно, шестой и седьмой регистры, информационные входы которых подключены к выходам первого и второго блоков памяти соответственно, а выходы являются четвертым и пятым информационными выходами системы, третий элемент ИЛИ, выход которого соединен с установочным входом четвертого регистра, третий, четвертый, пятый и шестой элементы задержки, отличающаяся тем, что содержит первый дешифратор, вход которого соединен с выходом третьего регистра, а выходы подключены к другим входам первого и второго элементов И, первый триггер, единичный вход которого соединен с выходом первого элемента И, установочный вход подключен к выходу первого элемента ИЛИ, а прямой выход соединен с другими входами элементов И первой, второй и третьей групп, третий элемент И, один вход которого является вторым синхронизирующим входом системы, другой вход подключен к прямому выходу первого триггера, а выход соединен с синхронизирующим входом четвертого регистра и с третьим элементом задержки, пятую группу элементов И, одни входы которых подключены к выходу третьего элемента задержки, а выходы соединены с входами считывания первого блока памяти, четвертый элемент И, один вход которого подключен к выходу третьего элемента задержки, а выход соединен с одними входами первого, второго и третьего элементов ИЛИ, второй дешифратор, входы которого подключены к выходам четвертого регистра, а выходы подключены к другим входам элементов И пятой группы и четвертого элемента И соответственно, четвертый элемент ИЛИ, входы которого соединены с входами соответствующих элементов И пятой группы, а выход соединен с входом четвертого элемента задержки, выход которого подключен к синхронизирующему входу шестого регистра, пятый элемент ИЛИ, выход которого подключен к установочному входу шестого регистра и к другим входам первого и второго элементов ИЛИ, второй триггер, единичный вход которого соединен с выходом четвертого элемента ИЛИ, установочный вход подключен к выходу пятого элемента ИЛИ, а прямой выход подключен к другим входам элементов И четвертой группы, пятый элемент И, один вход которого является третьим синхронизирующим входом системы, другой подключен к прямому выходу второго триггера, а выход соединен с синхронизирующим входом пятого регистра и с входом пятого элемента задержки, шестую группу элементов И, одни входы которых подключены к выходу пятого элемента задержки, а выходы соединены с входами считывания второго блока памяти, шестой элемент И, один вход которого подключен к выходу пятого элемента задержки, а выход соединен с другим входом третьего и одним входом пятого элементов ИЛИ, третий дешифратор, входы которого подключены к выходам пятого регистра, а выходы подключены к другим входам элементов И шестой группы и шестого элемента И соответственно, шестой элемент ИЛИ, входы которого соединены с выходами соответствующих элементов И шестой группы, а выход соединен с входом шестого элемента задержки, выход которого подключен к синхронизирующему входу седьмого регистра, седьмой элемент задержки, вход которого соединен с выходом шестого элемента задержки, а выход является сигнальным выходом системы, и восьмой элемент задержки, вход которого подключен к выходу седьмого элемента задержки, а выход соединен с установочными входами пятого и седьмого регистров и с другими входами третьего и пятого элементов ИЛИ, при этом выход второго элемента И соединен с третьим входом второго элемента ИЛИ и является первым синхронизирующим выходом системы, а выход четвертого элемента И является вторым синхронизирующим выходом системы.

РИСУНКИРисунок 1



 

Похожие патенты:

Изобретение относится к области оптического распознавания текста из растрового изображения

Изобретение относится к области электросвязи

Изобретение относится к лесному хозяйству, методам дистанционного решения задач лесохозяйственного назначения

Изобретение относится к телевидению и обеспечивает в качестве технического результата повышение точности распознавания того, отображено ли какое-либо изображение на экране телевизионного приемника

Изобретение относится к автоматике и вычислительной технике

Изобретение относится к автоматике и вычислительной технике и может быть использовано для автоматического распознавания и классификации объектов разведки в технических средствах разведки и прицеливания роботизированных комплексов вооружения

Изобретение относится к устройствам сканирования изображения

Изобретение относится к вычислительной технике

Изобретение относится к автоматике и вычислительной технике

Изобретение относится к кодированию с помощью нулевого дерева данных элементарной волны (ЭВ)

Изобретение относится к области оптического распознавания текста из растрового изображения

Изобретение относится к области электросвязи, а именно к методам цифровых вычислений и обработки данных с сокращением избыточности передаваемой информации

Изобретение относится к оптическим средствам для идентификации объектов

Изобретение относится к области обработки данных дистанционного зондирования для обнаружения и распознавания по изображениям

Изобретение относится к системам обнаружения движения технической кибернетики, а именно к системе и способу обнаружения статичного фона в видеопоследовательности изображений с движущимися объектами переднего плана

Изобретение относится к способу уплотнения и распаковки видеоданных

Изобретение относится к способу уплотнения и распаковки данных изображения

Изобретение относится к области обработки цифровых изображений и может быть использовано в системах захвата и сжатия изображений, например, фото-видеокамерах

Изобретение относится к оптическому приборостроению и касается конструкции цифрового формирователя панорамного изображения состыкованием снимков его участков
Наверх