Способ автоматизированного поиска эталонных печатей

Изобретение относится к области обработки данных, а в частности к способам распознавания данных, в том числе считывания знаков, изображений, образов. Техническим результатом является повышение быстродействия при выявлении в любом документе заранее заданной эталонной круглой печати. Предложен способ автоматизированного поиска заранее заданных эталонных круглых печатей. Способ включает в себя этап, на котором осуществляют сбор коллекции различных заранее заданных изображений как содержащих круглые печати, так и не содержащих круглые печати. Далее согласно способу осуществляют обучение каскадных классификаторов на собранных коллекциях изображений и преобразование в заранее заданный формат всех изображений эталонных печатей, заданных пользователем. А также выявляют области в электронном файле анализируемого документа, где предположительно может располагаться печать, и осуществляют сравнение найденных областей с заранее заданными эталонами.

 

Изобретение относится к области обработки данных, а в частности к способам распознавания данных, в том числе считывания знаков, изображений, образов.

Из уровня техники известны способы распознавания и поиска данных, в том числе изображений. Например, заявка на изобретение РФ №2012110605, система добавления метаданных, способ и устройство поиска изображения и способ добавления жеста для этого, 27.09.2013, которая включает в том числе и способ поиска изображения, содержащего извлечение по меньшей мере одних метаданных относительно изображения посредством анализа изображения; добавление метаданных к изображению и сохранение изображения с добавленными метаданными во внешнем устройстве и поиск по меньшей мере одного изображения из изображений, сохраненных во внешнем устройстве, на основе метаданных.

Недостатком известного способа является то, что для поиска изображения используются метаданные и не используется информация непосредственно из изображения, в данном случае при отсутствии таких метаданных изображение будет невозможно найти.

Наиболее близким техническим решением к предлагаемому изобретению является способ обнаружения лиц на изображении с применением каскада классификаторов (патент на изобретение РФ №2427911, опубликовано 27.08.2011).

Недостатком указанного способа является ограниченная возможность по поиску изображений только в виде лиц.

Технический результат, на решение которого направлено заявленное изобретение, заключается в создании быстрого, качественного и универсального способа, который позволил бы выявлять в любом документе заданную эталонную круглую печать.

Особенность способа по настоящему изобретению состоит в том, что если достаточно определить только наличие круглой печати, эталонные печати задавать не требуется.

Данный технический результат достигается посредством того, что в способе, включающем в себя использование каскадных класификаторов, предусматривается выполнение следующих операций:

- сбор коллекции различных изображений как содержащих круглые печати, так и не содержащих круглые печати;

- обучение каскадных классификаторов на собранных коллекциях изображений;

- преобразование в заранее заданный формат всех изображений эталонных печатей, заданных пользователем;

- сохранение преобразованных изображений печатей на запоминающем устройстве;

- выявление областей в электронном файле анализируемого документа, где предположительно может располагаться печать;

- сравнение найденных областей с заранее заданными эталонами;

- формирование результата, состоящего из эталонов, найденных в анализируемом документе.

Способ автоматизированного поиска эталонных печатей осуществляют следующим образом.

Используемый алгоритм состоит из двух ступеней:

1. На изображении ищутся области (заданные окнами - ограничивающими квадратами), похожие на круглую печать.

2. Найденные «подозрительные» области сравниваются с загруженными пользователем эталонами печатей.

Такая схема позволила достигнуть приемлемого качества и скорости работы.

Первая ступень настроена так, чтобы баланс ошибок был смещен в сторону ложноположительных срабатываний: практически все изображения печатей пропускаются до второй ступени, но вместе с ними могут попадаться и объекты, не являющиеся печатями.

На вторую ступень попадает небольшое количество подозрительных окон, что значительно сокращает пространство поиска и соответственно время работы детектора.

Для нахождения областей, похожих на круглую печать, был применен каскадный классификатор Виолы-Джонса. Указанный детектор представляет собой каскад очень простых классификаторов (принцип бустинга), основанных на признаках Хаара. Это позволяет отсекать большую часть окон на ранних стадиях, не прогоняя их через весь каскад. За счет этого достигается высокая скорость работы - детектор Виолы-Джонса широко используется для детектирования лиц (например, WO 2008064395 (PCT/AU 2007/001169)), в том числе в портативных устройствах в режиме real-time.

Общий принцип многих детекторов: изображение обрабатывается скользящим окном; для каждого окна решается независимо задача бинарной классификации: есть ли объект на изображении или нет. Если ответ положительный, то в данной позиции найден искомый объект. Размер скользящего окна варьируется от минимального до максимального с заданным множителем.

В способе используется реализация каскадного классификатора из OpenCV. Для обучения использовалась компьютерная программа «Traincascade».

Примеры реализации.

В компании ЗАО «ИнфоВотч» прошли испытания предложенного способа, а именно была создана большая коллекция круглых печатей, а также не-печатей (отрицательных примеров), состоящая примерно из 10.000 изображений. За основу были взяты различные изображения печатей и не-печатей (в частности, выкачанные автоматически из сети Интернет по разным запросам к Google Images), а также внутренняя коллекция документов с печатями компании.

Со всех изображений печати вырезались с помощью детектора окружностей Хафа, а затем с помощью отдельной компьютерной программы из каждого такого изображения создавалось еще несколько путем применения различных операций: поворота на случайный угол и изменения яркости на случайную величину (в пределах некоторого диапазона).

Отобранные каскадным классификатором окна сравниваются с эталонами, загруженными пользователем.

Однако сравнивать их напрямую нельзя, поскольку печать может быть повернута, а также слегка смещена и отмасштабирована относительно эталона. Поэтому используется преобразование Фурье-Меллина:

- К исходным изображениям применяется преобразование Фурье.

- Затем они переводятся в log-полярные координаты.

- Вычисляется фазовая корреляция, которая характеризует близость изображений.

После первых двух преобразований поворот и масштабирование представляются в виде линейных смещений.

Во время вычисления фазовой корреляции снова применяется преобразование Фурье, затем результаты перемножаются и выполняется обратное преобразование Фурье. Значения в ячейках полученной матрицы соответствуют близости изображений, полученных смещением исходных на величину, соответствующую данной ячейке.

Таким образом, благодаря выполненным преобразованиям достигается инвариантность относительно поворота, а также (в определенных пределах) смещения и масштабирования.

Мерой сходства изображения считается максимальное значение в сглаженной матрице фазовой корреляции. Если она превышает заданный порог, то детектор срабатывает.

Способ может работать только с круглыми печатями, поскольку именно на этом классе объектов был обучен каскадный классификатор.

Благодаря описанным взаимосвязанным действиям при использовании указанного способа значительно увеличивается скорость работы и повышается ее качество.

Анализ заявленного технического решения на соответствие условиям патентоспособности показал, что указанные в независимом пункте формулы признаки являются существенными и взаимосвязаны между собой с образованием устойчивой совокупности неизвестной на дату приоритета из уровня техники необходимых признаков, достаточной для получения требуемого синергетического (сверхсуммарного) технического результата.

Свойства, регламентированные в заявленном способе отдельными признаками, общеизвестны из уровня техники и не требуют дополнительных пояснений.

Таким образом, вышеизложенные сведения свидетельствуют о выполнении при использовании заявленного технического решения следующей совокупности условий:

- объект, воплощающий заявленное техническое решение, при его осуществлении предназначен для использования в области, касающейся обнаружения изображений, и может быть использован при обнаружении круглых печатей;

- для заявленного объекта в том виде, как он охарактеризован в независимом пункте формулы изобретения, подтверждена возможность его осуществления с помощью вышеописанных в материалах заявки известных из уровня техники на дату приоритета средств и методов;

- объект, воплощающий заявленное техническое решение, при его осуществлении способен обеспечить достижение усматриваемого заявителем технического результата.

Способ автоматизированного поиска заранее заданных эталонных круглых печатей, включающий в себя использование каскадных классификаторов, отличающийся тем, что предусматривает выполнение следующих операций:
сбор коллекции различных заранее заданных изображений как содержащих круглые печати, так и не содержащих круглые печати;
обучение каскадных классификаторов на собранных коллекциях изображений;
преобразование в заранее заданный формат всех изображений эталонных печатей, заданных пользователем;
сохранение преобразованных изображений печатей на запоминающем устройстве;
выявление областей в электронном файле анализируемого документа, где предположительно может располагаться печать;
сравнение найденных областей с заранее заданными эталонами;
формирование результата, состоящего из эталонов, найденных в анализируемом документе.



 

Похожие патенты:

Изобретение относится к способам представления цифровых изображений, в том числе видео и телевизионной информации и может быть использовано в системах цифрового стереоскопического телевидения.

Изобретение относится к компьютерной технике, а именно к системам обработки изображений. Техническим результатом является повышение точности обнаружения области документа.

Изобретение относится к технологиям кодирования и декодирования трехмерных видеоданных. Техническим результатом является повышение эффективности кодирования или декодирования видеоконтента с высоким разрешением или высоким качеством при помощи информации, указывающей на то, закодирована ли информация о текстуре единицы кодирования, и принимая во внимание вырезку глубины.

Изобретение относится к вычислительной технике, а именно к устройствам захвата изображений, имеющих функцию отслеживания объекта и функцию непрерывной съемки. Техническим результатом является повышение точности функции отслеживания объекта устройства регистрации изображения в ходе непрерывной съемки, за счет устранения задержки по времени между обнаружением объекта и получением информации фокуса в позиции объекта.

Группа изобретений относится к средствам помощи при вождении транспортного средства. Техническим результатом является повышение точности обнаружения транспортного средства, находящегося рядом с движимым транспортным средством.

Изобретение относится к компьютерной технике, а именно к устройствам и способам обработки изображений. Техническим результатом является обеспечение преобразования исходного изображения в изображение, подобное живописи, за счет настройки уровня размытости в соответствии с параметром регулировки съемки исходного изображения и объекта, включенного в исходное изображение.

Изобретение относится к области электросвязи. Технический результат - повышение установления синхронизации цифрового водяного знака электронного изображения (ЭИ) при разделении ЭИ со встроенным цифровым водяным знаком на составные части произвольного размера.

Изобретение относится к устройствам обнаружения трехмерных объектов. Техническим результатом является повышение точности оценки естественных трехмерных объектов.

Изобретение относится к компьютерной технике. Технический результат - автоматическое инструментальное исполнение синхронно с видео.

Изобретение относится к средствам управления воспроизведением видеоданных. Техническим результатом является адаптация статуса воспроизведения секции видеоданных в зависимости от изменения статуса отображения изображения.

Изобретение относится к средствам анализа цифровых изображений. Техническим результатом является обеспечение классификации объектов по геометрическим признакам в лабиринтных структурах.

Изобретение относится к биометрической идентификации человека и может быть использовано в системах ограничения доступа к защищенным от посторонних лиц услугам, ресурсам и объектам.

Изобретение относится к области стеганографии, а именно к способам идентификации цифровых изображений (ЦИ), содержащих цифровой водяной знак (ЦВЗ). .

Изобретение относится к биометрической идентификации и аутентификации человека и может быть использовано в электронных паспортах и удостоверениях личности, в системах электронного документооборота, в системах ограничения доступа на охраняемые объекты.

Изобретение относится к вычислительной технике и информатике. .

Изобретение относится к способам распознавания печатного текста из растрового изображения. .

Изобретение относится к технической кибернетике, а именно к устройствам распознавания символов текстовых документов. .

Изобретение относится к области цифровой обработки изображений, связанной с выделением и анализом сегментов. Техническим результатом является повышение точности определения толщины слоя за счет автоматизированного выявления нечеткой границы.
Наверх