Способ автоматизированного анализа растровых изображений

Изобретение относится к автоматизированному анализу растровых изображений. Техническим результатом является расширение арсенала технических средств по выявлению в растровых изображениях схожих с эталоном пикселей растровых изображений. Предложен способ автоматизированного анализа растровых изображений. Согласно способу преобразуют в заранее заданный формат все электронные файлы эталонных растровых изображений, переводя цвета в градации серого и сжимая до квадрата малой площади порядка 20×20 пикселей. Далее, согласно способу сохраняют преобразованные электронные файлы эталонных растровых изображений в специализированной базе данных. Преобразуют каждый электронный файл анализируемого растрового изображения в заранее заданный формат, идентичный эталонному. Осуществляют поиск каждого пикселя изображения в специализированной базе данных и извлекают из нее информацию о том, в каких эталонных изображениях на данном месте встречается схожий пиксель. При этом специализированная база данных содержит эталонные изображения, при этом каждому эталонному изображению присваивают идентификатор.

 

Область техники, к которой относится изобретение

Настоящее изобретение относится к автоматизированному анализу растровых изображений и может быть использовано при разработке новых и совершенствовании существующих систем проверки растровых изображений на совпадение с эталонными изображениями.

Уровень техники

В настоящее время весьма остро стоит проблема так называемого перехвата данных. Такая проблема может встретиться в случае отслеживания различных документов, в т.ч. содержащих изображения, проходящих по сети компании, на предмет наличия в них конфиденциальной информации.

В настоящее время известно несколько систем или способов, позволяющих решить эту проблему.

Например, в патенте России №2420800 (приоритет от 30.06.2009, опубликовано 10.06.2011) раскрыт способ поиска похожих по смысловому содержимому электронных документов, в котором задают правила формирования уникальных слов, взвешиваются уникальные слова и связи между ними, строят на основе этого семантическую сеть и сравнивают семантические сети документов. Этот способ достаточно трудоемок и пригоден лишь в ограниченной области.

Известен способ индексации и поиска цифровых изображений (патент на изобретение РФ №2510935, приоритет от 23.09.2011, опубликовано 10.04.2014). Способ, описанный в данном патенте, подходит для поиска изображений определенной категории, в том числе цветовой, но при этом не подходит для задачи поиска конкретного изображения в обширной базе данных, где может присутствовать много изображений с одинаковыми преобладающими цветами. Так как автор патента ставил задачу поиска изображений, подходящих под некоторое описание, он сам указал в качестве недостатка некоторых других методов тот факт, что они могут классифицировать изображения с похожими преобладающими цветами как совершенно различные. В то же время заявленное изобретение решает задачу поиска конкретного изображения с поправкой на искажения, возникающие при его сохранении в разных форматах и разных масштабах. При такой постановке задачи недостатком становится именно невозможность различить изображения с похожими характеристиками.

Раскрытие изобретения

Таким образом, существует потребность в расширении арсенала технических средств за счет создания сравнительно быстрого и универсального способа, который позволил бы выявлять в потоке данных растровые изображения, схожие с эталонными и который бы преодолевал недостатки известных решений.

Для решения этой задачи и получения указанного технического результата в настоящем изобретении предложен способ автоматизированного анализа растровых изображений, заключающийся в следующем.

1. Создают специализированную базу данных эталонных изображений, специализация которой заключается в том, что данные из эталонных изображений хранятся специальным образом. Каждое эталонное изображение описывается тремя параметрами: растр (набор пикселей), порог срабатывания (R, задается в процентах от 1 до 100), размер диапазона допустимых интенсивностей пикселя (L). Первый параметр используется как эталонные данные, второй и третий влияют на качество поиска. Для создания такой базы данных выполняют следующие шаги:

1) каждому эталонному изображению присваивают уникальный идентификатор;

2) все электронные файлы эталонных растровых изображений преобразуют в заранее заданный формат (bmp);

3) каждое эталонное изображение переводят в градации серого, где 1 пиксель кодируется 1 байтом, диапазон интенсивностей от 0 до 255;

4) каждое эталонное изображение ужимают до размера 20 на 20 пикселей;

5) для каждого пикселя строится допустимый диапазон интенсивностей, для этого строится массив допустимых интенсивностей размера L, каждый элемент которого представляет собой значение интенсивности, высчитываемое по формуле

,

где k[i] - элемент массива допустимых интенсивностей,

l - интенсивность в текущем пикселе,

L/2 - половина размера диапазона допустимых интенсивностей,

i - номер текущего элемента массива допустимых интенсивностей, принимает

значения от 0 до L. В граничных ситуациях, когда, например, разность интенсивности и L/2 меньше 0, отрицательные значения интенсивности отбрасывают. Также поступают с верхней границей - значения интенсивности больше 255 также отбрасывают. В этих случаях размер массива допустимых интенсивностей может быть меньше L.

6) создают трехмерный массив, первое измерение которого отражает все возможные значения интенсивности цвета (256 элементов), второе измерение отражает все пиксели изображения (400 элементов, при целевом размере изображения 20 на 20 пикселей), третье измерение будет содержать идентификаторы эталонов (размер заранее неизвестен, зависит от количества эталонных изображений).

7) каждое подготовленное изображение раскладывают по массиву из п. 6 следующим образом:

a) обходят все пиксели текущего эталона, позиция пикселя в изображении - это индекс второго измерения в массиве из п. 1.6;

b) для текущего пикселя обходят все допустимые значения интенсивности, интенсивность - индекс первого измерения в массиве из п. 1.6;

c) в массив из п. 6 по индексу соответствующей интенсивности (п. 1.7.b) и по позиции пикселя на изображении (п. 1.7.а) добавляется идентификатор эталонного документа.

8) создают вспомогательный массив, в котором ключом является уникальный идентификатор эталонного изображения, а значениями - счетчик найденных пикселей (инициализируется 0) и порог срабатывания эталона R.

2. Когда на анализ поступает файл, содержащий растровое изображение, то производят следующие действия:

1) изображение преобразуют в заранее заданный формат (bmp);

2) изображение переводят в градации серого, где 1 пиксель кодируется 1 байтом, диапазон интенсивностей от 0 до 255;

3) изображение ужимают до размера 20 на 20 пикселей;

4) для каждого пикселя анализируемого изображения:

a) по интенсивности, которая является индексом первого измерения массива из п. 1.6 получают массив позиций, в которые входит пиксель с такой интенсивностью;

b) по позиции пикселя в анализируемом изображении, которая является индексом в массиве, полученном в п. 2.4.а, получают список идентификаторов эталонов.

с) в вспомогательном массиве из п. 1.8 увеличивают счетчики найденных пикселей для эталонов, полученных в п. 2.4.b.

5) обходят вспомогательный массив:

a) счетчики найденных пикселей делят на размеры изображения (400) и умножают на 100, таким образом получают процент соответствия анализируемого изображения данному эталону;

b) сравнивают процент соответствия с соответствующими порогами;

c) если порог превышен, помещают идентификатор эталонного документа в список найденных эталонов;

d) обнуляют счетчики найденных пикселей;

6) возвращают массив найденных идентификаторов эталонных документов.

Настоящее изобретение может быть реализовано в любой вычислительной системе, например в персональном компьютере, на сервере и т.п.

Способ автоматизированного анализа растровых изображений по настоящему изобретению предназначен для осуществления так называемого копирайтного анализа (английский аналог - fingerprint detection), задачей которого является установление схожести растровых изображений с изображениями, переданным ранее в базу данных (библиотеку) в качестве эталонных.

Особенностью данного алгоритма является то, что параметрами R и L можно влиять на показатели полноты и качества алгоритма. Например, увеличивая значение L, можно повышать устойчивость к шуму и артефактам ценой повышенного риска ложноположительных срабатываний. Параметр R отвечает за степень похожести изображений в рамках алгоритма.

Способ автоматизированного анализа растровых изображений, заключающийся в том, что

преобразуют в заранее заданный формат все электронные файлы эталонных растровых изображений, переводя цвета в градации серого и сжимая до квадрата малой площади порядка 20×20 пикселей;

сохраняют преобразованные электронные файлы эталонных растровых изображений в специализированной базе данных;

преобразуют каждый электронный файл анализируемого растрового изображения в заранее заданный формат, идентичный эталонному;

осуществляют поиск каждого пикселя изображения в специализированной базе данных и извлекают из нее информацию о том, в каких эталонных изображениях на данном месте встречается схожий пиксель;

специализированная база данных содержит эталонные изображения, при этом каждому эталонному изображению присваивают идентификатор;

эталонные изображения описываются тремя параметрами: растр - набор пикселей, используемый как эталонные данные, R - порог срабатывания, заданный в пределах от 1 до 100%, L - размер диапазона допустимых интенсивностей пикселя;

анализ каждого пикселя анализируемого растрового изображения осуществляется посредством создания списка идентификаторов эталонов по позиции пикселя в анализируемом изображении, который является индексом в массиве позиций, определения процента соответствия эталону посредством деления счетчиков найденных пикселей на размеры изображений и умножения на 100, сравнения процента соответствия с заданным порогом, если порог превышен, помещают идентификатор эталонного документа в список найденных эталонов.



 

Похожие патенты:
Изобретение относится к автоматизированному анализу векторных изображений. Технический результат – расширение арсенала технических средств посредством выявления схожих с эталоном векторных изображений.

Изобретение относится к технологиям создания изображения модели для виртуальной примерки. Техническим результатом является повышение точности извлечения головного портрета, улучшение синтезирования головного портрета пользователя с телом.

Изобретение относится к технологиям загрузки фрагментов изображения на клиентское устройство. Техническим результатом является обеспечение экономии ресурсов памяти при отображении и отрисовке фрагментов изображения за счет осуществления замены областей просмотра.

Изобретение относится к вычислительной технике. Технический результат заключается в возможности исправления перспективных искажений изображения открытого разворота многостраничного документа.

Изобретение относится к способам цифровой обработки медицинских изображений и может быть использовано для автоматической сегментации флюорограмм грудной клетки.

Изобретение относится к определению факта столкновения сферического элемента с компонентом игрового поля или расположения на нем или вблизи него. Техническим результатом является повышение точности определения местоположения столкновения сферического элемента с мишенью.

Группа изобретений относится к области вычислительной техники. Техническим результатом является повышение точности распознавания объектов.

Группа изобретений относится к технологиям обработки изображений и оптическому распознаванию символов. Техническим результатом является расширение арсенала технических средств систем оптического распознавания текста.

Изобретение относится к области терминальной технологии, а именно к измерению освещенности. Технический результат – улучшение точности измерения освещенности.

Изобретение относится к распознаванию трехмерного объекта. Техническим результатом является повышение точности сопряжения между собой трехмерного объекта и модели трехмерной формы.

Группа изобретений относится к технологиям биометрической идентификации пользователей. Техническим результатом является расширение арсенала технических средств по биометрическому распознаванию радужной оболочки глаза пользователя.

Изобретение относится к семантической классификации оцифрованных киноматериалов и информационного поиска в архивах оцифрованных киноматериалов. Техническими результатами являются повышение точности сегментации фильмов на сцены, повышение точности классификации сцен по заранее заданному перечню классов, повышение быстродействия процесса извлечения семантических признаков из кадров кинофильма, сокращение дополнительных затрат на программирование при увеличении размерности вектора признаков, сокращение объема данных для хранения индекса для выполнения информационного поиска кинофрагментов по текстовым запросам, запросам в структурированной форме и запросам по образцу, сокращение времени выполнения индексации и повышение точности и чувствительности информационного поиска.

Изобретение относится к автоматике и вычислительной технике и может быть использовано при построении интеллектуальных систем технического зрения, видеонаблюдения, видеоконтроля.

Изобретение относится к способам предоставления доступа к данным, в частности к информации, доступ к которой осуществляется посредством сети передачи данных с помощью присвоения им кода.

Изобретение относится к технологиям компьютерной обработки изображений. Техническим результатом является повышение эффективности косметической обработки изображения лица за счет автоматического распознания части изображения, которое должно быть косметически обработано.

Изобретение относится к технологиям обнаружения движущихся объектов в последовательности видеоизображений. Техническим результатом является повышение эффективности обнаружения движущихся объектов в последовательности видеоизображения, за счет анализа качества изменения изображения.

Группа изобретений относится к технологиям распознавания человека. Техническим результатом является повышение защищенности от ложной идентификации за счет распознавания человека путем использования переменных временных компонентов поведенческой черты лица и биологических черт.

Изобретение относится к технологиям автоматизированной проверки биометрических данных пользователя. Техническим результатом является повышение эффективности проверки биометрических данных пользователя.

Изобретение относится к технологиям обработки электронных документов. Техническим результатом является обеспечение классификации изображений документов на основе функции классификации.

Изобретение относится к компьютерной технике, а именно к системам для просмотра видеопоследовательностей. Техническим результатом является обеспечение автоматизированного выбора ключевого кадра в видеопоследовательности.
Изобретение относится к автоматизированному анализу векторных изображений. Технический результат – расширение арсенала технических средств посредством выявления схожих с эталоном векторных изображений.
Наверх