Способ распознавания контентного содержания сообщений графических форматов



Способ распознавания контентного содержания сообщений графических форматов
Способ распознавания контентного содержания сообщений графических форматов
Способ распознавания контентного содержания сообщений графических форматов
Способ распознавания контентного содержания сообщений графических форматов
Способ распознавания контентного содержания сообщений графических форматов

 


Владельцы патента RU 2479028:

Федеральное государственное военное образовательное учреждение высшего профессионального образования ВОЕННО-КОСМИЧЕСКАЯ АКАДЕМИЯ им. А.Ф. Можайского (RU)

Изобретение относится к автоматике и вычислительной технике и может быть использовано для предварительной обработки сообщений графического формата (СГФ). Технический результат состоит в расширении возможностей по распознаванию, которые заключаются в возможности выявлять изображения, содержащие рисунки, баннеры, чертежи, диаграммы, тексты, таблицы и графические интерпретации кодов; а также в ускорении процесса обработки. Способ распознавания контентного содержания сообщения графического формата основан на последовательности операций, в результате которых декодируют сообщение с целью формирования растра изображения, оценивают объем растра изображения (произведение размеров изображения), вычисляют значение информативного признака, характеризующего неопределенность в структуре растра изображения. Предложенный способ позволяет повысить уровень автоматизации действий по контролю за контентным содержанием сообщений, передаваемых в графическом виде, а также составляет основу для построения системы анализа и отбора сообщений графических форматов путем реализации модели отбора и методики обработки СГФ в условиях их априорной семантической неопределенности. 2 ил., 1 табл.

 

Изобретение относится к автоматике и вычислительной технике и может быть использовано для предварительной обработки сообщений графического формата (СГФ). Предлагаемый способ позволяет выявить контентное содержание растрового изображения.

В настоящее время известны различные способы распознавания сообщений и обработки информации. В частности, в качестве аналогов можно назвать следующие способы.

1. Дерягин Д.Г., Сапроненко В.М. Способ распознавания текстовой информации из векторно-растрового изображения. Патент РФ №2309456, G06K 9/36, 2007 // Изобретения. - М.: ФИПС, 2007.

2. Чанде С., Сааринен П. Обработка информации. Патент РФ №2387007, G06K 9/00, 2010 // Изобретения. - М.: ФИПС, 2010.

3. Лысенко В.Л. Способ распознавания кодированных изображений. Патент РФ №2126552, G06K 9/00, 1999 // Изобретения. - М.: ФИПС, 1999.

В качестве прототипа при разработке предлагаемого способа распознавания контентного содержания СГФ использован «Способ распознавания текстовой информации из векторно-растрового изображения» Патент РФ №2309456, G06K 9/36, 2007. В прототипе для решения задачи выявляют текстовые объекты и извлекают информацию о визуальном оформлении документа.

В прототипе в рамках предварительной обработки (перед распознаванием символов) используя атрибуты форматирования файла, имеющиеся в файле растрового изображения, выполняют следующие операции.

1) Выполняют разбиение изображения до получения областей (фрагментов), содержащих неразрывный логически связанный текст наибольшего размера. Для этого изображение разбивают на области, предположительно содержащие текст, и затем анализируют соседние области на возможность их объединения в более крупные фрагменты.

2) Выполняют разбиение текстовых объектов на отдельные символы и группы символов по предполагаемым местам размещения пробелов или других неидентифицируемых символов, анализ и составление (объединение, сборка) групп символов в строки. Для разбиения на отдельные символы и группы символов выполняют преобразование абсолютных координат символов в группы, разделенные пробелами и увеличенными межсимвольными промежутками.

3) Выполняют обработку и анализ растровых объектов для выявления изображения текста в нетекстовых объектах, анализ для выявления векторных объектов, отличных от разделителей, в том числе выходящих за пределы объекта.

Недостаток прототипа состоит в его применимости для извлечения только текстовой информации и информации о форматировании документа.

Технический результат предлагаемого способа состоит в расширении возможностей по распознаванию контентного содержания изображений, которые заключаются в возможности выявлять сообщения графических форматов, содержащие рисунки, баннеры, чертежи, диаграммы, тексты, таблицы и графические интерпретации кодов (контентное содержание), а также в ускорении процесса обработки за счет исключения процедур разбиения изображения на связанные тексты и поиска предполагаемых мест расположения пробелов и неидентифицируемых символов.

Известный способ (прототип) не позволяет достичь заявленного технического результата.

Основу предлагаемого способа распознавания контентного содержания растрового изображения составляют теоретические предпосылки в виде выявленных статистических свойств, присущих структуре сообщений графических форматов с различным содержанием (контентом). С учетом этого способ включает в себя два основных этапа (фиг.1).

На первом этапе реализации способа определяют (оценивают) объем растра изображения, содержащегося в СГФ, и отсеивают сообщения, принадлежащие к элементам Web-дизайна (баннеры). На втором этапе оценивают значение признаков, характеризующих энтропию сообщений графических форматов и принимают решение о контентном содержании сообщения.

Предлагаемый способ позволяет разделять сообщения графических форматов на следующие классы:

- сообщения графических форматов, содержащих художественные изображения (фотографии, рисунки), - гипотеза W1;

- сообщения графических форматов, содержащих изображения с малой динамикой структурных связей в растре (комиксы, чертежи, диаграммы, схемы), - гипотеза W2;

- сообщения графических форматов, содержащих изображения с большой динамикой структурных связей в растре (тексты, таблицы, карты), - гипотеза W3;

- сообщения графических форматов, содержащих неструктурированные изображения с большой динамикой связей в растре (графические коды, шифры, изображения с поврежденным растром), - гипотеза W4;

- сообщения графических форматов, содержащие изображения с малым расширением (баннеры, иконки, элементы Web-дизайна и т.д.), - гипотеза W5.

Сущность способа состоит в реализации совокупности следующих процедур.

Этап 1. Первый этап обработки СГФ предназначен для выявления сообщений с малым объемом растра и их обработки. На первом этапе выполняют следующие процедуры.

1) Принятый графический файл S(i) декодируют в сообщение графического формата S[m,n,h].

2) Сообщение графического формата преобразуют в двумерный массив размером m×n элементов, описывающий структуру растра изображения, при этом:

- если массив является трехмерным (h=3), то СГФ преобразуют в цветоразностную систему YCrCb и для расчета информативного признака используют двумерный массив Y[m,n];

- если массив является одномерным (параметр h=1), то для расчета информативного признака используют двумерный массив S[m,n,1].

3) Определяют объем растра изображения VS=mn и полученное значение объема растра VS сравнивают с пороговым значением VP, при этом:

- если полученное значение объема растра VS удовлетворяет неравенству VS<VP, то принимают решение в пользу гипотезы W5;

- если полученное значение объема растра VS удовлетворяет условию VS≥VP, то принимают решение о принадлежности СГФ к одной из гипотез W1, W2, W3 или W4 и исходные данные поступают для расчета значения информативного признака.

В рамках предлагаемого способа в качестве порогового значения объема растра предлагается величина VP≈40000, которая определяется на основе анализа многочисленных СГФ в реальных каналах передачи данных.

Этап 2. На втором этапе производится вычисление и оценивание результирующего информативного признака, по значениям которого СГФ разделяется на указанные классы. На втором этапе выполняют следующие процедуры.

1) Рассчитывают значение результирующего информативного признака характеризующего контентное содержание СГФ.

Для вычисления результирующего информативного признака при распознавании контента СГФ предлагается многоуровневая схема преобразований структурных признаков объекта с целью получения значений, характеризующих энтропию СГФ.

В рамках решения задачи оценивания контентного содержания сообщений графических форматов первичными признаками, доступными субъекту непосредственно или с помощью специальных средств наблюдения, являются элементы структуры растра вида

которые объединяют в две подгруппы признаков первого уровня и образуют упорядоченные множества векторов , i=1(1)m и , j=1(1)n. С признаками первого уровня производят операцию расчета построчного (постолбцового) коэффициента корреляции между соседними векторами из множеств , i=1(1)m и , j=1(1)n, в результате чего образуются признаки второго уровня в виде коэффициента корреляции:

Признаки второго уровня представляют собой элементы векторов и , в которых содержатся результаты расчета построчных (постолбцовых) коэффициентов корреляции. Над признаками второго уровня производят операцию вычисления отклонений элементов векторов и коэффициентов корреляций от значений линейных трендов и :

В результате вычисления отклонений формируются признаки третьего уровня в виде:

Признаки третьего уровня представляют собой значения элементов векторов и , которые характеризуют нелинейные отношения элементов структуры растра изображения. При этом чем больше динамика изменения значений соседних элементов векторов и , тем больше динамика (хаотичность) нелинейных связей в структуре растра изображения, т.е. тем больше энтропия СГФ. Вычислительные процедуры на третьем уровне обеспечивают расчет величины, характеризующей зависимость (динамику) между элементами векторов и , которая представляет собой среднее значение разности соседних элементов в массивах и :

В результате вычислений по формулам (8) и (9) образуются признаки четвертого уровня, которые определяют числовые значения составляющих d(г)<m-1>) и d(в)<n-1>) результирующего информативного признака оценивания контентной информации СГФ.

На четвертом уровне вычисляют значение результирующего информативного признака по выражению вида

и разделяют изображений в соответствии с их контентным содержанием.

Таким образом, вычисление результирующего информативного признака для разделения изображений с различным контентным содержанием осуществляют с помощью сложной четырехуровневой системы преобразований структурных признаков исходного СГФ. В результате преобразований признаковое пространство сокращается в (m·n-1) раз, что существенно уменьшает размеры признаковых описаний.

2) Полученное значение информативного признака сравнивают с пороговыми значениями Hp1, Hp2 и Hp3 (исследуют значение информативного признака ), при этом:

- если полученное значение результирующего информативного признака удовлетворяет условию , то принимают решение в пользу гипотезы W1;

- если полученное значение результирующего информативного признака удовлетворяет условию то принимают решение в пользу гипотезы W2;

- если полученное значение результирующего информативного признака удовлетворяет условию то принимают решение в пользу гипотезы W3;

- если полученное значение результирующего информативного признака удовлетворяет условию , то принимают решение в пользу гипотезы W4.

Для определения численного значения порогов принятия решения Hp1, Hp2 и Hp3 требуется оценить статистические характеристики (законы распределения) величины для каждого класса СГФ. В силу того что генеральная совокупность СГФ (множество различных СГФ) бесконечна, оценивание законов распределения и числовых характеристик необходимо осуществлять на основе выборочного метода.

Для проведения выборочных наблюдений важно правильно установить требуемый объем выборки NTp, который в значительной степени определяет необходимые при этом временные, трудовые и стоимостные затраты. Для определения объема выборки необходимо задать надежность (доверительную вероятность β) и точность (доверительный интервал ε) оценок.

Для построения статистической плотности распределения вероятностей необходимо провести серию из NТрφ испытаний по схеме Бернулли (независимых и однородных). Задав максимальную вероятностную погрешность статистической оценки плотности распределения ε и доверительную вероятность β, количество проводимых испытаний NТрφ можно оценить по формуле

где Ф(tβ)=β.

Количество испытаний, вычисленное по формуле (11) при максимальной вероятной погрешности ε=1% и доверительной вероятности β=0,95, принимает значение NТрφ=9600.

В результате исследований результирующего информативного признака методом статистических испытаний доказана возможность его описания в виде нормальных законов распределения с соответствующими оценками математического ожидания и дисперсии (фиг.2) для четырех классов изображений, содержащих различную контентную информацию (табл. 1).

В связи с отсутствием априорных вероятностей появления объектов рассматриваемых классов в канале связи, а также матрицы потерь от неправильных решений для обоснования пороговых значений целесообразно использовать критерий Неймана-Пирсона. Результаты вычисления пороговых значений представлены в таблице 1.

Таблица 1
Классы изображений и их статистические характеристики
Классы изображений Гипотеза Статистическое описание класса (нормальный закон распределения с параметрами Пороговые значения Условие принятие решения в пользу соответствующей гипотезы
Художественные изображения (фотографии, рисунки) W1 N (58,1; 18,9) Hp1=29,1
Структурированные изображения с малой динамикой (комиксы, чертежи, диаграммы, схемы) W2 N (19,9; 3,8) Hp2=13,8
Структурированные изображения с большой динамикой (тексты, таблицы, карты) W3 N (8,3; 3,1) Hp3=4,1
Неструктурированные изображения с большой динамикой (коды, ошибки) W4 N (2,8; 0,6)

Разработанный способ позволяет осуществлять предварительное распознавание контентного содержания СГФ и основан на различиях статистических свойств структурных связей между элементами растра изображений.

Предложенный способ позволяет повысить уровень автоматизации действий по контролю за контентным содержанием сообщений, передаваемых в графическом виде, а также составляет основу для построения системы анализа и отбора сообщений графических форматов путем реализации модели отбора и методики обработки СГФ в условиях их априорной семантической неопределенности.

Способ распознавания контентного содержания сообщения графического формата, включающий операцию декодирования графического файла с целью формирования растра изображения, отличающийся тем, что выполняют операции по преобразованию структурных признаков изображения, вычисляют объем растра изображения, построчные и постолбцовые коэффициенты корреляции в растре изображения, отклонения значений коэффициентов корреляции от линейного тренда, среднее значение разности соседних элементов в массивах, результирующий информативный признак, характеризующий энтропию сообщений графических форматов, разделяют изображения на классы по следующим видам контентного содержания сообщений графических форматов: изображения баннеров, «иконок», элементов Web-дизайна, художественные изображения (фотографии, рисунки), структурированные изображения с малой динамикой (комиксы, чертежи, диаграммы, схемы), структурированные с большой динамикой (тексты, таблицы, карты), неструктурированные с большой динамикой (коды, ошибки).



 

Похожие патенты:

Изобретение относится к аналитической химии и может быть использовано для анализа иммунологических проб. .

Изобретение относится к средствам цифрового копирования документов. .

Изобретение относится к технике организации видеонаблюдения, а именно к системам и способам автоматического выделения и отслеживания лица человека для биометрической идентификации личности.

Изобретение относится к области обработки изображений и может быть использовано при редактировании изображения, при котором не нарушаются размеры, пропорции и взаимное расположение наиболее важных объектов.

Изобретение относится к распознаванию изображений. .

Изобретение относится к области обработки цветных изображений объектов и предназначено для приема, распознавания, визуализации изображений цветных объектов. .
Изобретение относится к автоматике и вычислительной технике. .

Изобретение относится к автоматическому распознаванию символов, напечатанных на структурированном фоне, как это имеет место, например, на банкнотах и ценных бумагах.

Изобретение относится к автоматике и вычислительной технике и может быть использовано при распознавании объектов или групп объектов среди большого числа шаблонов.

Изобретение относится к области распознавания образов, а именно к способам идентификации личности человека с помощью двух и более разнесенных видеокамер с заранее известным их расположением с применением трехмерной реконструкции лица человека

Изобретение относится к средствам детектирования копий видеоданных. Техническим результатом является повышение точности детектирования копий видеоданных за счет построения траектории представляющих интерес устойчивых точек. В способе выделяют ускоренные надежные элементы (SURF) из опорных видеоданных; сохраняют точки SURF из опорных видеоданных; определяют траектории точек SURF как пространственно-временные особенности опорных видеоданных на основе точки SURF; сохраняют траектории точек SURF и формируют индексы для траекторий точек SURF. 4 н. и 20 з.п. ф-лы, 7 ил., 1 табл.

Заявленная группа изобретений относится к области культурно-исторического и художественно-ретроспективного исследования с применением компьютерных технологий. Техническим результатом является получение обработанных опосредованным неразрушающим способом цифровых копий изображений художественных полотен и других произведений искусства, позволяющих увидеть рельеф и углубления поверхностных и внутренних слоев. Предложен способ опосредованного неразрушающего исследования художественных полотен, монументального или других произведений искусства для выявления их скрытых индивидуальных особенностей. Согласно способу получают цифровую копию изображения художественного полотна, сохраняют ее на компьютере и обрабатывают с помощью, по меньшей мере, одного графического редактора. При этом компьютерную обработку осуществляют путем выполнения последовательности действий, включающей изменение масштаба исходного изображения, выполнение последовательного затемнения изображения с помощью инструмента «Затемнитель» кистью минимальных размеров до появления видимых контуров, характеризующих углубления и рельеф поверхности. 4 н. и 15 з.п. ф-лы, 13 ил.

Изобретение относится к распознаванию данных, а именно к распознаванию лица человека на цифровых изображениях, и может быть использовано в системах технического зрения для ограничения доступа к защищенным от посторонних лиц услугам, ресурсам и объектам. Техническим результатом является увеличение скорости распознавания лиц людей при высокой точности распознавания. Способ идентификации графического изображения лица человека включает получение эталонного изображения лица, выбор на этом изображении ключевых точек, сравнение эталонного изображения с анализируемым, принятие решения о идентичности эталонного изображения и анализируемого, причем на эталонном изображении выделяют доменную область в виде квадрата с центром в ключевой точке и ранговую область, имеющую максимальную схожесть с доменной областью, определяют коэффициент подобия доменной и ранговой областей, анализируемое изображение сравнивают с эталонным, выделяя на анализируемом изображении области, соответствующие доменной и ранговой области эталонного изображения, и определяют коэффициент подобия этих областей, на основании анализа коэффициентов подобия доменных и ранговых областей анализируемого и эталонного изображения принимают решение о идентичности изображений. 1 з.п. ф-лы, 3 ил.

Изобретение относится к способу и системе распознавания изображений лиц. Техническим результатом является повышение быстродействия распознавания изображений лиц по скетчам и повышение его универсальности. Способ распознавания изображений лиц заключается в разделении распознавания на регистрацию и распознавание, причем при регистрации вводятся исходные цветные изображения лиц, выполняется преобразование цветных изображений в полутоновые, выполняется сглаживающая фильтрация полутоновых изображений, полученные изображения преобразуются в спектры с помощью двумерного косинус-преобразования, удаляются высокочастотные спектральные компоненты, близкие по значениям к нулю, и полученные спектры записываются в базу эталонов, при распознавании вводятся скетчи, выполняется преобразование скетчей в спектры с помощью двумерного косинус-преобразования, удаляются высокочастотные спектральные компоненты, близкие по значениям к нулю, выполняется сравнение полученных тестовых спектров со спектрами, хранящимися в базе эталонов, принимается решение о распознавании по критерию минимума расстояния. 2 н.п. ф-лы, 4 ил.

Изобретения относятся к способу, устройству и системе для определения автора картины. Техническим результатом является повышение надежности и гибкости определения автора картины. Способ определения автора картины включает преобразование исследуемого полотна или его фрагментов с помощью устройства для оцифровки по меньшей мере в один набор данных; анализ набора/наборов данных и определение характеризующих признаков или деталей характеризующих признаков с использованием метода Хафа, причем определяемые характеризующие признаки хранятся в одном наборе данных; определение опорных признаков по меньшей мере одного характеризующего признака или деталей характеризующих признаков, содержащихся в наборе данных, причем опорные признаки характеризующих признаков либо уже заложены в базу данных, либо их создают в ходе текущего процесса, при этом база данных содержит дополнительную связанную запись для каждого из этих хранящихся характеризующих признаков; признаки, которые были распознаны таким образом и проанализированы, сравнивают с характеризующими признаками, хранящимися в базе данных, и при обнаружении одного или нескольких совпадений выводят фамилию автора и/или связанный набор данных с информацией об авторе. 3 н. и 6 з.п. ф-лы, 20 ил.
Изобретение относится к средствам биометрической защиты анонимности свидетелей при судебном делопроизводстве. Техническим результатом является повышение надежности защиты анонимности свидетеля. Способ биометрической защиты анонимности свидетелей при судебном делопроизводстве заключается в том, что создают множество электронных одноразовых удостоверений личности свидетеля без указания его имени, получаемых генерированием случайного кода - К, используемого далее при обучении нейронной сети преобразовывать параметры примеров биометрического образа свидетеля в код - К, параметры обученной нейронной сети защищают самошифрованием на фрагментах кода - К, вычисляют хэш-функцию кода - К, одноразовое электронное удостоверение личности свидетеля формируют путем размещения в нем уникального номера удостоверения, шифротекста защищенных параметров обученной нейронной сети и значения хеш-функции кода - К, эти данные орган анонимной регистрации охватывает своей цифровой подписью, далее все примеры биометрических образов свидетеля и случайные коды - К уничтожают, далее при каждом К-том вызове анонимного свидетеля пересылают ему его К-тое электронное удостоверение, пользуясь которым, свидетель предъявляет свой биометрический образ и тем самым анонимно подтверждает свою личность, также, предъявив свой биометрический образ, свидетель получает выходной код - К, проверку которого осуществляют вычислением его хеш-функции и сравнением ее с эталоном, размещенным ранее в одноразовом удостоверении личности. 2 з.п. ф-лы.

Изобретение относится к области обработки изображений. Техническим результатом является повышение качества исходных фрагментов изображений за счет осуществления фильтрации. Предложен способ обработки изображения документа. Способ включает в себя этап, на котором осуществляют идентификацию при помощи вычислительного устройства, содержащего один или более процессоров, множества изображений фрагментов в пределах изображения документа. Далее согласно способу осуществляют разделение при помощи вычислительного устройства множества изображений фрагментов на множество классов, причем каждый класс из множества классов включает в себя подмножество из множества изображений фрагментов, которые в значительной степени похожи друг на друга, где определение степени похожести одного фрагмента изображения на другой осуществляется на основании заданной меры, определяющей степень сходства между этими фрагментами. 3 н. и 18 з.п. ф-лы, 15 ил.

Изобретение относится к идентификации преобразований, которые могут применяться по меньшей мере к части изображения документа для повышения качества оптического распознавания символов (OCR). Технический результат - повышение качества оптического распознавания символов, которое непосредственно зависит от эффективного определения последовательности из одного или нескольких преобразований. Для этого пример способа включает построение с помощью компьютерной системы упорядоченного списка преобразований, который должен применяться к изображению, содержащему строку символов, причем каждое преобразование соответствует гипотезе по отношению к одной или нескольким характеристикам изображения, применение к изображению очередного преобразования из списка для получения преобразованного изображения, оценку качества преобразованного изображения, получение оценки качества и обновление списка с учетом полученной оценки качества. 3 н. и 13 з.п. ф-лы, 4 ил.

Изобретение относится к оптическому распознаванию символов. Техническим результатом является оптимизация оптического распознавания символов за счет использования леса решений. Предложенная система включает в себя команды в машинном коде при их исполнении процессором, управляющие системой оптического распознавания символов для обработки содержащего текст отсканированного изображения документа путем выполнения идентификации изображений символов в содержащем текст отсканированном изображении документа. Причем идентификация выполняется для каждой страницы документа и для каждого изображения символа на странице. Выполняют идентификацию набора подходящих структур данных эталона для изображения символа с использованием леса решений. Используют подходящие структуры данных эталона для определения набора подходящих графем и используют идентифицированный набор подходящих графем для выбора кода символа, который соответствует изображению символа. Подготавливают обработанный документ, содержащий коды символов, которые соответствуют изображениям символов из отсканированного изображения документа, и сохраняют обработанный документ в одном или более запоминающих устройств и модулей памяти. 3 н. и 17 з.п. ф-лы, 66 ил.
Наверх