Патенты автора Загайнов Иван Германович (RU)

Настоящее изобретение относится главным образом к компьютерным системам и, в частности, к системам и способам идентификации систем письма, используемых в документах. Технический результат заключается в повышении эффективности оптического распознавания символов, применяя нейронную сеть к фрагментам изображения, уменьшая каждый фрагмент изображения до размера входного слоя сети, для снижения требований к вычислительным ресурсам. Технический результат достигается за счёт следующего. Способ включает в себя: получение изображения документа; разбиение изображения на фрагменты; генерирование векторов вероятности посредством нейронной сети, содержащих множество числовых элементов, и каждый числовой элемент отражает вероятность фрагмента изображения, содержащего текст, связанный с соответствующей системой письма; вычисление агрегированного вектора вероятности, причем каждый числовой элемент агрегированного вектора вероятности отражает вероятность изображения, содержащего текст, связанный с системой письма; и с учетом определения того, что максимальный числовой элемент агрегированного вектора вероятности превышает определенное пороговое значение, делается вывод, что изображение документа содержит один или несколько символов, связанных с соответствующей системой письма. 3 н. и 17 з.п. ф-лы, 5 ил.

Изобретение относится к способу, носителю данных и системе обработки изображения. Технический результат заключается в повышении точности распознавания объектов на изображении за счет разделения изображения на цветовые слои и извлечения информации из изображения с использованием выделенных цветовых слоев. В способе получение изображения документа устройством обработки данных; разделение изображения документа на множество патчей, каждый из которых представляет собой область изображения, содержащую объект изображения; определение для каждого патча, является ли данный патч монохромным или не монохромных; кластеризацию множества монохромных патчей на множество кластеров в цветовом пространстве, при этом каждый кластер соответствует одному цветовому слою из множества цветовых слоев изображения документа; сегментацию каждого не монохромного патча на соответствующее множество монохромных сегментов; связывание, для каждого не монохромного патча, каждого монохромного сегмента соответствующего множества монохромных сегментов с кластером из множества кластеров; и использование множества кластеров для выполнения задачи извлечения информации из изображения документа. 3 н. и 17 з.п. ф-лы, 10 ил.

Группа изобретений относится к компьютерным системам, предназначенным для анализа документов, а более конкретно к технологиям построения и оптимизации кодовых книг для обнаружения полей на документе. Техническим результатом является повышение точности извлечения информации из изображений за счет использования оптимизированных кодовых книг. Предложен способ оптимизации кодовой книги. Согласно способу получают посредством устройства обработки данных первый набор изображений документов. Далее осуществляют извлечение множества ключевых областей из каждого изображения документа первого набора изображений документов. Осуществляют вычисление локальных дескрипторов для каждой ключевой области из числа извлеченных ключевых областей. А также производят кластеризацию локальных дескрипторов таким образом, чтобы каждый центр кластера локальных дескрипторов соответствовал соответствующему визуальному слову, и осуществляют построение кодовой книги, содержащей набор визуальных слов. 3 н. и 17 з.п. ф-лы, 12 ил.

Группа изобретений относится к технологиям обработки изображений и более конкретно к системам и способам захвата изображения с помощью мобильного устройства. Техническим результатом является обеспечение автоматического захвата лучшего качества видеокадра видеопотока мобильным устройством с помощью приложения, не требующего установки на мобильное устройство. Предложен реализуемый компьютером способ захвата изображения мобильным устройством. Способ содержит этап, на котором осуществляют прием приложением для видеозахвата, запущенным на мобильном устройстве, видеопотока с камеры мобильного устройства. Далее осуществляют идентификацию конкретного кадра видеопотока. Генерируют множество гипотез, определяющих границы изображения в конкретном кадре. Выбирают обученной нейронной сетью конкретной гипотезы среди множества гипотез. Осуществляют определение значения показателя качества изображения-кандидата. При этом если значение показателя качества выбранного кадра ниже, чем значение показателя качества ранее обработанного изображения, выбранный кадр отбраковывается и идентифицируется новый кадр. Выполняют автоматическую запись кадра с самым высоким показателем качества. 3 н. и 17 з.п. ф-лы, 6 ил.

Изобретение относится к системам распознавания документов. Технический результат заключается в расширении арсенала средств того же назначения. Система и способ для распознавания документов на изображении включают создание суперпиксельной карты сегментации исходного изображения при помощи нейронной сети; генерацию суперпиксельной бинарной маски путем связки каждого суперпикселя из карты сегментации с классом из заданного набора классов; идентификацию одного или более связных компонент в суперпиксельной бинарной маске; идентификацию соответствующего минимального описывающего многоугольника для каждой связной компоненты бинарной маски; создание одной или более линий, разделяющих изображение, основываясь на минимальных описывающих многоугольниках; и определение границ одного или более объектов интереса, основываясь как минимум на подмножестве линий, разделяющих изображение. 3 н. и 17 з.п. ф-лы, 7 ил.

Изобретение относится к механизмам обнаружения объектов в изображениях с использованием нейронных сетей. Технический результат заключается в обеспечении автоматического обнаружения объектов на изображениях. Такой результат достигается тем, что осуществляют получение изображения, представляющего каждый элемент из множества элементов изображения с помощью входного вектора из множества входных векторов, причем каждый из входных векторов содержит один или более параметров, относящихся к визуальному представлению соответствующего элемента изображения; предоставление множества входных векторов в первую подсеть нейронной сети для получения множества выходных векторов, причем каждый выходной вектор из множества выходных векторов связан с элементом изображения; определение на основе множества выходных векторов подмножества элементов изображения, относящихся к изображению объекта, и определение расположения изображения объекта на изображении на основе расположения подмножества элементов. 3 н. и 17 з.п. ф-лы, 10 ил.

Изобретение относится к формированию текстового корпуса, содержащего реалистичные ошибки оптического распознавания символов (OCR), и обучению языковых моделей с использованием текстовых корпусов. Технический результат заключается в повышении качества распознавания изображений. Для этого пример реализации способа включает создание вычислительной системой исходного набора изображений на основе входных содержащих текст текстовых корпусов; наложение вычислительной системой одного или более смоделированных дефектов на изображения исходного множества изображений для создания аугментированного набора изображений; формирование выходного текстового корпуса на основе аугментированного набора изображений и обучение языковой модели с использованием полученного текстового корпуса для оптического распознавания символов. 3 н. и 17 з.п. ф-лы, 8 ил.

Изобретение относится к области вычислительной техники. Технический результат заключается в улучшении контраста и уменьшении шума на изображении. Содержание настоящего описания может быть реализовано за счет применения способа, который включает выявление одного или более блоков в электронном изображении, содержащем символы текста, выявление одного или более текстовых блоков среди блоков, которые содержат символы текста, определение среднего значения контраста текста для каждого из текстовых блоков, выявление типа каждого пикселя в каждом из текстовых блоков, исходя из среднего значения контраста текста, выполнение локально-адаптивной фильтрации в первой окрестности пикселей вокруг каждого пикселя из каждого текстового блока для определения яркости пикселя, исходя из выявленного типа, сохранение, как минимум в одном устройстве хранения данных, электронного изображения, содержащего найденную яркость для каждого пикселя в каждом из текстовых блоков. 3 н. и 17 з.п. ф-лы, 4 ил.

Изобретение относится к вычислительной технике. Технический результат заключается в повышении эффективности обработки изображений. Способ обработки изображений обученными нейронными сетями включает создание вычислительной системой исходного набора изображений, где каждое изображение из исходного набора изображений содержит рендеринг текстовой строки; создание аугментированного набора изображений путем обработки исходного набора изображений для внесения в каждое изображение из исходного набора изображений по меньшей мере одного смоделированного дефекта эмуляции процесса фотосъемки изображения; создание обучающей выборки данных, содержащей множество пар изображений, в которых каждая пара изображений содержит первое изображение, выбранное из исходного набора изображений, и второе изображение, выбранное из аугментированного набора изображений; и обучение, с использованием обучающей выборки данных, сверточной нейронной сети для обработки изображений; и применение одной или более обученной сверточной нейронной сети для обработки одного или более изображений. 3 н. и 17 з.п. ф-лы, 10 ил.

Изобретение относится к области вычислительной техники обработки изображений. Технический результат заключается в повышении точности индикации контуров электронных документов, соответствующих полученным изображениям. Технический результат достигается за счет получения изображения, содержащего один или более документов; детектирования набора линий на изображении; определения множества точек пересечения, соответствующих указанному набору линий; определения одной или более точки схода на основе указанного множества точек пересечения; генерации многоугольника-кандидата на основе указанного набора линий; оценки указанного многоугольника-кандидата на основе ассоциированного с одной или более характеристикой указанной одной или более точки схода одного или более параметра; и индикации указанного многоугольника-кандидата, представляющего контуры одного из одного или более документов. 3 н. и 17 з.п. ф-лы, 31 ил.

Изобретение относится к созданию разметки изображения документа. Технический результат заключается в расширении арсенала средств того же назначения. Пример способа включает выявление ключевых точек в каждом из множества изображений; добавление каждого из множества изображений в один или более кластеров, добавление включает добавление ключевых точек одного или более индексов, связанных с кластерами, где минимальное количество одной или более ключевых точек соответствует ключевым точкам в индексах; анализ каждого из изображений кластера как изображения-кандидата для генерации путем генерации разметки вдоль границ документа, имеющегося на изображении-кандидате; верификация разметки путем сравнения разметки с границами изображенного документа на нескольких других изображениях кластера; и выбор изображения-кандидата в качестве эталонного изображения, если разметка была верифицирована больше заранее определенного количества раз; и обнаружение разметки документа вдоль границ документа, присутствующего на исходном изображении, с помощью эталонного изображения. 3 н. и 18 з.п. ф-лы, 7 ил.

Изобретение относится к реконструкции документа из серии изображений документа. Технический результат – повышение эффективности получения и обработки изображений документов. Способ реконструкции документа включает получение множества кадров изображений, где каждый кадр изображения из множества кадров изображений содержит часть изображения исходного документа, выявление множества присущих изображениям визуальных особенностей на множестве кадров изображения, выполнение пространственного выравнивания множества кадров изображений исходя из совпадений выявленных визуальных особенностей, разделение каждого из множества кадров изображений на множество фрагментов изображения, выявление одного или более фрагментов изображения с изображением текста во множестве фрагментов изображения, связывание каждого выявленного содержащего текст фрагмента изображения с кадром изображения, на котором этот фрагмент изображения имеет оптимальное значение заранее определенного показателя качества из значений показателя качества для этого фрагмента изображения на множестве кадров изображений, и создание реконструированного кадра изображения путем совмещения фрагментов изображения указанных связанных кадров изображений. 3 н. и 20 з.п. ф-лы, 9 ил.

Изобретение относится к области обработки изображений и оптическому распознаванию символов. Технический результат – обеспечение выявления содержащих документ фрагментов на изображении. Система обработки содержащих документы изображений предназначена для: получения изображения, применения к полученному изображению детекторов признаков, причем каждый детектор признаков создает из изображения связанный с детектором набор признаков, для каждой из одной или более моделей типа документа; применения модели типа документа к полученному изображению, причем модель документа содержит набор признаков модели, для создания набора итоговых пар признаков; применения одной или более проверок к набору итоговых пар признаков и в случае установления наличия в изображении фрагмента изображения, содержащего соответствующий модели тип документа, применение преобразования, которое преобразует положения признаков модели в положения на изображении для создания и сохранения положений одной или более точек содержащего документ фрагмента изображения; и создания и сохранения ориентации содержащего документ фрагмента изображения. 3 н. и 17 з.п. ф-лы, 78 ил.

Изобретение относится к средствам анализа цифрового изображения документа в вычислительной системе. Технический результат заключается в расширении арсенала технических средств анализа цифрового изображения документа. Вычислительная система, включающая: электронное устройство пользователя; сервер, к которому электронное устройство пользователя имеет доступ через сеть связи, этот сервер настроен на выполнение на сервере обработки OCR цифрового изображения для создания документа с распознанным текстом. В способе, исполняемом электронным устройством пользователя, выполняют этапы: получение пользовательским электронным устройством цифрового изображения документа; анализ с помощью классификатора, исполняемого электронным устройством пользователя, параметра качества OCR сжатого цифрового изображения, которое было получено из цифрового изображения путем использования алгоритма сжатия и параметра сжатия; для параметра качества OCR выше или равного заданному пороговому значению: передачу сжатого цифрового изображения на сервер для выполнения OCR на сервере. 3 н. и 26 з.п. ф-лы, 8 ил.

Изобретение относится к средствам выпрямления искривлений текстовых строк, содержащих текст цифровых изображений, включая содержащие текст цифровые изображения, полученные из двух страниц разворота книги. Технический результат заключается в уменьшении ошибок при распознании текста. Получают введенное изображение, содержащее текст. Определяют на содержащем текст изображении подызображения страницы. Исправляют вертикальную перспективу подызображения страницы. Создают линии контуров для отображения текстовых строк подызображения страницы. Создают модели искривления текстовых строк для подызображения страницы. Выпрямляют текстовые строки полученного изображения, содержащего текст, с помощью модели искривления текстовых строк. 3 н. и 18 з.п. ф-лы, 72 ил.

Группа изобретений относится к технологиям обработки документов посредством систем оптического распознавания символов (OCR). Техническим результатом является расширение арсенала технических средств для анализа пригодности цифрового изображения для OCR. Предложен способ анализа пригодности цифрового изображения для OCR, выполняемый пользовательским электронным устройством. Способ содержит этап, на котором осуществляют получение пользовательским электронным устройством цифрового изображения документа. Далее согласно способу осуществляют определение с помощью классификатора на электронном устройстве пользователя параметра пригодности цифрового изображения для OCR, представляющего собой признак того, является ли цифровое изображение пригодным для создания результата OCR приемлемого качества. При этом указанный классификатор обучается на основании, по меньшей мере, прогнозируемого параметра зашумленности изображения для определения параметра пригодности документа для OCR и/или индикатора вероятности OCR и проходит валидацию после обучения указанного классификатора. 3 н. и 25 з.п. ф-лы, 5 ил.

Изобретение относится к области определения ориентации страницы. Технический результат – повышение эффективности определения ориентации строк текстового контента на изображении документа. Способ определения ориентации строк текстового контента включает: получение изображения документа устройством обработки; преобразование изображения в бинаризованное изображение путем выполнения в отношении данного изображения операции бинаризации; определение фрагмента бинаризованного изображения, который включает одну или более строк текстового контента; определение множества горизонтальных серий белых пикселей в одной или более строк текстового контента в данном фрагменте бинаризованного изображения и множество вертикальных серий белых пикселей в одной или более строк текстового контента в данном фрагменте бинаризованного изображения; создание первой гистограммы для множества горизонтальных серий белых пикселей и второй гистограммы для множества вертикальных серий белых пикселей; и определение устройством обработки ориентации одной или более строк текстового контента на изображении на основе первой гистограммы и второй гистограммы. 3 н. и 42 з.п. ф-лы, 14 ил.

Изобретение относится к вычислительной технике. Технический результат заключается в возможности исправления перспективных искажений изображения открытого разворота многостраничного документа. Технический результат достигается за счет компонента мобильного устройства, ответственного за исправление искажений, который получает изображение отснятого разворота многостраничного документа, определяет положение линии переплета открытого разворота многостраничного документа, определяет первое множество почти вертикальных или вертикальных прямых линий, лежащих слева от линии переплета, и второе множество почти вертикальных или вертикальных прямых линий, лежащих справа от линии переплета, при этом почти вертикальные или вертикальные линии являются линиями с отклонением в положительную или отрицательную сторону на угол до 45 градусов. Координаты первого четырехугольника определяются на основании первой точки схода, координаты второго четырехугольника - на основании второй точки схода. Исправленное изображение первой страницы строится на основании первого четырехугольника, исправленное изображение второй страницы - на основании второго четырехугольника. 3 н. и 39 з.п. ф-лы, 23 ил.

Группа изобретений относится к технологиям обработки изображений и оптическому распознаванию символов. Техническим результатом является расширение арсенала технических средств систем оптического распознавания текста. Предложена подсистема обработки изображений в составе устройства, прибора или системы, предназначенных для оптического распознавания текста. Подсистема получает содержащее текст с изогнутыми текстовыми строками изображение и вводит полученное содержащее текст изображение в подсистему обработки изображений, которая, в свою очередь, формирует соответствующее исправленное изображение с выпрямленными текстовыми строками с прямоугольной организацией. При этом такая подсистема обработки изображений включает отдельный аппаратный уровень или аппаратный уровень, используемый совместно с устройством, прибором или системой, включающий один или более процессоров, один или более модулей памяти. Подсистема также содержит команды в машинном коде, хранящиеся в одном или более физических устройств хранения данных, которые при их выполнении одним или несколькими из одного или более процессоров управляют работой подсистемы обработки изображений в части следующих операций: получение введенного содержащего текст изображения; определение на содержащем текст изображении подызображения страницы. 3 н. и 19 з.п. ф-лы, 77 ил.

Изобретение относится к области обработки изображений. Технический результат – обеспечение определения на цифровых изображениях криволинейных и прямолинейных контуров. Подсистема обработки изображений включает: отдельный аппаратный уровень или аппаратный уровень, используемый совместно с устройствами, приборами или системами, включающий один или более процессоров и один или более модулей памяти; и команды, хранящиеся в одном или более физических устройствах хранения данных, которые при выполнении одним или более из процессоров управляют подсистемой обработки изображений для: получения цифрового изображения, и применения многочисленных значений параметров, регулирующих определение контуров путем определения затравочных пикселей в пределах цифрового изображения, совпадающих с границами яркости, и для каждого из множества затравочных пикселей построение начального контура, который включает затравочный пиксель, итеративное продление обоих концов начального контура вдоль границы яркости для создания выявленного контура и сохранение выявленного контура в структуре данных в памяти. 3 н. и 20 з.п. ф-лы, 36 ил.

Изобретение относится в обработке изображений. Технический результат заключается в обеспечении возможности определения содержащих документ фрагментов цифрового изображения. Такой результат достигается тем, что определяются контуры на цифровом изображении, выявленные контуры делятся на четыре множества контуров, соответствующих четырем различным сторонам в исходном цифровом изображении, на основе этих контуров строятся гипотезы о краях или границах фрагмента цифрового изображения, содержащего документ, и выполняется оценка гипотез для выбора гипотез с самыми высокими оценками для представления границ фрагмента цифрового изображения, содержащего документ, в исходном полученном цифровом изображении. 3 н. и 19 з.п. ф-лы, 48 ил.

Изобретение относится к технологиям обработки изображений посредством электронных средств. Техническим результатом является устранение ошибок обработки изображений с целью устранения шума при сохранении резких контуров. Предложена система анализа цифрового изображения. Система содержит один или более процессоров, один или более модулей памяти, команды в машинном коде, хранящиеся в одном или более из одного или более электронных запоминающих устройств. Команды машинного кода при выполнении одним или более процессорами управляют системой для получения исходного изображения, осуществления фильтрации исходного изображения, осуществления анализа резкости исходного изображения и определения типа его искажения. Далее создают из полученного исходного изображения производные изображения, представляющие собой серые изображения, или бинаризованные изображения, или контурные изображения, представляющие направленные компоненты оцениваемых градиентов интенсивности. Далее сохраняют производные изображения в одном или более электронных запоминающих устройствах. 3 н. и 18 з.п. ф-лы, 37 ил.

Изобретение относится к области обработки изображений. Техническим результатом является повышение качества исходных фрагментов изображений за счет осуществления фильтрации. Предложен способ обработки изображения документа. Способ включает в себя этап, на котором осуществляют идентификацию при помощи вычислительного устройства, содержащего один или более процессоров, множества изображений фрагментов в пределах изображения документа. Далее согласно способу осуществляют разделение при помощи вычислительного устройства множества изображений фрагментов на множество классов, причем каждый класс из множества классов включает в себя подмножество из множества изображений фрагментов, которые в значительной степени похожи друг на друга, где определение степени похожести одного фрагмента изображения на другой осуществляется на основании заданной меры, определяющей степень сходства между этими фрагментами. 3 н. и 18 з.п. ф-лы, 15 ил.

Изобретение относится к области обработки изображений, а именно к предварительному анализу кадра на дисплее устройства до момента съемки документа и контролю создания изображений с помощью камеры портативного электронного устройства. Техническим результатом является упрощение и автоматизация процесса получения электронными устройствами изображений, содержащих текст, когда документ с заданными настройками обнаружен видоискателем камеры, без необходимости ручной настройки устройства и расположения объекта съемки, сортировки файлов вручную и участия пользователя. Указанный технический результат достигается тем, что осуществляют: выбор кадра в видоискателе из видеопотока для проведения его последующего анализа; выделение в выбранном кадре по меньшей мере одной зоны поиска, обработку выбранного кадра в по меньшей мере одной из зон поиска; определение по меньшей мере одного документа; осуществление проверки на критерий надежности по меньшей мере одного обнаруженного документа; анализ обнаруженного документа на степень искажения с последующим выбором кадра с минимальной степенью искажения обнаруженных документов для дальнейшей обработки; проверку по меньшей мере одного обнаруженного в видоискателе документа на соответствие предварительно заданным геометрическим пропорциям; и автоматическую съемку текущего анализируемого кадра в случае, если геометрические пропорции обнаруженного документа соответствуют предварительно заданным пропорциям. 2 н. и 27 з.п. ф-лы, 11 ил.

Изобретение относится к области обработки изображений, компьютерного зрения и анализа видеоданных. Техническим результатом является улучшение качества распознавания объекта. Способ включает получение серии изображений или последовательности видеокадров объекта; выбор изображения или видеокадра-аккумулятора и выполнение оценки перемещения элементов объекта относительно выбранного изображения или видеокадра-аккумулятора, по крайней мере, для одной полученной серии изображений или последовательности видеокадров; осуществление на основании проведенной оценки перемещения компенсации перемещения и накопление сигнала элементов объекта на основе выбранного изображения или видеокадра-аккумулятора, по крайней мере, для одной серии изображений или видеокадров; создание скомпенсированного изображения объекта высокого разрешения, полученного на основе компенсации и накопления сигнала; и осуществление распознавания объекта в полученном скомпенсированном изображении, обладающем высоким разрешением. 2 н. и 25 з.п. ф-лы, 6 ил.

 


Наверх