Патенты автора Калюжный Алексей Иванович (RU)

Настоящее изобретение относится главным образом к компьютерным системам и, в частности, к системам и способам идентификации систем письма, используемых в документах. Технический результат заключается в повышении эффективности оптического распознавания символов, применяя нейронную сеть к фрагментам изображения, уменьшая каждый фрагмент изображения до размера входного слоя сети, для снижения требований к вычислительным ресурсам. Технический результат достигается за счёт следующего. Способ включает в себя: получение изображения документа; разбиение изображения на фрагменты; генерирование векторов вероятности посредством нейронной сети, содержащих множество числовых элементов, и каждый числовой элемент отражает вероятность фрагмента изображения, содержащего текст, связанный с соответствующей системой письма; вычисление агрегированного вектора вероятности, причем каждый числовой элемент агрегированного вектора вероятности отражает вероятность изображения, содержащего текст, связанный с системой письма; и с учетом определения того, что максимальный числовой элемент агрегированного вектора вероятности превышает определенное пороговое значение, делается вывод, что изображение документа содержит один или несколько символов, связанных с соответствующей системой письма. 3 н. и 17 з.п. ф-лы, 5 ил.

Изобретение относится к области оптического распознавания символов. Технический результат заключается в расширении арсенала средств того же назначения. Способ оптического распознавания последовательности символов, включающий этапы: получение обрабатывающим устройством первого изображения документа с множеством планарных областей, на котором по меньшей мере две планарные области множества планарных областей взаимно не копланарны, выполнение оптического распознавания символов (OCR) первого изображения для определения распознанного текста на первом изображении, получение текста на одном или более вторых изображениях документа, определение множества опорных точек на первом и втором изображениях, определение параметров первого и второго координатных преобразований, определение, используя параметры первого координатного преобразования и параметры второго координатного преобразования, кластера последовательностей символов, содержащего последовательность символов распознанного текста на первом изображении и по меньшей мере одной соответствующей последовательности символов на одном или более вторых изображениях документа и представление результирующего текста оптического распознавания символов (OCR), содержащего медианную последовательность символов для кластера последовательностей символов. 3 н. и 17 з.п. ф-лы, 11 ил.

Изобретение относится к выполнению распознавания серии изображений, содержащих текстовые символы. Технический результат заключается в повышении качества оптического распознавания. Связывают с использованием преобразования координат части текста OCR с первым кластером из множества кластеров символьных последовательностей, где текст OCR получен путем обработки текущего изображения, и где последовательности символов получены путем обработки ранее полученных изображений из серии изображений. Выявляют первую строку-медиану, представляющую первый кластер символьной последовательности, исходя из первого подмножества изображений. Выявляют первое поле шаблона из шаблона документа, соответствующего первому кластеру, исходя из первой строки-медианы, представляющей первый кластер, и разметки текста текущего изображения. Анализируют последовательность символов первого кластера для выявления подходящих последовательностей символов, причем подходящие последовательности символов удовлетворяют первым параметрам первого поля шаблона. Выявляют для первого кластера строки-медианы второго уровня, соответствующие кластеру символьных последовательностей, исходя из множества подходящих символьных последовательностей. Получают с помощью строки-медианы второго уровня итогового текста OCR, представляющего как минимум часть первого поля шаблона исходного документа. 3 н. и 17 з.п. ф-лы, 9 ил.

Изобретение относится к средствам выполнения OCR серии изображений, содержащих текстовые символы. Технический результат заключается в повышении точности геометрии для медианной строки. Выполняют оптическое распознавание серии изображений для создания последовательностей символов и соответствующих четырехугольников последовательностей символов. Определяют медианную строку. Вычисляют преобразования четырехугольников последовательностей символов в общую систему координат. Определяют расстояния между преобразованными четырехугольниками последовательностей символов. Определяют медианный четырехугольник последовательности символов. Отображают, используя медианный четырехугольник последовательности символов, итоговый распознанный текст, представляющий по меньшей мере часть исходного документа. 3 н. и 17 з.п. ф-лы, 15 ил.

Изобретение относится к области оптического распознавания символов, а именно к способам распознавания символов на изображениях из видеопотока. Технический результат заключается в повышении качества распознавания изображений документов за счет объединения нескольких кадров. Способ включает получение одного или более первых изображений с первой камеры, содержащих первый вид физического объекта из первого пространственного положения, при этом физический объект содержит множество символов, получение одного или более вторых изображений со второй камеры, содержащих второй вид физического объекта из второго пространственного положения, при этом первое пространственное положение отличается от второго пространственного положения, выполнение оптического распознавания символов первых изображений для выявления одного или более первых символов из символов, изображенных на физическом объекте, выполнение оптического распознавания символов вторых изображений для выявления одного или более вторых символов из символов, изображенных на физическом объекте, объединение первых символов со вторыми символами путем сопоставления первых символов со вторыми символами и сохранение объединенных символов. 3 н. и 27 з.п. ф-лы, 9 ил.

Группа изобретений относится к технологиям оптического распознавания символов на изображении, содержащем текстовые символы. Техническим результатом является повышение качества оптического распознавания символов (OCR) за счет создания набора изображений и применения к изображению документа различных наборов операций конверсии. Предложен способ улучшения распознавания. Способ содержит этап, на котором осуществляют получение устройством обработки исходного изображения документа. Далее согласно способу осуществляют идентификацию месторасположения первой последовательности символов на исходном изображении, применение первого набора операций конвертации к первой части исходного изображения, включающей местоположение первой последовательности символов, для создания первой конвертированной части исходного изображения. Далее выполняют оптическое распознавание символов (OCR) первой конвертированной части исходного изображения для получения первой распознанной первой последовательности символов. 3 н. и 17 з.п. ф-лы, 5 ил.

Группа изобретений относится к технологиям оптического распознавания символов (OCR). Техническим результатом является исключение необходимости ручного ввода текста с помощью клавиатуры в процессе верификации результатов OCR. Предложен способ автокоррекции результатов оптического распознавания символов. Способ содержит этап, на котором выполняют оптическое распознавание символов на одном или более исходных изображениях документа с целью получения исходных результатов оптического распознавания символов и демонстрации пользователю исходных результатов оптического распознавания символов документа. Далее согласно способу получают от пользователя отклик, содержащей местоположение ошибки в исходных результатах оптического распознавания символов, при этом местоположение ошибки представляет собой положение последовательности неверно распознанных символов в исходных результатах оптического распознавания символов. 3 н. и 16 з.п. ф-лы, 3 ил.

Группа изобретений относится к технологиям оптического распознавания символов (OCR). Техническим результатом является повышение качества извлекаемых данных и обеспечение шумоусточивости. Предложен способ извлечения данных из серии изображений шаблонного документа. Способ содержит этап, на котором осуществляют получение обрабатывающим устройством вычислительной системы текущего изображения из серии изображений копии шаблонного документа, где шаблонный документ имеет по крайней мере один статический элемент и по крайней мере одно информационное поле. Далее, согласно способу, выполняют оптическое распознавание символов (OCR) текущего изображения для получения распознанного текста и соответствующих координат каждого символа распознанного текста. А также, определяют параметры преобразования координат для преобразования координат текущего изображения в координаты шаблона на основании координат опорных точек текущего изображения и шаблона. При этом шаблон содержит текст и координаты как минимум одного статического элемента шаблонного документа и координаты как минимум одного информационного поля шаблонного документа. 6 н. и 21 з.п. ф-лы, 6 ил.

Изобретение относится к технологиям оптического распознавания символов серий изображений с текстовыми символами. Техническим результатом является повышение качества оптического распознавания символов за счет определения порядка кластеров символьных последовательностей посредством определения медианы перестановок кластеров символьных последовательностей. Предложен способ для анализа результатов распознавания серии изображений. Способ содержит этап, на котором получают текущее изображение из серии изображений исходного документа, причем текущее изображение хотя бы частично перекрывает предыдущее изображение из серии изображений. Далее, согласно способу, выполняют оптическое распознавание символов (OCR) текущего изображения для получения распознанного текста и соответствующей ему разметки текста. А также определяют с использованием распознанного текста и соответствующей ему разметки текста множество текстовых артефактов для каждого текущего изображения и предыдущего изображения, причем каждый текстовый артефакт представлен символьной последовательностью, которая обладает частотой встречаемости в распознанном тексте ниже пороговой частоты. 3 н. и 18 з.п. ф-лы, 11 ил.

Изобретение относится к средствам выполнения оптического распознавания символов серий изображений с текстовыми символами. Технический результат заключается в повышении качества оптического распознавания за счет анализа серии изображений. Выполняют оптическое распознавание символов (OCR) текущего изображения для получения распознанного текста и соответствующей ему разметки текста. Определяют для каждого текущего и предыдущего изображений соответствующего множества опорные точки, причем каждая опорная точка ассоциируется с по крайней мере одним текстовым артефактом из множества текстовых артефактов. Вычисляют с использованием координат соответствующие опорные точки текущего и предыдущего изображений параметров преобразования координат предыдущего изображения в координаты текущего изображения. Связывают с помощью преобразования координат как минимум часть распознанного текста с кластером из множества кластеров символьных последовательностей. Определяют для каждого кластера строку-медиану, представляющую кластер символьных последовательностей. Получают с использованием этой строки-медианы итоговый распознанный текст, соответствующий хотя бы части исходного документа. 3 н. и 17 з.п. ф-лы, 12 ил.

 


Наверх