Патенты автора Рыбкин Владимир Юрьевич (RU)

Изобретение относится к системам и способам распознавания символов с использованием искусственного интеллекта. Технический результат заключается в повышении эффективности распознавания текста за счет использования набора моделей машинного обучения, позволяющих осуществлять анализ контекста слов текста на изображении с высоким качеством. Такой результат достигается благодаря тому, что способ включает получение изображения текста, при этом текст на изображении содержит одно или более слов в одном или более предложениях; получение изображения текста в качестве первых исходных данных для набора обученных моделей машинного обучения, хранящего информацию о сочетаемости слов и частотности их совместного употребления в реальных предложениях; получение одного или более конечных выходных данных от набора обученных моделей машинного обучения, а также извлечение из одного или более конечных выходных данных одного или более предполагаемых предложений из текста на изображении. Каждое из одного или более предполагаемых предложений содержит вероятные последовательности слов. 4 н. и 17 з.п. ф-лы, 27 ил.

Изобретение относится к средствам выпрямления искривлений текстовых строк, содержащих текст цифровых изображений, включая содержащие текст цифровые изображения, полученные из двух страниц разворота книги. Технический результат заключается в уменьшении ошибок при распознании текста. Получают введенное изображение, содержащее текст. Определяют на содержащем текст изображении подызображения страницы. Исправляют вертикальную перспективу подызображения страницы. Создают линии контуров для отображения текстовых строк подызображения страницы. Создают модели искривления текстовых строк для подызображения страницы. Выпрямляют текстовые строки полученного изображения, содержащего текст, с помощью модели искривления текстовых строк. 3 н. и 18 з.п. ф-лы, 72 ил.

Изобретение относится к области определения ориентации страницы. Технический результат – повышение эффективности определения ориентации строк текстового контента на изображении документа. Способ определения ориентации строк текстового контента включает: получение изображения документа устройством обработки; преобразование изображения в бинаризованное изображение путем выполнения в отношении данного изображения операции бинаризации; определение фрагмента бинаризованного изображения, который включает одну или более строк текстового контента; определение множества горизонтальных серий белых пикселей в одной или более строк текстового контента в данном фрагменте бинаризованного изображения и множество вертикальных серий белых пикселей в одной или более строк текстового контента в данном фрагменте бинаризованного изображения; создание первой гистограммы для множества горизонтальных серий белых пикселей и второй гистограммы для множества вертикальных серий белых пикселей; и определение устройством обработки ориентации одной или более строк текстового контента на изображении на основе первой гистограммы и второй гистограммы. 3 н. и 42 з.п. ф-лы, 14 ил.

Изобретение относится к области обмена данными между клиентским устройством и сервером. Техническим результатом является оптимизированный обмен данными между клиентским устройством и серверным устройством. Клиентское устройство получает исходное изображение физического документа, на основе которого создается уменьшенный файл, который значительно меньше исходного изображения по размеру и содержит данные, указывающие на тип документа. Клиентское устройство отправляет на сервер запрос, включающий уменьшенный файл, на получение информации, относящейся к типу документа для физического документа, получает от сервера сведения о местонахождении, исходя из типа документа, для, по меньшей мере, одной части исходного изображения, которое содержит, по меньшей мере, один элемент содержимого физического документа, и извлекает, по меньшей мере, одну часть исходного изображения, используя информацию о местонахождении, для создания, по меньшей мере, одной извлеченной части изображения. Клиентское устройство отправляет второй запрос, содержащий, по меньшей мере, одну извлеченную часть изображения, на сервер для, по меньшей мере, одного элемента содержимого. При получении, по меньшей мере, одного элемента содержимого с серверного устройства, клиентское устройство предоставляет, по меньшей мере, один элемент содержимого для просмотра. 3 н. и 27 з.п. ф-лы, 8 ил.

Изобретение относится к распознаванию образов из графического изображения, и в частности к распознаванию текста на изображении документа в электронном виде

 


Наверх