Способ и устройство для извлечения области изображения

Изобретение относится к средствам выделения области изображения. Технический результат заключается в повышении точности выделения символьной зоны из информационной области. Получают позиции первой информационной области на идентификационном изображении. Определяют вторую информационную область в соответствии с позиционированием первой информационной области. Сегментируют вторую информационную область для получения как минимум одной символьной зоны. 3 н. 8 з.п. ф-лы, 23 ил.

 

[001] По настоящей заявке испрашивается приоритет на основании патентной заявки Китая № 201510726272.4, поданной 30 октября 2015 г., все содержание которой включено в настоящий документ посредством ссылки.

Область техники

[002] Настоящее изобретение в общем смысле относится к технической области обработки изображений, а именно к способу и устройству для извлечения области изображения.

Уровень техники

[003] Автоматическая идентификация удостоверения личности – это технология для распознавания символьной (текстовой) информации на удостоверении личности способами обработки изображений.

[004] Имеющийся уровень техники предлагает способ для автоматической идентификации удостоверения личности, способ предполагает сканирование удостоверения личности при фиксированном расположении сканирующего устройства относительно удостоверения для получения сканированного изображения удостоверения личности; распознавание символов в заранее заданных n областях сканированного изображения, включая, как минимум, имя, пол национальность, дату рождения, адрес и номер гражданского удостоверения личности. Однако все еще имеются сложности в идентификации изображения на удостоверении личности, полученного непосредственно в результате фотографирования.

Раскрытие изобретения

[005] Принимая во внимание предшествующий уровень техники, в изобретении дается описание способа и устройства для извлечения областей. Технические решения заключаются в следующем.

[006] Первый аспект настоящего изобретения представляет собой способ извлечения области изображения, включающий: получение позиции первой информационной области на идентификационном изображении; определение второй информационной области в соответствии с позиционированием первой информационной области; сегментирование второй информационной области для получения как минимум одной символьной зоны.

[007] В альтернативном варианте осуществления изобретения, позиция области представлена координатой вершины, что предполагает определение второй информационной области в соответствии с позицией первой информационной области: вторая информационная область определяется на основе как минимум двух вершин первой информационной области и предустановленного относительного соотношения позиций, где под относительным соотношением позиций понимается относительное соотношение позиций между координатами вершин и второй информационной областью.

[008] В альтернативном варианте осуществления изобретения, первой информационной областью является область номера гражданского удостоверения личности на удостоверениях личности (ID) второго поколения, координаты по меньшей мере двух вершин являются координатами двух вершин области номера гражданского удостоверения личности и второй информационной областью является область информации об адресе на удостоверениях личности второго поколения. При этом под определение второй информационной области на основании координата как минимум двух вершин первой информационной области и предустановленного относительного соотношения позиций предполагает: определение нижней границы области информации об адресе на основании вертикальной координаты вершины и координат двух вершин, ближайших к области информации об адресе; определение верхней границы области информации об адресе на основании вертикальной координаты ближайшей вершины и предустановленной высоты; определение левой границы области информации об адресе на основании горизонтальной координаты любой из двух вершин и первой предустановленной ширины; определение правой границы области информации об адресе на основании горизонтальной координаты любой из двух вершин и второй предустановленной ширины и определение области информации об адресе на основании данных о ее нижней границе, верхней границе, левой границе и правой границе

[009] В альтернативном варианте осуществления изобретения сегментирование второй информационной области для получения как минимум одной символьной зоны включает в себя: выполнение бинаризации второй информационной области для получения бинаризированой версии второй информационной области; вычисление первой гистограммы бинаризированной версии второй информационной области в горизонтальном направлении, где первая гистограмма включает: вертикальную координату каждого ряда пикселей и суммарное количество пикселей с цветом переднего плана в каждой строке; распознавание n строк текстовых областей на основании наборов последовательных рядов в первой гистограмме, причем каждый из наборов последовательных рядов составлен из рядов, в которых суммарное количество пикселей с цветом переднего плана больше, чем первое пороговое значение, а n является положительным целым; вычисление второй гистограммы для i-й строки текстовой области в вертикальном направлении, причем вторая гистограмма включает: горизонтальную координату каждого столбца пикселей, где n≥i≥1, и i является положительным целым; и распознавание ni символьных зон в соответствии с наборами последовательных столбцов во второй гистограмме, причем каждый и наборов последовательных столбцов состоит из столбцов, у которых суммарное значение цвета переднего плана превышает второе пороговое значение.

[0010] В альтернативном варианте осуществления изобретения, способ может предполагать также: распознавание расстояние между двумя соседними строками текстовой области на основе наборов последовательных рядов первой гистограммы; исключение строки текстовой области, ближайшей к верхнему или нижнему краю второй информационной области, в случае если расстояние между строками превышает третье пороговое значение.

[0011] В альтернативном варианте осуществления изобретения, способ может предполагать также: распознавание межсимвольного расстояния между двумя соседними символьными зонами на основе наборов последовательных колонок во второй гистограмме; распознавание правой из двух соседних символьных зон в качестве первой символьной зоны в текущей строке текстовой области в случае, если две соседние символьные зоны расположены в левой части второй информационной области и межсимвольное расстояние превышает четвертое пороговое значение; а также распознавание левой из двух символьных зон в качестве последней символьной зоны в текущей текстовой области в случае, если две соседние символьные зоны расположены в правой части второй информационной области и межсимвольное расстояние превышает пятое пороговое значение.

[0012] Второй аспект изобретения представляет устройство для извлечения области изображения, включающее: получающий модуль, предназначенный для получения позиции первой информационной области идентификационного изображения; модуль определения, предназначенный для определения второй информационной области на основании позиции первой информационной области; а также модуль распознавания, предназначенный для сегментирования второй информационной области с целью получить как минимум одну символьную зону.

[0013] В альтернативном варианте осуществления изобретения, позиция области представлена координатой вершины, причем модуль определения предназначен для определения второй информационной области на основании координат как минимум двух вершин первой информационной области и предустановленного относительного соотношения позиций, где под относительным соотношением позиций понимается относительное соотношений позиций между координатами вершин и второй информационной областью.

[0014] В альтернативном варианте осуществления изобретения, первой информационной областью является область номера гражданского удостоверения личности на удостоверениях личности (ID) второго поколения, координаты по меньшей мере двух вершин являются координатами двух вершин области номера гражданского удостоверения личности, и второй информационной областью является область информации об адресе на удостоверениях личности второго поколения. При этом модуль определения включает: первый субмодуль определения, настроенный на определение нижней границы области информации об адресе на основании вертикальной координаты вершины и координат двух вершин, ближайших к области информации об адресе; второй субмодуль определения, настроенный на определение верхней границы области информации об адресе на основании вертикальной координаты ближайшей вершины и предустановленной высоты; третий субмодуль определения, настроенный на определение левой границы области информации об адресе на основании горизонтальной координаты любой из двух вершин и первой предустановленной ширины; четвертый субмодуль определения, настроенный на определение правой границы области информации об адресе на основании горизонтальной координаты любой из двух вершин и второй предустановленной ширины; а также субмодуль сегментации, настроенный на определение области информации об адресе на основании данных о ее нижней границе, верхней границе, левой границе и правой границе.

[0015] В альтернативном варианте осуществления изобретения модуль распознавания предполагает: выполнение бинаризации второй информационной области для получения бинаризированой версии второй информационной области; первый вычислительный субмодуль, настроенный для вычисления первой гистограммы бинаризированной версии второй информационной области в горизонтальном направлении, где первая гистограмма включает: вертикальную координату каждого ряда пикселей и суммарное количество пикселей с цветом переднего плана в каждом ряду; субмодуль распознавания строк, настроенный для распознавания n строк текстовых областей на основании наборов последовательных рядов в первой гистограмме, причем каждый из наборов последовательных рядов составлен из рядов, в которых суммарное количество пикселей с цветом переднего плана превышает первое пороговое значение, а n является положительным целым; второй вычислительный субмодуль, предназначенный для вычисления второй гистограммы для i-й строки текстовой области в вертикальном направлении, причем вторая гистограмма включает: горизонтальную координату каждого столбца пикселей, где n≥i≥1, и i является положительным целым; и распознавание ni символьных зон в соответствии с наборами последовательных столбцов во второй гистограмме, причем каждый и наборов последовательных столбцов состоит из столбцов, у которых суммарное количество пикселей с цветом переднего плана превышает второе пороговое значение.

[0016] В альтернативном варианте осуществления изобретения, устройство может также включать: модуль распознавания рядов, предназначенный для распознавания расстояния между двумя соседними строками текстовой области на основе наборов последовательных рядов первой гистограммы; модуль исключения, предназначенный для исключения из рассмотрения строки текстовой области, ближайшей к верхней или нижней границе второй информационной области, в случае если расстояние между строками превышает третье пороговое значение.

[0017] В альтернативном варианте осуществления изобретения, способ может предполагать также: модуль распознавания межсимвольного расстояния, настроенный для распознавания расстояния между двумя соседними символьными зонами на основе наборов последовательных колонок во второй гистограмме; модуль распознавания текста, настроенный для распознавания правой из двух соседних символьных зон в качестве первой символьной зоны в текущей строке текстовой области в случае, если две соседние символьные зоны расположены в левой части второй информационной области и межсимвольное расстояние превышает четвертое пороговое значение; а также модуль распознавания одиночного символа, настроенный для распознавания левой из двух символьных зон в качестве последней символьной зоны в текущей текстовой области в случае, если две соседние символьные зоны расположены в правой части второй информационной области и межсимвольное расстояние превышает пятое пороговое значение.

[0018] Третий аспект изобретения представляет устройство для извлечения области изображения, включающее: процессор, память для сохранения инструкций, выполняемых процессором; причем процессор настроен для: получения позиции первой информационной области идентификационного изображения; определения позиции второй информационной области на основании позиции первой информационной области и сегментирования второй информационной области с целью получения как минимум одной символьной зоны.

[0019] Технические решения, представленные в осуществлении изобретения, могут включать следующие эффекты:

[0020] Различные варианты осуществления изобретения могут обеспечивать по крайней мере некоторые из следующих положительных эффектов: решаются проблемы, присущие предшествующему уровню техники, связанные с трудностью распознавания информации по изображению удостоверения личности, полученному непосредственно в результате фотографирования, а также связанные с неточным позиционированием первой информационной области на идентификационном изображении; вторая информационная область определяется на основании позиции первой информационной области; вторая информационная область сегментируется до получения по меньшей мере одной символьной зоны. Благодаря определению второй информационной области на основании позиции первой информационной области на идентификационном изображении, а также сегментированию второй информационной области, позиционирование второй информационной области и распознавание символьной зоны в рамках второй информационной области может быть более точным.

[0021] Следует понимать, что как предшествующее общее описание, так и нижеследующее подробное описание являются лишь примерами и не ограничивают настоящее изобретение.

КРАТКОЕ ОПИСАНИЕ ЧЕРТЕЖЕЙ

[0022] Прилагаемые чертежи, являющиеся частью данной спецификации, иллюстрируют варианты осуществления, соответствующие настоящему изобретению, и, вместе с описаниями, служат для объяснения принципов изобретения.

[0023] ФИГ. 1 представляет собой функциональную схему извлечения области изображения в соответствии с примером осуществления изобретения.

[0024] ФИГ. 2A представляет собой функциональную схему, иллюстрирующую способ выделения области изображения в соответствии с иным примером осуществления изобретения.

[0025] ФИГ. 2B представляет собой схему извлечения области изображения в соответствии с иным примером осуществления изобретения.

[0026] ФИГ. 2C представляет собой схематичную диаграмму, иллюстрирующую определение нижней границы области с информацией об адресе в соответствии с примером осуществления изобретения.

[0027] ФИГ. 2D представляет собой схематичную диаграмму, иллюстрирующую определение верхней границы области с информацией об адресе в соответствии с примером осуществления изобретения.

[0028] ФИГ. 2E представляет собой схематичную диаграмму, иллюстрирующую определение левой границы области с информацией об адресе в соответствии с примером осуществления изобретения.

[0029] ФИГ. 2F представляет собой схематичную диаграмму, иллюстрирующую определение правой границы области с информацией об адресе в соответствии с примером осуществления изобретения.

[0030] ФИГ. 2G представляет собой схематичную диаграмму, иллюстрирующую показывает определение области с информацией об адресе в соответствии с примером осуществления изобретения.

[0031] ФИГ. 3A представляет собой функциональную схему, иллюстрирующую способ выделения области изображения в соответствии с иным примером осуществления изобретения.

[0032] ФИГ. 3B представляет собой схематичную диаграмму, иллюстрирующую процесс бинаризации второй информационной области в соответствии с примером осуществления изобретения.

[0033] ФИГ. 3C представляет собой схематичную диаграмму, иллюстрирующую расчет первой гистограммы в горизонтальном направлении в соответствии с примером осуществления изобретения.

[0034] ФИГ. 3D представляет собой схематичную диаграмму, иллюстрирующую набор продолжающихся строк в соответствии с примером осуществления изобретения.

[0035] ФИГ. 3C представляет собой схематичную диаграмму, иллюстрирующую расчет второй гистограммы в вертикальном направлении в соответствии с примером осуществления изобретения.

[0036] ФИГ. 3D представляет собой схематичную диаграмму, иллюстрирующую набор продолжающихся столбцов в соответствии с примером осуществления изобретения.

[0037] ФИГ. 4A представляет собой функциональную схему, иллюстрирующую способ выделения области изображения в соответствии с иным примером осуществления изобретения.

[0038] ФИГ. 4B представляет собой схематичную диаграмму, иллюстрирующую межстрочный интервал между двумя соседними строками текстовой области в соответствии с примером осуществления изобретения.

[0039] ФИГ. 5A представляет собой функциональную схему, иллюстрирующую способ выделения области изображения в соответствии с иным примером осуществления изобретения.

[0040] ФИГ. 5B представляет собой схематичную диаграмму, иллюстрирующую межстрочный интервал между двумя соседними строками текстовой области в соответствии с иным примером осуществления изобретения.

[0041] ФИГ. 6 представляет собой блок-схему, иллюстрирующую устройство для выделения области изображения в соответствии с примером осуществления изобретения.

[0042] ФИГ. 7 представляет собой блок-схему, иллюстрирующую устройство для выделения области изображения в соответствии с иным примером осуществления изобретения.

[0043] ФИГ. 8 представляет собой блок-схему, иллюстрирующую устройство для выделения области изображения в соответствии с иным примером осуществления изобретения.

[0044] ФИГ. 9 представляет собой блок-схему, иллюстрирующую устройство для выделения области изображения в соответствии с иным примером осуществления изобретения.

[0045] ФИГ. 10 представляет собой блок-схему, иллюстрирующую устройство для выделения области изображения в соответствии с иным примером осуществления изобретения.

ПОДРОБНОЕ ОПИСАНИЕ ИЗОБРЕТЕНИЯ

[0046] Далее в подробностях будут рассмотрены примерные варианты осуществления изобретения, иллюстрируемые сопровождающими чертежами, со ссылками на сопровождающие чертежи. Дальнейшее описание относится к сопровождающим чертежам, в которых одинаковые номера на разных чертежах обозначают одинаковые или подобные элементы, если не указано иное. Рассмотренные ниже варианты не ограничивают всех возможных вариантов осуществления, соответствующих данному изобретению. Напротив, они представляют собой лишь примеры устройств и способов, соответствующих аспектам, относящимся к настоящему изобретению согласно прилагаемой формуле изобретения.

[0047] ФИГ. 1 представляет собой функциональную схему извлечения области изображения в соответствии с примером осуществления изобретения. Как показано на фиг. 1, способ извлечения области может включать в себя следующие шаги.

[0048] На шаге 101 высчитывается позиция первой информационной области идентификационного изображения.

[0049] Идентификационное изображение – это изображение, полученное непосредственно в результате фотографирования документа, например, изображение удостоверения личности, изображение карточки социального страхования и т. д.

[0050] Под первой информационной областью понимается область, содержащая текстовую информацию, например, область одного из имен, область даты рождения, область информации о поле, область адреса, область идентификационного номера, область органа, выдавшего документ, срока действия и т.д.

[0051] На шаге 102 на основании позиции первой информационной области определяется вторая информационная область.

[0052] Определение позиции второй информационной области трудней, чем позиционирование первой информационной области.

[0053] На шаге 103 вторая информационная область сегментируется до получения как минимум одной символьной зоны.

[0054] Таким образом, способ извлечения области, представленный вариантом осуществления изобретения, предполагающим получение позиции первой информационной области идентификационного изображения, определение позиции второй информационной области в зависимости от позиции первой области и сегментирование второй информационной области до получения как минимум одной символьной зоны, может решить проблемы, характерные для существующего уровня техники и проявляющиеся в сложности распознавания некоторых областей непосредственно сфотографированного идентификационного изображения и неточности позиционирования отдельных информационных областей. Данный способ обеспечивает определение второй информационной области на основе позиции первой информационной области идентификационного изображения и сегментирование второй информационной области, тем самым точно позиционируя вторую информационную область и распознавая символьную зону во второй информационной области.

[0055] ФИГ. 2A представляет собой функциональную схему, иллюстрирующую способ выделения области изображения в соответствии с иным примером осуществления изобретения. Как показано на фиг. 2A, способ извлечения области может включать в себя следующие шаги.

[0056] На шаге 201 высчитывается позиция первой информационной области на идентификационном изображении, при этом позиция области представлена парой координат вершины.

[0057] Идентификационное изображение – это изображение, полученное непосредственно в результате фотографирования документа, например изображение удостоверения личности, изображение карточки социального страхования и т. д. В других вариантах, при фотографировании документа, в интерфейсе фотографирования используются прямоугольную область наведения. При наведении прямоугольной области на удостоверение личности, пользователь может сфотографировать идентификационное изображение.

[0058] Терминал может принять позицию первой информационной области на идентификационном изображении и получить координаты соответствующих вершин при данной позиции области, в соответствии с позицией первой информационной области. Другими словами, позиция области представлена парой координат вершины.

[0059] Например, приняв в качестве исходной точки верхний левый угол удостоверяющего изображения, верхнюю границу как положительную полуось абсцисс X, левую границу как положительную полуось ординат Y, и, установив, таким образом, систему декартовых координат, можно получить пары координат, относящихся к соответствующим вершинам, а позиция первой информационной области будет также представлена парой координат.

[0060] На шаге 202 на основании как минимум двух вершин первой информационной области и предустановленного относительного соотношения позиций, определяется вторая информационная область, причем под относительным соотношением позиций понимается относительное соотношение координат вершины и второй информационной области.

[0061] Под предустановленным относительным соотношением областей понимается соотношение между координатами вершин первой информационной области и верхней, нижней, левой и правой границами второй информационной области.

[0062] Терминал может определить позицию второй информационной области на основании координат по меньшей мере двух вершин первой информационной области и предустановленного относительного соотношения позиций.

[0063] Альтернативное осуществление предполагает, что первая информационная области включает четыре вершины, при этом здесь не прорабатывается способ выбора конкретных двух вершин из четырех. Альтернативное осуществление предполагает, что чем больше расстояние между двумя вершинами первой информационной области, тем меньше вероятная ошибка при определении второй информационной области.

[0064] На шаге 203 вторая информационная область сегментируется до получения как минимум одной символьной зоны.

[0065] После определения позиции второй информационной области, эта область сегментируется и вычисляется по меньшей мере одна символьная зона. Символьная зона – это зона изображения, содержащая одиночные символы.

[0066] Таким образом, представленный в осуществлении изобретения способ получения позиции первой информационной области, определения на ее основе второй информационной области и ее сегментации до получения как минимум одной символьной зоны может решить проблемы, присущие предшествующему уровню техники, связанные с трудностью распознавания информации по изображению удостоверения личности, полученному непосредственно в результате фотографирования, а также связанные с неточным позиционированием первой информационной области на идентификационном изображении. Благодаря определению второй информационной области на основании позиции первой информационной области на идентификационном изображении, а также сегментированию второй информационной области, позиционирование второй информационной области и распознавание символьной зоны в рамках второй информационной области может быть более точным.

[0067] В альтернативном варианте осуществления, представленном на фиг. 2А, первой информационной областью выступает область номера гражданского удостоверения личности, второй информационной областью является область информации об адресе на удостоверениях личности второго поколения. Вместо шага 202 могут следовать шаги 202а-202е, как показано на фиг. 2B.

[0068] На шаге 202а на основании вертикальной координате вершины, более близкой к области адреса, определяется нижняя граница области адреса.

[0069] Как видно из предустановленного относительного соотношения позиций областей, область информации об адресе находится справа сверху от области номера гражданского удостоверения личности. Таким образом, в соответствии с тем, как используются декартовы координаты, для двух пар координат вершин оказывается, что чем выше вершина, тем меньше вертикальная координата, и при этом более высокая вершина располагается ближе к области информации об адресе. Поэтому горизонтальная линия, которой соответствует вертикальная координата более высокой из двух вершин, служит нижней границей области информации об адресе. Как показано на фиг. 2С, горизонтальная линия, которая соответствует вертикальной координате первой цифры “3” номера гражданского удостоверения личности, выступает нижней границей m1 области информации об адресе.

[0070] На шаге 202b на основании вертикальной координаты ближайшей вершины и предустановленной высоты определяется верхняя граница области адреса.

[0071] Верхняя граница определяется в результате следующих действий: определяется вертикальная координата ближайшей к области адреса вершины, данная вертикальная координата берется в качестве точки отсчета вертикальных координат, производится сдвиг на расстояние, равное предустановленной высоте, и затем горизонтальная линия, проходящая через новое положение вертикальной координаты берется в качестве верхней границы области адреса.

[0072] В альтернативном варианте осуществления предустановленная высота достаточно широка и требует, чтобы область, сдвинутая на расстояние, равное предварительно определенной высоте, закрывала область адреса. Как показано на фиг. 2D, для определения верхней границы, первая цифра “3” номера гражданского удостоверения личности, берется в качестве точки отсчета вертикальных координат, производится движение на высоту h, и горизонтальная линия, соответствующая текущему положению вертикальной координаты, берется в качестве верхней границы m2 области информации об адресе.

[0073] На шаге 202с на основании горизонтальной координаты одной из двух вершин и первой предустановленной ширины определяется левая граница области адреса.

[0074] Левая граница определяется путем выполнения следующих действий: сдвиг влево горизонтальной координаты любой из двух вершин на первую предустановленную ширину, при этом вертикальная линия, на которой в настоящий момент находится горизонтальная координата, берется в качестве ЛЕВОЙ границы области адреса. Как показано на фиг. 2Е, для определения левой границы первая цифра “3” номера гражданского удостоверения личности берется в качестве точки отсчета горизонтальных координат и сдвигается влево на величину r*w, где r – доля в процентах и w – длина области номера гражданского удостоверения личности, после чего вертикальная линия, соответствующая r*m, на которой теперь находится горизонтальная координата, принимается в качестве левой границы m3 области адреса.

[0075] В другом варианте реализации, первая предустановленная ширина отсчитывается от горизонтальной координаты другой вершины. Иными словами, первая предустановленная ширина зависит от того, координаты какой вершины используются.

[0076] В другом варианте осуществления, первая предустановленная ширина является выраженной в процентах долей от длины области номера гражданского удостоверения личности.

[0077] На шаге 202d на основании горизонтальной координаты одной из двух вершин и второй предустановленной ширины определяется правая граница области адреса.

[0078] Правая граница определяется путем выполнения следующих действий: сдвиг горизонтальной координаты любой из двух вершин на вторую предустановленную ширину, при этом вертикальная линия, на которой в настоящий момент находится горизонтальная координата, берется в качестве правой границы области адреса. Как показано на фиг. 2F, для определения правой границы последняя цифра “4” номера гражданского удостоверения личности берется в качестве точки отсчета горизонтальных координат и сдвигается влево на величину d, после чего вертикальная линия, соответствующая r, на которой теперь находится горизонтальная координата, принимается в качестве левой границы m4 области адреса.

[0079] В другом варианте осуществления, вторая предустановленная ширина отсчитывается от горизонтальной координаты другой вершины. Иными словами, первая предустановленная ширина зависит от того, координаты какой вершины используются. Кроме того, при определении правой границы области адреса, горизонтальные координаты некоторых вершин должны быть сдвинуты влево, горизонтальные координаты других вершин должны быть сдвинуты вправо, иными словами, направление сдвига зависит от выбранной вершины, которая определяется описанным выше относительным соотношением позиций.

[0080] В другом варианте осуществления, вторая предустановленная ширина является выраженной в процентах долей от длины области номера гражданского удостоверения личности.

[0081] На шаге 202е, область информации об адресе обрамляется нижней, верхней, правой и левой границами.

[0082] На фиг. 2G показана область адреса, обрамленная нижней, верхней, левой и правой границами, определенными согласно п. 202a-202d.

[0083] Подводя итог, можно сказать, что, определяя верхнюю, нижнюю, левую и правую границы области адреса, в соответствии с координатами вершин в первой информационной области и предустановленным соотношением позиций, способ извлечения области изображения, представленный в осуществлении данного изобретения, может увеличить точность позиционирования при сегментировании по символам во второй информационной области.

[0084] Следует отметить, что получение области номера гражданского удостоверения личности на удостоверениях личности второго поколения, как это показано на фиг. 2B, подробно не описывается, поскольку формат карты гражданского удостоверения достаточно постоянен и соответствующая технология относительно зрелая. В частности, путем извлечения признаков Хаара или других визуальных параметров удостоверения личности второго поколения и последующей обработки полученных данных с помощью алгоритма Adaboost или SVM (Support Vector Machine) получается учебная модель. С помощью учебной модели идентифицируется область номера гражданского удостоверения личности на удостоверениях личности второго поколения, в результате чего определяется позиция этой области.

[0085] В альтернативном варианте осуществления, представленном на фиг. 2А, шаги 203а-203е могут заменять шаг 203, как показано на фиг. 3А.

[0086] На шаге 203а выполняется процесс бинаризации второй информационной области для получения бинаризированной второй информационной области.

[0087] В альтернативном варианте осуществления, берется вторая информационная область, определенная на шаге 202, и выполняется ряд функций предварительной обработки, таких как уменьшение шума, фильтрация, извлечение границ и т. д. Затем на предварительно обработанной второй информационной области проводится процесс бинаризации.

[0088] Под бинаризацией понимаются следующие действия: сравнение значения серого у пикселей во второй информационной области с предустановленным порогом серого; разделение пикселей во второй информационной области на две части: группа пикселей, превышающих предустановленный порог серого и группа пикселей, которые меньше данного порога; преобразование двух групп пикселей в черные и белые и затем получение бинаризированной второй информационной области, как показано на фиг. 3B, текст на фиг. означает: «Дадунван №126, поселение Цзиньсин, город Динчжа, район Цзяшань, провинция Чжецзян» и является фактически изображением после процесса бинаризации, а не китайскими символами в общем смысле. На фиг. 3B цветной пиксель, расположенный на переднем плане, называется пикселем с цветом переднего плана; а цветной пиксель, расположенный на заднем плане, обозначается как пиксель с цветом заднего плана.

[0089] На шаге 302b производится вычисление первой гистограммы для бинаризованной второй информационной области по горизонтальному направлению, причем первая гистограмма включает: вертикальную координату каждого ряда пикселей и суммарное количество пикселей с цветом переднего плана в каждом ряду пикселей.

[0090] Для расчета первой гистограммы для бинаризированной второй информационной области по горизонтальному направлению, по вертикальной оси гистограммы фиксируется вертикальная координата каждого ряда пикселей, а по горизонтальной оси гистограммы отображается количество пикселей с цветом переднего плана в каждом горизонтальном ряду, как это показано на фиг. 3C, текст на фиг. означает: «Дадунван №126, поселение Цзиньсин, город Динчжа, район Цзяшань, провинция Чжецзян» и является фактически изображением после процесса бинаризации, а не китайскими символами в общем смысле.

[0091] На шаге 203с распознаются n рядов в текстовой области в соответствии с суммарным количеством пикселей, имеющих цвет переднего плана выше первого порога, где n - положительное целое.

[0092] Ряды текстовой области определяются путем выполнения следующих действий: получение суммарного количества пикселей с цветом переднего плана в каждом ряду пикселей, согласно первой гистограмме; сравнение суммарного количества пикселей с цветом переднего плана в каждом ряду с первым предустановленным порогом и затем определение наборов последовательных рядов в первой гистограмме как рядов текстовой области, где каждый набор последовательных рядов состоит из рядов, в которых суммарное количество пикселей с цветом переднего плана превышает первый порог.

[0093] Последовательным набором рядов называется набор, состоящий из пикселей в m последовательных рядах, в которых суммарное количество пикселей с цветом переднего плана превышает первый порог. Как показано на фиг. 3D, для m рядов пикселей, суммарное количество пикселей с цветом переднего плана, представленное в правой части гистограммы, превышает первый порог, и текстовая область, содержащая m рядов пикселей на удостоверении личности содержит текст ,означающий “ Дадунван №126”, причем текст на фиг. 3D означает «Дадунван №126, поселение Цзиньсин, город Динчжа, район Цзяшань, провинция Чжецзян» и является фактически изображением после процесса бинаризации, а не китайскими символами в общем смысле.

[0094] Каждый набор последовательных рядов распознается как строка текстовой области, и n наборов последовательных рядов распознаются как n строк текстовой области.

[0095] На шаге 203d производится расчет второй гистограммы по вертикальному направлению для i-й строки текстовой области, причем вторая гистограмма включает: горизонтальную координату каждого столбца пикселей и суммарное количество пикселей с цветом переднего плана в каждом столбце пикселей, причем n≥i≥1 и i - это положительное целое число.

[0096] После определения n строк текстовой области, рассчитывается вторая гистограмма для i-й строки текстовой области в вертикальном направлении, причем горизонтальная координата каждого столбца пикселей фиксируется на горизонтальной оси второй гистограммы, а суммарное количество пикселей с цветом переднего плана в каждом столбце пикселей отображается по вертикальной оси второй гистограммы, как показано на фиг. 3E, текст на фиг. означает «Дадунван №126, поселение Цзиньсин, город Динчжа, район Цзяшань, провинция Чжецзян» и является фактически изображением после процесса бинаризации, а не китайскими символами в общем смысле.

[0097] На шаге 203е распознаются ni символьных зон в соответствии с наборами последовательных столбцов во второй гистограмме, каждый из наборов состоит из столбцов, в которых суммарное количество пикселей с цветом переднего плана больше второго порогового значения.

[0098] Столбцы символьной зоны определяются путем выполнения следующих действий: получение суммарного количества пикселей с цветом переднего плана в каждом столбце пикселей, согласно второй гистограмме; сравнение суммарного количества пикселей с цветом переднего плана в каждом столбце со вторым предустановленным порогом и затем определение наборов последовательных столбцов на второй гистограмме как столбцов символьных зон, где каждый набор последовательных столбцов состоит из столбцов, в которых суммарное количество пикселей с цветом переднего плана превышает второй порог.

[0099] Последовательным набором столбцов называется набор, состоящий из пикселей в p последовательных столбцах, в которых суммарное количество пикселей с цветом переднего плана превышает второй порог. Как показано на фиг. 3F, текст на котором означает «Дадунван №126, поселение Цзиньсин, город Динчжа, район Цзяшань, провинция Чжецзян» и является фактически изображением после процесса бинаризации, а не китайскими символами в общем смысле, для p столбцов пикселей суммарное число пикселей с цветом переднего плана, указанное в нижней части гистограммы, превышает второе пороговое значение, а символьная зона, соответствующая p столбцам пикселей на изображении удостоверения личности, относится к символу , т.е. «Чже».

[00100] Каждый набор последовательных столбцов распознается как столбец символьной зоны, при этом n наборов последовательных столбцов распознаются как p столбцов символьной зоны.

[00101] Таким образом, способ извлечения области изображения, представленный в осуществлении изобретения, может включать: выполнение бинаризации второй информационной области, расчет первой гистограммы для второй информационной области по горизонтальному направлению для распознавания n строк текстовой области; расчет второй гистограммы дает n рядов текстовой области в вертикальном направлении, что позволяет определить символьные зоны, соответствующие каждому символу; определение сначала строк текстовой области, а затем символьных зон в каждой строке для более точного позиционирования символов во второй информационной области.

[00102] Согласно варианту осуществления, представленному на фиг. 3А, в ходе процесса определения второй информационной области на основании позиции первой информационной области и относительного соотношения позиций, могут возникать ошибки, связанные с дроблением текста или с неинформативным шумом в рамках второй информационной области. В этой связи, в рамках следующего осуществления, текст или шум, не относящиеся ко второй информационной области могут быть исключены из рассмотрения на основании межстрочного расстояния.

[00103] Согласно альтернативному варианту осуществления, представленному на фиг.3А, после шага 203 могут быть предприняты следующие шаги, как показано на фиг. 4А.

[00104] На шаге 401 определяется расстояние между двумя соседними строками в соответствии с наборами последовательных рядов в первой гистограмме, где каждый набор последовательных рядов состоит из рядов, в которых суммарное количество пикселей с цветом переднего плана превышает первое пороговое значение.

[00105] Следует отметить, что область информации об адресе обычно содержит от 1 до 3 областей текста, отделенных друг от друга сравнительно небольшим расстоянием. В то же время эти строки отделены от других текстовых областей сравнительно большим расстоянием. Текстовые области, не относящиеся ко второй информационной области, исключаются на этом шаге из рассмотрения на основании величины межстрочного интервала.

[00106] Для n строк текстовой области, распознанных на шаге 203с, вычисляется значение межстрочного интервала между двумя соседними строками. Под межстрочным интервалом понимается расстояние между двумя строками текстовой области на первой гистограмме. На фиг. 4B межстрочный интервал между двумя строками текстовой области обозначен как h1, при этом текст означает «Дадунван №126, поселение Цзиньсин, город Динчжа, район Цзяшань, провинция Чжецзян» и является фактически изображением после процесса бинаризации, а не китайскими символами в общем смысле.

[00107] На шаге 402, в случае, если межстрочный интервал превышает третье пороговое значение, строка текстовой области, ближайшая к верхней или нижней границе второй информационной области, исключается из рассмотрения.

[00108] На основании первой гистограммы проводится анализ текстовой области снизу вверх, при обнаружении межстрочного интервала, превышающего третье пороговое значение, нижняя строка текстовой области исключается из рассмотрения. После этого поиск продолжается по направлению вверх, при обнаружении межстрочного интервала, превышающего третье пороговое значение, поиск прекращается, верхняя строчка текстовой области исключается из рассмотрения, а оставшиеся текстовые области считаются относящимися ко второй текстовой области.

[00109] При первом обнаружении межстрочного интервала меньше третьего порогового значения, две строчки текстовой области считаются относящимися ко второй информационной области. Затем поиск продолжается по направлению вверх до обнаружения межстрочного интервала превышающего третье пороговое значение, после этого верхняя строчка исключается из рассмотрения, поиск прекращается. В альтернативном варианте осуществления, поиск продолжается по направлению вверх до момента, пока не остается межстрочного интервала, превышающего третье пороговое значение, после этого поиск прекращается.

[00110] В альтернативном варианте осуществления, поиск проводится в направлении сверху вниз, на основании данных первой гистограммы, при первом нахождении межстрочного интервала, превышающего третье пороговое значение, верхняя строчка исключается из рассмотрения. После этого поиск продолжается по направлению вниз, при обнаружении еще одного межстрочного интервала, превышающего третье пороговое значение, поиск прекращается, нижняя строчка текстовой области исключается из рассмотрения, а оставшиеся текстовые области считаются относящимися ко второй текстовой области.

[00111] При первом обнаружении межстрочного интервала меньше третьего порогового значения, две строчки текстовой области считаются относящимися ко второй информационной области. Затем поиск продолжается по направлению вниз до обнаружения межстрочного интервала превышающего третье пороговое значение, после этого верхняя строчка исключается из рассмотрения, поиск прекращается. В альтернативном варианте осуществления, поиск продолжается по направлению вниз до момента, пока не остается межстрочного интервала, превышающего третье пороговое значение, после этого поиск прекращается.

[00112] Таким образом, способ извлечения области изображения, представленный в осуществлении изобретения, может включать: распознавание межстрочного интервала между двумя соседними строками текстовой области исходя из анализа наборов последовательных пиксельных рядов во второй гистограмме, где каждый из наборов последовательных рядов состоит рядов, в которых суммарное количество пикселей с цветом переднего плана превышает первое пороговое значение; исключение строк, близких к верхней или нижней границе второй информационной области в случае, если межстрочное расстояние превышает третье пороговое значение; определение текстовых областей внутри второй информационной области на основании модуля межстрочного интервала, что позволяет обеспечить более точное позиционирование второй информационной области.

[00113] Согласно варианту осуществления, представленному на фиг. 3А, в ходе процесса определения правой и левой границ второй информационной области, могут возникать ошибки, связанные с появлением фрагментов символьных зон, не относящихся ко второй информационной области. В этой связи, в рамках следующего осуществления, символьные зоны, не относящиеся ко второй информационной области, могут быть исключены из рассмотрения на основании значения межстрочного интервала.

[00114] Согласно альтернативному варианту осуществления, представленному на фиг. 4А, после шага 203е могут быть предприняты следующие шаги, как показано на фиг. 5А.

[00115] На шаге 501 распознается расстояние между символами в соседних столбцах текстовой области в соответствии с наборами последовательных столбцов во второй гистограмме, каждый из наборов состоит из столбцов, в которых суммарное количество пикселей с цветом переднего плана больше второго порогового значения.

[00116] Для ni символьных зон, распознанных на шаге 203е, вычисляется расстояние между соседними столбцами. Расстояние между двумя соседними столбцами в каждой строке текстовой области относительно невелико.

[00117] Под межсимвольным расстоянием понимается расстояние между двумя символьными зонами на второй гистограмме. На фиг. 5B межсимвольное расстояние обозначается как h2, текст означает «Дадунван №126, поселение Цзиньсин, город Динчжа, район Цзяшань, провинция Чжецзян» и является фактически изображением после процесса бинаризации, а не китайскими символами в общем смысле.

[00118] На шаге 502, если две соседние символьные зоны расположены в левой части второй информационной области, и межсимвольное расстояние превышает четвертое пороговое значение, то правая из двух соседних символьных зон рассматривается как зона первого символа в текущей строке текстовой области.

[00119] Символ в середине текущей текстовой строки берется в качестве начальной позиции. Начинается поиск от стартовой позиции по направлению налево, при первом нахождении межсимвольного расстояния, превышающего четвертое пороговое значение, все символьные зоны слева от межсимвольного расстояния исключаются из рассмотрения, а символьная зона справа берется в качестве зоны первого символа текущей строки текстовой области. После определения зоны первого символа, начинается поиск от его позиции по направлению вправо до нахождения межсимвольного расстояния, превышающего четвертое пороговое значение, после этого поиск прекращается.

[00120] При первом нахождении межсимвольного расстояния меньшего, чем четвертое пороговое значение, две соседние символьные зоны воспринимаются как относящиеся к текущей строке текстовой области.

[00121] На шаге 503, если две соседние символьные зоны расположены в правой части второй информационной области, и межсимвольное расстояние превышает четвертое пороговое значение, то левая из двух соседних символьных зон рассматривается как зона последнего символа в текущей строке текстовой области.

[00122] Символ в середине текущей текстовой строки берется в качестве начальной позиции. Начинается поиск от стартовой позиции по направлению направо, при первом нахождении межсимвольного расстояния, превышающего четвертое пороговое значение, все символьные зоны справа от межсимвольного расстояния исключаются из рассмотрения, а символьная зона справа берется в качестве зоны последнего символа текущей строки текстовой области. После определения зоны последнего символа, начинается поиск от его позиции по направлению влево до нахождения межсимвольного расстояния, превышающего четвертое пороговое значение, после этого поиск прекращается.

[00123] При первом нахождении межсимвольного расстояния меньшего, чем четвертое пороговое значение, две соседние символьные зоны воспринимаются как относящиеся к текущей строке текстовой области.

[00124] Таким образом, способ извлечения области изображения, представленный вариантом осуществления изобретения, способ может включать: распознавание межсимвольного расстояния между двумя соседними символьными зонами на основе наборов последовательных колонок во второй гистограмме; распознавание правой из двух соседних символьных зон в качестве первой символьной зоны в текущей строке текстовой области в случае, если две соседние символьные зоны расположены в левой части второй информационной области и межсимвольное расстояние превышает четвертое пороговое значение; а также распознавание левой из двух символьных зон в качестве последней символьной зоны в текущей текстовой области в случае, если две соседние символьные зоны расположены в правой части второй информационной области и межсимвольное расстояние превышает пятое пороговое значение; определение символьных зон во второй информационной области на основании величины межсимвольного расстояния, что позволяет обеспечить более точное позиционирование каждой символьной зоны во второй информационной области.

[00125] Следует указать, что согласно варианту осуществления, представленному на фиг. 1, варианту осуществления, представленному на фиг. 2А, варианту осуществления, представленному на фиг. 2B, варианту осуществления, представленному на фиг. 3А, варианту осуществления, представленному на фиг. 4А, и варианту осуществления, представленному на фиг. 5А, после распознавания символьных зон, собственно символы в символьных зонах могут быть распознаны в ходе последующей обработки на основании существующих алгоритмов распознавания символов.

[00126] Следует также упомянуть, что изображение удостоверения личности, приведенное в упомянутых выше вариантах осуществления, представляет собой лишь иллюстрацию для примера и не является изображением подлинного удостоверения личности.

[00127] Ниже показаны варианты исполнения устройства, предназначенного для осуществления способа в соответствии с настоящим изобретением. Для получения более подробной информации о подробностях, не указанных в вариантах осуществления устройства, см. варианты осуществления способа в соответствии с настоящим изобретением.

[00128] Фиг. 6 представляет собой блок-схему, иллюстрирующую устройство для извлечения области изображения в соответствии с примерным вариантом осуществления изобретения. Как показано на фиг. 6, устройство для извлечения области изображения включает следующие элементы, не ограничиваясь ими:

[00129] Модуль получения 610 предназначен для получения позиции первой информационной области идентификационного изображения.

[00130] Идентификационное изображение - это изображение, полученное непосредственно в результате фотографирования документа, такое как изображение удостоверения личности, карточки социального страхования и т. д.

[00131] Под первой информационной областью понимается область, содержащая текстовую информацию, например, область одного из имен, область даты рождения, область информации о поле, область адреса, область идентификационного номера, область органа, выдавшего документ, срока действия и т.д.

[00132] Модуль определения 620 предназначен для определения второй информационной области на основании позиции первой информационной области.

[00133] Модуль распознавания предназначен для сегментирования второй информационной области до получения как минимум одной символьной зоны.

[00134] Таким образом, способ извлечения области, представленный вариантом осуществления изобретения, предполагает получение позиции первой информационной области идентификационного изображения, определение позиции второй информационной области в зависимости от позиции первой области и сегментирование второй информационной области до получения как минимум одной символьной зоны. Способ может решить проблемы, характерные для существующего уровня техники и проявляющиеся в сложности распознавания некоторых областей непосредственно сфотографированного идентификационного изображения и неточности позиционирования отдельных информационных областей. Более точное позиционирование информационной области достигается путем определения второй информационной области на основе позиции первой информационной области и последующего сегментирования второй информационной области.

[00135] Фиг. 7 представляет собой блок-схему, иллюстрирующую устройство для извлечения области изображения в соответствии с альтернативным вариантом осуществления изобретения. Как показано на фиг. 7, устройство для извлечения области изображения включает следующие элементы, не ограничиваясь ими:

[00136] Модуль получения 610 предназначен для получения позиции первой информационной области идентификационного изображения.

[00137] Идентификационное изображение - это изображение, полученное непосредственно в результате фотографирования документа, такое как изображение удостоверения личности, карточки социального страхования и т. д.

[00138] При получении позиции первой информационной области, модуль получения 610 получает координаты соответствующих вершин первой информационной области на основании данных о позиции первой информационной области. Другими словами, позиция области представлена парами координат вершин.

[00139] Например, приняв в качестве исходной точки верхний левый угол идентификационного изображения, верхнюю границу как положительную полуось абсцисс X, левую границу как положительную полуось ординат Y, и установив, таким образом, систему декартовых координат, можно получить пары координат, относящихся к соответствующим вершинам, а позиция первой информационной области будет также представлена парами координат.

[00140] Модуль определения 620 предназначен для определения второй информационной области на основании позиции первой информационной области.

[00141] Модуль распознавания 620 предназначен также для определения второй информационной области в соответствии как минимум с двумя парами координат вершин первой информационной области и предустановленным относительным соотношением, причем под предустановленным соотношением позиций понимается относительное соотношение позиций между парами координат вершин и второй информационной областью.

[00142] Под предустановленным относительным соотношением областей понимается соотношение между координатами вершин первой информационной области и верхней, нижней, левой и правой границами второй информационной области.

[00143] Модуль определения 620 может определить позицию второй информационной области на основании координат по меньшей мере двух вершин первой информационной области и предустановленного относительного соотношения позиций.

[00144] В данном варианте осуществления изобретения выделительный модуль 620 может также включать следующие подмодули:

[00145] Первый субмодуль определения 621 предназначен для определения нижней границы области адреса на основании вертикальной координаты вершины, более близкой к области адреса.

[00146] Как видно из предустановленного относительного соотношения позиций областей, область информации об адресе находится справа сверху от области номера гражданского удостоверения личности. Таким образом, в соответствии с тем, как используются декартовы координаты, для двух пар координат вершин оказывается, что чем выше вершина, тем меньше вертикальная координата, и при этом более высокая вершина располагается ближе к области информации об адресе. Таким образом, первый субмодуль определения 621 принимает горизонтальную линию, которой соответствует вертикальная координата более высокой из двух вершин, в качестве нижней границы области адреса.

[00147] Второй субмодуль определения 622 предназначен для определения верхней границы области адреса на основании вертикальной координаты ближайшей вершины и предустановленной высоты.

[00148] После определения вертикальной координаты, ближайшей к области адреса вершины, первым субмодулем определения 621, второй субмодуль определения 622 принимает вертикальную координату в качестве точки отсчета по вертикальной оси, сдвигает положение вертикальной координаты на величину предустановленной высоты и затем принимает горизонтальную линию, проходящую через новое положение вертикальной координаты в качестве верхней границы области адреса.

[00149] Третий субмодуль определения 623 предназначен для определения левой границы области адреса на основе горизонтальной координаты одной из двух вершин и первой предустановленной ширины.

[00150] Третий субмодуль определения 623 сдвигает влево горизонтальную координату любой из двух вершин на величину, равную первой предустановленной ширине, и принимает вертикальную линию, на которой в настоящий момент находится горизонтальная координата, в качестве левой границы области адреса.

[00151] Четвертый субмодуль определения 625 предназначен для определения правой границы области адреса на основе горизонтальной координаты одной из двух вершин и первой предустановленной ширины.

[00152] Четвертый субмодуль определения 624 сдвигает влево горизонтальную координату любой из двух вершин на величину, равную второй предустановленной ширине, и принимает вертикальную линию, на которой в настоящий момент находится горизонтальная координата, в качестве правой границы области адреса.

[00153] Субмодуль сегментации 625 предназначен для определения области адреса на основании нижней, верхней, правой и левой границ.

[00154] Субмодуль сегментации 625 сегментирует область адреса на основе верхней, нижней, левой и правой границ области адреса, определенных в ходе работы субмодулей определения от 621 до 624.

[00155] Модуль распознавания 630 предназначен для сегментирования второй информационной области до получения как минимум одной символьной зоны.

[00156] После определения позиции второй информационной области путем сегментации с помощью субмодуля 625, модуль распознавания 630 может провести сегментацию второй информационной области. После сегментации, вторая информационная область включает как минимум одну символьную зону, причем каждая символьная зона включает один символ.

[00157] В рамках альтернативного варианта осуществления, представленного на фиг. 7, модуль распознавания 630 может включать следующие подмодули, как показано на фиг. 8.

[00158] Подмодуль бинаризации 631 предназначен для выполнения процесса бинаризации второй информационной области для получения бинаризованной второй информационной области.

[00159] В альтернативном варианте осуществления, берется вторая информационная область, определенная модулем распознавания 630, и выполняется ряд функций предварительной обработки, таких как уменьшение шума, фильтрация, извлечение границ и т. д. Затем на предварительно обработанной второй информационной области проводится процесс бинаризации.

[00160] Под бинаризацией понимаются следующие действия: сравнение значения серого у пикселей во второй информационной области с предустановленным порогом серого; разделение пикселей во второй информационной области на две части: группа пикселей, превышающих предустановленный порог серого и группа пикселей, которые меньше данного порога; преобразование двух групп пикселей в черные и белые и затем получение бинаризированной второй информационной области.

[00161] Первый расчетный субмодуль 632 предназначен для расчета первой гистограммы для бинаризованной второй информационной области по горизонтальному направлению, причем первая гистограмма включает: вертикальную координату каждого ряда пикселей и суммарное количество пикселей с цветом переднего плана в каждом ряду пикселей.

[00162] Первый расчетный субмодуль 632 производит расчет первой гистограммы для бинаризированной второй информационной области, полученной от субмодуля бинаризации 631, по горизонтальному направлению, при этом по вертикальной оси гистограммы фиксируется вертикальная координата каждого ряда пикселей, а по горизонтальной оси гистограммы отображается количество пикселей с цветом переднего плана в каждом горизонтальном ряду.

[00163] Субмодуль распознавания строк 633 предназначен для распознавания n строк текстовой области в соответствии с наборами последовательных рядов первой гистограммы, где каждый набор последовательных рядов состоит из рядов пикселей, у которых суммарное количество пикселей с цветом переднего плана превышает первое пороговое значение, а n является целым числом.

[00164] Суммарное количество пикселей с цветом переднего плана в каждом ряду берется в соответствии с данными первой гистограммы. Субмодуль распознавания строк 633 сравнивает суммарное количество пикселей с цветом переднего плана в каждом ряду с первым предустановленным порогом и затем определяет наборы последовательных рядов на первой гистограмме как текстовые строки, при этом каждый набор последовательных рядов состоит из рядов пикселей, у которых суммарное количество пикселей с цветом переднего плана превышает первое пороговое значение.

[00165] Последовательным набором рядов называется набор, состоящий из пикселей в m последовательных рядах, в которых суммарное количество пикселей с цветом переднего плана превышает первый порог.

[00166] Каждый набор последовательных рядов распознается как строка текстовой области, и n наборов последовательных рядов распознаются как n строк текстовой области.

[00167] Второй расчетный субмодуль 634 предназначен для расчета второй гистограммы для i-й строки текстовой области в вертикальном направлении, причем вторая гистограмма включает: горизонтальную координату каждого столбца пикселей и суммарное количество пикселей с цветом переднего плана в каждом столбце пикселей, причем n≥i≥1 и i является положительным целым числом.

[00168] После определения n строк текстовой области субмодулем определения строк 633, второй расчетный субмодуль 634 рассчитывает вторую гистограмму в вертикальном направлении, причем горизонтальная координата каждого столбца пикселей фиксируется на горизонтальной оси второй гистограммы, а суммарное количество пикселей с цветом переднего плана в каждом столбце пикселей отображается по вертикальной оси второй гистограммы.

[00169] Субмодуль распознавания символов 635 предназначен для распознавания ni символьных зон в соответствии с наборами последовательных столбцов во второй гистограмме, каждый из наборов состоит из столбцов, в которых суммарное количество пикселей с цветом переднего плана больше второго порогового значения.

[00170] Суммарное количество пикселей с цветом переднего плана в каждом столбце берется в соответствии с данными второй гистограммы. Субмодуль распознавания символов 635 сравнивает суммарное количество пикселей с цветом переднего плана в каждом ряду со вторым предустановленным порогом и затем определяет наборы последовательных рядов на первой гистограмме как столбцы символьных зон, при этом каждый набор последовательных столбцов состоит из столбцов пикселей, у которых суммарное количество пикселей с цветом переднего плана превышает второе пороговое значение.

[00171] Последовательным набором столбцов называется набор, состоящий из пикселей в p последовательных столбцах, в которых суммарное количество пикселей с цветом переднего плана превышает второй порог.

[00172] Каждый набор последовательных столбцов распознается как столбец символьной зоны, при этом n наборов последовательных столбцов распознаются как p столбцов символьной зоны.

[00173] Таким образом, устройство для извлечения информации об области изображения, представленное вариантом осуществления, может быть настроено для: выполнения бинаризации второй информационной области, расчет первой гистограммы бинаризованной второй информационно области по горизонтальному направлению для распознавания n строк текстовой области внутри второй информационной области. Определение позиции символьной зоны внутри второй информационной зоны может быть более точным благодаря расчету второй гистограммы для n строк текстовой области в вертикальном направлении для определения символьной зоны, соответствующей каждому символу, а также благодаря определению сначала строк текстовой области, а затем символьных зон в каждой строке.

[00174] В рамках альтернативного варианта осуществления, представленного на фиг. 8, устройство для извлечения областей изображения может включать следующие модули, как показано на фиг. 9:

[00175] Модуль распознавания межстрочного интервала 910 предназначен для распознавания интервала между двумя соседними строками текстовой области на основе наборов последовательных рядов пикселей в первой гистограмме.

[00176] Для n строк текстовой области, распознанных субмодулем распознавания строк 633, модуль распознавания межстрочного интервала 910 получает расстояние между двумя соседними строками. Под межстрочным интервалом понимается расстояние между двумя строками текстовой области на первой гистограмме.

[00177] Исключающий модуль 920 предназначен для исключения из рассмотрения строк текстовой области, ближних к верхней или нижней границе второй информационной области, в случае, если межстрочный интервал превышает третье пороговое значение.

[00178] На основании первой гистограммы проводится анализ текстовой области снизу вверх, при обнаружении межстрочного интервала превышающего третье пороговое значение, исключающий модуль 920 исключает из рассмотрения нижнюю строку текстовой области. После этого поиск продолжается по направлению вверх, при обнаружении межстрочного интервала, превышающего третье пороговое значение, поиск прекращается, и исключающий модуль 920 исключает из рассмотрения верхнюю строчку, а оставшиеся текстовые области считаются относящимися ко второй текстовой области.

[00179] Модуль распознавания межсимвольного расстояния 930 предназначен для распознавания расстояния между двумя соседними символьными зонами текстовой области на основе наборов последовательных столбцов пикселей во второй гистограмме.

[00180] Работая с ni символьными зонами, распознанных субмодулем распознавания символов 635, модуль распознавания межсимвольного расстояния 930 получает значение расстояния между двумя соседними символами. Расстояние между двумя соседними столбцами в каждой строке текстовой области относительно невелико.

[00181] Под межсимвольным расстоянием понимается расстояние между двумя символьными зонами на второй гистограмме.

[00182] Модуль распознавания текста 940 предназначен для распознавания правой из двух расположенных рядом символьных зон в качестве первой символьной зоны в текущей строке текстовой области, в случае, если две соседние символьные зоны расположены в левой части второй информационной области, и межсимвольное расстояние превышает четвертое пороговое значение.

[00183] Модуль распознавания отдельного символа 950 предназначен для распознавания левой из двух расположенных рядом символьных зон в качестве последней символьной зоны в текущей строке текстовой области, в случае, если две соседние символьные зоны расположены в правой части второй информационной области, и межсимвольное расстояние превышает пятое пороговое значение.

[00184] Таким образом, устройство для извлечения области изображения, представленное вариантом осуществления, может быть настроено для распознавания межсимвольного расстояния между двумя соседними символьными зонами на основе наборов последовательных колонок во второй гистограмме; распознавание правой из двух соседних символьных зон в качестве первой символьной зоны в текущей строке текстовой области в случае, если две соседние символьные зоны расположены в левой части второй информационной области и межсимвольное расстояние превышает четвертое пороговое значение; а также распознавание левой из двух символьных зон в качестве последней символьной зоны в текущей текстовой области в случае, если две соседние символьные зоны расположены в правой части второй информационной области и межсимвольное расстояние превышает пятое пороговое значение; определение символьных зон во второй информационной области на основании величины межсимвольного расстояния, что позволяет обеспечить более точное позиционирование каждой символьной зоны во второй информационной области.

[00185] В отношении устройства, описанного в вышеуказанных вариантах осуществления изобретения, конкретные способы, при помощи которых соответствующие модули выполняют свои операции, были подробно описаны в рамках соответствующих способов, поэтому нет необходимости разбирать их здесь.

[00186] В примерном варианте осуществления изобретения представлено устройство для извлечения области изображения, включающее: процессор, память для сохранения инструкций, выполняемых процессором; причем процессор настроен для: получения позиции первой информационной области идентификационного изображения; определения позиции второй информационной области на основании позиции первой информационной области и сегментирования второй информационной области с целью получения как минимум одной символьной зоны.

[00187] Фиг. 10 представляет собой блок-схему, иллюстрирующую устройство 1000 для извлечения области изображения соответствии с примерным вариантом осуществления изобретения. Например, устройством 000 может быть мобильный телефон, компьютер, цифровой передающий терминал, устройство рассылки сообщений, игровая консоль, планшетный компьютер, медицинское устройство, тренировочное оборудование, карманный персональный компьютер и т. д.

[00188] Согласно фиг. 10 устройство 1000 может включать в себя один или более следующих компонентов: компонент обработки данных 1002, память 1004, питающий компонент 1006, мультимедийный компонент 1008, аудиокомпонент 1010, интерфейс ввода-вывода 1012, сенсорный компонент 1014 и коммуникационный компонент 1016.

[00189] Компонент обработки данных 1002, как правило, управляет всеми операциями, выполняемыми устройством 1000, например, операциями, связанными с отображением, телефонными вызовами, передачей данных, функционированием камеры, операциями записи. компонент обработки данных 1002 может включать один или несколько процессоров 1018 для выполнения команд, соответствующих всем или части шагов в описанных выше способах. Помимо этого, компонент обработки данных 1002 может включать один или более модулей, обеспечивающих взаимодействие между компонентом обработки данных 1002 и прочими компонентами Например, компонент обработки данных1002 может включать мультимедийный модуль для облегчения взаимодействия между мультимедийным компонентом 1008 и компонентом обработки данных 1002.

[00190] Память 1004 выполнена с возможностью хранения различных типов данных для поддержки операций устройства 1000. Примеры таких типов данных могут включать в себя инструкции для каких-либо приложений или способов, используемых на устройстве 1000, контактные данные, данные телефонной книги, сообщения, изображения, видео и т. д. Память 1004 может быть выполнена с возможностью использования любого типа энергозависимых или энергонезависимых устройств или их сочетания, например, статического запоминающего устройства с произвольной выборкой СЗУПВ (SRAM), электрически стираемого программируемого постоянного запоминающего устройства ЭСППЗУ (EEPROM), стираемого программируемого постоянного запоминающего устройства СППЗУ (EPROM), программируемого постоянного запоминающего устройства ППЗУ (PROM), постоянного запоминающего устройства ПЗУ (ROM), магнитного запоминающего устройства, флэш-памяти, магнитного или оптического диска.

[00191] Питающий компонент 1006 используется для подачи питания на различные компоненты устройства 1000. Питающий компонент 1006 может включать себя систему управления питанием, источники питания и другие компоненты, связанные с генерацией, управлением и распределением питания устройства 1000.

[00192] Мультимедийный компонент 1008 может включать в себя экран, обеспечивающий выходной интерфейс между устройством 1000 и пользователем. В некоторых вариантах осуществления экран может включать в себя жидко-кристаллический дисплей ЖКД (LCD) и сенсорную панель (TP). Если экран включает в себя сенсорную панель, возможен вариант осуществления, в котором сенсорный экран используют для получения входных сигналов от пользователя. Сенсорная панель включает в себя один или несколько датчиков касания для обнаружения касаний, скольжений по экрану и жестов на сенсорной панели. Датчики касания выполнены с возможностью определения не только границ, но и продолжительности и давления касания или скольжения. В некоторых вариантах осуществления мультимедийный компонент 1008 включает в себя переднюю камеру и/или заднюю камеру. Передняя камера и задняя камера могут быть выполнены с возможностью получения внешних мультимедийных данных, когда устройство 1000 находится в рабочем режиме, например, в режиме фотосъемки или видеосъемки. Как передняя, так и задняя камера может выполнена в форме фиксированной оптической системы или с возможностью оптической регулировки фокусного расстояния и увеличения.

[00193] Аудио компонент 1010 выполнен с возможностью вывода и/или ввода аудио сигналов. Например, аудио компонент 1010 включает в себя микрофон («MIC»), предназначенный для получения внешнего аудио сигнала, когда устройство 1000 находится в рабочем режиме, например, в режиме вызова, в режиме записи, в режиме распознавания голосовых данных. Полученный аудио сигнал затем можно хранить в памяти 1004 или передавать через коммуникационный компонент 1016. В некоторых вариантах осуществления аудиокомпонент 1010 дополнительно включает в себя громкоговоритель для вывода звуковых сигналов.

[00194] Интерфейс ввода-вывода 1012 представляет собой интерфейс между компонентом обработки данных 1002 и периферийными интерфейсными модулями, например, клавиатурой, манипулятором типа Click Wheel, кнопками и т. д. Помимо прочего, кнопки могут включать в себя кнопку «Домой» (Home), кнопку регулировки громкости, пусковую кнопку, блокирующую кнопку.

[00195] Сенсорный компонент 1014 включает в себя один или несколько датчиков, обеспечивающих оценку состояния различных аспектов устройства 1000. Например, сенсорный компонент 1014 может определять включенное / выключенное состояние устройства 1000, относительное позиционирование компонентов (например, дисплей и клавиатура устройства 1000), изменение положения устройства 1000 или компонента устройства 1000, наличие или отсутствие контакта пользователя с устройством 1000, ориентацию, ускорение / замедление движения устройства 1000 и изменение температуры устройства 1000. Сенсорный компонент 1014 может включать в себя датчик приближения, выполненный с возможностью обнаружения присутствия объекта поблизости без физического контакта. Сенсорный компонент 1014 также может включать в себя датчик освещенности, например, датчик на основе комплементарного металл-оксидного полупроводника КМОП (CMOS), датчик на основе прибора с зарядовой связью (ПЗС), используемые для работы с изображениями. В некоторых вариантах осуществления изобретения сенсорный компонент 1014 также может включать в себя датчик ускорения, гиродатчик, магнитный датчик, датчик давления или датчик температуры.

[00196] Коммуникационный компонент 1016 может быть выполнен с возможностью повышения удобства проводной или беспроводной коммуникации между устройством 1000 и другими устройствами. Устройство 1000 может быть выполнено с возможностью доступа к беспроводной сети на основе стандарта связи, например, Wi-Fi, 2G, 3G или их сочетания. В примерном варианте осуществления изобретения коммуникационный компонент 1016 получает раздаваемый сигнал или передаваемую соответствующую информацию от внешней системы управления широковещательной передачей через широковещательный канал. В примерном варианте осуществления изобретения коммуникационный компонент 1016 дополнительно включает в себя модуль коммуникации ближнего поля (NFC), способствующий коммуникации малого радиуса действия. Например, модуль NFC может быть выполнен на основе технологии радиочастотной идентификации (RFID), технологии ассоциации инфракрасной передачи данных (IrDA), технологии сверхширокополосной передачи (UWB), технологии Bluetooth (BT) и других технологий.

[00197] В примерных вариантах осуществления устройство 1000 может быть выполнено с использованием интегральных схем специального назначения (ASIC), цифровых сигнальных процессоров ЦСП (DSP), устройств цифровой обработки сигналов (DSPD), программируемых логических устройств (PLD), программируемой пользователем вентильной матрицы (FPGA), контроллеров, микроконтроллеров, микропроцессоров или других электронных компонентов для осуществления вышеописанных способов выделения признаков.

[00198] В примерных вариантах осуществления изобретения также предлагается энергонезависимый машиночитаемый накопитель, включающий в себя инструкции, например, содержащиеся в памяти 1004, исполняемые процессором 1018 в устройстве 1000 для осуществления способов выделения признаков, описанных выше. Например, в качестве энергонезависимого машиночитаемого накопителя может использоваться ПЗУ, оперативное запоминающее устройство ОЗУ (RAM), ПЗУ на компакт-диске (CD-ROM), магнитная лента, дискета, оптическое устройство хранения данных и т. д.

[00199] Другие варианты осуществления изобретения очевидны для специалистов в данной области техники из рассмотрения спецификации и практики использования изобретения, раскрываемого в настоящем документе. Настоящая заявка предназначена для охвата любых вариаций, областей применения или адаптаций изобретения в соответствии с общими принципами, изложенными в заявке, и включая отклонения от настоящего изобретения в соответствии с известной или общепринятой практикой в данной области техники. Спецификацию и примеры рассматривают только в качестве примеров, а действительный объем и сущность изобретения определяют формулой далее.

[00200] Следует понимать, что настоящая идея изобретения не ограничивается точной вышеописанной конструкцией, проиллюстрированной на сопровождающих чертежах, возможны различные модификации и изменения без отклонения от объема притязаний настоящего изобретения. Объем притязаний настоящего изобретения ограничивается лишь формулой изобретения.

1. Способ выделения области изображения, включающий в себя:

получение позиции первой информационной области на идентификационном изображении;

определение второй информационной области на основании позиции первой информационной области и

сегментирование второй информационной области до получения как минимум одной символьной зоны,

при этом сегментирование второй информационной области до получения как минимум одной символьной зоны включает в себя:

процесс бинаризации второй информационной области для получения бинаризированной второй информационной области;

расчет первой гистограммы для бинаризованной второй информационной области по горизонтальному направлению, причем первая гистограмма включает: вертикальную координату каждого ряда пикселей и суммарное количество пикселей с цветом переднего плана в каждом ряду пикселей;

распознавание n строк текстовой области в соответствии с наборами последовательных рядов первой гистограммы, где каждый набор последовательных рядов состоит из рядов пикселей, у которых суммарное количество пикселей с цветом переднего плана превышает первое пороговое значение, а n является целым числом;

распознавание межстрочного интервала между двумя соседними строками текстовой области на основе наборов последовательных рядов пикселей в первой гистограмме;

исключение из рассмотрения строк текстовой области, ближних к верхней или нижней границе второй информационной области, в случае, если межстрочный интервал превышает третье пороговое значение.

2. Способ по п. 1, отличающийся тем, что позиция области представлена координатами вершины,

причем определение второй информационной области осуществляется на основании позиции первой информационной области, включает в себя:

определение второй информационной области на основании как минимум двух координат вершины первой информационной области и предустановленного относительного соотношения позиций, причем под относительным соотношением позиций понимается относительное соотношение координат вершины и второй информационной области.

3. Способ по п. 2, отличающийся тем, что первой информационной областью номера гражданского удостоверения личности на удостоверении личности второго поколения, двумя координатами вершины выступают координаты области номера гражданского удостоверения личности и второй информационной областью является область информации об адресе на удостоверениях личности второго поколения,

причем определение второй информационной области на основании координат по меньшей мере двух вершин первой информационной области и предустановленного относительного соотношения позиций включает в себя:

определение нижней границы области адреса на основании вертикальной координаты вершины, более близкой к области адреса;

определение верхней границы области адреса на основании вертикальной координаты ближайшей вершины и предустановленной высоты;

определение левой границы области адреса на основе горизонтальной координаты одной из двух вершин и первой предустановленной ширины;

определение правой границы области адреса на основе горизонтальной координаты одной из двух вершин и второй предустановленной ширины;

и определения области адреса на основании нижней, верхней, правой и левой границ.

4. Способ по любому из пп. 1-3, отличающийся тем, что сегментация второй информационной области до получения как минимум одной символьной зоны дополнительно включает в себя:

расчет второй гистограммы по вертикальному направлению для i-й строки текстовой области, причем вторая гистограмма включает: горизонтальную координату каждого столбца пикселей и суммарное количество пикселей с цветом переднего плана в каждом столбце пикселей, причем n≥i≥1 и i - это положительное целое число;

и распознавание ni символьных зон в соответствии с наборами последовательных столбцов во второй гистограмме, каждый из наборов состоит из столбцов, в которых суммарное количество пикселей с цветом переднего плана больше второго порогового значения.

5. Способ по п. 4, дополнительно содержащий:

распознавание межсимвольного расстояния между двумя соседними символьными зонами текстовой области на основе наборов последовательных столбцов пикселей во второй гистограмме;

распознавание правой из двух расположенных рядом символьных зон в качестве первой символьной зоны в текущей строке текстовой области, в случае, если две соседние символьные зоны расположены в левой части второй информационной области, и межсимвольное расстояние превышает четвертое пороговое значение;

и распознавание левой из двух расположенных рядом символьных зон в качестве последней символьной зоны в текущей строке текстовой области, в случае, если две соседние символьные зоны расположены в правой части второй информационной области, и межсимвольное расстояние превышает пятое пороговое значение.

6. Устройство для выделения области изображения, включающее в себя:

модуль получения, предназначенный для получения позиции первой информационной области идентификационного изображения;

модуль определения, предназначенный для определения второй информационной области на основании позиции первой информационной области;

и модуль распознавания, предназначенный для сегментирования второй информационной области до получения как минимум одной символьной зоны,

при этом модуль распознавания содержит:

подмодуль бинаризации, предназначенный для выполнения процесса бинаризации второй информационной области для получения бинаризованной второй информационной области;

первый расчетный субмодуль, предназначенный для расчета первой гистограммы для бинаризованной второй информационной области по горизонтальному направлению, причем первая гистограмма включает: вертикальную координату каждого ряда пикселей и суммарное количество пикселей с цветом переднего плана в каждом ряду пикселей;

субмодуль распознавания строк, предназначенный для распознавания n строк текстовой области в соответствии с наборами последовательных рядов первой гистограммы, где каждый набор последовательных рядов состоит из рядов пикселей, у которых суммарное количество пикселей с цветом переднего плана превышает первое пороговое значение, а n является целым числом;

модуль распознавания межстрочного интервала, предназначенный для распознавания интервала между двумя соседними строками текстовой области на основе наборов последовательных рядов пикселей в первой гистограмме;

исключающий модуль, предназначенный для исключения из рассмотрения строк текстовой области, ближних к верхней или нижней границе второй информационной области, в случае, если межстрочный интервал превышает третье пороговое значение.

7. Устройство по п. 6, отличающееся тем, что позиция области представлена координатами вершины,

причем модуль распознавания предназначен также для определения второй информационной области в соответствии как минимум с двумя парами координат вершин первой информационной области и предустановленным относительным соотношением, причем под предустановленным соотношением позиций понимается относительное соотношение позиций между парами координат вершин и второй информационной областью.

8. Устройство по п. 7, отличающееся тем, что первой информационной областью является область номера гражданского удостоверения личности на удостоверении личности второго поколения, двумя координатами вершины выступают координаты области номера гражданского удостоверения личности и второй информационной областью является область информации об адресе на удостоверениях личности второго поколения,

причем модуль определения включает в себя:

первый субмодуль определения, предназначенный для определения нижней границы области адреса на основании вертикальной координаты вершины, более близкой к области адреса;

второй субмодуль определения, предназначенный для определения верхней границы области адреса на основании вертикальной координаты ближайшей вершины и предустановленной высоты;

третий субмодуль определения, предназначенный для определения левой границы области адреса на основе горизонтальной координаты одной из двух вершин и первой предустановленной ширины;

четвертый субмодуль определения, предназначенный для определения правой границы области адреса на основе горизонтальной координаты одной из двух вершин и первой предустановленной ширины;

субмодуль сегментации, предназначенный для определения области адреса на основании нижней, верхней, правой и левой границ.

9. Устройство по любому из пп. 6-8, отличающееся тем, что модуль распознавания содержит:

второй расчетный субмодуль, предназначенный для расчета второй гистограммы для i-й строки текстовой области в вертикальном направлении, причем вторая гистограмма включает: горизонтальную координату каждого столбца пикселей и суммарное количество пикселей с цветом переднего плана в каждом столбце пикселей, причем n≥i≥1 и i является положительным целым числом;

и субмодуль распознавания символов, предназначенный для распознавания ni символьных зон в соответствии с наборами последовательных столбцов во второй гистограмме, каждый из наборов состоит из столбцов, в которых суммарное количество пикселей с цветом переднего плана больше второго порогового значения.

10. Устройство по п. 9, дополнительно содержащее:

модуль распознавания межсимвольного расстояния, предназначенный для распознавания расстояния между двумя соседними символьными зонами текстовой области на основе наборов последовательных столбцов пикселей во второй гистограмме;

модуль распознавания текста, предназначенный для распознавания правой из двух расположенных рядом символьных зон в качестве первой символьной зоны в текущей строке текстовой области, в случае, если две соседние символьные зоны расположены в левой части второй информационной области, и межсимвольное расстояние превышает четвертое пороговое значение;

и модуль распознавания отдельного символа, предназначенный для распознавания левой из двух расположенных рядом символьных зон в качестве последней символьной зоны в текущей строке текстовой области, в случае, если две соседние символьные зоны расположены в правой части второй информационной области, и межсимвольное расстояние превышает пятое пороговое значение.

11. Устройство для выделения области изображения, включающее:

процессор,

память для хранения инструкций, исполняемых процессором;

при этом процессор выполнен с возможностью:

получения позиции первой информационной области на идентификационном изображении;

определения второй информационной области на основании позиции первой информационной области;

и сегментирования второй информационной области до получения как минимум одной символьной зоны,

при этом сегментирование второй информационной области до получения как минимум одной символьной зоны включает в себя:

процесс бинаризации второй информационной области для получения бинаризированной второй информационной области;

расчет первой гистограммы для бинаризованной второй информационной области по горизонтальному направлению, причем первая гистограмма включает: вертикальную координату каждого ряда пикселей и суммарное количество пикселей с цветом переднего плана в каждом ряду пикселей;

распознавание n строк текстовой области в соответствии с наборами последовательных рядов первой гистограммы, где каждый набор последовательных рядов состоит из рядов пикселей, у которых суммарное количество пикселей с цветом переднего плана превышает первое пороговое значение, а n является целым числом;

распознавание межстрочного интервала между двумя соседними строками текстовой области на основе наборов последовательных рядов пикселей в первой гистограмме;

исключение из рассмотрения строк текстовой области, ближних к верхней или нижней границе второй информационной области, в случае, если межстрочный интервал превышает третье пороговое значение.



 

Похожие патенты:

Изобретение относится к способам цифровой обработки медицинских изображений и может быть использовано для автоматической сегментации флюорограмм грудной клетки.

Изобретение относится к области терминальной технологии, а именно к измерению освещенности. Технический результат – улучшение точности измерения освещенности.

Изобретение относится к технологиям проверки идентичности. Технический результат - получение безартефактных биометрических изображений глаза.

Изобретение относится к способам для генерирования регистрационной записи событий, ассоциированных с участниками спортивного события, а именно к области автоматизированной обработки данных, полученных при помощи измерительных видеосистем.

Изобретение относится к обработке изображений, в частности к способу замены объектов в потоке видео. Техническим результатом является предоставление вставки заменяющих изображений в поток видео без необходимости получения и передачи параметров камеры через сенсорное оборудование, установленное на штативе камер и без необходимости в статической модели реальной окружающей среды.

Изобретение относится к сегментации изображений и, более конкретно, к сегментации изображений с использованием деформируемых моделей. Техническим результатом является повышение точности адаптации модели анатомического органа с высокой анатомической вариабельностью при сегментировании изображения анатомического органа.

Изобретение относится к области распознавания и обработки данных. Техническим результатом является повышение скорости преобразования документов, содержащих математические формулы, за счет автоматического преобразования математических формул в элементы нефиксированного формата.

Изобретение относится к способам цифровой обработки изображений. Техническим результатом является повышение помехоустойчивости сегментации, а также повышение степени автоматизации процесса анализа и классификации сегментов изображения.

Изобретения относятся к средствам обработки цифровых изображений. Техническим результатом является повышение быстродействия процесса поиска объектов на изображении посредством применения вычисления особых точек вейвлет-преобразования.

Изобретение относится к области цифровой обработки изображений, связанной с выделением и анализом сегментов. Техническим результатом является повышение точности определения толщины слоя за счет автоматизированного выявления нечеткой границы.

Изобретение относится к области радиотехники. Техническим результатом является ускорение распознавания и повышение вероятности правильного распознавания излучающих объектов в воздушно-космическом пространстве.

Изобретение относится к устройству пользовательского интерфейса для пользовательского терминала. Технический результат заключается в расширении функциональных возможностей за счет поддержки функции заметки, написанной от руки, в различных приложениях.

Изобретение относится к области обработки изображений, документов и текстов. Технический результат – обеспечение распознавания символов, не полностью представленных на изображении.

Изобретение относится к области обработки изображения. Технический результат заключается в расширении арсенала технических средств для идентификации информационной области изображения.

Изобретение относится к области обработки изображений. Технический результат – повышение общей точности распознавания документов.
Изобретение относится к биометрической аутентификации, верификации и идентификации человека и может быть использовано для определения или подтверждения личности пользователя в платежных системах, системах лояльности, системах контроля и управления доступа.

Изобретение относится к компьютерной технике для распознавания символов. Технический результат заключается в повышении эффективности оптического распознавания символов.

Изобретение относится к средствам анализа цифрового изображения документа в вычислительной системе. Технический результат заключается в расширении арсенала технических средств анализа цифрового изображения документа.

Изобретение относится к устройствам для обнаружения и распознавания сложных технических объектов на основе сравнения топологий электромагнитных точек объектов. Технический результат заключается в повышении чувствительности устройства обнаружения и классификации объектов, имеющих точки электромагнитного излучения.

Изобретение относится к области обработки изображений. Технический результат – обеспечение сворачивания изображений для создания серий изображений, в соответствии с различными требованиями к сходству изображений различных пользователей.

Изобретение относится к области геологии и может быть использовано для определения стандартного элемента по статистическим данным кластерного анализа. Иллюстративный способ включает получение двухмерных (2D) или трехмерных (3D) цифровых изображений образца породы. Способ также включает итерационный анализ измерений свойств, собранных для всех цифровых изображений, с использованием частей образца разного размера, чтобы определить сходимость распределения свойств в зависимости от размера части образца. Способ также включает выбор наименьшего размера части образца, соответствующего сходимости распределения свойств, в качестве стандартного элемента площади или объема для образца породы. Технический результат – повышение репрезентативности получаемых данных. 2 н. и 20 з.п. ф-лы, 10 ил.

Изобретение относится к средствам выделения области изображения. Технический результат заключается в повышении точности выделения символьной зоны из информационной области. Получают позиции первой информационной области на идентификационном изображении. Определяют вторую информационную область в соответствии с позиционированием первой информационной области. Сегментируют вторую информационную область для получения как минимум одной символьной зоны. 3 н. 8 з.п. ф-лы, 23 ил.

Наверх