Способ и устройство детектирования локальных особенностей на изображении



Способ и устройство детектирования локальных особенностей на изображении
Способ и устройство детектирования локальных особенностей на изображении
Способ и устройство детектирования локальных особенностей на изображении
Способ и устройство детектирования локальных особенностей на изображении
Способ и устройство детектирования локальных особенностей на изображении

 


Владельцы патента RU 2535184:

Федеральное государственное бюджетное образовательное учреждение высшего профессионального образования "Южно-Российский государственный университет экономики и сервиса" (ФГБОУ ВПО "ЮРГУЭС") (RU)

Изобретение относится к средствам обработки цифровых изображений. Техническим результатом является обеспечение детектирования локальных особенностей на изображении. В способе изображение в цветовом пространстве RGB преобразуется в градации серого; обрабатывается энергетическими характеристиками Лавса посредством свертки матрицы исходного изображения с ядрами типа обнаружения образа в виде ряби, обнаружения пятен, обнаружения волн, и обнаружения краев; для каждого полученного изображения детектируют пятна, углы, край линии методом SURF нахождения локальной точки с помощью матрицы Гессе. 2 н.п. ф-лы, 2 ил.

 

Изобретение относится к способам обработки цифровых изображений и может быть использовано в системах регистрации и наблюдения, мультимедийных приложениях работающих с визуальными данными.

Упрощенная математическая модель изображения представляет собой модель в цветовом пространстве RGB в виде массива Si,j,k, где i = 1, I ¯ , j = 1, J ¯ - столбцы и строки изображения, k = 1.3 ¯ - цветовой канал. При реализации метода поиска локальных особенностей используется изображение в градациях серого, т.е. каждая точка представлена уровнем яркости в диапазоне от 0 (черный) до 255 (белый), с промежуточными значениями, представляющими различные уровни серого. Соответственно такое изображение обозначим, как Si,j.

Основная решаемая задача - детектирование локальных особенностей на изображении с определенными текстурными свойствами.

Несмотря на то что изображение представляет простую структуру - матрицу двумерных чисел в ней содержится больше количество информации о наблюдаемой сцене. Извлечь структурированную информацию из этой сцены довольно сложная задача. Когда речь идет о последовательности изображений, то задача становится еще более сложной, так как появляются пространственно-временные связи между кадрами. Таким образом, требуются устройства и методы, которые позволят извлекать и анализировать заложенную в видеопоследовательность информацию. Одним из таких подходов является поиск, отслеживание и сопоставление точечных особенностей на последовательности кадров. Это один из простых способов извлечь информацию о динамике сцены. Несколько точек, отслеживаемых в видеопоследовательности, могут давать огромное количество информации.

Упрощенно способы детектирования локальных особенностей на изображении можно разделить на следующие группы:

1) Способы обнаружения углов.

2) Способы обнаружения точек.

3) Способы обнаружения пятен.

4) Способы обнаружения краев.

Анализ существующих способов детектирования показывает, что данные способы работают только с определенным типом локальных особенностей, что является основным их недостатком. Использование способов обнаружения углов на основе метода Моравека приводит к тому, что если угол не направлен в сторону соседней, то он не будет обнаружен как точечная особенность. Детектор Харриса не инвариантен к изменению масштаба изображения и алгоритм поиска углов Ши-Томаси очень чувствителен к шуму и к выбору масштабного уровня. Применение способов на основе обнаружения точек показывает, что метод SURF (Speeded Up Robust Features) не работает с объектами простой формы и без выраженных границ, а метод SIFT (Scale Invariant Feature Transform) не работает с зеркальными поверхностям и чувствителен к изменению освещения. Для использования способов обнаружения краев на основе оператора Кирша требуется больших вычислительных затрат, что ограничивает его использование в масштабе реального времени. Способы обнаружения пятен (областей) на основе детектора областей MSER (Maximally Stable Extremal Regions) приводит к тому, что он не инвариантен к масштабу при слабой контрастности, но нормализует все 6 параметров аффинных преобразований. Детектор областей FAST (Features accelerated segment testing) определяет локальные особенности достаточно быстро.

Известен способ и устройство для обнаружения объекта на изображении [Патент US №6711293, МПК G06K 9/68]. Изобретение относится к способам распознавания объектов в системах машинного зрения.

Основная техническая задача состоит в распознавании объектов на изображении, с использованием инвариантной функции масштаба. На первом этапе выполняется свертка изображения с функцией Гаусса, далее используется пирамида Гаусса для построения разностного изображения. На втором этапе находят локальные экстремумы путем сравнения каждого пикселя изображения с несколькими соседними данного масштаба. На следующем этапе выделяют область вокруг точек экстремума. На четвертом вычисляется направление градиентов некоторой окрестности и на пятом этапе для каждой точки экстремума вычисляется локальный дескриптор.

Признаки способа-аналога, совпадающие с признаками заявляемого технического решения, следующие:

- инвариантность к изменению масштаба;

- нахождение локальных экстремумов.

Недостатками известного способа и устройства его реализующего являются:

- низкая точность определения локальных дескрипторов.

Причины, препятствующие достижению требуемого технического результата, заключаются в следующем:

- так как функция Гаусса обладает ограниченным набором инвариантных функций, характеризующих особенности изображения, описываемые векторами-признаками, и тем самым данные вектора являются менее информативными.

Известен способ распознавания объектов [Патент №2438174 С1, МПК G06K 9/68]. Изобретение относится к способам распознавания объектов в системах машинного зрения, телевизионных системах наблюдения, информационно-управляющих системах робототехнических комплексов.

Основная техническая задача, решаемая заявляемым изобретением, состоит в создании способа, позволяющего повысить точность распознавания за счет повышения стабильности работы детекторов ключевых областей на изображении и увеличения количества инвариантных характеристик данных детекторов. Способ осуществляется следующим образом: входное изображение сворачивается с заданной функцией Грина:

U ( y , τ | y 0 , τ 0 ) = λ D π ( 1 e 2 λ ( τ τ 0 ) ) * exp [ λ D π ( 1 e 2 λ ( τ τ 0 ) ) ( y y 0 e λ ( τ τ 0 ) ) 2 ]

для эволюционного оператора процесса Орнштейна-Уленбека при различных значениях параметров τ, λ.

τ U ( y , τ ) = y ( λ y U ( y , τ ) ) + D 2 y y U ( y , τ ) ,

где τ, λ - параметры, используемые для определения сверток на различных масштабах;

D - константа, которая подбирается опытным путем для различных категорий изображений;

y=(a, b) - пространственная временная функция, суть координаты (a,b) пикселя на изображении.

Полученные свертки вычитают друг из друга для получения конечно-разностной аппроксимации первой производной свертки входного изображения с фильтром. При поиске локального экстремума данной свертки приравнивают к нулю соответствующие первые производные. Находят все локальные экстремумы и проводят адаптивную пороговую фильтрацию для отсечения незначительных особенностей. Выделенные таким способом точки служат центрами окрестностей, для которых строят произвольные дескрипторы.

Признаки способа-аналога, совпадающие с признаками заявляемого технического решения, следующие:

- изменяя набор симметрии выбором соответствующей функции Грина, получать для одного и того же изображения векторы-признаки, отражающие различные свойства изображения, повышая тем самым информативность представления изображения.

Недостатками известного способа и устройства его реализующего являются:

- детектирование особенностей в виде локальных областей экстремума.

Причины, препятствующие достижению требуемого технического результата, заключаются в следующем:

- использование способа свертки с функцией Грина не позволяет детектировать различные типы текстур.

Известен способ выделения контуров движущихся объектов [Патент №2466456 С2, МПК G06K 9/50]. Изобретение относится к области распознания образов и может быть использовано в системах технического зрения при решении задач предварительной обработки изображения.

Основная техническая задача, решаемая заявляемым изобретением, состоит в повышении точности определения областей движущихся объектов и повышения скорости выделения контуров изображения.

Структурная схема устройства включает в себя:

- выделение контуров движущихся объектов, включая обнаружение движущихся пикселей по принципу межкадрового вычитания;

- определение направления движения обнаруженных пикселей с учетом направления движения смежных пикселей;

- формирование движущихся объектов путем объединения смежных пикселей с одним направлением и наличия пикселей в восьмисвязной окрестности;

- пространственное дифференцирование обнаруженных объектов оператором Собела:

G r = G ( x , y ) , v ( x , y ) = f e d ( S ( k ) , I ( k ) ) = ( δ I ( x , y ) x ) 2 + ( δ I ( x , y ) y ) 2 , a r c t g ( α )

α = ( ( I ( x , y ) y ) ( I ( x , y ) x ) ) , ( x , y ) S ( k )

- скелетизация контурных линий на градиентном изображении методом подавления точек немаксимальной яркости, пороговая обработка скелетного градиентного изображения на основе максимума и минимума энтропии.

Признаки способа-аналога, совпадающие с признаками заявляемого технического решения, следующие:

- выделение контуров объектов на изображении.

Недостатками известного способа и устройства его реализующего являются:

- низкая точность определения локальных дескрипторов.

Причины, препятствующие достижению требуемого технического результата, заключаются в следующем:

- пространственное дифференцирование оператором Собела при наличии текстурированных объектов приводит к значительным ложным детектированиям.

Известен способ детектирования особых точек и устройство, реализующее его [Патент US №2007/0071289 А1, МПК G06K 9/00]. Изобретение относится к детектированию точечных особенностей и способу детектирования локальных особенностей лица.

Основная техническая задача, решаемая заявляемым изобретением, состоит в создании устройства и способа корректного детектирования локальных особенностей на изображении лица одной точечной нормализацией и многоточечной нормализацией распознавания образов.

Структурная схема устройства для обнаружения локальных особенностей включает в себя:

- запоминающее устройство, настроенное на хранение первого шаблона для первой локальной точки объекта, второго шаблона для второй локальной точки, а третий шаблон для комбинации первой и второй локальной точки;

- устройство ввода изображений;

- блок кандидат;

- первый блок распознавания образов, извлекает множество третьих кандидатов из множества первых кандидатов на основе сходства между первым кандидатом и первым шаблоном, а также извлекает множество четвертого кандидата из множества вторых кандидатов на основе сходства между каждым вторым кандидатом и вторым шаблоном;

- второй блок распознавания образов, создает множество первых комбинаций каждого третьего кандидата, а каждый четвертый кандидат извлекается второй комбинацией из множества первых сочетаний, основанных на третьем сходстве между первой комбинацией и третьим шаблоном.

Признаки способа-аналога, совпадающие с признаками заявляемого технического решения, следующие:

- детектирование особенностей в виде локальных областей экстремума.

Недостатками известного способа и устройства его реализующего являются:

- изобретение предназначено только для детектирования точечных особенностей локальных особенностей лица.

Известен способ обнаружения углов на основе метода Моравека [Moravec Н (1980). "Obstacle Avoidance and Navigation in the Real World by a Seeing Robot Rover"]. Данный способ проверяет каждый пиксель в изображении, чтобы определить является ли тот углом, рассматривая участки в области пикселя. Сходство определяется путем принятия суммы квадратов разностей между двумя участками. Меньшее число указывает на большее сходство.

Способ осуществляется следующим образом:

1. Используется тот факт, что однородные и реберные участки изображения самоподобны.

2. В каждом пикселе считается функция самоподобности окрестностей с различным радиусом у этого пиксела.

3. Строится карта самоподобности.

4. Выбираются локальные максимумы рассогласования различных окрестностей пиксела.

5. Если величина локального максимума больше порога, то точка классифицируется как угловая:

E x , y = u , v w u , v [ I x + u , y + u I u , v ] 2 ,

где I - обозначается интенсивность изображения; w - окно, которое определяет область изображения с коэффициентом единица.

Признаки способа-аналога, совпадающие с признаками заявляемого технического решения, следующие:

- детектирование локальных особенностей в виде углов.

Недостатками известного способа являются:

- если угол не направлен в сторону соседней, то он не будет обнаружен, как точечная особенность.

Известен способ обнаружения углов с помощью преобразования Хафа [Шапиро Л., Дж. Стокман. Компьютерное зрение; Пер с англ. - М.: БИНОМ. Лаборатория знаний, 2006. - С.413]. Данный способ преобразования Хафа использует аккумуляторный массив, размерность которого соответствует количеству неизвестных параметров в уравнении семейства искомых кривых. Области углов на изображении можно обнаружить посредством поиска пар выделенных краевых сегментов E1 и Е2, удовлетворяющих перечисленным ниже условиям:

- аппроксимирующие прямые для множеств краевых точек E1 и Е2 пересекаются в точке [u,v], координаты которой определены в действительной системе координат изображения;

- точка [u,v] лежит близко от крайних точек множеств E1 и Е2;

- направления градиентов E1 и Е2 симметричны относительно оси симметрии двух этих краев.

Исходные краевые сегменты выделяются с помощью преобразования Хафа путем прослеживания границ и последующей аппроксимации прямыми или каким-либо другим подходящим алгоритмом. Для каждой пары отрезков ([d1,θ1], [d2,θ2]), удовлетворяющей перечисленным условиям, четверка элементов (d1,θ1], [d2,θ2], [u,v], α) добавляется в множество кандидатов на углы (где α - это величина угла). Сформированное множество угловых характерных признаков применяется в различных целях, например для построения каких-либо высокоуровневых описаний.

Аккумуляторный массив А используется в алгоритме Хафа для проверки каждого пиксела изображения и его окрестности. Определяется, присутствует ли в данном пикселе достаточно выраженный край. Если присутствует, то вычисляются параметры искомой кривой, проходящей через данный пиксел. После оценки параметров прямой в данном пикселе они дискретизируются для получения соответствующих значений М и В и значение элемента массива А[М,В] увеличивается. После обработки пикселов выполняется поиск локальных максимумов в аккумуляторном массиве. Точки локальных максимумов соответствуют параметрам наиболее вероятных прямых на изображении.

Признаки способа-аналога, совпадающие с признаками заявляемого технического решения, следующие:

- детектирование локальных особенностей в виде углов.

Недостатками известного способа являются:

- приведенные условия определяют только углы типа 'L';

- второе условие исключает из рассмотрения углы типа 'T', 'X' и 'Y';

- аккумуляторный массив позволяет определить параметры бесконечно протяженных прямых или кривых линий, но с его помощью нельзя определить, где именно на изображении начинаются и заканчиваются отрезки линий.

Известен способ Blob обнаружения на основе Лапласиан Гауссиан [Lindeberg Т. (1998). "Feature detection with automatic scale selection". International Journal of Computer Vision 30 (2): pp.77-116], который основан на выполнении одноразовой цифровой операции полосовой фильтрации пространственной функции изображения с использованием оператора лапласиана гауссиана.

Данный способ использует свойство коммутативности линейных операторов Гаусса и Лапласа:

L × ( G × I ) = ( L × G ) × I = L o C × I ,

где × - оператор свертки и возможности объединения их в один путем изменения порядка выполнения операций дифференцирования и сглаживания. Объединенный оператор получил название оператора лапласиана гауссиана LoG (LoG - Laplacian of Gaussian) и представляет собой свертку операторов Лапласа и Гаусса.

Признаки способа-аналога, совпадающие с признаками заявляемого технического решения, следующие:

- детектирование локальных особенностей в виде областей.

Недостатками известного способа являются:

- операторы Гаусса и Лапласа являются ненаправленными;

- чувствительность к изменению яркости в параллельном направлении, что уменьшает соотношение сигнал/шум.

Известен способ детектирования краев методом Кирша [Шапиро Л., Дж. Стокман. Компьютерное зрение; Пер с англ. - М.: БИНОМ. Лаборатория знаний, 2006. - С.413]. Оператор Кирша - нелинейный детектор края, который находит максимальную толщину края в нескольких направлениях. Взяв маску, оператор вращает ее в 8 основных направлениях компаса: север, северо-запад, запад, юго-запад, юг, юго-восток, восток, северо-восток.

Способ осуществляется следующим образом:

Метод Кирша работает с двумерной апертурой 3×3 следующего вида:

А0 A1 A2
А7 F A3
А6 A5 A4

Сначала находятся все значения переменных Si и Ti, где i изменяется от 0 до 7, производится вычисление двух сумм, одна из которых содержит 3 элемента, последовательно выбранные при обходе «по кругу» крайних элементов, вошедших в окно, вторая сумма включает оставшиеся пять элементов:

S i = j = i ( i + 2 ) mod 8 A j

T i = j = i + 3 ( i + 7 ) mod 8 A j

Далее значения сумм подвергаются сравнению при помощи взвешенной разности по модулю, что определяет наличие либо отсутствие контраста в рассматриваемом направлении:

Y i = | 5 S i 3 T i |

Выбирается максимальный перепад контраста из всех направлений, направление изменяется за счет вычисления всех возможных разностей, последовательно меняя стартовую позицию начального элемента (i):

F ' = max { Y i } i = 0,7

В точку со значением F записывается полученное значение, фильтр сдвигается вправо.

Признаки устройства-аналога, совпадающие с признаками заявляемого технического решения, следующие:

- детектирование локальных особенностей в виде границ.

Недостатками известного способа являются:

- требуется большое количество времени для расчета локальных особенностей.

Известен способ детектирования точек методом SIFT (Scale Invariant Feature Transform) [David G. Lowe «Distinctive image features from scale-invariant keypoints» International Journal of Computer Vision, 60, 2(2004), pp.91-110]. Главным этапом в детектировании особых точек является построение пирамиды гауссианов (Gaussian) и разностей гауссианов (Difference of Gaussian, DoG).

Способ осуществляется следующим образом: точка считается особой, если она является локальным экстремумом разности гауссианов. Для поиска экстремумов будем использовать следующий метод. В каждом изображении из пирамиды DoG ищутся точки локального экстремума. Каждая точка текущего изображения DoG сравнивается с ее восьмью соседями и с девятью соседями в DoG, находящимися на уровень выше и ниже в пирамиде. Если эта точка больше (меньше) всех соседей, то она принимается за точку локального экстремума.

Следующим шагом будет пара проверок пригодности точки экстремума на роль ключевой. Первым делом определяются координаты особой точки с субпиксельной точностью. Это достигается с помощью аппроксимирования функции DoG многочленом Тейлора второго порядка, взятого в точке вычисленного экстремума.

D ( x ) = D + D T x x + 1 2 x T 2 D x 2 x ,

здесь D - функция DoG, X=(x,y,sigma) - вектор смещения относительно точки разложения, первая производная DoG - градиент, вторая производная DoG - матрица Гессе.

Экстремум многочлена Тейлора находится путем вычисления производной и приравнивания ее к нулю. В итоге получим смещение точки вычисленного экстремума относительно точного

x ^ = 2 D 1 x 2 D x ,

Все производные вычисляются по формулам конечных разностей. Если одна из компонент вектора X ^ больше 0.5*шаг сетки в этом направлении, то это означает, что на самом деле точка экстремума была вычислена неверно и нужно сдвинуться к соседней точке в направлении указанных компонент. Для соседней точки все повторяется заново. Если таким образом выходим за пределы октавы, то следует исключить данную точку из рассмотрения.

Когда положение точки экстремума вычислено, то значение DoG сравнивается с порогом в точке по формуле:

D ( x ^ ) = D + 1 2 D T x x ^

Если эта проверка не проходит, то точка исключается из рассмотрения, как точка с малым контрастом.

Признаки способа-аналога, совпадающие с признаками заявляемого технического решения, следующие:

- детектирование локальных особенностей в виде областей.

Недостатками известного способа являются:

- не работает с отражающими поверхностями.

Наиболее близким к изобретению относится способ SURF (Speeded Up Robust Features) [Bay H., Tuytelaars T. (2006) Ess A. Speeded-Up Robust Features (SURF) in LNCS 3951 (ECCV'06), vol. 1, 2006, pp.404-417]. Способ SURF позволяет находить локальные точки с помощью матрицы Гессе и хорошо детектирует пятна и углы. Гессиан инвариантен относительно вращения, но не инвариантен масштабу. Поэтому метод SURF использует разномасштабные фильтры для нахождения гессианов.

Для каждой локальной точки считается направление максимального изменения яркости (градиент) и масштаб, взятый из масштабного коэффициента матрицы Гессе. Градиент в точке вычисляется с помощью фильтров Хаара. Обнаружение особых локальных точек в методе SURF использует бинаризированную аппроксимацию лаплассиана-гауссиана.

Признаки способа-прототипа, совпадающие с признаками заявляемого технического решения, следующие:

- детектирование локальных особенностей в виде областей и углов.

Недостатками известного способа являются:

- частично инвариантен к освещению и положению оптических камер;

- не работает с отражающими поверхностями и сильно выраженной геометрической структурой.

Наиболее близким к изобретению является способ и система для обнаружения лиц [Патент №2008145913/28, МПК G06K 9/00]. Рассматриваемое устройство-прототип предполагает выполнение следующих операций:

1) Выполняется построение карт градиентов входящего изображения, результатом работы которого является вычисление изменений интенсивности (или цветных компонент) соседних пикселей или групп и оценка направления наибольшего изменения в каждой точке изображения;

2) Проводится поиск дуг окружностей на картах градиентов, основным результатом работы которого является получение многомерной весовой карты возможных местоположений лица с учетом геометрических параметров дуг: радиусов, длины и расположения;

3) Проводится поиск локальных особенностей на входящем изображении и градиентных картах, результатом работы будет являться набор выделенных локальных особенностей с их геометрическими характеристиками;

4) Выполняется построение набора гипотез возможных положений лиц, выходной информацией служит набор гипотез, каждая из которых определяет возможное положение лица на исходном изображении, с учетом его размеров и ориентации;

5) Осуществляется верификация построенных гипотез.

Устройство для обнаружения лиц включает: блок регистрации (памяти) входящего изображения; блок построения карт градиентов входящего изображения; блок поиска дуг окружностей на картах градиентов; блок поиска локальных особенностей на входящем изображении и градиентных картах; блок построения набора гипотез возможных положений лиц; блок предобработки; блок-детектор лица; блок верификации построения гипотез.

Недостатками известного устройства-прототипа являются:

- детектирование определенных локальных особенностей с целью обнаружения местоположения лица на изображении.

Причины, препятствующие достижению требуемого технического результата, заключаются в следующем:

- в качестве детектирования локальных особенностей может выступать метод SURF, соответственно такой метод обнаруживает только локальные особенности в виде областей.

Суть предлагаемого способа детектирования локальных особенностей на изображении состоит в следующем (фиг.1).

На первом шаге исходное изображение, которое представлено моделью в цветовом пространстве RGB, преобразуется в градации серого для реализации метода поиска локальных особенностей.

На втором шаге происходит выбор интересующей локальной особенности с помощью обработки текстурными энергетическими характеристиками Лаве (Laws) [Laws К. Textured image segmentation, Ph.D. dissertation, University of Southern California. 130 pp. - 1980].

Для вычисления энергетических характеристик используется набор из 22 масок размерами 5x5. Затем энергетические характеристики каждого пиксела анализируемого изображения представляются в виде вектора и 9 чисел. Для вычисления масок используются следующие векторы:

L 5 ( L e v e l ) = [ 1 4 6 4 1 ]

E 5 ( E d g e ) = [ 1 2 0 2 1 ]

S 5 ( S p o t ) = [ 1 0 2 0 1 ]

E 5 ( R i p p l e ) = [ 1 4 6 4 1 ]

E 5 ( W a v e ) = [ 1 2 0 2 1 ]

Название вектора описывает их назначение. Вектор L5 предназначен для вычисления симметричного взвешенного локального среднего значения. Вектор Е5 предназначен для обнаружения краев, S5 - для обнаружения пятен, R5 - для обнаружения образа в виде ряби, a W5 - для обнаружения волн. Двумерные маски вычисляются умножением пар векторов. Например, для получения маски E5L5 надо умножить вектор Е5 на L5:

[ 1 2 0 2 1 ] × [ 1 4 6 4 1 ] = [ 1 4 6 4 1 2 8 12 8 2 0 0 0 0 0 2 8 12 8 2 1 4 6 4 1 ]

Каждая текстурная энергетическая карта является полноразмерным изображением, которое представляет результаты обработки входного изображения с использованием k-й маски.

После получения 22 энергетических карт некоторые симметричные пары комбинируются и в результате строятся 13 окончательных карт. Каждая симметричная пара карт заменяется усредненной картой. Например, маска E5L5 характеризует содержание горизонтальных краев, L5E5 - вертикальных. Среднее двух этих карт будет характеризовать наличие на изображении краев обоих этих типов. Перечислим 13 окончательных энергетических карт: L5E5/E5L5, L5S5/S5L5, W5W5, L5W5/W5L5, L5R5/R5L5, Е5Е5, ESWSIWSES, E5S5/S5E5, E5R5/R5E5, RSWSIW5RS, S5S5, S5R5/R5S5, R5R5.

Таким образом, используя фильтры Лавса, для любого пикселя получаем описание характеристик текстуры в некоторой окрестности выбранного пикселя.

На третьем шаге полученное изображение обрабатывается методом SURF. Метод SURF позволяет находить локальные точки с помощью матрицы Гессе и хорошо детектирует пятна, углы и края линий. Гессиан инвариантен относительно вращения, но не инвариантен масштабу. Поэтому метод SURF использует разномасштабные фильтры для нахождения гессианов.

Для каждой локальной точки считается направление максимального изменения яркости (градиент) и масштаб, взятый из масштабного коэффициента матрицы Гессе. Градиент в точке вычисляется с помощью фильтров Хаара.

Для эффективного вычисления фильтров Гессе и Хаара используется интегральное представление изображений.

Интегральное представление является матрицей, размерность которой совпадает с размерностью исходного изображения, а элементы считаются по формуле:

I I ( x , y ) = i = 0, y = 0 i x , j y I ( x , y )

где I(i,j) - яркость пикселов исходного изображения.

Имея интегральную матрицу, можно очень быстро вычислять сумму яркостей пикселов произвольных прямоугольных областей изображения по формуле:

S u m O f Re c t = I I ( A ) + I I ( C ) I I ( B ) I I ( D )

где ABCD - интересующий прямоугольник.

Обнаружение особых локальных точек в методе SURF использует бинаризированную аппроксимацию лапласиана гауссиана:

det ( H a p p r o s ) = D x x D y y ( 0.9 D x y ) 2 .

Предлагаемый способ позволяет детектировать различные типы локальных особенностей за счет предварительной обработки энергетическими характеристиками Лавса.

Устройство детектирования локальных особенностей на изображении (фиг.2) содержит 2D камеру 1, выход которой подключен к входу блока регистрации изображения 2, выход которого подключен к следующим входам: входу блока построения карт градиентов 3, выход которого подключен к входу блока свертки изображения с ядром обнаружения краев 4.1, к входу блока свертки изображения с ядром обнаружения образа в виде ряби 4.2, к входу блока свертки изображения с ядром обнаружения пятен 4.3, к входу блока свертки изображения с ядром обнаружения волн 4.4, выходы которых подключены к входам блоков поиска локальных особенностей 5.1, 5.2, 5.3, 5.4 соответственно в каждом канале, выходы которых подключены к входам блоков хранения 6.1, 6.2, 6.3, 6.4; синхронность работы устройства обеспечивается генератором тактовых импульсов 7.

Устройство детектирования локальных особенностей на изображении реализуется следующим образом. Изображение с камеры поступает в блок регистрации изображения, который выполняет роль памяти, далее изображение преобразуется в градации серого в блоке построения карт градиентов и поступает параллельно в четыре канала, в каждом из которых матрица изображения сворачивается с различными ядрами, которые характеризуют текстурные признаки изображения. Полученные текстурные энергетические карты, в свою очередь, поступают параллельно на входы блоков поиска локальных особенностей, в которых происходит поиск локальных особенностей изображения способом детектирования SURF. Результатом работы блоков будет являться набор выделенных локальных особенностей с их геометрическими характеристиками.

Устройство детектирования локальных особенностей на изображении работает следующим образом. Изображение с 2D камеры 1 передается на блок регистрации изображения 2, из которого изображение поступает в блок построения карт градиентов 3, результатом работы в котором является изменение цветного изображения в градации серого. Полученное изображение в градациях серого параллельно поступает на: вход блока 4.1, результатом которого является текстурная энергетическая карта свертки изображения с ядром обнаружения краев; на вход блока 4,2, результатом которого является текстурная энергетическая карта свертки изображения с ядром обнаружения образа в виде ряби; на вход блока 4.3, результатом которого является текстурная энергетическая карта свертки изображения с ядром обнаружения пятен; на вход блока 4.4, результатом которого является текстурная энергетическая карта свертки изображения с ядром обнаружения волн. Полученные текстурные энергетические карты, в свою очередь, поступают параллельно на входы блоков поиска локальных особенностей 5.1, 5.2, 5.3, 5.4 соответственно, в которых происходит поиск локальных особенностей изображения способом детектирования SURF. Набор выделенных локальных особенностей с различными текстурными и геометрическими характеристиками хранится в блоках 6.1, 6.2, 6.3, 6.4.

Технический результат - детектирование локальных особенностей на изображении с определенными текстурными свойствами.

1. Способ детектирования локальных особенностей на изображении, заключающийся в поиске локальных особенностей с помощью метода SURF, отличающийся тем, что полученное изображение в цветовом пространстве RGB преобразуется в градации серого, и далее обрабатывается энергетическими характеристиками Лавса с помощью свертки матрицы исходного изображения с ядрами типа обнаружения образа в виде ряби, обнаружения пятен, обнаружения волн, и обнаружения краев, для каждого полученного изображения детектируют такие локальные особенности, как пятна, углы, край линии методом SURF нахождения локальной точки с помощью матрицы Гессе.

2. Устройство детектирования локальных особенностей на изображении, содержащее 2D камеру, выход которой подключен к входу блока регистрации изображения, выход которого подключен к входу блока построения карт градиентов; отличается тем, что устройство содержит четыре канала обработки изображения посредством свертки матрицы указанного изображения, выход блока построения карт градиентов подключен к входам блоков признаков, характеризующих свертку матрицы изображения с ядрами, выходы которых подключены к входам блоков поиска локальных особенностей в каждом канале соответственно, выходы которых подключены к входам блоков хранения, синхронизация всех блоков устройства осуществляется генератором тактовых импульсов.



 

Похожие патенты:

Изобретение относится к средствам идентификации объектов на изображении. Техническим результатом изобретения является повышение точности обнаружения объекта на изображении.

Изобретение относится к средствам анализа содержимого изображений. Техническим результатом является повышение эффективности оценки содержимого изображений.

Изобретение относится к средствам определения гряд и поясов торосов на ледяном покрове акваторий. Техническим результатом является обеспечение мониторинга состояния ледяного покрова акваторий за счет определения толщины ледяного покрова, осредненной на локальном элементе разрешения.

Изобретение относится к средствам обработки изображений. .

Изобретение относится к средствам распознавания и анализа изображений при гистологических исследованиях. .

Изобретение относится к области цифрового формирования изображений. .

Изобретение относится к синтезу текстуры, включающему автоматической формирование больших текстур из маленького примерного изображения. .

Изобретение относится к области обработки цифровых данных фотографий биологических объектов для постановки диагноза, в частности при цитологических исследованиях клеток крови.

Изобретение относится к системам стабилизации видеоизображения. .

Изобретение относится к способам обработки визуальной информации. .

Изобретение относится к средствам формирования цифровых изображений. Техническим результатом является повышение качества результирующего изображения за счет устранения артефактов в полноцветном изображении. Система содержит блок предварительной обработки пикселей, содержащий логику сбора статистики автоматического баланса белого и статистики автоматической установки экспозиции, логику сбора статистики, содержащей вход, логику преобразования цветового пространства, набор пиксельных фильтров. Система так же содержит управляющую логику, сконфигурированную для определения набора коэффициентов усиления баланса белого по точкам для применения к многоцветным первичным пикселям кадра на основании накопленных значений суммы цветов. 3 н. и 17 з.п. ф-лы, 74 ил.

Группа изобретений относится к средствам ориентирования в реальном пространстве. Техническим результатом является повышение точности обнаружения трехмерного объекта в окружающем пространстве. Устройство содержит устройство захвата изображения предопределенной зоны, блок преобразования точки обзора, создающий изображение вида с высоты птичьего полета, вычислитель яркостного различия между двумя пикселями вблизи положений вдоль вертикальной воображаемой линии, тянущейся в вертикальном направлении в реальном пространстве, обнаружитель трехмерного объекта, обнаруживающий указанный объект на основе непрерывностей яркостных различий соответствующих вычисленных положений. 2 н. и 8 з.п. ф-лы, 25 ил.

Изобретение относится к устройствам выделения высокодетализированных объектов. Технический результат заключается в выделении на изображениях и видеопоследовательностях высокодетализированных объектов на произвольном низкодетализированном фоне. Устройство содержит блок хранения входной реализации, блок управления, блок детектора границ Канни, блок определения общего коэффициента детализации, блок выбора скользящего окна, блок определения коэффициента детализации в скользящем окне, блок сравнения, блок хранения выходной реализации, генератор тактовых импульсов. 1 ил.

Изобретение относится к средствам компенсации дефектов цвета глаз на изображении. Техническим результатом является повышение эффективности обнаружения эффекта красных глаз на изображении. Способ включает вычисление первого разностного изображения на основе разности между яркостью красных пикселей и яркостью зеленых пикселей из набора пикселей, ассоциированного с первой областью глаза на изображении, обработку первого разностного изображения для вычисления градиента и проекции, ассоциированной с указанным градиентом, определение центральной точки на основе проекции и вычисление первой области дефекта цвета глаз на основе центральной точки и множества красных пикселей из указанного набора. 6 н. и 19 з.п. ф-лы, 8 ил.

Изобретение относится к технологиям кодирования и декодирования трехмерных видеоданных. Техническим результатом является повышение эффективности кодирования или декодирования видеоконтента с высоким разрешением или высоким качеством при помощи информации, указывающей на то, закодирована ли информация о текстуре единицы кодирования, и принимая во внимание вырезку глубины. Предложен способ кодирования видеоданных. Способ включает в себя этап, на котором кодируют один или более блоков видеоданных, представляющих информацию текстуры, по меньшей мере, части кадра видеоданных. Далее, согласно способу обрабатывают вырезку текстуры для компонента вида текстуры текущего вида, ассоциированного с единицей доступа, причем вырезка текстуры содержит кодированные один или более блоков и заголовок вырезки текстуры, содержащий набор элементов синтаксиса, представляющих характеристики вырезки текстуры. При выполнении вырезки текстуры осуществляют формирование или прием вырезки текстуры. Далее, кодируют информацию глубины, представляющую значения глубины, по меньшей мере, для части кадра, и обрабатывают вырезку глубины для компонента вида глубины текущего вида, соответствующего компоненту вида текстуры текущего вида. 4 н. и 52 з.п. ф-лы, 6 ил., 6 табл.

Описаны способ и система формирования пространственного изображения, в общем, для металлических поверхностей с зеркальной характеристикой и, в частности, для баллистических улик, при этом используют фотометрическое стерео путем определения и решения множества систем нелинейных уравнений, содержащих диффузный член и зеркальный член, с тем, чтобы определить поле N(x, y) векторов нормалей к поверхности и использовать N(x, y) для определения пространственной топографии Z(x, y). 3 н. и 17 з. п. ф-лы,9 ил.

Изобретение относится к системам рулевого управления сельскохозяйственным транспортным средством. Техническим результатом является повышение точности рулевого управления сельскохозяйственного транспортного средства за счет передачи сигнала о корректировке, учитывающей характерную структуру поля. Предложен способ рулевого управления сельскохозяйственным транспортным средством или оборудованием по отношению к структуре в поле. Способ включает в себя этап, на котором получают изображение поля формирователем изображения, анализируют изображение устройством обработки изображения для получения текстурной информации. Далее, согласно способу, присваивают множеству областей изображения показатели вероятности, которые отражают вероятность того, что соответствующая область относится к характерной структуре. 3 н. и 8 з.п. ф-лы, 9 ил.
Наверх