Способ автоматической идентификации объектов на изображениях

Изобретение относится к информатике и может быть использовано для автоматической идентификации объектов на изображениях. Согласно способу производят сканирование исходного фотоизображения с высоким разрешением. Матрицу полученных отсчетов приводят к масштабу эталонной матрицы путем нормирования пикселей яркости масштабным коэффициентом. Производят разложение полученного изображения на три двумерные матрицы в палитре стандартных цветов RGB. Методами пространственного дифференцирования функции сигнала матриц выделяют контурные рисунки объектов. Поверхности рельефов объектов внутри выделенных контуров аппроксимируют мозаикой треугольников. Площадь мозаик в каждом из каналов рассчитывают по формуле Герона и производят сравнение полученных площадей рельефов поверхности объектов с их значениями для эталонов по критерию достоверности:

Технический результат - автоматизация распознавания с высокой достоверностью. 7 ил.

 

Изобретение относится к информатике и может найти применение в системах сбора, преобразования, переработки информации в различных сферах человеческой деятельности: криминалистике, космонавтике.

Дистанционное зондирование Земли из космоса в интересах разведки полезных ископаемых, лесного хозяйства, экологии, мониторинга почвенных покровов осуществляют путем получения цифровых изображений подстилающей поверхности. Селективными признаками объектов на изображениях являются: цвет, тон, текстура, топология. Существуют многофункциональные программы редактирования, ретуширование изображений, работа со слоями в палитре RGB, CMYK, Lab и др. в интерактивном режиме [см., например, Минько П.А. Обработка графики в Photoshop CS2. М.: Изд. «Эксмо», 2007 г., стр.71-89, стр.145-151].

Пока не существуют универсальные методы автоматической идентификации объектов на изображениях. Наибольший объем информации для обнаружения объектов на изображениях и их идентификации содержится в их форме. Психологически, восприятие образов человеком-оператором происходит на уровне абриса, т.е. контура формы объекта. Контур - это край, где наиболее быстро изменяется градиент функции сигнала.

Известен способ выделения контура рисунка объекта [см., например, Дуда P.O., Харт П.Е. Распознавание образов и анализ сцен. Перев. с англ., М.: Мир, 1976 г., §7-3, «Пространственное дифференцирование», стр.287-288, рис.7.3] - аналог. Контурный рисунок получают путем вычисления градиента скалярной функции яркости I(х, у) видеоизображения в каждой точке как:

g r a d I ( x , y ) = d I d x i + d I d y j

Для получения контурного рисунка выбирают регулярный оператор с апертурой окна |2×2| элемента:

I, j i, j+1
i+l, j i+l, j+l

Элементы окна связаны по диагоналям (двум взаимно ортогональным направлениям) операцией вычитания. Вычисляют оператор Робертса в каждой точке:

R(i, j)=|I(i, j)-I(i+1, j+1)|-|I(i+1, j)-I(i,j+1)|,

выводят на экран точки, для которых R(i, j)≥порог.

Недостатками аналога следует считать:

- не все признаки сигнала изображения используются для идентификации объекта, в частности в аналоге используют один параметр сигнала - амплитуду;

- недостаточная достоверность при визуальном анализе объекта оператором.

Ближайшим аналогом к заявляемому техническому решению является «Способ обнаружения аномалий подстилающей поверхности». Патент РФ №2160912, кл. G01V 8/00, 2000 г. Способ ближайшего аналога включает получение изображения подстилающей поверхности в виде цифровой матрицы функции яркости I(х, y) от пространственных координат, разбиение изображения на сравнительно однородные по тону участки на основе априорных данных, вычисление фрактальной размерности каждого участка, составление матрицы эталонов из коэффициентов фрактальной размерности каждого участка, разницы между текущим и эталонным значениями фрактальной размерности за пороговый уровень для анализируемого участка.

Недостатками ближайшего аналога являются:

- неопределенность разбиения изображения на мозаику участков, приводящая к погрешности вычисления фрактальной размерности;

- не все независимые признаки изображения используются при идентификации;

- малый интервал изменения функции фрактальной размерности изображения, в пределах 2,1…2,7, что снижает достоверность идентификации.

Задача, решаемая заявляемым способом, состоит в автоматической, достоверной идентификации объектов на изображениях путем выделения контурного рисунка объекта и количественного сравнения площади рельефа поверхности объекта внутри контура с эталоном.

Технический результат достигается тем, что способ автоматической идентификации объектов на изображениях включает сканирование исходного фотоизображения с высоким линейным и амплитудным разрешением, приведение матрицы полученных отсчетов I(х, y) к масштабу эталонной матрицы путем нормирования пикселов масштабным коэффициентом M = I I max × I max  шкалы , разложение полученного изображения на три двумерные матрицы в стандартной палитре цветов RGB, выделение методами пространственного дифференцирования контурных рисунков объекта в каждом из каналов RGB, аппроксимацию поверхности рельефов объекта А внутри выделенных контуров мозаикой треугольников в окнах |2×2| элементов, расчет по формуле Герона площадей мозаики треугольников в каждом из каналов, сравнение полученных площадей с их значениями для эталонных объектов в каждом из каналов и их суммой, идентификацию образа объекта по совпадению площадей поверхности рельефов объекта (Sоб) и эталона (Sэтал) с установленной достоверностью:

| S э т а л S о б | S э т а л 100 % ,

где: Imax шкалы - максимальная величина шкалы параметра используемого сканера;

Imax - максимальная амплитуда пиксела сигнала в матрице;

I - текущее значение пиксела сигнала в матрице.

Изобретение поясняется чертежами, где:

фиг.1 - исходное изображение;

фиг.2 - контурный рисунок объекта в одном из слоев RGB;

фиг.3 - последовательность разбиения матрицы изображения на окна;

фиг.4 - разбиение окна на две пары смежных треугольников;

фиг.5 - функциональная схема устройства, реализующая способ.

Техническая сущность изобретения состоит в следующем. Многие научные задачи при дистанционных исследованиях из космоса решаются путем получения изображения подстилающей поверхности: обнаружение очагов землетрясений, выделение областей экологических аномалий, пожарищ, разведка объектов военной инфраструктуры, позиционных районов расположения войск и т.д.

До настоящего времени задача распознавания объектов на изображениях подстилающей поверхности решается, как правило, оператором по набору дешифровочных признаков. Как отмечалось выше, наибольший объем информации содержит форма объекта, а на изображении - его контурный рисунок. Самым высоким разрешением обладают фотоснимки с разрешением порядка 200 точек на 1 мм. Для цифровой обработки необходимо преобразовать изображение в цифровую матрицу, а всякое преобразование информации ведет к потерям. Для уменьшения потерь используют сканер высокого разрешения. Средняя яркость изображений зависит от условий съемки: времени суток, высоты Солнца, состояния среды (атмосферы), параметров аппаратуры.

Для исключения влияния перечисленных факторов на достоверность идентификации необходимо сравниваемые изображения привести к единому масштабу, т.е. пронормировать пикселы яркости исходной матрицы, умножив их амплитуду на масштабный коэффициент, упомянутый выше. После масштабирования исходного изображения осуществляют разложение матрицы на три ортогональных, в стандартной палитре цветов RGB. Методами пространственного дифференцирования функции сигнала матриц способа-аналога выделяют контурные рисунки объекта во всех трех каналах. Выделенный контурный рисунок в одном из каналов иллюстрируется фиг.2. Программа выделения контуров приведена ниже, в примере реализации. Идентификацию объектов по форме осуществляют путем расчета площади рельефа их поверхности в границах выделенных контуров в каналах R, G, В и сравнения их с эталонными значениями.

На фиг.3 представлена иллюстрация последовательности разбиения матрицы на окна из 4-х смежных пикселей. Каждый пиксель характеризуется разрешением по координатам Δx, Δy, амплитудой, глубиной ΔН, которые считаются известными из технических характеристик средств. Размер контура определяется числом строк и столбцов матрицы. Алгоритм вычисления элементарной площади окна четырехточечного шаблона основан на триангуляции, т.е. разбиении его диагоналями 1-4 и 3-2 на две пары смежных треугольников. Процедура разбиения иллюстрируется фиг.4. Площадь каждого треугольника вычисляют по формуле Герона. Предварительно, по теореме Пифагора, рассчитывают длины сторон треугольников. В соответствии с фиг.4 длины сторон треугольника, например, с вершинами 1-3-4 равны:

l 3 4 = Δ x 2 + Δ ( H 4 H 3 ) 2 ; l 3 1 = Δ y 2 + Δ ( H 1 H 3 ) 2 ;

диагональ l 1 4 = ( 2 Δ x ) 2 + ( 2 Δ y ) 2 + Δ ( H 1 H 4 ) 2

Существуют два способа триангуляции - по главной диагонали (слева-сверху - направо-вниз) и по вспомогательной диагонали (справа-сверху - налево-вниз). Площадь вычисляется обоими способами, а в качестве результата выбирается среднегеометрическое. Если хотя бы одна вершина треугольника находится за границей участка - площадь треугольника считается равной нулю. Если все вершины принадлежат участку, площадь треугольника вычисляется по формуле Герона.

Пример реализации способа.

Заявленный способ может быть реализован по схеме фиг.5. Функциональная схема устройства фиг.5 содержит аппаратно-программный вход-выход 1 сети Интернет, флеш-карту 2 клиентских изображений в одном из общеупотребимых форматов, цифровой сканер 3, преобразующий клиентские снимки в стандартной палитре цветов RGB в специальный формат, ПЭВМ 4 пограммной обработки изображений в стандартной конфигурации элементов: процессор 5, оперативное запоминающее устройство 6, винчестер 7, дисплей 8, принтер 9, клавиатура 10, реализованные на микропроцессорной базе видеокарты 11 эталонных объектов, цифровой дискриминатор сравнения объектов 12.

Процедура автоматической идентификации образов объектов состоит в следующем. Текущие изображения объектов, подлежащие идентификации, перекачиваются из «Интернета» или флеш-карты в ПЭВМ. Оператор осуществляет предварительную сортировку отображаемых на дисплее снимков визуально.

На фиг.1а представлено исходное изображение поэт А.А.Блок в 1920 г. В качестве эталонного использовано изображение А.А.Блока - студента Петербургского университета 1902 г., фиг.1б. Специализированной программой обработки изображений выделяют контурный рисунок объекта (контурный рисунок лица А.А.Блока)

Результат программной обработки иллюстрируется фиг.2. Затем вычисляют площадь поверхности рельефа внутри выделенного контура, для чего записывают на винчестер специализированную программу, текст которой приведен выше.

Обрабатываемый участок может иметь произвольную конфигурацию. Для его обработки следует выполнить выделение границы участка «залив» окрестности белым цветом (максимум яркости в шкале квантования принтера).

Для вычисления площади поверхности участка просматривается весь контур последовательно, шаблоном, из четырех соседних точек, образующих квадрат. Шаблон сканирует контур слева-направо, сверху-вниз, а для каждого элемента изображения вычисляется элементарная площадь, затем все элементарные площади суммируются. Для повышения точности расчета площади поверхности рельефа вычисления осуществляют двумя методами триангуляции, а суммарную площадь рельефа находят как среднегеометрическое S Σ = S 1 S 2 . Поскольку исходное и эталонное изображения приводятся к одному масштабу, то площадь рельефа измеряют в условных единицах: разрешение Δx=Δy=1, а единица глубины - шаг квантования шкалы яркости.

Расчетные результаты параметров сигнала изображения составили:

RGB - изображение

Площадь рельефа Sr = 434346.935

Площадь проекции Sp = 59700.000

Максимальная интенсивность Imax = 255

Минимальная интенсивность Imin = 40

Средняя интенсивность Isr = 158.54935

Обработано точек count = 60200

Blue - изображение

Площадь рельефа Sr = 459476.328

Площадь проекции Sp = 59700.000

Максимальная интенсивность Imax = 255

Минимальная интенсивность Imin = 25

Средняя интенсивность Isr = 140.05271

Обработано точек count = 60200

Green - изображение

Площадь рельефа Sr = 415642.552

Площадь проекции Sp = 59700.000

Максимальная интенсивность Imax = 255

Минимальная интенсивность Imin = 48

Средняя интенсивность Isr = 161.33251

Обработано точек count = 60200

Red - изображение

Площадь рельефа Sr = 440343.389

Площадь проекции Sp = 59700.000

Максимальная интенсивность Imax = 255

Минимальная интенсивность Imin = 34

Средняя интенсивность Isr = 148.34257

Обработано точек count = 60200

Аналогичные вычисления параметров сигнала изображения эталона RGB изображения: Sp = 418218.659.

С возрастом (из-за морщин) площадь рельефа поверхности лица увеличивается, поэтому площадь эталона меньше площади анализируемого объекта. Критерий расхождения образа объекта с эталоном в суммарном канале RGB составил:

| S э т а п S о б | S э т а п 100 % = | 418218 434346 | 418218 100 % = 3,9 %

Поскольку в ортогональных каналах сигналы считаются статистически независимыми, результирующая достоверность идентификации образа объекта по трем ортогональным каналам (по вероятности) составит:

PΣ≈(1-0,961)3≈0,99996, т.е. расхождение в пятом знаке.

Эффективность способа определяется такими показателями, как оперативность, достоверность, документальность, воспроизводимость, точность.

Способ реализован на существующей технической базе. ПЭВМ типа «Intel», сканер типа «Panasonic» разрешением 1024 точки на дюйм, видеокарты типа «NVidia», имеющих в своем составе графический чип GTX 250 с 512 арифметико-логическими устройствами, а также оперативную память 2 Гбайт.

Способ автоматической идентификации объектов на изображениях включает сканирование исходного фотоизображения с высоким линейным и амплитудным разрешением, приведение матрицы полученных отсчетов I(х, y) к масштабу эталонной матрицы путем нормирования пикселов масштабным коэффициентом , разложение полученного изображения на три двумерные матрицы в стандартной палитре цветов RGB, выделение методами пространственного дифференцирования контурных рисунков объекта в каждом из каналов RGB, аппроксимацию поверхности рельефов объекта внутри выделенных контуров мозаикой треугольников в окнах |2×2| элементов, расчет по формуле Герона площадей мозаики треугольников в каждом из каналов, сравнение полученных площадей с их значениями для эталонных объектов в каждом из каналов и их суммой, идентификацию образа объекта по совпадению площадей поверхности рельефов объекта (Sоб) и эталона (Sэтал) с установленной достоверностью:
,
где: Imax шкалы - максимальная величина шкалы параметра используемого сканера;
Imax - максимальная амплитуда пиксела сигнала в матрице;
I - текущее значение пиксела сигнала в матрице.



 

Похожие патенты:

Изобретение относится к преобразованию цветового пространства. За исходное цветовое пространство могут использоваться известные цветовые системы CIE 1931 г.

Изобретение относится к автоматике и вычислительной технике и может быть использовано для распознавания изображений лиц в системах машинного зрения, биометрических системах контроля доступа и видеонаблюдений, интерактивных системах человек-компьютер и других системах.

Изобретение относится к вычислительной технике и может быть применено в автоматических дактилоскопических идентификационных системах на базе специализированных электронных вычислительных машин.

Изобретение относится к способам оптического распознавания символов и может быть использовано для обработки выходных данных из системы оптического распознавания изображений (OCR), где выходные данные включают изображения дважды отпечатанных символов.

Изобретение относится к способам распознавания объектов в системах машинного зрения, телевизионных системах наблюдения, информационно-управляющих системах робототехнических комплексов.
Изобретение относится к технике защиты врачебной тайны при ведении обезличенных электронных историй болезни. .

Изобретение относится к области гидрологии и связано с определением толщины ледяного покрова замерзающих акваторий по данным дистанционных средств измерений, устанавливаемых на метеорологических искусственных спутниках Земли.

Изобретение относится к автоматике и цифровой вычислительной технике. .

Изобретение относится к способу и устройству для считывания физических характеристик объекта. Техническим результатом является обеспечение позиционирования интересующей области, откуда считывается физическая характеристика объекта при регистрации выходных данных объекта для упорядочивания и стандартизации. Способ считывания физической характеристики объекта включает: шаг (240, 315, 405) получения первого изображения по меньшей мере части объекта с первым разрешением; шаг (245, 320, 415, 420) определения положения области объекта, подлежащей обработке, на основании первого изображения; шаг (255, 330, 430) получения второго изображения области объекта, подлежащей обработке, со вторым разрешением, большим, чем первое разрешение; и шаг (260, 335, 440) определения физической характеристики на основании второго изображения, причем шаг (245, 320, 415, 420) определения положения области объекта, подлежащей обработке, содержит: шаг определения по меньшей мере одного положения нанесенной маркировки, шаг получения изображения по меньшей мере одной указанной маркировки и шаг считывания информации, представленной этой маркировкой и представляющей положение области, подлежащей обработке. 2 н. и 15 з.п. ф-лы, 6 ил.

Изобретение относится к способам обработки цифровых изображений. Техническим результатом является обеспечение возможности сопоставления дескрипторов применительно к задаче поиска дубликатов изображений. Предложено устройство поиска дубликатов изображений. Устройство содержит блоки предобработки первого и второго изображений, блоки регистрации первого и второго изображений, блоки преобразования первого и второго изображений в цветовое пространство YIQ, блоки выделения синфазной составляющей первого и второго изображений, блоки формирования изображений в результате вращения первого и второго изображений, блоки формирования изображений при изменении угла наклона первого и второго изображений, блоки хранения моделированных изображений для первого и второго изображений, блок применения метода SIFT, блок вычисления количества одинаковых дескрипторов, блок хранения найденной пары дубликатов. 5 ил.

Изобретение относится к способу идентификации печати на цифровом изображении. Техническим результатом является снижение временных затрат на распознавание изображения печати. Способ идентификации печати на цифровом изображении заключается в том, что предварительно приводят изображение объекта, вводимого в компьютер, к нормальному, стандартному для данного способа виду - изменению масштаба, центрированию, причем производят поиск местоположения изображения объекта, соответствующего оттиску печати, а затем приводят изображение объекта к нормальному виду, после чего переводят значения яркостей пикселей изображения из декартовой в полярную систему координат с внесением избыточности, вычисляют границы резких переходов в значениях яркостей пикселей изображения, формируют характеристический вектор признаков, устанавливают идентичность изображения объекта одной из эталонных печатей путем распознавания на основе метода опорных векторов. 4 ил.

Изобретение относится к способу идентификации и верификации изображений. Техническим результатом является обеспечение возможности автоматического сопоставления предъявляемого изображения с эталонным. Способ идентификации и верификации изображения характеризуется формированием электронного образа из предъявленного системе изображения с использованием восприятия яркостного поля предъявленного изображения, преобразованием яркостного поля в цифровые коды, соответствующие используемым градациям яркости каждого микроэлемента изображения, и последующим его кадрированием с запоминанием в базе данных, причем перед сопоставлением приводят электронный образ предъявленного изображения к масштабу эталонного электронного образа, из них выделяют информационные части, отбрасывая вокруг них фоновые части, имеющие одинаковые или близкие коды яркости сенселей, для каждой информационной части для всех сенселей определяют максимальное и минимальное значения этих кодов, складывают их и делят пополам, определяя тем самым код средней яркости, вычисляют раздельно числа сенселей, имеющих код яркости выше кода средней яркости или равный ему, и числа сенселей, имеющих код яркости ниже кода средней яркости, а затем полученные числа для эталонного и предъявленного электронных образов попарно сопоставляют с учетом заданного допуска, контроль имеет положительный исход, если обе пары укладываются в допуск, в противном случае исход контроля отрицательный. 6 з.п. ф-лы, 1 ил.

Изобретения относятся к способу и системе оптического распознавания символов. Техническим результатом является повышение эффективности распознавания символов посредством сокращения времени обработки документов. На первой стадии обработки каждое изображение символа связывается со множеством потенциальных графем. На второй стадии обработки каждое изображение символа оценивается относительно множества потенциальных графем, обнаруженного для изображения символа на первой стадии. В процессе обработки потенциальных графем представленные в настоящем документе способы и системы наблюдают за прогрессом обнаружения подходящей графемы и, если наблюдается недостаточный прогресс, прерывают обработку потенциальных графем и распознают изображение символа как область, содержащую несимвольный элемент, в изображении отсканированного документа или другом содержащем текст изображении. Далее осуществляют оценку каждой последовательной группы из одной или более потенциальных графем относительно возможного изображения символа. 3 н. и 16 з.п. ф-лы, 55 ил.

Изобретение относится к оптическому распознаванию символов. Техническим результатом является оптимизация оптического распознавания символов за счет использования леса решений. Предложенная система включает в себя команды в машинном коде при их исполнении процессором, управляющие системой оптического распознавания символов для обработки содержащего текст отсканированного изображения документа путем выполнения идентификации изображений символов в содержащем текст отсканированном изображении документа. Причем идентификация выполняется для каждой страницы документа и для каждого изображения символа на странице. Выполняют идентификацию набора подходящих структур данных эталона для изображения символа с использованием леса решений. Используют подходящие структуры данных эталона для определения набора подходящих графем и используют идентифицированный набор подходящих графем для выбора кода символа, который соответствует изображению символа. Подготавливают обработанный документ, содержащий коды символов, которые соответствуют изображениям символов из отсканированного изображения документа, и сохраняют обработанный документ в одном или более запоминающих устройств и модулей памяти. 3 н. и 17 з.п. ф-лы, 66 ил.

Изобретение относится к лазерным локационным системам и может быть использовано для распознавания замаскированных малозаметных наземных объектов (MHO) с борта пилотируемого или беспилотного летательного аппарата (ЛА). Устройство содержит лазерный локатор 1, включающий оптическую систему 2, соединенную через лазерное приемопередающее устройство 3 с блоком управления 4 и с устройством 5 цифровой обработки отраженных лазерных сигналов. Устройство 5 выполнено блочной конструкции на перепрограммируемых логических интегральных схемах (ПЛИС) с параллельной обработкой лазерных 3-D сигналов. Принцип распознавания MHO в блоке 5 основан на приеме отраженных от подстилающей поверхности лазерных ответных сигналов, формирование на их основе лазерных 3-D портретов, сравнении полученных портретов с банком данных 3-D эталонов (лазерных портретов типовых MHO) и принятии решения об обнаружении потенциально опасного MHO на основе совпадения портретов с эталонами и обнаружения у MHO светоотражающей оптики и/или средств активного противодействия ЛА. Технический результат - повышение вероятности распознавания MHO, покрытых маскировочной сеткой, а также спрятанных под кронами деревьев в лесном массиве. 1 ил.
Наверх