Способ классификации изображений

Авторы патента:

G06K9/6267 - Способы и устройства для считывания и распознавания напечатанных или написанных знаков или распознавания образов, например отпечатков пальцев (обработка или анализ траекторий ядерных частиц G01T 5/02; проверка рисунков на бумажных деньгах или подобных ценных бумагах G07D 7/20; распознавание речи G10L 15/00)

G06K9/62 - способы и устройства для распознавания с использованием электронных средств (самообучающиеся машины G06F 15/18; цифровая корреляция G06F 17/15; аналоговая корреляция G06G 7/19)

Владельцы патента RU 2756778:

Федеральное государственное бюджетное учреждение науки Институт проблем машиноведения Российской академии наук (ИПМаш РАН) (RU)

Изобретение относится к области информационных технологий, в частности к способу классификации изображений. Техническим результатом является высокая скорость классификации изображений без ухудшения точности. Способ классификации изображений заключается в том, что после формирования строк атрибутов эталонов для каждого класса объекта классификации и аналогичных атрибутов классифицируемых изображений формируют соответствующие атрибутам эталонов и классифицируемых изображений строки вероятностей, умноженные на коэффициенты значимости, выбранные оператором, а решающее правило определения класса для объекта классификации формируют в виде вычисления минимума суммы квадратов разностей между значениями элементов строк вероятностей эталонов и классифицируемых изображений, и относят классифицируемое изображение к классу эталона, соответствующего этой минимальной сумме. 1 ил.

Предлагаемый способ классификации изображений относится к области вычислительной техники и робототехники, и может быть использован в современных информационных системах и технологиях, моделирующих или поддерживающих процесс интеллектуального анализа данных, в том числе, в процессах распознавания изображений, ориентированных на классификацию объектов, что до сих пор остается сложной теоретической и технической задачей.

Операция классификации представляет собой процесс отнесения классифицируемого объекта к определенному классу на основе нахождения у объекта заданного формализованного признака, присутствующего в изображениях и сигналах. Реализация соответствующих способов распознавания требует предварительного статистического анализа свойств объектов в предполагаемых условиях наблюдения и формирования эталонных описаний распознаваемых классов объектов, специфических для каждой прикладной задачи распознавания.

При этом в практических задачах распознавания имеет место так называемая проблема априорной неопределенности, состоящая в том, что объекты любых классов представлены неограниченным множеством реализаций, в которых ни одно из микроструктурных свойств анализируемого сигнала не оказывается достаточно достоверным признаком для выделения объекта и для его идентификации. Применительно к анализу изображений такие условия возникают по следующим причинам:

- анализируемые объекты приходится различать не по интенсивности сигнала, а по сложным геометрическим и топологическим параметрам типа формы;

- присутствие большого структурного разнообразия анализируемых объектов, например, при распознавании символов - это различные алфавиты и шрифты; при роботизации производства - это широкая номенклатура деталей и операций с ними; в системах наблюдения и контроля обстановки - это всевозможные типы техники, людей, промышленных объектов и коммуникаций;

- наличие неограниченной изменчивости условий наблюдения объектов по масштабам, ракурсам, подстилающим поверхностям, условиям освещенности.

Перечисленные условия априорной неопределенности ограничивают применение распознающих систем со специфическими априорными эталонами объектов, для преодоления чего развивают так называемые структурно-лингвистические методы распознавания.

Например, известен «Способ классификации подстилающей поверхности по многоканальному изображению» (патент РФ №2314565, G06K 9/62, БИ №1, 10.01.2008, Миронов М.Н.), заключающийся в формировании строк атрибутов выбранного типа объекта классификации и соответствующей строки вероятностей атрибутов классов выбранного типа объекта классификации с последующим отнесением классифицируемого изображения к тому или иному классу выбранного типа изображения путем геометрической коррекции и представления компонентов изображений в единой системе пространственных координат, преобразования плотности вероятности значений яркости к гауссовскому виду тех компонентов изображений, у которых она отличается от гауссовской, определением номера класса каждого элемента изображения, а при формировании компонентных изображений для каждого элемента компонентного изображения, определением апостериорных вероятностей принадлежности данного элемента компонентного изображения к k-му классу (k=1, 2, …, К). Затем для каждого элемента изображения определяют апостериорные вероятности принадлежности данного элемента изображения к k-му классу путем сложения соответствующих апостериорных вероятностей компонентных изображений и их нормировки, определяют номер класса подстилающей поверхности (ПП) каждого элемента многоканального изображения по максимальному значению апостериорной вероятности принадлежности данного элемента многоканального изображения к k-му классу.

Недостатками данного способа являются его высокая трудоемкость и зависимость точности классификации от шага разбиения изображения на компоненты.

Известен также «Способ и устройство для распознавания изображений объектов» (патент РФ №2361273, G06K 9/62, БИ №26, 20.09.2008, Коростелев С.И. и др.), заключающийся в следующей последовательности действий:

- формирование набора атрибутов выбранного типа эталонного объекта классификации в виде ряда плоских изображений объекта при различных ракурсах;

- формирование дополнительных атрибутов класса выбранного типа объекта классификации (например, размер и др.);

- поворот и формирование плоских изображений классифицируемого объекта;

- выявление дополнительных атрибутов классифицируемого объекта;

- отнесение классифицируемого изображения к тому или иному классу выбранного типа изображения путем поиска совпадения плоских изображений классифицируемого объекта с плоскими изображениями эталонного объекта, а также с дополнительными атрибутами класса эталонного изображения.

Недостатками данного способа являются зависимость точности классификации от числа поворотов изображений и сложность получения оценки совпадения изображений, от которой зависит корректность классификации.

Наиболее близким к заявляемому техническому решению, выбранному в качестве прототипа, является способ классификации, описанный в статье «Алгоритм построения деревьев решений при наличии противоречий в данных», В.Н. Вагин, А.В. Крупецков, М.В. Фомина // Труды семнадцатой национальной конференции по искусственному интеллекту с международным участием КИИ-2019, Ульяновск, 21-25 октября 2019 г., Т. 2, с. 182-191.

Способ заключается в следующей последовательности действий:

- формирование строк атрибутов эталонных изображений для каждого класса из выбранного типа объекта классификации;

- формирование строк атрибутов классифицируемого изображения;

- формирование решающего правила выделения класса из выбранного типа объекта;

- формирование обучающей выборки классов изображений;

- настройка (обучение) системы распознавания класса изображения путем использования сформированного решающего правила выделения класса из выбранного типа объекта;

- отнесение классифицируемого изображения к тому или иному классу выбранного типа изображения.

Недостатками данного способа являются его сложность, зависимость точности классификации от корректности формирования обучающей выборки и высокая длительность классификации, связанная с затратами времени на обучение персонала.

Задачей изобретения является упрощение способа классификации изображений и устранение влияния на точность классификации от корректности формирования обучающей выборки за счет исключения операции обучения.

Технический результат от решения поставленной задачи состоит в достижении высокой скорости классификации без ухудшения точности.

Поставленная задача решается за счет того, что в предлагаемом способе, как и в способе принятом за прототип, формируют строки атрибутов эталонов для каждого класса объекта классификации и аналогичных атрибутов классифицируемых изображений. После чего относят классифицируемые изображения к тому или иному классу эталона изображений путем применения сформированного решающего правила. В отличие от прототипа после формирования строк атрибутов эталонов для каждого класса объекта классификации и аналогичных атрибутов классифицируемых изображений формируют соответствующие атрибутам эталонов и классифицируемых изображений строки вероятностей, умноженные на коэффициенты значимости, выбранные оператором, а решающее правило определения класса эталона для объекта классификации формируют в виде определения суммы квадратов разностей элементов строк вероятностей, умноженных на коэффициенты значимости эталона и классифицируемого изображения для первого класса эталона, аналогично проводят определение сумм квадратов разностей элементов строк вероятностей, умноженных на коэффициенты значимости эталона и классифицируемого изображения для второго класса эталона и всех последующих классов эталона, далее определяют минимальную из вышеуказанных сумм и относят классифицируемое изображение к классу эталона, соответствующего этой минимальной сумме.

Сущность предлагаемого способа поясняется чертежом, где на фиг. 1 изображена блок-схема устройства.

Блок-схема содержит блок 1 управления, блок 2, содержащий базу данных эталонов, блок 3 технического зрения, блок 4 формирования строки атрибутов эталонов, блок 5 формирования строки атрибутов классифицируемых изображений, блок 6 формирования строки вероятностей атрибутов эталонов, блок 7 формирования строки вероятностей атрибутов классифицируемых изображений, блок 8 выбора строк эталонов, блок 9 выбора строк классифицируемых изображений, блок 10, содержащий базу данных коэффициентов значимости, блок 11 умножения на коэффициенты значимости атрибутов эталонов, блок 12 умножения на коэффициенты значимости атрибутов классифицируемых изображений, блок 13 вычисления квадратов разностей значений элементов строк вероятностей атрибутов эталонов и классифицируемых изображений, блок 14 вычисления суммы квадратов разностей значений элементов строк вероятностей атрибутов эталонов и классифицируемых изображений, блок 15, содержащий базу данных сумм квадратов разностей значений элементов строк вероятностей атрибутов эталонов и классифицируемых изображений, блок 16 вычисления минимальной суммы квадратов разностей значений элементов строк вероятностей атрибутов эталонов и классифицируемых изображений и блок 17 обозначения класса изображения, соответствующего минимальной сумме.

Выходы блока 1 связаны со входами блоков 2, 3, 8, 9, 10, 15 и 16. Первый выход блока 2 связан с входом блока 4, второй - с входом блока 6, а первый выход блока 3 связан с входом блока 5, второй - с входом блока 7. Выход блока 4 связан с входом блока 6, выход которого связан с входом блока 8. Выход блока 5 связан с входом блока 7, выход которого связан с входом блока 9. Выход блока 8 связан с входом блока 11, другой вход которого связан с выходом блока 10. Выход блока 9 связан с входом блока 12, другой вход которого связан с другим выходом блока 10. Выход блока 11 связан с одним входом блока 13, другой вход которого связан с выходом блока 12. Выход блока 13 связан с входом блока 14, а его выход с входом блока 15, другой вход которого связан с другим выходом блока 1. Выход блока 15 связан с входом блока 16, другой вход которого связан с другим выходом блока 1. Выход блока 16 связан с входом блока 17, а его выход с блоком 1.

Описание способа

В соответствии с приведенной на чертеже схемой блок 1 управления формирует команды для блока 2 на выбор первого класса эталона классифицируемого изображения и для блока 3 на выбор атрибутов сформированного в системе технического зрения изображения с атрибутами. Блок 2 передает атрибуты первого эталона в блок 4, который формирует строку эталонных атрибутов, затем передает вероятности этих атрибутов в блок 6, который формирует строку вероятностей, соответствующую строке атрибутов. Блок 3 передает атрибуты классифицируемого изображения в блок 5, который формирует строку атрибутов этого изображения той же размерности, что и у эталонной строки, затем вероятности этих атрибутов поступают в блок 7, который формирует строку вероятностей, соответствующую строке атрибутов. Блок 8 по команде из блока 1 управления выбирает из блока 6 строку вероятностей и передает ее в блок 11. Блок 9 по команде блока 1 управления выбирает из блока 7 строку вероятностей и передает ее в блок 12. Блок 10 по команде блока 1 управления передает в блоки 11 и 12 коэффициенты значимости атрибутов, где они умножаются на соответствующие вероятности. Блоки 11 и 12 передают в блок 13 строки вероятностей для вычисления квадратов разностей элементов строк эталона и классифицируемого изображения, которые из блока 13 поступают в блок 14, для определения суммы квадратов разностей для первого класса эталона. Эту сумму передают из блока 14 в блок 15 на хранение.

Затем блок 1 управления формирует команду для блока 2 на выбор второго класса эталона классифицируемого изображения и далее аналогично предыдущему вычисляют суммы квадратов разностей для второго класса эталона, которую так же передают из блока 14 в блок 15 на хранение.

Затем блок 1 управления формирует команду для блока 2 на выбор следующего класса эталона классифицируемого изображения и далее аналогично предыдущему вычисляют суммы квадратов разностей для этого класса эталона, которую так же передают из блока 14 в блок 15 на хранение.

Описанные действия продолжают до момента пока не будут исчерпаны все классы эталона. При этом в блоке 15 будут содержаться суммы квадратов разностей для всех классов эталона. После чего блок 1 управления формирует для блока 16 команду на определение минимальной из всех хранящихся сумм, которую из блока 16 передают в блок 17 для определения номера класса эталона, к которому принадлежит классифицируемое изображение. На этом процесс классификации данного изображения заканчивают. Блок 17 передает в блок 1 управления сигнал о готовности системы к классификации следующего изображения.

Способ классификации изображений, заключающийся в формировании строк атрибутов эталонов для каждого класса объекта классификации и аналогичных атрибутов классифицируемых изображений и отнесении классифицируемых изображений к тому или иному классу эталона изображений в соответствии со сформированным решающим правилом, отличающийся тем, что после формирования строк атрибутов эталонов для каждого класса объекта классификации и аналогичных атрибутов классифицируемых изображений формируют соответствующие атрибутам эталонов и классифицируемых изображений строки вероятностей, умноженные на коэффициенты значимости, выбранные оператором, а решающее правило определения класса эталона для объекта классификации формируют в виде определения суммы квадратов разностей элементов строк вероятностей, умноженных на коэффициенты значимости эталона и классифицируемого изображения для первого класса эталона, аналогично проводят определение сумм квадратов разностей элементов строк вероятностей, умноженных на коэффициенты значимости эталона и классифицируемого изображения для второго класса эталона и всех последующих классов эталона, далее определяют минимальную из вышеуказанных сумм и относят классифицируемое изображение к классу эталона, соответствующего этой минимальной сумме.

Изобретение относится к операционному управлению транспортным средством и вождению, включая автономное операционное управление транспортным средством и автономное вождение. Способ перемещения по транспортной сети транспортных средств содержит определение операционной информации транспортного средства для транспортного средства, включающее измерение глобальной позиции транспортного средства, причем транспортное средство представляет собой автономное транспортное средство или полуавтономное транспортное средство, затем определение оценки метрического местоположения транспортного средства с использованием операционной информации транспортного средства, включающее определение оценки метрического местоположения с использованием измеренной глобальной позиции в качестве входных данных в нелинейную функцию потерь с фильтрацией посредством фильтра Калмана для смягчения эффектов от немоделируемой ошибки датчиков.

Система и способы контроля поведения водителя для управления автопарком в парке транспортных средств с использованием устройства формирования изображения, обращенного к водителю // 2756256

Изобретение относится к контролю эксплуатации транспортных средств автопарка с использованием одного или нескольких устройств формирования изображения, обращенных к водителю и расположенных в транспортных средствах автопарка, для регистрации действий водителей автопарка и их пассажиров и передачи отчетов о контролируемых действиях в центральную систему управления автопарком.

Способ определения местонахождения лейкоцитов костного мозга на основе агрегации насыщения // 2755553

Изобретение относится к области обработки медицинских изображений. Техническим результатом является повышение точности определения местоположения лейкоцитов костного мозга на изображении.

Нейросетевой перенос выражения лица и позы головы с использованием скрытых дескрипторов позы // 2755396

Изобретение относится к компьютерным технологиям, а именно к компьютерной графике. Технический результат заключается в повышении точности синтезирования изображения.

Система и способ мониторинга рабочего участка // 2754704

Группа изобретений относится к системе и способу мониторинга рабочего участка. Система содержит компонент связи с устройством формирования изображения беспилотного летательного аппарата, контроллер, содержащий модуль сцены, модуль объектов и модуль карты.

Обнаружение присутствия и отсутствия // 2754392

Изобретение относится к способам обнаружения присутствия и отсутствия существа. Технический результат заключается в повышении качества обнаружения теплового объекта на местности.

Модуль видеоанализа и способ формирования материалов расследования поведения пользователя // 2753959

Изобретение относится к вычислительной технике. Технический результат заключается в уменьшении потерь материальных ценностей в розничной торговле.

Программа специфицирования, устройство обработки информации и способ специфицирования // 2751580

Изобретение относится к устройству обработки информации и способу специфицирования для создания финансовых отчетов. Технический результат - повышение точности для специфицирования (задания) элемента экземпляра, ассоциированного со значением элемента, включенным в таблицу завершенного ввода, когда таблица завершенного ввода преобразуется в экземпляр.

Универсальная система распределенного защищенного дистанционного голосования // 2751315

Изобретение относится к системам удаленного голосования. Технический результат - обеспечение возможности защищенного дистанционного голосования с помощью мобильных устройств.

Способ координационного совмещения систем координат, используемых устройством генерируемой компьютером реальности и устройством для передачи тактильных ощущений // 2751130

Изобретение относится к взаимодействию между устройствами для передачи тактильных ощущений и устройствами для создания генерируемой компьютером реальности, такими как устройства для создания смешанной реальности и устройства для создания виртуальной реальности. Технический результат заключается в обеспечении точности совмещения систем координат первого электронного устройства и второго электронного устройства.

Определение локализации для работы транспортного средства // 2756439