Искажение символов для символьно-графического обратного теста тьюринга



Владельцы патента RU 2608262:

Вязников Максим Николаевич (RU)

Изобретение относится к средствам графического искажения отдельных символов при помощи интерполяции (морфинга) шрифтов между собой. Технический результат заключается в обеспечении возможности создания изображений для полностью автоматизированного теста Тьюринга (САРТСНА), при повышении сложности автоматического распознавания символов данных изображений с помощью компьютерных программ. Сущность изобретения заключается в том, чтобы загрузить два или более шрифтов, с помощью интерполяции (морфинга) получить одно или несколько промежуточных состояний между ними, и использовать результаты для генерации изображений для графического обратного текста Тьюринга. 2 з.п. ф-лы, 1 табл.

 

Область техники

Изобретение относится к методу графического искажения отдельных символов при помощи морфинга (трансформации) шрифтов между собой, используемых для вывода текста.

Полностью автоматизированный символьно-графический обратный тест Тьюринга (САРТСНА) предназначен для различения компьютером и людей и строится на предложении пользователям изображения набора символов (обычно, латинского алфавита или арабских цифр), начертанных с искажениями. Суть такого теста заключается в том, чтобы создание программ автоматического прохождения тестов Тьюринга (ПАПАТТ) таких тестов было максимально сложно, либо невозможно. Поэтому разработчики САРТСНА зачастую предлагают самые разнообразные способы исказить выводимый набор символов. Тем не менее у такого метода есть и обратная сторона, которая заключается в огромной нагрузке на человека при прохождении таких тестов.

Уровень техники

Среди аналогов изобретения можно выделить такие библиотеки, как «Cryptograph?» (http://www.captcha.fr/) и «Securimage» (http://www.phpcaptcha.org/). Они предоставляют широкие возможности генерации изображений для САРТСНА с искаженными символами. Сравнение их с изобретением приведено в таблице 1.

Таблица 1.
Название, описание Использование произвольного набора различных шрифтов Создание новых шрифтов на основе имеющихся
«Cryptograph?», http://www.captcha.fr/index.php ?page=34 Да Нет (У
«Securimage», https://github.com/dapphp/secur image/blob/master/securimage.php* (*к сожалению, описание возможностей «Securimage» доступно лишь в виде исходного кода) Да Нет
Изобретение Да Да

В них применяются такие способы искажений символов, как поворот, изменение размеров и смещения относительно друг друга, масштабирование и т.д. Причем наиболее эффективными из них являются нелинейные, т.е. имеющие переменные во времени параметры, заданные интервалами возможных значений (например, угол поворота от 10 до 30 градусов), т.к. линейные искажения, т.е. не меняющие свои параметры от изображения к изображению, легче компенсировать при написании ПАПАТТ. Так же стоит выделить применение специфических шрифтов для вывода символов, т.к. изобретение тесно связано с этим видом усложнения автоматического прохождения САРТСНА. Оно интересно тем, что до сих пор применялось на ограниченном наборе доступных шрифтов (в большинстве случаев используется 1 нестандартный шрифт), а значит, давало авторам ПАПАТТ возможность собрать используемые шрифты из доступных источников, либо обучить свои программы (например, строящиеся на нейронных сетях) с высокой степенью вероятности распознавать изображенный текст.

Раскрытие изобретения

Программным результатом изобретения является возможность создания таких алгоритмов генерации изображений для САРТСНА, символы на которых будут максимально понятны человеку, но при этом сложны для автоматического распознавания с помощью компьютерных программ. Утверждение строится на предположении о том, что если взять 2 понятных человеку изображения знакомых ему символов текста и найти среднее между ними с помощью некоторых алгоритмов интерполяции (морфинга), то полученное изображение будет распознано человеком, как тот же самый символ (1). При этом, программы автоматического распознавания изображений для САРТСНА (например, на основе нейронных сетей) оперируют конечными алфавитами, состоящими из заранее определенных изображений символов. Поэтому с точки зрения их разработки, изобретение является нелинейным способом искажения набора символов. А значит, его использование окажет существенное влияние на сложность разработки программ автоматического распознавания изображений для САРТСНА и эффективность их работы, а учитывая утверждение (1), в случае соблюдения множества других факторов, не будет оказывать существенного влияния на распознание символов человеком. Другими словами, человеку пройти такой САРТСНА становится легче, а специально созданным для этого программам автоматического распознавания гораздо сложнее, либо невозможно.

Изобретение включает в себя способ графического искажения множества символов, которые система изображает для проведения САРТСНА, и машинно-ориентированную систему, его реализующую. Последовательность действий системы, изложенной в изобретении, складывается из следующих этапов:

1) Использование как минимум 2-х шрифтов для морфинга, и содержащих изображения как минимум для нужного множества символов. Например, можно взять 2 шрифта: «Times New Roman Regular» и «DeJaVu Extralight».

2) Проведение процедуры морфинга для каждой пары изображений одного и того же символа из разных шрифтов. Например, если имеется 2 шрифта и 10 символов, то для каждого из этих 10 символов будем брать по изображению из каждого шрифта для нахождения одного или нескольких промежуточных состояний между ними с помощью интерполяции их точек (формула п.1); тогда сгруппированные соответствующим образом, эти полученные множества изображений символов будут являться промежуточными состояниями изначально взятых шрифтов, и их можно будет использовать для создания новых шрифтов (формула п.2).

Если это необходимо, возможно создание и использование ключевых точек на загруженных шрифтах для оптимизации процедуры морфинга. Ключевыми точками можно отметить, например, углы на растровых шрифтах, если в нашем распоряжении нет векторных.

Кроме того, возможно использование вместо 2-х шрифтов, одного шрифта и геометрической фигуры для проведения процедуры морфинга между ними. В этом случае, утверждение (1) теряет силу, т.к. символы взятого шрифта будут терять свои очертания в процессе продвижения морфинга от шрифта к геометрической фигуре. Однако в определенной мере такая процедура тоже допускается и также является искажением символов.

3) Используем полученное множество новых изображений каждого символа (один или несколько новых шрифтов) для изображений нужных нам символов на изображениях САРТСНА.

Таким образом, система генерирует изображения для САРТСНА и новые шрифты на основании используемых. Так же не исключается возможность использования созданных шрифтов для генерации на их основе других, т.к. это еще больше повышает сложность разработки ПАПАТТ.

1. Способ искажения символов, включающий изменение графического отображения символов за счет изменения используемого шрифта, отличающийся тем, что при его реализации:

(а) используют как минимум два шрифта, содержащих изображения как минимум для нужного множества символов;

(б) для каждого символа проводят процедуру создания промежуточных изображений заранее заданного числа промежуточных состояний путем интерполяции (морфинга) каждого изображения символа из одного шрифта в соответствующее изображение символа из другого шрифта;

(в) используют созданные промежуточные изображения для графического изображения символов.

2. Способ по п.1, в котором этап (б) содержит этап, на котором осуществляется сохранение полученного множества созданных промежуточных изображений в виде одного или нескольких новых шрифтов, характеризующийся тем, что сохраненные шрифты используются на этапе (а).

3. Способ по п.1, содержащий использование хотя бы одного шрифта, отличающийся использованием хотя бы одной геометрической фигуры для интерполяции (морфинга) каждого символа из шрифта в геометрическую фигуру или наоборот.



 

Похожие патенты:

Изобретение относится к области стеганографии и направлено на организацию канала для скрытой передачи дополнительной информации в видеоизображении. Техническим результатом является обеспечение минимизации искажений видеоизображения, в которое осуществляется внедрение, при обеспечении стегостойкости системы передачи информации.

Изобретение относится к медицине, радиологии и может использоваться для диагностики и хирургического лечения функциональных расстройств и новообразований головного мозга.

Изобретения относятся к области обработки цифровых данных на основе использования сканирующих устройств и может найти применение для лазерных сканов (ЛС) в системах позиционирования и навигации автономных машин погрузчиков.

Изобретение относится к области передачи и приема стереоскопической информации. Технический результат - обеспечение ффективной передачи с высокой скоростью информации стереоскопического изображения между электронными устройствами.

Изобретение относится к области масштабирования отображаемого изображения. Технический результат - обеспечение улучшенного отображения изображения в поле просмотра за счет масштабирования изображения.

Изобретение относится к технологиям автоматического тестирования для цифровых систем отображения. Техническим результатом является осуществление автоматизированного тестирования цифровых систем отображения.

Изобретение относится к области мультимедиа, обработке или генерации данных изображения. Техническим результатом является автоматизация процесса конвертации изображения.

Изобретение относится к медицине, в частности к хирургической стоматологии, и может быть использован при планировании установки дентальных имплантатов. Пациенту проводят компьютерную томографию.

Изобретение относится к измерительной технике, основанной на видеоизмерении. Технический результат заключается в уменьшении погрешности в результатах видеоизмерения.

Изобретение относится к отображению многомерного изображения и размещенной в нем аннотации. Техническим результатом является обеспечение возможности пользователю переключаться с отображения поперечного сечения трехмерного изображения, которое лишь частично демонстрирует представляющую интерес аннотацию и связанную с ней область, на отображение поперечного сечения, которое полностью демонстрирует представляющую интерес аннотацию и упомянутую область.

Группа изобретений относится к области медицины, а именно к онкологии. Для интеллектуального объединения результатов медицинских исследований используют способ и систему, содержащую модуль извлечения контекстной информации из изображения интересующей области, модуль выбора признаков, формирующий текущий вектор признаков, подсистему связывания, вычисляющую показатель подобия и подсистему представления, обеспечивающую отображение представляемых данных на основе показателя подобия.

Изобретение относится к технологиям обработки электронных документов. Техническим результатом является обеспечение классификации изображений документов на основе функции классификации.

Группа изобретений относится к технологиям распознавания символов, соответствующих изображениям символов, полученных из изображения отсканированного документа или другого изображения, содержащего текст.

Группа изобретений относится к технологиям оптического распознавания символов (OCR) кадров видеоматериалов с целью обнаружения в них текстов на естественных языках.

Изобретение относится к области поиска изображений. Технический результат - обеспечение повышения эффективности процесса поиска изображений, посредством использования композитного параметра визуальных характеристик.

Изобретение относится к средствам распознавания механического воздействия с использованием электронных средств. Техническим результатом является повышение безопасности при идентификации пользователя.

Изобретение относится к оптическому распознаванию символов. Техническим результатом является оптимизация оптического распознавания символов за счет использования леса решений.

Группа изобретений относится к области вычислительной техники, может быть использована в специализированных устройствах аппаратной поддержки типовых операций задач распознавания образов, в аппаратной поддержке в высокопроизводительных системах и устройствах параллельной обработки символьной информации, в аппаратных средствах поддержки вывода в информационно-поисковых и экспертных системах, осуществляющих обработку строк (строковых данных), и позволяет реализовать операции поиска по образцу и модификации строки на основе ассоциативной памяти.

Изобретение относится к области распознавания образов. Технический результат заключается в повышении точности определения сравниваемых изображений.

Способ определения скорости движущихся объектов методом пассивной локации включает получение изображения самолета при помощи телевизионной системы с формированием видеокадров перемещения движущегося объекта в поле зрения оптической системы и их оцифровкой, определение величины перемещения изображения движущегося объекта на фотоприемной матрице по перемещению центра тяжести изображения.

Изобретение относится к области разблокирования экрана. Технический результат – повышение точности операции разблокирования с использованием пароля нефиксированной длины и улучшение безопасности терминала.
Наверх