Способ определения принадлежности страниц документа к одному акту печати



Способ определения принадлежности страниц документа к одному акту печати
Способ определения принадлежности страниц документа к одному акту печати
Способ определения принадлежности страниц документа к одному акту печати
Способ определения принадлежности страниц документа к одному акту печати

Владельцы патента RU 2582065:

Ситников Борис Вадимович (RU)
Музалевский Федор Александрович (RU)
Свиридов Юрий Алексеевич (RU)

Изобретение относится к экспертизе документов. Технический результат - повышение достоверности определения принадлежности страниц документа к одному акту печати. Способ заключается в том, что осуществляют оцифровку документа путем сканирования текста документа, осуществляют предварительную обработку цифровой копии документа путем удаления полей и элементов, не содержащих текста, на каждой странице подсчитывают число пикселей, содержащих различные цвета текста, каждый из которых характеризуется соответствующими значениями цветовой модели. Определяют наиболее часто встречающиеся в документе цвета текста, усредняют значения цветовой модели для этих цветов для разных страниц документа и сравнивают полученные значения для разных страниц документа. При обнаружении различия в усредненных значениях цветовой модели и в значениях цветовой модели самого часто встречающегося цвета на разных страницах делают вывод о том, что эти страницы не принадлежат к одному акту печати. Предпочтительно использовать для подсчета числа пикселей различных цветов страницы документа, кроме первой. Чаще всего в качестве цветов текста используют различные тона серого цвета, а в качестве цветовой модели целесообразно использовать цветовую модель RGB. 4 табл., 3 з.п. ф-лы.

 

Изобретение относится к экспертизе документов и может быть использовано в судебно-экспертной, криминалистической и судебной практике при технической экспертизе определения принадлежности группы страниц с текстом к одному акту печати на монохромном лазерном принтере.

Терминология

Акт печати - последовательная печать страниц на принтере без смены типа бумаги и замены следообразующих конструктивных элементов принтера (тонер-картриджа, термоэлемента и т.д.).

Цветовая модель - представление какого-либо цвета в виде комбинации чисел.

RGB (red, green, blue) - цветовая модель, представляющая любой оттенок как комбинацию трех безразмерных величин - интенсивности соответственно красного, зеленого и синего цветов. Каждая величина может принимать значение от 0 до 255. Так, комбинация 0-0-0 представляет собой черный цвет, 255-255-255 - белый, 255-0-0 - красный. Данная система преставления цвета требует 24 бита данных на один цвет.

Пиксель (или растр) - неделимая элементарная частица цифрового изображения, характеризующаяся положением (координатами) в рисунке и RGB-составляющими.

Монохромный лазерный принтер - печатающее устройство, обладающее возможностью печати черно-белого текста посредством нанесения углеродного вещества на бумагу с последующим его прижиганием к ней.

Суть известных способов определения принадлежности страниц документа к одному акту печати сводится к визуальному поиску идентификационных признаков, отобразившихся на страницах документа, характеризующих печатающее устройство, которые в свою очередь классифицируются на признаки отдельных узлов электрофотографического печатающего устройства и признаки всего устройства в целом (напр. см. А.В. Пахомов, С.Б. Шашкин, А.В. Гортинский. ТЕХНИКО-КРИМИНАЛИСТИЧЕСКОЕ ИССЛЕДОВАНИЕ ДОКУМЕНТОВ, ИЗГОТОВЛЕННЫХ С ИСПОЛЬЗОВАНИЕМ ЗНАКОСИНТЕЗИРУЮЩИХ ПЕЧАТАЮЩИХ УСТРОЙСТВ. Учебное пособие. - М.: ЭКЦ при МВД России, 2004, С. 76-78).

Подобные методики имеют ряд недостатков. Во-первых, с повышением качества печати наличие признаков состояния печатающего устройства на странице стремится к нулю. Во-вторых, подобный поиск имеет субъективный характер, что, так или иначе, сказывается на результатах исследования.

Задачей изобретения является создание способа определения принадлежности страниц документа к одному акту печати, имеющего объективный характер.

Технический результат изобретения заключается в повышении достоверности определения принадлежности страниц документа к одному акту печати за счет использования объективно измеряемых параметров, характеризующих текст на различных страницах документа.

Поставленная задача решается способом определения принадлежности страниц документа к одному акту печати, заключающимся в том, что осуществляют оцифровку документа путем сканирования текста документа, осуществляют предварительную обработку цифровой копии документа путем удаления участков, не содержащих печатного текста, на каждой странице подсчитывают число пикселей, содержащих различные цвета текста, каждый из которых характеризуется соответствующими значениями цветовой модели, определяют наиболее часто встречающиеся в документе цвета текста, усредняют значения цветовой модели для этих цветов для разных страниц документа, сравнивают полученные значения для разных страниц документа и при обнаружении различия в усредненных значениях цветовой модели и в значениях цветовой модели самого часто встречающегося цвета на разных страницах делают вывод о том, что эти страницы не принадлежат к одному акту печати.

Предпочтительно использовать для подсчета числа пикселей различных цветов страницы документа, кроме первой.

Кроме того, чаще всего в качестве цветов текста используют различные тона серого цвета. При этом в качестве цветовой модели целесообразно использовать цветовую модель RGB.

Существуют различные варианты математического представления цветов, называемые цветовыми моделями. Один и тот же цвет может быть охарактеризован в координатах RGB (red, green, blue), HSV (hue, saturation, value), CMYK (cyan, magenta, yellow, key color) или иных. Между всеми этими моделями существует возможность преобразования путем применения простых математических действий (сложение, умножение, поиск максимума и минимума). Таким образом, суть математических представлений цвета не зависит от выбранной цветовой модели. В предложенном способе может использоваться любая цветовая модель, но наиболее предпочтительной является модель RGB как наиболее интуитивно понятная, распространенная и легко извлекаемая из стандартных цифровых изображений.

Суть изобретения состоит в определении статистики цветности документа. Иными словами - методика подразумевает сравнение фрагментов напечатанного текста по наиболее часто встречающимся оттенкам серого (или иного преобладающего) цвета. Способ позволяет находить невидимые глазу различия, а в силу своего инструментального характера имеет большую объективность.

Предлагаемый способ состоит из четырех этапов:

1) Оцифровка документа,

2) Предварительная обработка полученных изображений,

3) Расчет статистики цветности,

4) Интерпретация результатов.

На этапе оцифровки документа осуществляется сканирование фрагментов текста (страниц или их частей) документа с разрешением не менее 24 бит на пиксель и не менее 600 пикселей на дюйм. Формат выходного файла предпочтительнее bmp (bitmappicture) или png (portablenetworkgraphic), то есть не содержащие сжатия, и, как следствие, потери качества.

Под предварительной обработкой следует понимать удаление участков документа, не содержащих печатного текста: обрезание полей документа, а также удаление из него возможных артефактов, таких как штрихи и пятна красящих веществ, всевозможные цветные элементы. Предварительная обработка позволяет кратно ускорить последующие процессы расчета и интерпретации результатов.

Расчет статистки цветности подразумевает вычисление числа пикселей, содержащих тот или иной цвет текста (например, тон серого цвета). По вычисленным значениям для каждого документа выбираются наиболее часто встречающиеся цвета.

Каждый из цветов текста (в частности, тонов серого цвета) характеризуется определенными значениями цифровой модели, в частности модели RGB. Подсчитывают число пикселей, имеющих значения цветовой модели, характеризующие тот или иной цвет. Определение значений цветовых моделей заложено в программу любого графического редактора. Подсчет пикселей различных цветов может быть осуществлен с помощью соответствующей программы.

Методика имеет не определяющий, а исключающий характер. Это означает, что полное совпадение цветовых спектров страницы не гарантирует, что они принадлежат одному акту печати. В то же время расхождение спектров указывает на то, что анализируемые фрагменты принадлежат различным актам.

При анализе полученных результатов сравнивают значения цветовой модели - RGB-представления цветов (либо представление цветов в иной цветовой модели), преобладающих на страницах документа. В качестве примеров приведем сравнение трех страниц документа.

В первом примере имеет место явное различие тонов. Результаты расчета статистики приведены ниже в примере осуществления способа в таблице 1. Первый тон, второй тон и третий тон - это наиболее часто встречающиеся в документе цвета (оттенки серого цвета) в порядке убывания числа пикселей, содержащих данный цвет.

В данном случае видно, что для первых двух страниц документа RGB-представление составляет 66-54-68, в то время как третья страница отпечатана более светлым текстом - 70-59-73. Такая ситуация позволяет делать однозначный вывод о том, что третья страница не относится к одному акту печати с первыми двумя. Допускаемая погрешность сравнения - до одной единицы по каждой шкале. В приведенной таблице средние значения подкреплены значениями первого (самого часто встречающего на странице) второго и третьего тонов.

Пример менее однозначной ситуации приведен в таблице 3.

По усредненному значению тонов все страницы различаются. В то же время основные тоны первой и третьей страниц совпадают, а вторичный тон первой страницы аналогичен основному тону второй. Подобную ситуацию следует интерпретировать как принадлежность страниц к одному акту печати.

Отдельно следует оговорить возможное расхождение показателей первой и последующих страниц. Поскольку на первую страницу документа наиболее выражено оказывают влияние различные факторы, такие как ультрафиолетовое воздействие, механическое истирание и тому подобные воздействия, статистические характеристики первой страницы могут отличаться от прочих, несмотря на принадлежность всех страниц документа к одному акту печати.

В качестве примера осуществления предложенного способа приводим выдержки из заключения эксперта по результатам судебно-технической экспертизы четырех документов.

На исследование были представлены:

1. Экземпляр Договора займа №1/2010 от 03.02.2010 г., заключенного между ИП NN и ООО «МММ», в котором пункт 1.4 предусматривает проценты за пользование займом по ставке 0,5% годовых.

2. Экземпляр Договора займа №2/2010 от 23.06.2010 г., заключенного между ИП NN и ООО «МММ», в котором пункт 1.4 предусматривает проценты за пользование займом по ставке 0,5% годовых.

3. Экземпляр Договора займа №1/2010 от 03.02.2010 г., заключенного между ИП NN и ООО «МММ», в котором пункт 1.4 предусматривает проценты за пользование займом по ставке 12% годовых.

4. Экземпляр Договора займа №2/2010 от 23.06.2010 г., заключенного между ИП NN и ООО «МММ», в котором пункт 1.4 предусматривает проценты за пользование займом по ставке 12% годовых.

На разрешение эксперту поставлен вопрос: имеются ли признаки замены страниц в представленных документах?

С целью установления способа выполнения печатных текстов на представленных документах проводилось микроскопическое исследование с помощью микроскопа МСП-2, цифрового микроскопа «Эксперт» в различных режимах освещения, в результате которого было установлено:

- штрихи букв и линий графления печатных текстов на всех листах документов образованы красящим веществом черного цвета с характерным блеском, которое расположено на поверхности бумаги;

- штрихи образуют оплавленные микрочастицы, лежащие относительно плотным, выпуклым слоем;

- в штрихах отсутствуют следы давления;

- слой красящего вещества в штрихах непрочный - при воздействии острым предметом отделяется от поверхности бумаги;

- по краям знаков микрочастицы красящего вещества вплотную не примыкают, располагаются в виде ореолов вокруг штрихов;

- на пробельных участках документа наблюдаются микроскопические точки-марашки;

- шрифты знаков соответствуют конфигурации и размерным характеристикам компьютерных шрифтов.

Перечисленные признаки в своей совокупности достаточны для вывода о том, что печатные тексты исследуемых документов нанесены с использованием порошка (тонера) электрофотографическим способом (печатающее устройство типа лазерный принтер).

В основе способа установления относительной давности выполнения печатных текстов, расположенных на разных листах каждого документа, по анализу статистики цветности печатных знаков, выполненных электрофотографическим способом, лежит следующая закономерность - при выполнении печати отдельных фрагментов документа в разное время (даже при условии печати на одном печатающем устройстве), параметры цвета печатных знаков будут различны. Иными словами, используемая методика подразумевает сравнение фрагментов напечатанного текста на разных участках (листах) документа по наиболее часто встречающимся оттенкам серого (или иного преобладающего) цвета. Методика позволяет находить невидимые глазу различия в параметрах цветности печатных знаков, расположенных на разных листах документов, при условии их выполнения в разное время. В силу своего инструментального характера метод характеризуется объективностью, а также высокой степени воспроизводимости полученных результатов (то есть возможностью проверки их достоверности).

Используемая экспертная методика состоит из четырех этапов:

1) Оцифровка документов,

2) Предварительная обработка полученных изображений,

3) Расчет статистики цветности,

4) Интерпретация результатов.

На этапе оцифровки документа осуществлялось сканирование фрагментов текста документа с разрешением 24 бит на пиксель (600 пикселей на дюйм). При этом использовался формат выходного файла bmp (bitmappicture), то есть не содержащий сжатия, и, как следствие, потери качества.

Под предварительной обработкой следует понимать обрезание полей документа, а также удаление из него возможных артефактов, таких как посторонние пятна красящих веществ и пр. всевозможные цветные элементы. Предварительная обработка позволила кратно ускорить последующие процессы расчета и интерпретации результатов.

Расчет статистки цветности заключался в вычислении количества пикселей, содержащих тот или иной цвет. Для каждого документа выбирались наиболее часто встречающиеся цвета - то есть оттенки серого цвета. При этом следует подчеркнуть, что проведенное исследование имеет не определяющий, а исключающий характер. Это обозначает, что полное совпадение цветовых спектров страницы не гарантирует, что они принадлежат одному акту печати. В то же время расхождение спектров указывает на то, что анализируемые фрагменты принадлежат различным актам.

При анализе полученных результатов сравнивались RGB-представления цветов, преобладающих на каждой странице документа. Результаты расчета статистики печатных текстов на каждом листе четырех документов приведены в таблицах 3-6. Первый тон, второй тон и третий тон - это наиболее часто встречающиеся в документе цвета (оттенки серого цвета) в порядке убывания числа пикселей, содержащих данный цвет.

Анализ полученных цветовых параметров позволяет сделать следующие выводы.

- для первых двух листов договоров, в которых пункт 1.4 предусматривает проценты за пользование займом по ставке 0,5% годовых (документы 1 и 2), RGB-раскладка составляет 66-54-68, в то время как листы 3 документов отпечатаны более светлым текстом - 70-59-73 (таблицы 1 и 2).

Полученные результаты позволяют сделать категорический вывод о том, что печатные тексты на листах 3 указанных документов не относятся к одному акту печати с первыми двумя листами. Допускаемая погрешность сравнения - до одной единицы по каждой шкале в силу дискретности измеряемых величин. В приведенной таблице средние значения подкреплены значениями первого (самого часто встречающего на странице) второго и третьего тонов.

В то же время исходя из полученных данных печатные тексты на трех листах договоров, в которых пункт 1.4 предусматривает проценты за пользование займом по ставке 12% годовых (документы 3 и 4) - допустимо отнести к одному акту печати (таблицы 3 и 4).

Таблицы значений получены с помощью сканера CanonCanoskan Lide-25. Расчет статистики цветности осуществлялся при помощи программного обеспечения, созданного на языке JavaSE в среде NetBeans.

Выводы

Печатные тексты на листах 1 и 2 в экземплярах Договоров займа №1/2010 от 03.02.2010 г. и №2/2010 от 23.06.2010 г., в которых пункт 1.4 предусматривает проценты за пользование займом по ставке 0,5% годовых, и печатные тексты на листах 3 указанных документов - выполнены в разные акты печати. Следовательно, данные документы имеют признаки частичной подделки путем замены листов (под номерами 1 и 2).

Печатные тексты на листах 1-3 в экземплярах Договоров займа №1/2010 от 03.02.2010 г. и №2/2010 от 23.06.2010 г., в которых пункт 1.4 предусматривает проценты за пользование займом по ставке 12% годовых, - выполнены в едином акте печати. Вывод сделан в совокупности на основании сравнения первых двух преобладающих оттенков. Поэтому в данных документах признаков частичной подделки путем замены листов не выявлено.

1. Способ определения принадлежности страниц документа к одному акту печати, заключающийся в том, что осуществляют оцифровку документа путем сканирования текста документа, осуществляют предварительную обработку цифровой копии документа путем удаления участков, не содержащих печатного текста, подсчитывают число пикселей, содержащих различные цвета текста, каждый из которых характеризуется соответствующими значениями цветовой модели, определяют наиболее часто встречающиеся в документе цвета текста, усредняют значения цветовой модели для этих цветов для разных страниц документа, сравнивают полученные значения для разных страниц документа и при обнаружении различия в усредненных значениях цветовой модели и в значениях цветовой модели самого часто встречающегося цвета на разных страницах делают вывод о том, что эти страницы не принадлежат к одному акту печати.

2. Способ по п. 1, отличающийся тем, что для подсчета числа пикселей различных цветов используют страницы документа, кроме первой.

3. Способ по п. 1, отличающийся тем, что в качестве цветов текста используют различные тона серого цвета.

4. Способ по п. 1, отличающийся тем, что в качестве цветовой модели используют цветовую модель RGB.



 

Похожие патенты:

Изобретение относится к области домовых систем связи, таких как домофоны, а именно к дверной станции домашней системы связи с множеством квартирных станций. Техническим результатом является обеспечение возможности индикации для посетителя кнопки вызова предположительно посещаемого жильца.
Изобретение относится к способу и портативному считывающему устройству для декодирования штриховых кодов с фиксацией даты, времени и координат места сканирования.

Изобретение относится к системам обработки гиперспектральных изображений поверхности Земли, в частности к способу повышения детальности материалов съемки путем субпиксельного выделения объектов и их спектральных характеристик.

Изобретение относится к обработке бинарного кодированного импульсного информационного сигнала, вырабатываемого пассивным ответчиком в радиочастотной системе дистанционной идентификации и контроля состояния объектов, функционирующим на поверхностных акустических волнах.

Изобретение относится к средствам распознавания образов на основе изображения и может быть использовано для обработки изображений дороги и дорожной обстановки. Техническим результатом является повышение надежности распознавания границ дороги, элементов разметки, транспортных средств и других объектов.

Изобретение относится к технологиям классификации изображений посредством оптического распознавания символов. Техническим результатом является повышение эффективности классификации документов, основанной на заранее заданных признаках.

Изобретение относится к обработке медицинских изображений. Техническим результатом является сокращение времени реконструкции изображения МРТ из недосемплированных данных.

Изобретение относится к области визуализации изображений, в частности к способу и системе для выполнения реконструкции изучаемой области (ROI) с максимальным правдоподобием, даже если исходные данные проецирования усечены.

Изобретение относится к соотнесению полученных изображений с объектами. Техническим результатом является повышение точности диагностирования пациента.

Изобретение относится к области обработки изображения для анализа объекта. Технический результат - повышение точности и стабильности анализа объекта.

Изобретение относится к области домовых систем связи, таких как домофоны, а именно к дверной станции домашней системы связи с множеством квартирных станций. Техническим результатом является обеспечение возможности индикации для посетителя кнопки вызова предположительно посещаемого жильца.

Изобретение относится к пользовательским интерфейсам. Технический результат заключается в обеспечении возможности масштабирования изображения в приложении.

Изобретение относится к способам предоставления пользовательских интерфейсов для приложений навигации по уличному виду на мобильном устройстве. Техническим результатом является сокращение задержек при извлечении изображений для обеспечения отображения уличного вида в картографическом приложении.

Изобретение относится к области поисковых систем. Технический результат - обеспечение предоставления настраиваемых для пользователя изображений на основании пользовательского запроса или пользовательских данных.

Изобретение относится к средствам переноса файлов между устройствами с использованием 3D маркера. Технический результат заключается в обеспечении возможности переноса файлов с помощью маркеров.

Изобретение относится к системе для восприятия ассоциированного контента, используя несколько экранов. Техническим результатом является обеспечение восприятия ассоциированного контента, используя несколько экранов.

Группа изобретений относится к способам интеграции нескольких доменов управления. Технический результат - создание компьютерной системы, обеспечивающей возможность интеграции и отображения на экране нескольких доменов управления.

Изобретение относится к техническим средствам для обеспечения безопасности жизнедеятельности. Система включает измерительный микрофон с передающим устройством, связанный с измерителем шума по радиоканалу, четырехрежимное сигнально-информационное табло, связанное с блоком вычислителя по радиоканалу, и устройство ввода информации.

Изобретение относится к пользовательским интерфейсам поиска. Технический результат состоит в представлении новой парадигмы пользовательского интерфейса, который позволяет пользователям обследовать фасеты, относящиеся к термину поискового запроса, поддерживая исходное состояние термина поискового запроса или оставаясь в границах темы, заданной пользователем.

Группа изобретений относится к электронному устройству для определения цифрового интерфейса подключенного внешнего устройства для управления модулем передачи данных.

Изобретение относится к оптическому распознаванию символов. Техническим результатом является оптимизация оптического распознавания символов за счет использования леса решений.
Наверх