Система и способ определения правила классификации события на терминальном устройстве пользователя



Система и способ определения правила классификации события на терминальном устройстве пользователя
Система и способ определения правила классификации события на терминальном устройстве пользователя
Система и способ определения правила классификации события на терминальном устройстве пользователя
Система и способ определения правила классификации события на терминальном устройстве пользователя
Система и способ определения правила классификации события на терминальном устройстве пользователя
Система и способ определения правила классификации события на терминальном устройстве пользователя
Система и способ определения правила классификации события на терминальном устройстве пользователя
Система и способ определения правила классификации события на терминальном устройстве пользователя
Система и способ определения правила классификации события на терминальном устройстве пользователя
Система и способ определения правила классификации события на терминальном устройстве пользователя
Система и способ определения правила классификации события на терминальном устройстве пользователя
Система и способ определения правила классификации события на терминальном устройстве пользователя
Система и способ определения правила классификации события на терминальном устройстве пользователя

Владельцы патента RU 2772404:

Акционерное общество "Лаборатория Касперского" (RU)

Изобретение относится к области обеспечения информационной безопасности. Технический результат - определение большей части нежелательных событий на терминальном устройстве за счет использования правил классификации события и анализа характеристик событий. Система определения правила классификации события на терминальном устройстве пользователя содержит: средство определения характеристик, предназначенное для определения характеристик перехваченного события; средство выбора события, предназначенное для выбора на основании определенных характеристик события из базы событий, схожесть которого с перехваченным событием выше заранее заданного значения; средство определения правила, предназначенное для определения на основании схожего события правила классификации для перехваченного события с использованием профиля пользователя, заранее сформированного с использованием средства формирования профиля в виде вектора из элементов матрицы пользовательских предпочтений, содержащей определенный при помощи алгоритма разложения рейтинг события из базы событий на терминальном устройстве пользователя, где указанный профиль характеризует вероятность того, что событие из базы событий принадлежит заданному классу на терминальном устройстве пользователя. 2 н. и 20 з.п. ф-лы, 4 ил.

 

Область техники

Изобретение относится к области обеспечения информационной безопасности.

Уровень техники

В настоящий момент практически любой обладатель универсального мобильного устройства (например, мобильного телефона, смартфона, планшета и т.д.) сталкивается с нежелательными звонками, СМС-сообщениями, электронными письмами из банков, медицинских центров, страховых фирм, салонов красоты и других компаний, использующих в своей работе телемаркетинг. Большинство из этих компаний неявно прописывают распространение рекламы через коммуникационные сети в договоре и тем самым обходят правовые нормы.

Компании, предоставляющие услуги телемаркетинга, активно используют интеллектуальных ботов, которые имитируют в процессе общения людей. Роботы определяют уровень раздражительности и зачастую специально выстраивают разговор так, чтобы маскировать искусственное происхождение беседы. Также коммуникационные сети нередко используют мошенники для получения конфиденциальной информации пользователя (например, данных о кредитных картах, номерах социального страхования и т.д.).

Для борьбы с описанными злоупотреблениями в коммуникационных сетях используют мобильные приложения, определяющие номера (например, TrueCaller). В большинстве случаев входящие вызовы проверяют по базе данных спам-номеров, которая постоянно обновляется на основании обратной связи от пользователей и, если номер спамера или мошенника находится в этой базе, пользователя информируют о том, что вызывающая сторона была замечена в назойливом общении.

Однако такой подход основан на обобщенном мнении и не учитывает персональные потребности в информировании, что приводит к возникновению ситуаций, при которых значимые для конкретного пользователя события заносят в категорию спам. К примеру, несмотря на навязчивый способ информирования о банковских кредитах, вызываемый абонент может быть заинтересован в данной услуге.

В патентной публикации US 20050221840 A1 описана технология присваивания репутации телефонному номеру, ассоциированному с неклассифицированной вызываемой стороной. На основании анализа определенных атрибутов входящего вызова (например, продолжительности звонка) неклассифицированной вызывающей стороне присваивают репутацию. Если вызывающую сторону определяют как нежелательную заранее установленное количество раз, ее идентификатор помещают в черный список.

Хотя описанный выше способ работы хорошо справляется с задачей формирования репутации вызывающей стороны и блокировкой большей части нежелательных звонков, он не позволяет определять персональные правила классификации. К тому же данный способ применяют исключительно к голосовым звонкам.

Настоящее изобретение позволяет решать задачу определения персональных правил классификации входящих событий, включая телефонные звонки, CMC-сообщения, электронные письма и HTML-блоки.

Раскрытие изобретения

Изобретение предназначено для обеспечения информационной безопасности.

Технический результат настоящего изобретения заключается в определении правила классификации события на терминальном устройстве пользователя за счет анализа характеристик события и профиля пользователя.

Данный результат достигается с помощью использования системы определения правила классификации события на терминальном устройстве пользователя, которая содержит: средство определения характеристик, предназначенное для определения характеристик перехваченного события; средство выбора события, предназначенное для выбора на основании определенных характеристик события из базы событий, схожесть которого с перехваченным событием выше заранее заданного значения; средство определения правила, предназначенное для определения на основании схожего события правила классификации для перехваченного события с использованием заранее сформированного профиля пользователя, где указанный профиль характеризует вероятность того, что событие из базы событий принадлежит заданному классу на терминальном устройстве пользователя.

В другом частном случае реализации системы в качестве события на терминальном устройстве пользователя выступает по меньшей мере: принятый звонок; полученное CMC-сообщение; полученное электронное письмо; загруженная HTML-страница.

Еще в одном частном случае реализации системы в качестве характеристики события на терминальном устройстве пользователя выступает по меньшей мере: текст CMC-сообщения; содержимое служебных полей электронного письма; содержимое электронного письма; содержимое служебных заголовков HTML-страницы; содержимое HTML-страницы.

В другом частном случае реализации системы схожесть двух событий вычисляют на основании модели преобразования характеристики события в числовой вектор.

Еще в одном частном случае реализации системы в качестве класса события выступает по меньшей мере: регулярный; нежелательный; неизвестный.

В другом частном случае реализации система дополнительно содержит средство формирования профиля, предназначенное для формирования профиля пользователя, где в качестве профиля пользователя используют вектор из элементов матрицы пользовательских предпочтений, содержащей определенный при помощи алгоритма разложения рейтинг события из базы событий на терминальном устройстве, где в качестве алгоритма разложения используют по меньшей мере: метод главных компонент; сингулярное разложение; неотрицательное разложение матрицы.

Еще в одном частном случае реализации системы значение элемента матрицы пользовательских предпочтений определяют методом минимизации функции ошибки, характеризующей расстояние между определенным и фактическим значением рейтинга события из базы событий.

В другом частном случае реализации системы рейтинг события из базы событий вычисляют при помощи модели классификации, заранее обученной на атрибутах события.

Еще в одном частном случае реализации системы в качестве атрибута события из базы событий выступает по меньшей мере: параметры медиаданных события; флаг перехвата медиаданных события на терминальном устройстве; время, прошедшее с момента перехвата медиаданных события на терминальном устройстве; флаг просмотра пользователем терминального устройства медиаданных события; флаг удаления пользователем терминального устройства медиаданных события.

В другом частном случае реализации системы для перехваченного события определяют правило классификации таким образом, что перехваченное событие классифицируют как нежелательное на терминальном устройстве пользователя, если рейтинг схожего события в сформированном профиле пользователя меньше заранее заданного значения.

В другом частном случае реализации системы матрицу пользовательских предпочтений формируют на основании повторного определения рейтинга события из базы событий таким образом, чтобы значения матрицы, были точнее, чем текущие.

Данные результаты достигаются с помощью использования способа определения правила классификации события на терминальном устройстве пользователя, при этом способ содержит этапы, которые реализуются с помощью средств из системы классификации звонка, и на которых: определяют характеристики перехваченного события; выбирают на основании определенных характеристик событие из базы событий, схожесть которого с перехваченным событием выше заранее заданного значения; определяют правило классификации перехваченного события на основании выбранного события с использованием профиля пользователя, где указанный профиль характеризует вероятность того, что событие из базы событий принадлежит заданному классу на терминальном устройстве пользователя.

В другом частном случае реализации способа в качестве события на терминальном устройстве пользователя выступает по меньшей мере: принятый звонок; полученное CMC-сообщение; полученное электронное письмо; загруженная HTML-страница.

Еще в одном частном случае реализации способа в качестве характеристики события на терминальном устройстве пользователя выступает по меньшей мере: текст CMC-сообщения; содержимое служебных полей электронного письма; содержимое электронного письма; содержимое служебных заголовков HTML-страницы; содержимое HTML-страницы.

В другом частном случае реализации способа схожесть двух событий вычисляют на основании модели преобразования характеристики события в числовой вектор.

Еще в одном частном случае реализации способа в качестве класса события выступает по меньшей мере: регулярный; нежелательный; неизвестный.

В другом частном случае реализации способа профиль пользователя формируют на основании матрицы пользовательских предпочтений, содержащей определенный при помощи алгоритма разложения рейтинг события из базы событий на терминальном устройстве, где в качестве профиля пользователя используют вектор из элементов матрицы пользовательских предпочтений, содержащей определенный при помощи алгоритма разложения рейтинг события из базы событий на терминальном устройстве, где в качестве алгоритма разложения используют по меньшей мере: метод главных компонент; сингулярное разложение; неотрицательное разложение матрицы.

Еще в одном частном случае реализации способа значение элемента матрицы пользовательских предпочтений определяют методом минимизации функции ошибки, характеризующей расстояние между определенным и фактическим значением рейтинга события из базы событий.

В другом частном случае реализации способа рейтинг события из базы событий вычисляют при помощи модели классификации, заранее обученной на атрибутах события.

Еще в одном частном случае реализации способа в качестве атрибута события из базы событий выступает по меньшей мере: параметры медиаданных события; флаг перехвата медиаданных события на терминальном устройстве; время, прошедшее с момента перехвата медиаданных события на терминальном устройстве; флаг просмотра пользователем терминального устройства медиаданных события; флаг удаления пользователем терминального устройства медиаданных события.

В другом частном случае реализации способа для перехваченного события определяют правило классификации таким образом, что перехваченное событие классифицируют как нежелательное на терминальном устройстве пользователя, если рейтинг схожего события в сформированном профиле пользователя меньше заранее заданного значения.

В другом частном случае реализации способа матрицу пользовательских предпочтений формируют на основании повторного вычисления рейтинга события из базы событий таким образом, чтобы значения матрицы, были точнее, чем текущие.

Краткое описание чертежей

Фиг. 1 иллюстрирует общее устройство коммуникационной сети.

Фиг. 2 иллюстрирует систему определения правила классификации события на терминальном устройстве пользователя.

Фиг. 3 иллюстрирует способ определения правила классификации события на терминальном устройстве пользователя.

Фиг. 4 представляет пример компьютерной системы общего назначения, персональный компьютер или сервер.

Хотя изобретение может иметь различные модификации и альтернативные формы, характерные признаки, показанные в качестве примера на чертежах, будут описаны подробно. Следует понимать, однако, что цель описания заключается не в ограничении изобретения конкретным его воплощением. Наоборот, целью описания является охват всех изменений, модификаций, входящих в рамки данного изобретения, как это определено приложенной формуле.

Описание вариантов осуществления изобретения

Объекты и признаки настоящего изобретения, способы для достижения этих объектов и признаков станут очевидными посредством отсылки к примерным вариантам осуществления. Однако настоящее изобретение не ограничивается примерными вариантами осуществления, раскрытыми ниже, оно может воплощаться в различных видах. Сущность, приведенная в описании, является ничем иным, как конкретными деталями, необходимыми для помощи специалисту в области техники в исчерпывающем понимании изобретения, и настоящее изобретение определяется в объеме приложенной формулы.

Фиг. 1 иллюстрирует общее устройство коммуникационной сети.

Структурная схема общего устройства коммуникационной сети содержит коммуникационную сеть 100, терминальное устройство пользователя 101, медиаданные 111.

Коммуникационная сеть 100 представляет собой систему физических каналов связи, реализующую протокол передачи медиаданных 111 между терминальным устройством пользователя 101 и узлами коммуникационной сети.

Примерами коммуникационных сетей являются по меньшей мере:

• компьютерная сеть;

• телефонная сеть;

• сеть сотовой связи.

Терминальное устройство - оборудование, преобразующее пользовательскую информацию в медиаданные 111 для передачи по каналам связи и осуществляющее обратное преобразование.

Событие - процессе обмена медиаданными 111 между терминальным устройством пользователя и другими узлами коммуникационной сети.

К примеру, в качестве терминального устройства пользователя 101 может выступать мобильный телефон абонента сети сотовой связи, где в качестве события выступает по меньшей мере:

• голосовой звонок;

• СМС-сообщение.

Фиг. 2 иллюстрирует систему определения правила классификации события на терминальном устройстве пользователя.

Структурная схема системы определения правила классификации события на терминальном устройстве пользователя содержит базу событий 210, перехваченное событие 220, средство определения характеристик 230, средство выбора события 240, схожее событие 250, средство формирования профиля 260, модуль определения атрибутов 261, модуль вычисления рейтинга 262, модуль формирования 263, профиль пользователя 270, средство определения правила 280, правило классификации 281, средство блокирования 290.

Средство определения характеристик 230 предназначено для определения характеристик события и передачи их средству выбора события 240.

В одном из вариантов реализации системы в качестве события на терминальном устройстве пользователя 101 выступает по меньшей мере:

• принятый звонок;

• полученное СМС-сообщение;

• полученное электронное письмо;

• загруженная HTML-страница.

Еще в одном из вариантов реализации системы средство определения характеристик 230 преобразует голосовой звонок в форматированный текст при помощи алгоритма распознавания речи.

В одном из вариантов реализации системы в качестве характеристики события выступает по меньшей мере:

• распознанная речь;

• текст СМС-сообщения;

• содержимое служебных полей электронного письма;

• содержимое электронного письма;

• содержимое служебных заголовков HTML-страницы;

• содержимое HTML-страницы.

Средство выбора события 240 предназначено для вычисления схожести перехваченного события 220 с событием из базы событий 210 и передачи события, схожесть которого с перехваченным событием 220 выше заранее заданного значения, средству определения правила 280.

В одном из вариантов реализации системы средство выбора события 240 производит предобработку характеристики события. Предобработка включает по меньшей мере:

• удаление нерелевантных, не относящихся к цифро-буквенным, символов (к примеру, дефисов);

• приведение всех символов в нижний регистр;

• удаление неинформативных стоп-слов (к примеру, алло);

• приведение различных форм одного слова к словарной форме (лемматизация);

• выделение основы слова (стемминг).

Еще в одном из вариантов реализации системы средство выбора события 240 формирует на основании обработанных характеристик признаки для определения схожести двух событий.

В качестве признаков выступают по меньшей мере:

• слова;

• последовательность слов (англ. n-grams);

• векторное представление слов (англ. word-embedding);

• мультимножество слов, не учитывающих грамматику и порядок (англ. bag-of-words).

К примеру, в одном из вариантов реализации системы средство выбора события 240 преобразует СМС-сообщение sms = «Осенние скидки - 20% на женские сапоги» в вектор:

В одном из вариантов реализации системы средство выбора события 240 предварительно формирует набор признаков для определения схожести событий si из базы событий 210, представленные в виде вектора длины словаря n, где на позиции, соответствующей номеру слова wj расположено число вхождений ƒij данного слова в характеристике события si.

Данный набор представляют в виде разреженной матрицы М:

Средство выбора события 240 дописывает в конец матрицы М строку признаков для определения схожести перехваченного события 220, представленную в виде вектора длины словаря n.

Еще в одном из вариантов реализации системы средство выбора события 240 модифицирует матрицу М с помощью TF - IDF преобразования, где TF -это частота слова w в сообщении s, a IDF - это логарифм обратной частоты распространенности слова w в множестве всех событий С.

Средство выбора события 240 проводит сингулярное разложение (англ. Singular Value Decomposition, SVD) полученной матрицы М на три составляющих:

М=S×D×Wt

где S и Wt - ортогональные матрицы, a D - диагональная матрица. Причем сингулярные числа - диагональные элементы матрицы D упорядочены в порядке убывания.

Согласно правилам произведения матриц, столбцы и строки, соответствующие меньшим сингулярным значениям, дают наименьший вклад в итоговое произведение. Средство выбора события 240 игнорирует последние столбцы матрицы S и последние строки матрицы Wt, оставляя только первые k. Таким образом средство выбора события 240 представляет каждое событие si из базы событий 210 и перехваченное событие 220 в виде вектора длины k≤n, где k имеет заранее определенное значение:

К примеру, для k=2 средство выбора события 240 проводит двумерное сингулярное разложение, представляя каждое событие в виде двумерного вектора.

В одном из вариантов реализации системы средство выбора события 240 вычисляет схожесть событий из базы событий 210 с перехваченным событием 220. К примеру, в качестве меры схожести средство выбора события 240 использует косинусное расстояние между векторами. Событие из базы событий 210, схожесть которого с перехваченным событием 220 выше заранее определенного значения, средство выбора события 240 передает средству формирования правила 280.

К примеру, событие с характеристикой «приглашение на детскую елку» с высокой вероятностью будет иметь большую схожесть с событием с характеристикой «скидки на подарки для детей», чем с событием с характеристикой «рейтинг алкогольных коктейлей».

В одном из вариантов реализации системы средство выбора события 240 проводит кластерный анализ событий для создания групп схожих событий.

Еще в одном из вариантов реализации системы средство выбора события 240 проводит кластерный анализ событий на основании алгоритма машинного обучения, к которым относят по меньшей мере:

• K-средних (англ. k-means);

• К-медиан;

• ЕМ-алгоритм (англ. Expectation-maximization algorithm);

• алгоритм на основе нейронной сети.

Средство формирования профиля 260 предназначено для формирования профиля пользователя 270 и передачи профиля пользователя 270 средству определения правила классификации события 280.

Средство формирования профиля 260 состоит из модуля определения атрибутов 261, модуля вычисления рейтинга 262, модуля формирования 263.

Модуль определения атрибутов 261 предназначен для определения пригодных для классификации событий из базы событий 210 атрибутов и передачи указанных атрибутов модулю вычисления рейтинга 262.

В качестве атрибута события выступает по меньшей мере:

• параметры медиаданных события;

• время, прошедшее с момента перехвата медиаданных события на терминальном устройстве 101;

• флаг просмотра пользователем терминального устройства 101 медиаданных события.

• флаг удаления пользователем медиаданных события с терминального устройства 101.

Модуль вычисления рейтинга 262 предназначен для вычисления рейтинга события из базы событий 210, где рейтинг характеризует вероятность того, что событие принадлежит заданному классу и передачи вычисленного рейтинга модулю формирования 263.

В одном из вариантов реализации системы в качестве класса события выступает по меньшей мере:

• регулярный - класс, который характеризует ожидаемые пользователем события (к примеру, уведомление о банковской операции);

• нежелательный - класс, который характеризует игнорируемые пользователем события, вызывающие негативную реакцию (к примеру, спам);

• неизвестный.

В одном из вариантов реализации системы при помощи модуля определения атрибутов 261 предварительно собирают атрибуты событий, которые относятся к заранее известному классу событий. На основании собранных данных обучают модель классификации таким образом, чтобы схожие по своим атрибутам события могли быть классифицированы упомянутой моделью классификации с точностью выше заданной.

В качестве алгоритма классификации выступает по крайней мере:

• байесовские классификаторы (англ. naive bayesian classifier);

• логистическая регрессия (англ. logistic regression);

• MRF-классификатор (англ. MRF classifier);

• Метод опорных векторов (англ. SVM, support vector machine);

• методы ближайших соседей (англ. k-nearest neighbor);

• дерево принятия решений (англ. decision tree).

Модуль вычисления рейтинга 262 передает атрибуты события из базы событий обученной модели, которая выносит решение о принадлежности события одному из классов с некоторой вероятностью.

В одном из вариантов реализации системы модуль вычисления рейтинга 262 повторно вычисляет рейтинг события из базы событий 210 при помощи обученной модели таким образом, чтобы вероятность принадлежности события заданному классу была выше, чем при текущей классификации.

Модуль формирования 263 предназначен для формирования профиля пользователя 270.

В одном из вариантов реализации системы модуль формирования 263 предварительно определяет набор векторов длины n, равной количеству событий в базе событий 210, где на позиции r'j, соответствующей событию sj на терминальном устройстве пользователя ui расположен по меньшей мере:

• рейтинг события sj, вычисленный модулем вычисления рейтинга 262, на терминальном устройстве пользователя ui;

• нулевое значение, если медиаданные события sj ранее не перехватывали на терминальном устройстве пользователя ui.

Данный набор представляют в виде матрицы М':

К примеру, для большого числа событий sj и пользователей щ модуль формирования 263 сформирует сильно разряженную матрицу М', поскольку на терминальном устройстве пользователя ui перехватывают лишь малую часть всех событий из базы событий 210.

В одном из вариантов реализации системы модуль формирования 263 проводит разложение полученной матрицы М' на две составляющих с k компонентами, где k≤n имеет заранее определенное значение:

М'=P×Qt

где Р и Qt - ортогональные матрицы.

В качестве алгоритма разложения выступает по меньшей мере:

• метод главных компонент (англ. Principal Component Analysis, РСА);

• сингулярное разложение;

• неотрицательное разложение матрицы (англ. Non-negative matrix factorization, NNMF/NMF).

Еще в одном из вариантов реализации системы модуль формирования 263 инициализирует матрицу пользовательских предпочтений Mr значениями, полученными в результате разложения исходной матрицы М' таким образом, что реконструированное значение рейтинга rij для события sj на терминальном устройстве пользователя ui равен скалярному произведению векторов pi и qj матриц Р и Qt:

rij=pi⋅qj

Модуль формирования 263 определяет оптимальное значение rij инициализированной матрицы пользовательских предпочтений Mr при помощи алгоритма градиентного спуска путем минимизации функции ошибки:

где bi - базовый предикатор пользователя ui;

bj - базовый предикатор события sj;

μ - средний рейтинг по матрице Mr;

δ - параметр регуляризации.

Модуль формирования 263 определяет рейтинг каждого события из базы событий 210 на терминальном устройстве пользователя на основании матрицы пользовательских предпочтений Mr:

Значение элемента rij матрицы Mr, характеризующего рейтинг события sj, медиаданные которого ранее не перехватывали на терминальном устройстве пользователя ui, будет ненулевым, в отличие от соответствующего элемента r'ij матрицы М'.

В одном из вариантов реализации системы модуль формирования 263 в качестве профиля пользователя ui используют вектор, составленный из элементов матрицы пользовательских предпочтений Mr, которые соответствуют рейтингу rij события sj на терминальном устройстве пользователя ui:

Средство определения правила 280 предназначено для определения правила классификации 281 перехваченного события 220.

В одном из вариантов реализации системы средство определения правила 280 определяет правило классификации 281 перехваченного события 220 на терминальном устройстве пользователя ui таким образом, что перехваченное событие 220 классифицируют как нежелательное на терминальном устройстве пользователя ui, если рейтинг rij схожего события 250 sj в сформированном профиле пользователя 270 меньше заранее заданного значения.

Еще в одном из вариантов реализации системы средство определения правила 280 определяет правило классификации 281 перехваченного события 220, принадлежащего группе схожих событий G, на терминальном устройстве пользователя ui таким образом, что перехваченное событие 220 классифицируют как нежелательное на терминальном устройстве пользователя ui, если мера центральной тенденции рейтингов rij всех событий sj в сформированном профиле пользователя 270, где sj ∈ G, меньше заранее заданного значения.

В одном из вариантов реализации система дополнительно содержит средство блокирования 290, предназначенное для блокирования перехваченного события 220 на терминальном устройстве пользователя.

В одном из вариантов реализации системы средство блокирования 290 блокирует перехваченное событие 220 на терминальном устройстве пользователя, если согласно правилу классификации 281, определенному средством определения правила 280, перехваченное событие 220 классифицируют как нежелательное на терминальном устройстве пользователя.

Фиг. 3 иллюстрирует способ определения правила классификации события на терминальном устройстве пользователя.

Структурная схема способа определения правила классификации события на терминальном устройстве пользователя содержит этап 310, на котором определяют характеристики события, этап 320, на котором выбирают схожее событие, этап 330, на котором формируют профиль пользователя, этап 340, на котором определяют правило классификации, этап 350, на котором блокируют нежелательное событие.

На этапе 310 с помощью средства определения характеристик 230 определяют характеристики перехваченного события 220.

На этапе 320 с помощью средства выбора события 240 на основании определенных характеристик определяют схожее событие 250.

Дополнительно в одном из вариантов реализации системы на этапе 330 с помощью средства формирования профиля 260 формируют профиль пользователя 270.

На этапе 340 с помощью средства определения правила 280 на основании сформированного профиля 270 и схожего события 250 определяют правило классификации 281.

Дополнительно в одном из вариантов реализации системы на этапе 350 с помощью средства блокирования 290 на основании правила классификации 281 блокируют нежелательное событие.

Фиг. 4 представляет пример компьютерной системы общего назначения, персональный компьютер или сервер 20, содержащий центральный процессор 21, системную память 22 и системную шину 23, которая содержит разные системные компоненты, в том числе память, связанную с центральным процессором 21. Системная шина 23 реализована, как любая известная из уровня техники шинная структура, содержащая в свою очередь память шины или контроллер памяти шины, периферийную шину и локальную шину, которая способна взаимодействовать с любой другой шинной архитектурой. Системная память содержит постоянное запоминающее устройство (ПЗУ) 24, память с произвольным доступом (ОЗУ) 25. Основная система ввода/вывода (BIOS) 26, содержит основные процедуры, которые обеспечивают передачу информации между элементами персонального компьютера 20, например, в момент загрузки операционной системы с использованием ПЗУ 24.

Персональный компьютер 20 в свою очередь содержит жесткий диск 27 для чтения и записи данных, привод магнитных дисков 28 для чтения и записи на сменные магнитные диски 29 и оптический привод 30 для чтения и записи на сменные оптические диски 31, такие как CD-ROM, DVD-ROM и иные оптические носители информации. Жесткий диск 27, привод магнитных дисков 28, оптический привод 30 соединены с системной шиной 23 через интерфейс жесткого диска 32, интерфейс магнитных дисков 33 и интерфейс оптического привода 34 соответственно. Приводы и соответствующие компьютерные носители информации представляют собой энергонезависимые средства хранения компьютерных инструкций, структур данных, программных модулей и прочих данных персонального компьютера 20.

Настоящее описание раскрывает реализацию системы, которая использует жесткий диск 27, сменный магнитный диск 29 и сменный оптический диск 31, но следует понимать, что возможно применение иных типов компьютерных носителей информации 56, которые способны хранить данные в доступной для чтения компьютером форме (твердотельные накопители, флеш карты памяти, цифровые диски, память с произвольным доступом (ОЗУ) и т.п.), которые подключены к системной шине 23 через контроллер 55.

Компьютер 20 имеет файловую систему 36, где хранится записанная операционная система 35, а также дополнительные программные приложения 37, другие программные модули 38 и данные программ 39. Пользователь имеет возможность вводить команды и информацию в персональный компьютер 20 посредством устройств ввода (клавиатуры 40, манипулятора «мышь» 42). Могут использоваться другие устройства ввода (не отображены): микрофон, джойстик, игровая консоль, сканер и т.п. Подобные устройства ввода по своему обычаю подключают к компьютерной системе 20 через последовательный порт 46, который в свою очередь подсоединен к системной шине, но могут быть подключены иным способом, например, при помощи параллельного порта, игрового порта или универсальной последовательной шины (USB). Монитор 47 или иной тип устройства отображения также подсоединен к системной шине 23 через интерфейс, такой как видеоадаптер 48. В дополнение к монитору 47, персональный компьютер может быть оснащен другими периферийными устройствами вывода (не отображены), например, колонками, принтером и т.п.

Персональный компьютер 20 способен работать в сетевом окружении, при этом используется сетевое соединение с другим или несколькими удаленными компьютерами 49. Удаленный компьютер (или компьютеры) 49 являются такими же персональными компьютерами или серверами, которые имеют большинство или все упомянутые элементы, отмеченные ранее при описании существа персонального компьютера 20, представленного на Фиг. 4. В вычислительной сети могут присутствовать также и другие устройства, например, маршрутизаторы, сетевые станции, пиринговые устройства или иные сетевые узлы.

Сетевые соединения могут образовывать локальную вычислительную сеть (LAN) 50 и глобальную вычислительную сеть (WAN). Такие сети применяются в корпоративных компьютерных сетях, внутренних сетях компаний и, как правило, имеют доступ к сети Интернет. В LAN- или WAN-сетях персональный компьютер 20 подключен к локальной сети 50 через сетевой адаптер или сетевой интерфейс 51. При использовании сетей персональный компьютер 20 может использовать модем 54 или иные средства обеспечения связи с глобальной вычислительной сетью, такой как Интернет. Модем 54, который является внутренним или внешним устройством, подключен к системной шине 23 посредством последовательного порта 46. Следует уточнить, что сетевые соединения являются лишь примерными и не обязаны отображать точную конфигурацию сети, т.е. в действительности существуют иные способы установления соединения техническими средствами связи одного компьютера с другим.

В заключение следует отметить, что приведенные в описании сведения являются примерами, которые не ограничивают объем настоящего изобретения, определенного формулой.

1. Система определения правила классификации события на терминальном устройстве пользователя, которая содержит:

а) средство определения характеристик, предназначенное для определения характеристик перехваченного события;

б) средство выбора события, предназначенное для выбора на основании определенных характеристик события из базы событий, схожесть которого с перехваченным событием выше заранее заданного значения;

в) средство определения правила, предназначенное для определения на основании схожего события правила классификации для перехваченного события с использованием профиля пользователя, заранее сформированного с использованием средства формирования профиля в виде вектора из элементов матрицы пользовательских предпочтений, содержащей определенный при помощи алгоритма разложения рейтинг события из базы событий на терминальном устройстве пользователя, где указанный профиль характеризует вероятность того, что событие из базы событий принадлежит заданному классу на терминальном устройстве пользователя.

2. Система по п.1, в которой в качестве события на терминальном устройстве пользователя выступает по меньшей мере:

• принятый звонок;

• полученное СМС-сообщение;

• полученное электронное письмо;

• загруженная HTML-страница.

3. Система по п.2, в которой в качестве характеристики события на терминальном устройстве пользователя выступает по меньшей мере:

• текст СМС-сообщения;

• содержимое служебных полей электронного письма;

• содержимое электронного письма;

• содержимое служебных заголовков HTML-страницы;

• содержимое HTML-страницы.

4. Система по п.1, в которой схожесть двух событий вычисляют на основании модели преобразования характеристики события в числовой вектор.

5. Система по п.1, в которой в качестве класса события выступает по меньшей мере:

• регулярный;

• нежелательный;

• неизвестный.

6. Система по п.1, в которой в качестве алгоритма разложения используют по меньшей мере:

• метод главных компонент;

• сингулярное разложение;

• неотрицательное разложение матрицы.

7. Система по п.6, в которой значение каждого элемента матрицы пользовательских предпочтений определяют методом минимизации функции ошибки, характеризующей расстояние между определенным и фактическим значением рейтинга события из базы событий на терминальном устройстве пользователя.

8. Система по п.6, в которой рейтинг события из базы событий вычисляют при помощи модели классификации, заранее обученной на атрибутах события.

9. Система по п.8, в которой в качестве атрибута события из базы событий выступает по меньшей мере:

• параметры медиаданных события;

• флаг перехвата медиаданных события на терминальном устройстве;

• время, прошедшее с момента перехвата медиаданных события на терминальном устройстве;

• флаг просмотра пользователем терминального устройства медиаданных события;

• флаг удаления пользователем терминального устройства медиаданных события.

10. Система по п.6, в которой для перехваченного события определяют правило классификации таким образом, что перехваченное событие классифицируют как нежелательное на терминальном устройстве пользователя, если рейтинг схожего события в сформированном профиле пользователя меньше заранее заданного значения.

11. Система по п.6, в которой матрицу пользовательских предпочтений формируют на основании повторного определения рейтинга события из базы событий таким образом, чтобы значения матрицы, были точнее, чем текущие.

12. Способ определения правила классификации события на терминальном устройстве пользователя, который содержит этапы, которые реализуются с помощью средств из системы по пп.1-11, на которых:

а) определяют характеристики перехваченного события;

б) выбирают на основании определенных характеристик из базы событий событие, схожесть которого с перехваченным событием выше заранее заданного значения;

в) определяют правило классификации перехваченного события на основании выбранного события с использованием профиля пользователя, заранее сформированного в виде вектора из элементов матрицы пользовательских предпочтений, содержащей определенный при помощи алгоритма разложения рейтинг события из базы событий на терминальном устройстве пользователя, где указанный профиль характеризует вероятность того, что событие из базы событий принадлежит заданному классу на терминальном устройстве пользователя.

13. Способ по п.12, по которому в качестве события на терминальном устройстве пользователя выступает по меньшей мере:

• принятый звонок;

• полученное СМС-сообщение;

• полученное электронное письмо;

• загруженная HTML-страница.

14. Способ по п.13, по которому в качестве характеристики события на терминальном устройстве пользователя выступает по меньшей мере:

• текст СМС-сообщения;

• содержимое служебных полей электронного письма;

• содержимое электронного письма;

• содержимое служебных заголовков HTML-страницы;

• содержимое текстовых блоков HTML-страницы.

15. Способ по п.12, по которому схожесть двух событий вычисляют на основании модели преобразования характеристики события в числовой вектор.

16. Способ по п.12, по которому в качестве класса события выступает по меньшей мере:

• регулярный;

• нежелательный;

• неизвестный.

17. Способ по п.12, по которому в качестве алгоритма разложения используют по меньшей мере:

• метод главных компонент;

• сингулярное разложение;

• неотрицательное разложение матрицы.

18. Способ по п.17, по которому значение каждого элемента матрицы пользовательских предпочтений определяют методом минимизации функции ошибки, характеризующей расстояние между определенным и фактическим значением рейтинга события из базы событий.

19. Способ по п.18, по которому рейтинг события из базы событий вычисляют при помощи модели классификации, заранее обученной на атрибутах события.

20. Способ по п.17, по которому в качестве атрибута события из базы событий выступает по меньшей мере:

• параметры медиаданных события;

• флаг перехвата медиаданных события на терминальном устройстве;

• время, прошедшее с момента перехвата медиаданных события на терминальном устройстве;

• флаг просмотра пользователем терминального устройства медиаданных события;

• флаг удаления пользователем терминального устройства медиаданных события.

21. Способ по п.17, по которому для перехваченного события определяют правило классификации таким образом, что перехваченное событие классифицируют как нежелательное на терминальном устройстве пользователя, если рейтинг схожего события в сформированном профиле пользователя меньше заранее заданного значения.

22. Способ по п.17, по которому матрицу пользовательских предпочтений формируют на основании повторного вычисления рейтинга события из базы событий таким образом, чтобы значения матрицы были точнее, чем текущие.



 

Похожие патенты:

Группа изобретений относится к системам проверки, более конкретно, к проверке авторства сеанса электронной подписи. Техническим результатом является повышение точности управления удаленной встречей с нотариусом, за счет синхронизации отображаемого документа подписывающей стороне с отображением документа удаленному нотариальному агенту.

Изобретение относится к вычислительной технике. Технический результат заключается в обеспечении защиты от незаконного присвоения и ошибочного использования конфиденциальных данных пользователя.

Группа изобретений относится к технике связи. Технический результат заключается в снижении вероятности потерь пакетов и обеспечении своевременной передачи аварийных данных.

Изобретение относится к области связи, а именно обмена данными. Технический результат заключается в повышении безопасности обмена данных.

Изобретение относится к бортовым волоконно-оптическим системам передачи данных и может быть использовано для формирования волоконно-оптической системы с функцией реконфигурации на борту летательных аппаратов, морских кораблей, космических систем, а также любых наземных технологических объектов. Техническим результатом изобретения является расширение функциональных возможностей бортовой волоконно-оптической системы передачи данных за счет обеспечения функции гибкой настройки спектральной составляющей оптических модулей участников обмена данных в режиме реального времени.

Изобретение относится к области связи. Технический результат заключается в обеспечении возможности управления пакетом предоставления сервиса, установленным в интеллектуальной платформе безопасности.

Изобретение относится к области связи. Технический результат изобретения заключается в уменьшении сложности обработки протокола и эффективном осуществлении связи между терминальным устройством и устройством базовой станции.

Изобретение относится к области вычислительной техники, в частности к вычислительным системам электронной почты (e-mail), ведения календарей или планирования. Технический результат заключается в возможности автоматического выявления уровня удовлетворения системой у множества различных пользователей.

Изобретение относится к средствам для идентификации сетевой службы. Технический результат – повышение эффективности определения типа службы для службы, подлежащей идентификации, на основании результата анализа пакета службы.

Изобретение относится к вычислительной технике. Технический результат заключается в улучшении уровня защиты набора устройств пользователя.

Изобретение относится к вычислительной технике. Технический результат заключается в обеспечении оценки степени износа IoT-устройства.
Наверх