Способ, устройство и система для определения нежелательного телефонного номера - заявка 2016119025 на патент на изобретение в РФ

1. Способ определения нежелательного телефонного номера, содержащий:
получение целевых записей данных вызова из по меньшей мере одного терминала с целью формирования группы записей данных вызова, причем указанная группа записей данных вызова содержит заранее заданное число целевых записей данных вызова, каждая из целевых записей данных вызова содержит незнакомый номер и по меньшей мере одно ключевое слово, указанное по меньшей мере одно ключевое слово получается терминалом на основании текстовых данных содержания вызова, сделанного с указанного незнакомого номера, и служит для представления темы вызова, соответствующей указанным текстовым данным содержания вызова, а указанный незнакомый номер представляет собой номер, не хранящийся в списке контактных лиц терминала, соответствующего указанному незнакомому номеру;
получение N подозрительных номеров в указанной группе записей данных вызова, причем указанными N подозрительными номерами являются первые N незнакомых номеров из числа незнакомых номеров, содержащихся в заранее заданном числе целевых записей данных вызова и упорядоченных в соответствии с частотами появления в порядке убывания;
проверку присутствия характерного для злоупотребления слова, записанного в заранее заданном словаре, в ключевых словах, содержащихся в целевой записи данных вызова, относящейся к каждому подозрительному номеру; и,
если характерное для злоупотребления слово, записанное в заранее заданном словаре, присутствует в ключевых словах, содержащихся в целевой записи данных вызова, относящейся к любому подозрительному номеру, полагание подозрительного номера, имеющего характерное для злоупотребления слово в целевой записи данных вызова, относящейся к указанному подозрительному номеру, нежелательным телефонным номером.

2. Способ по п. 1, отличающийся тем, что полагание подозрительного номера, имеющего характерное для злоупотребления слово в целевой записи данных вызова, относящейся к указанному подозрительному номеру, нежелательным телефонным номером содержит:
получение группы целевых записей данных вызова, образованной целевыми записями данных вызова, содержащими первый подозрительный телефонный номер, причем первым подозрительным телефонным номером является любой подозрительный номер, имеющий характерное для злоупотребления слово в любой целевой записи данных вызова, относящейся к этому первому подозрительному номеру;
определение типа злоупотребления, соответствующего характерному для злоупотребления слову, содержащемуся в первой записи данных вызова, на основании взаимосвязи между заранее заданными характерными для злоупотребления словами и типами злоупотребления, причем тип злоупотребления указывает цель злоупотребления, соответствующую первому подозрительному телефонному номеру, а первая запись данных вызова представляет собой любую запись данных вызова в группе целевых записей данных вызова;
полагание типа злоупотребления, соответствующего характерному для злоупотребления слову, содержащемуся в первой записи данных вызова, типом злоупотребления, относящимся к этой первой записи данных вызова;
подсчет количества записей данных вызова, соответствующих каждому типу злоупотребления, в указанной группе целевых записей данных вызова;
определение доли каждого типа злоупотребления в группе целевых записей данных вызова на основании отношения количества записей данных вызова, соответствующих каждому типу злоупотребления, к общему количеству записей данных вызова в указанной группе целевых записей данных вызова; и
полагание первого подозрительного телефонного номера нежелательным телефонным номером, если в указанной группе целевых записей данных вызова присутствует тип злоупотребления, имеющий долю, превышающую пороговое значение доли.

3. Способ по п. 2, дополнительно содержащий полагание типа злоупотребления, имеющего наибольшую долю в группе целевых записей данных вызова, типом злоупотребления, соответствующим указанному нежелательному телефонному номеру.

4. Способ по любому из пп. 1-3, отличающийся тем, что каждая из целевых записей данных вызова содержит два телефонных номера, и в числе этих двух телефонных номеров содержится незнакомый номер, а указанное получение N подозрительных номеров в группе записей данных вызова содержит:
удаление повторяющейся записи данных вызова из указанной группы записей данных вызова, причем удаление повторяющейся записи данных вызова имеет целью удаление записи данных вызова в по меньшей мере двух записях данных вызова одинакового типа, не затрагивающее целевую запись данных вызова, содержащую больше всего ключевых слов, а указанные по меньшей мере две записи данных вызова одинакового типа являются целевыми записями данных вызова, содержащими два идентичных телефонных номера; и
получение N подозрительных номеров в группе записей данных вызова, подвергнутой указанному удалению.

5. Способ определения нежелательного телефонного номера, содержащий:
получение речевых данных вызова и записи данных вызова, относящихся к вызову, который сделан с использованием незнакомого номера, причем указанная запись данных вызова содержит этот незнакомый номер, а этот незнакомый номер представляет собой номер, не хранящийся в списке контактных лиц;
преобразование указанных речевых данных вызова в текстовые данные содержания вызова;
получение по меньшей мере одного ключевого слова текстовых данных содержания вызова, причем указанное по меньшей мере одно ключевое слово является словом, представляющим тему вызова, относящуюся к указанным текстовым данным содержания вызова;
формирование целевой записи данных вызова на основании указанного по меньшей мере одного ключевого слова и указанной записи данных вызова, причем указанная целевая запись данных вызова содержит указанный незнакомый номер и указанное по меньшей мере одно ключевое слово; и
передачу указанной целевой записи данных вызова в сервер, выполненный с возможностью проверки того, является ли этот незнакомый номер нежелательным телефонным номером, на основании этого незнакомого номера и указанного по меньшей мере одного ключевого слова в целевой записи данных вызова.

6. Способ по п. 5, отличающийся тем, что получение по меньшей мере одного ключевого слова текстовых данных содержания вызова содержит:
выполнение разбиения текстовых данных содержания вызова на слова с целью получения результата разбиения на слова, содержащего по меньшей мере одно слово;
получение коэффициента ключевого слова каждого слова, содержащегося в результате разбиения на слова, причем указанный коэффициент ключевого слова имеет положительную корреляцию с тематической коррелятивностью каждого слова, а тематическая коррелятивность каждого слова служит для указания на коррелятивность между каждым словом и темой вызова, соответствующей указанным текстовым данным содержания вызова;
упорядочение слов, содержащихся в результате разбиения на слова, в порядке убывания соответствующих значений коэффициентов ключевого слова; и
использование первых M слов в качестве ключевых слов текстовых данных содержания вызова.

7. Способ по п. 6, отличающийся тем, что получение коэффициента ключевого слова каждого слова, содержащегося в результате разбиения на слова, содержит:
получение типа каждого слова, содержащегося в указанном результате разбиения на слова, в соответствии с заранее заданным словарем типов, причем указанный тип служит для представления характеристики каждого слова;
задание веса для каждого слова, содержащегося в результате разбиения на слова, в соответствии с типом каждого слова на основании взаимосвязи между заранее заданными типами и весами;
получение частоты встречаемости каждого слова, содержащегося в результате разбиения на слова; и
использование для каждого слова произведения веса и частоты встречаемости этого слова в качестве коэффициента ключевого слова этого слова.

8. Способ по п. 6, отличающийся тем, что получение коэффициента ключевого слова каждого слова, содержащегося в результате разбиения на слова, содержит:
удаление слов, у которых типом слова является модальная частица, личное местоимение или уточняющее слово, из результата разбиения на слова с целью получения обработанного результата разбиения на слова; и
получение коэффициента ключевого слова для каждого слова, содержащегося в результате разбиения на слова, подвергнутом указанному удалению.

9. Устройство для определения нежелательного телефонного номера, содержащее:
модуль формирования группы, выполненный с возможностью получения целевых записей данных вызова из по меньшей мере одного терминала с целью формирования группы записей данных вызова, причем эта группа записей данных вызова содержит заранее заданное число целевых записей данных вызова, каждая из целевых записей данных вызова содержит незнакомый номер и по меньшей мере одно ключевое слово, указанное по меньшей мере одно ключевое слово получается терминалом на основании текстовых данных содержания вызова, сделанного с использованием указанного незнакомого номера, и служит для представления темы вызова, относящейся к указанным текстовым данным содержания вызова, а указанный незнакомый номер представляет собой номер, не хранящийся в списке контактных лиц терминала, соответствующего указанному незнакомому номеру;
модуль получения номера, выполненный с возможностью получения N подозрительных номеров в группе записей данных вызова, причем указанные N подозрительных номеров представляют собой первые N незнакомых номеров из числа незнакомых номеров, содержащихся в заранее заданном числе целевых записей данных вызова и упорядоченных в соответствии с частотами появления в порядке убывания;
модуль проверки, выполненный с возможностью проверки присутствия характерного для злоупотребления слова, записанного в заранее заданный словарь, в ключевых словах, содержащихся в целевой записи данных вызова, относящейся к каждому подозрительному номеру; и
модуль полагания, выполненный с возможностью в случае, если характерное для злоупотребления слово, записанное в заранее заданном словаре, присутствует в ключевых словах, содержащихся в целевой записи данных вызова, относящейся к любому подозрительному номеру, полагания подозрительного номера, имеющего характерное для злоупотребления слово в целевой записи данных вызова, относящейся к указанному подозрительному номеру, нежелательным телефонным номером.

10. Устройство по п. 9, отличающееся тем, что модуль полагания содержит:
субмодуль формирования группы, выполненный с возможностью формирования группы целевых записей данных вызова, образованной целевыми записями данных вызова, содержащими первый подозрительный телефонный номер, причем этим первым подозрительным телефонным номером является любой подозрительный номер, имеющий характерное для злоупотребления слово в любой целевой записи данных вызова, относящейся к этому первому подозрительному номеру;
субмодуль определения характерного слова, выполненный с возможностью определения типа злоупотребления, относящегося к характерному для злоупотребления слову, содержащемуся в первой записи данных вызова, на основании взаимосвязи между заранее заданными характерными для злоупотребления словами и типами злоупотребления, причем тип злоупотребления указывает цель злоупотребления первого подозрительного телефонного номера, а первая запись данных вызова представляет собой любую запись данных вызова в группе целевых записей данных вызова;
субмодуль доопределения записи, выполненный с возможностью задания типа злоупотребления, соответствующего характерному для злоупотребления слову, содержащемуся в первой записи данных вызова, в качестве типа злоупотребления, относящегося к первой записи данных вызова;
субмодуль подсчета, выполненный с возможностью подсчета количества записей данных вызова, соответствующих каждому типу злоупотребления, в группе целевых записей данных вызова;
субмодуль определения доли, выполненный с возможностью определения доли каждого типа злоупотребления в группе целевых записей данных вызова на основании отношения количества записей данных вызова, соответствующих каждому типу злоупотребления, к общему количеству записей данных вызова в указанной группе целевых записей данных вызова; и
субмодуль полагания номера, выполненный с возможностью полагания первого подозрительного телефонного номера нежелательным телефонным номером, когда в группе целевых записей данных вызова присутствует тип злоупотребления с долей, превышающей пороговое значение доли.

11. Устройство по п. 9, дополнительно содержащее модуль задания типа, выполненный с возможностью задания типа злоупотребления, имеющего наибольшую долю в группе целевых записей данных вызова, в качестве типа злоупотребления, относящегося к нежелательному телефонному номеру.

12. Устройство по любому из пп. 9-11, отличающееся тем, что каждая из целевых записей данных вызова содержит два телефонных номера, и в числе этих двух телефонных номеров содержится незнакомый номер, модуль получения номера выполнен с возможностью удаления повторяющейся записи данных вызова из группы записей данных вызова, причем это удаление повторяющейся записи данных вызова имеет целью удаление записи данных вызова в по меньшей мере двух записях данных вызова одинакового типа, не затрагивающее целевую запись данных вызова, содержащую больше всего ключевых слов, а указанные по меньшей мере две записи данных вызова одинакового типа являются целевыми записями данных вызова, содержащими два идентичных телефонных номера; а модуль получения номера выполнен с возможностью получения N подозрительных номеров в группе записей данных вызова, подвергнутой указанному удалению.

13. Устройство для определения нежелательного телефонного номера, содержащее:
модуль получения данных терминала, выполненный с возможностью получения речевых данных вызова и записи данных вызова, относящейся к вызову, сделанному с использованием незнакомого номера, причем указанная запись данных вызова содержит указанный незнакомый номер, и этот незнакомый номер представляет собой номер, не хранящийся в списке контактных лиц;
модуль преобразования, выполненный с возможностью преобразования речевых данных вызова в текстовые данные содержания вызова;
модуль получения ключевого слова, выполненный с возможностью получения по меньшей мере одного ключевого слова, относящегося к текстовым данным содержания вызова, причем указанное по меньшей мере одно ключевое слово является словом, представляющим тему вызова, относящуюся к указанным текстовым данным содержания вызова;
модуль формирования целевой записи, выполненный с возможностью формирования целевой записи данных вызова на основании указанного по меньшей мере одного ключевого слова и указанной записи данных вызова, причем указанная целевая запись данных вызова содержит указанный незнакомый номер и указанное по меньшей мере одно ключевое слово; и
модуль передачи записи, выполненный с возможностью передачи целевой записи данных вызова в сервер, выполненный с возможностью проверки того, является ли этот незнакомый номер нежелательным телефонным номером, на основании этого незнакомого номера и указанного по меньшей мере одного ключевого слова в целевой записи данных вызова.

14. Устройство по п. 13, отличающееся тем, что модуль получения ключевого слова содержит:
субмодуль разбиения на слова, выполненный с возможностью разбиения текстовых данных содержания вызова на слова с целью получения результата разбиения на слова, содержащего по меньшей мере одно слово;
субмодуль получения коэффициента, выполненный с возможностью получения коэффициента ключевого слова каждого слова, содержащегося в результате разбиения на слова, причем указанный коэффициент ключевого слова имеет положительную корреляцию с тематической коррелятивностью каждого слова, а тематическая коррелятивность каждого слова служит для указания на коррелятивность между каждым словом и темой вызова, соответствующей указанным текстовым данным содержания вызова;
субмодуль сортировки по коэффициенту, выполненный с возможностью упорядочения слов, содержащихся в результате разбиения на слова, в порядке убывания соответствующих значений коэффициентов ключевого слова; и
субмодуль определения ключевого слова, выполненный с возможностью использования первых M слов в качестве ключевых слов указанных текстовых данных содержания вызова.

15. Устройство по п. 14, отличающееся тем, что субмодуль получения коэффициента выполнен с возможностью
получения типа каждого слова в указанном результате разбиения на слова в соответствии с заранее заданным словарем типов, причем указанный тип служит для представления характеристики каждого слова;
задания веса для каждого слова, содержащегося в результате разбиения на слова, в соответствии с типом каждого слова на основании взаимосвязи между заранее заданными типами и весами;
нахождения частоты встречаемости каждого слова, содержащегося в результате разбиения на слова; и
использования для каждого слова произведения веса и частоты встречаемости этого слова в качестве коэффициента ключевого слова этого слова.

16. Устройство по п. 13, отличающееся тем, что субмодуль получения коэффициента выполнен с возможностью
удаления слов, у которых типом слова является модальная частица, личное местоимение или уточняющее слово, из результата разбиения на слова с целью получения обработанного результата разбиения на слова; и
получения коэффициента ключевого слова для каждого слова, содержащегося в этом обработанном результате разбиения на слова.

17. Устройство для определения нежелательного телефонного номера, содержащее:
процессор,
память, выполненную с возможностью хранения команд, выполняемых процессором,
причем указанный процессор выполнен с возможностью
получения целевых записей данных вызова из по меньшей мере одного терминала с целью формирования группы записей данных вызова, причем эта группа записей данных вызова содержит заранее заданное число целевых записей данных вызова, каждая из целевых записей данных вызова содержит незнакомый номер и по меньшей мере одно ключевое слово, указанное по меньшей мере одно ключевое слово получается терминалом на основании текстовых данных содержания вызова, сделанного с использованием указанного незнакомого номера, и служит для представления темы вызова, относящейся к текстовым данным содержания вызова, а указанный незнакомый номер представляет собой номер, не хранящийся в списке контактных лиц терминала, соответствующего указанному незнакомому номеру;
получения N подозрительных номеров в группе записей данных вызова, причем указанные N подозрительных номеров представляют собой первые N незнакомых номеров из числа незнакомых номеров, содержащихся в заранее заданном числе целевых записей данных вызова и упорядоченных в соответствии с частотами появления в порядке убывания;
проверки присутствия характерного для злоупотребления слова, записанного в заранее заданный словарь, в ключевых словах, содержащихся в целевой записи данных вызова, относящейся к каждому подозрительному номеру; и,
если характерное для злоупотребления слово, записанное в заранее заданном словаре, присутствует в ключевых словах, содержащихся в целевой записи данных вызова, относящейся к любому подозрительному номеру, полагания подозрительного номера, имеющего характерное для злоупотребления слово в целевой записи данных вызова, относящейся к указанному подозрительному номеру, нежелательным телефонным номером.

18. Устройство для определения нежелательного телефонного номера, содержащее:
процессор,
память, выполненную с возможностью хранения команд, выполняемых указанным процессором,
причем указанный процессор выполнен с возможностью
получения речевых данных вызова и записи данных вызова, относящейся к вызову, сделанному с использованием незнакомого номера, причем указанная запись данных вызова содержит указанный незнакомый номер, и этот незнакомый номер представляет собой номер, не хранящийся в списке контактных лиц;
преобразования речевых данных вызова в текстовые данные содержания вызова;
получения по меньшей мере одного ключевого слова, относящегося к текстовым данным содержания вызова, причем указанное по меньшей мере одно ключевое слово является словом, представляющим тему вызова, относящуюся к указанным текстовым данным содержания вызова;
формирования целевой записи данных вызова на основании указанного по меньшей мере одного ключевого слова и указанной записи данных вызова, причем указанная целевая запись данных вызова содержит указанный незнакомый номер и указанное по меньшей мере одно ключевое слово; и
передачи целевой записи данных вызова в сервер, выполненный с возможностью проверки того, является ли этот незнакомый номер нежелательным телефонным номером, на основании этого незнакомого номера и указанного по меньшей мере одного ключевого слова в целевой записи данных вызова.

19. Система для определения нежелательного телефонного номера, содержащая сервер и терминал, в которой
сервер содержит устройство для определения нежелательного телефонного номера по любому из пп. 9-12, а
терминал содержит устройство для определения нежелательного телефонного номера по любому из пп. 13-16.

20. Система для определения нежелательного телефонного номера, содержащая сервер и терминал, в которой
сервер содержит устройство для определения нежелательного телефонного номера по п. 17, а
терминал содержит устройство для определения нежелательного телефонного номера по п. 18.
Наверх