Способ и устройство иерархической фильтрации документов - заявка 2016141279 на патент на изобретение в РФ

1. Способ иерархической фильтрации документов, который отличается тем, что содержит этапы, на которых:
выбирают несколько документов из фильтруемого набора документов текущего слоя фильтрации документов в соответствии с предварительно установленной стратегией отбора образцов и формируют первый список документов посредством использования выбранных документов в соответствии с упорядоченностью выбранных документов в фильтруемом наборе документов, при этом документы в фильтруемом наборе документов упорядочены в соответствии со значениями качества документов на вышерасположенном слое фильтрации документов;
вычисляют значение качества каждого документа в первом списке документов на текущем слое фильтрации документов соответственно согласно способу вычисления релевантности для текущего слоя фильтрации документов;
переупорядочивают документы в первом списке документов в соответствии со значением качества каждого документа в первом списке документов на текущем слое фильтрации документов, чтобы получить второй список документов; и
фильтруют фильтруемый набор документов текущего слоя фильтрации документов в соответствии со степенью согласованности между первым списком документов и вторым списком документов.
2. Способ по п. 1, который отличается тем, что этап, на котором выбирают несколько документов из фильтруемого набора документов текущего слоя фильтрации документов в соответствии с предварительно установленной стратегией отбора образцов, содержит этапы, на которых:
определяют, в соответствии с количеством документов, которые содержатся в фильтруемом наборе документов текущего слоя фильтрации документов, первое количество подмножеств документов, на которое требуется разделить фильтруемый набор документов, и второе количество документов, которое требуется выбрать из каждого из подмножеств документов;
делят фильтруемый набор документов на первое количество подмножеств документов в соответствии с упорядоченностью документов; и
выбирают второе количество документов из каждого из подмножеств документов соответственно, чтобы получить упомянутые несколько документов.
3. Способ по п. 2, который отличается тем, что этап, на котором выбирают второе количество документов из каждого из подмножеств документов соответственно, содержит этапы, на которых:
выбирают второе количество документов из передней части каждого из подмножеств документов соответственно; или
выбирают второе количество документов из каждого из подмножеств документов с предварительно определенным интервалом, соответственно; или
выбирают второе количество документов из каждого из подмножеств документов соответственно случайным образом.
4. Способ по п. 1, который отличается тем, что этап, на котором выбирают несколько документов из фильтруемого набора документов текущего слоя фильтрации документов в соответствии с предварительно установленной стратегией отбора образцов, содержит этапы, на которых:
определяют интервал отбора образцов документов в соответствии с количеством документов, которые содержатся в фильтруемом наборе документов текущего слоя фильтрации документов; и
выбирают документы из фильтруемого набора документов с интервалом отбора образцов документов, чтобы получить упомянутые несколько документов.
5. Способ по п. 1, который отличается тем, что этап, на котором фильтруют фильтруемый набор документов текущего слоя фильтрации документов в соответствии со степенью согласованности между первым списком документов и вторым списком документов, содержит этапы, на которых:
оценивают, является ли степень согласованности между первым списком документов и вторым списком документов больше, чем предварительно установленная пороговая величина согласованности;
если да, отфильтровывают документы, удовлетворяющие предварительно установленному условию фильтрации, в фильтруемом наборе документов текущего слоя фильтрации документов; и
если нет, вычисляют значение качества каждого документа в фильтруемом наборе документов в соответствии со способом вычисления релевантности для текущего слоя фильтрации документов, переупорядочивают документы в фильтруемом наборе документов в соответствии с вычисленными значениями качества и отфильтровывают документы, удовлетворяющие предварительно установленному условию фильтрации, в переупорядоченном фильтруемом наборе документов.
6. Способ по п. 1, который отличается тем, что после этапа, на котором фильтруют фильтруемый набор документов текущего слоя фильтрации документов в соответствии со степенью согласованности между первым списком документов и вторым списком документов, способ дополнительно содержит этапы, на которых:
оценивают, удовлетворяется ли предварительно установленное условие остановки фильтрации, в соответствии с номером слоя у текущего слоя фильтрации документов или количеством документов в отфильтрованном фильтруемом наборе документов; если да, определяют документы в отфильтрованном фильтруемом наборе документов в качестве результата поиска; и если нет, используют отфильтрованный фильтруемый набор документов в качестве нового набора документов и фильтруют этот новый набор документов посредством использования нижерасположенного слоя фильтрации документов.
7. Устройство иерархической фильтрации документов, которое отличается тем, что устройство содержит:
модуль выбора, выполненный с возможностью выбирать несколько документов из фильтруемого набора документов текущего слоя фильтрации документов в соответствии с предварительно установленной стратегией отбора образцов и формировать первый список документов посредством использования выбранных документов в соответствии с упорядоченностью выбранных документов в фильтруемом наборе документов, при этом документы в фильтруемом наборе документов упорядочены в соответствии со значениями качества документов на вышерасположенном слое фильтрации документов;
модуль вычисления, выполненный с возможностью вычислять значение качества каждого документа в первом списке документов соответственно согласно способу вычисления релевантности для текущего слоя фильтрации документов;
модуль упорядочивания, выполненный с возможностью переупорядочивать документы в первом списке документов в соответствии со значением качества каждого документа в первом списке документов, чтобы получить второй список документов; и
модуль фильтрации, выполненный с возможностью фильтровать фильтруемый набор документов текущего слоя фильтрации документов в соответствии со степенью согласованности между первым списком документов и вторым списком документов.
8. Устройство по п. 7, которое отличается тем, что модуль выбора содержит:
первый блок определения, выполненный с возможностью определять, в соответствии с количеством документов, которые содержатся в фильтруемом наборе документов текущего слоя фильтрации документов, первое количество подмножеств документов, на которое требуется разделить фильтруемый набор документов, и второе количество документов, которое требуется выбрать из каждого из подмножеств документов;
блок деления, выполненный с возможностью разделять фильтруемый набор документов на первое количество подмножеств документов в соответствии с упорядоченностью документов; и
первый блок выбора, выполненный с возможностью выбирать второе количество документов из каждого из подмножеств документов, соответственно, чтобы получить упомянутые несколько документов.
9. Устройство по п. 8, которое отличается тем, что первый блок выбора содержит:
первый субблок выбора, выполненный с возможностью выбора второго количества документов из передней части каждого из подмножеств документов, соответственно; или
второй субблок выбора, выполненный с возможностью выбора второго количества документов из каждого из подмножеств документов с предварительно определенным интервалом, соответственно; или
третий субблок выбора, выполненный с возможностью выбора второго количества документов из каждого из подмножеств документов соответственно случайным образом.
10. Устройство по п. 7, которое отличается тем, что модуль выбора содержит:
второй блок определения, выполненный с возможностью определения интервала отбора образцов документов в соответствии с количеством документов, которые содержатся в фильтруемом наборе документов текущего слоя фильтрации документов; и
второй блок выбора, выполненный с возможностью выбора документов из фильтруемого набора документов с интервалом отбора образцов документов, чтобы получить упомянутые несколько документов.
11. Устройство по п. 7, которое отличается тем, что модуль фильтрации содержит:
блок фильтрации, выполненный с возможностью определять, является ли степень согласованности между первым списком документов и вторым списком документов больше, чем предварительно установленная пороговая величина согласованности; если да, отфильтровывать документы, удовлетворяющие предварительно установленному условию фильтрации, в фильтруемом наборе документов текущего слоя фильтрации документов; и если нет, вычислять значение качества каждого документа в фильтруемом наборе документов в соответствии со способом вычисления релевантности для текущего слоя фильтрации документов, переупорядочивать документы в фильтруемом наборе документов в соответствии с вычисленными значениями качества и отфильтровывать документы, удовлетворяющие предварительно установленному условию фильтрации, в переупорядоченном фильтруемом наборе документов.
12. Устройство по п. 7, которое отличается тем, что устройство дополнительно содержит:
модуль оценки остановки, выполненный с возможностью определять, удовлетворяется ли предварительно установленное условие остановки фильтрации, в соответствии с номером слоя у текущего слоя фильтрации документов или количеством документов в отфильтрованном фильтруемом наборе документов; если да, определять документы в отфильтрованном фильтруемом наборе документов в качестве результата поиска; и если нет, использовать отфильтрованный фильтруемый набор документов в качестве нового набора документов и фильтровать этот новый набор документов посредством использования нижерасположенного слоя фильтрации документов.
Наверх