Способ и устройство для кластеризации



Способ и устройство для кластеризации
Способ и устройство для кластеризации
Способ и устройство для кластеризации
Способ и устройство для кластеризации
Способ и устройство для кластеризации
Способ и устройство для кластеризации
Способ и устройство для кластеризации
Способ и устройство для кластеризации
Способ и устройство для кластеризации
Способ и устройство для кластеризации

 


Владельцы патента RU 2630373:

СЯОМИ ИНК. (CN)

Изобретение относится, в общем, к кластеризации данных, в частности к кластеризации изображений. Техническим результатом является повышение точности результата кластеризации. В способе кластеризации получают взвешенное расстояние между классами согласно весовым коэффициентам, соответствующим межобъектным расстояниям. При этом весовой коэффициент определяют согласно сходству между двумя объектами, т.е. межобъектное расстояние является взвешенным. Объединяют классы, взвешенные расстояния между которыми отвечают условию объединения. При этом выполнение способа не завершают до тех пор, пока количество классов после объединения не будет тем же, что и количество классов до объединения. После чего получают результат кластеризации. Поскольку взвешенное расстояние связано со сходством между двумя объектами, различные межобъектные расстояния обеспечивают различный вклад, при этом чем больше сходство, тем большим будет соответствующий вклад. 3 н. и 4 з.п. ф-лы, 8 ил.

 

Настоящая заявка ссылается на приоритет заявки на патент Китайской Народной Республики №201410096608.9, на которой она основана и которая была зарегистрирована 14 марта 2014 года. При этом содержимое упомянутой заявки полностью включено в настоящий документ путем ссылки.

Область техники

[0001] Настоящее изобретение относится, в общем, к области компьютерных технологий, а именно, к способу кластеризации и к соответствующему устройству.

Предпосылки создания изобретения

[0002] Кластеризацией называется процедура разделения набора физических или абстрактных объектов на множество классов, каждый из которых состоит из сходных объектов, то есть, процедура классификации объектов по различным классам (или кластерам) таким образом, чтобы объекты в одном классе имели значительное сходство, а объекты из различных классов имели значительное несходство. В методах иерархической кластеризации заданное множество объектов иерархически разделяют до тех пор, пока не будет выполнено некоторое условие завершения. Метод агломерационной иерархической кластеризации - это стратегия восходящей кластеризации, в нем каждый объект сначала считают отдельным классом, и затем объединяют эти классы во все более крупные классы то тех пор, пока не будет достигнуто некоторое условие завершения. Большинство методов иерархической кластеризации относятся к подобному типу, отличаются только определения сходства между классами.

[0003] Например, если метод кластеризации используют для классификации изображений, то изображения, относящиеся к одному человеку, относят к одному классу, при этом в соответствующем методе кластеризации для измерения сходства двух лиц используют только расстояния между классами. Однако расстояния между соответствующими объектами вносят практически столь же значительный вклад в измерение сходства, и поэтому точность результатов кластеризации в подобных методах кластеризации является сравнительно низкой.

Сущность изобретения

[0004] С целью преодоления недостатков, имеющихся на существующем уровне техники, в настоящем изобретении предложены способ кластеризации и соответствующее устройство, которые позволяют повысить точность результатов кластеризации.

[0005] Для решения поставленной выше технической задачи в вариантах осуществления настоящего изобретения предложены технические решения, которые будут изложены ниже.

[0006] В соответствии с первым аспектом вариантов осуществления настоящего изобретения предложен способ кластеризации, включающий:

[0007] получение взвешенного расстояния между двумя классами согласно весовому коэффициенту, соответствующему межобъектному расстоянию в отношении всех объединяемых классов, при этом упомянутый коэффициент определяют в соответствии со сходством между двумя объектами согласно межобъектному расстоянию; определение, имеются ли классы, которые могут быть объединены, в соответствии с упомянутым взвешенным расстоянием между двумя классами и заранее заданным пороговым значением расстояния; если классы, которые могут быть объединены, существуют, соответствующее объединение всех классов, которые могут быть объединены, и возврат к выполнению шага получения взвешенного расстояния в отношении всех объединяемых классов до тех пор, пока количество классов после объединения не будет тем же самым, что и количество классов до объединения, и получение результата кластеризации.

[0008] В сочетании с первым аспектом настоящего изобретения, в первой возможной реализации этого первого аспекта, способ дополнительно включает:

[0009] получение отношения соответствия между межобъектным расстоянием и вероятностью того, что два объекта являются одним и тем же объектом, в соответствии со статистикой по образцовым объектам; и определение отношения отображения между межобъектным расстоянием и упомянутым весовым коэффициентом согласно упомянутому отношению соответствия, при этом упомянутый весовой коэффициент определяют в соответствии с упомянутой вероятностью.

[0010] В сочетании с первой возможной реализацией первого аспекта настоящего изобретения, во второй реализации этого первого аспекта, определение отношения отображения между упомянутым межобъектным расстоянием и упомянутым весовым коэффициентом согласно упомянутому отношению соответствия выполняют следующим образом:

[0011] запрашивают упомянутое отношение соответствия для получения вероятности того, что два объекта, соответствующие межобъектному расстоянию, являются одним и тем же объектом; и определяют, что эта вероятность является весовым коэффициентом, соответствующим упомянутому межобъектному расстоянию.

[0012] В сочетании с первым аспектом настоящего изобретения или первой возможной реализацией этого первого аспекта, в третьей возможной реализации первого аспекта настоящего изобретения упомянутое взвешенное расстояние представляет собой взвешенное расстояние между первым классом и вторым классом; при этом получение взвешенного расстояния между двумя классами согласно весовому коэффициенту, соответствующему межобъектному расстоянию в отношении всех объединяемых классов, выполняют следующим образом:

[0013] получают первое однонаправленное взвешенное расстояние между первым классом и вторым классом, согласно расстояниям между всеми объектами первого класса и всеми объектами второго класса, и соответствующими весовыми коэффициентами; получают второе однонаправленное взвешенное расстояние между вторым классом и первым классом; и получают взвешенное расстояние между первым классом и вторым классом в соответствии с упомянутыми первым однонаправленным взвешенным расстоянием и вторым однонаправленным взвешенным расстоянием.

[0014] В сочетании с третьей возможной реализацией первого настоящего изобретения, в четвертой возможной реализации этого первого аспекта получение первого однонаправленного взвешенного расстояния между первым классом и вторым классом согласно расстояниям между всеми объектами упомянутого первого класса и всеми объектами упомянутого второго класса, и соответствующими весовыми коэффициентами, выполняют следующим образом:

[0015] получают наибольшее расстояние сходства между любым из объектов в упомянутом первом классе и всеми объектами упомянутого второго класса, и первый весовой коэффициент, соответствующий этому наибольшему расстоянию сходства;

[0016] получают минимальное взвешенное расстояние между объектом в упомянутом первом классе и всеми объектами упомянутого второго класса, согласно произведению упомянутого наибольшего расстояния сходства и упомянутого соответствующего первого весового коэффициента;

[0017] получают среднее взвешенное расстояние по расстояниям между объектом в упомянутом первом классе и другими объектами, за исключением объекта, который соответствует упомянутому наибольшему расстоянию сходства в упомянутом втором классе;

[0018] получают взвешенное расстояние между объектом в упомянутом первом классе и упомянутом вторым классом, в соответствии с упомянутым минимальным взвешенным расстоянием и упомянутым средним взвешенным расстоянием; и

[0019] получают первое однонаправленное взвешенное расстояние между упомянутым первым классом и упомянутым вторым классом в соответствии со взвешенными расстояниями между всеми объектами в упомянутом первом классе и упомянутым вторым классом, и весовыми коэффициентами, соответствующими этим взвешенным расстояниям.

[0020] В соответствии со вторым аспектом вариантов осуществления настоящего изобретения предложено устройство для кластеризации, включающее:

[0021] блок получения, сконфигурированный для получения взвешенного расстояния между двумя классами согласно весовому коэффициенту, соответствующему межобъектным расстояниям в отношении всех объединяемых классов, при этом упомянутый весовой коэффициент определяют в соответствии со сходством двух объектов, соответствующих межобъектному расстоянию;

[0022] блок определения, сконфигурированный для определения, имеются ли классы, которые могут быть объединены, в соответствии со взвешенным расстоянием между двумя классами и заранее заданным пороговым значением расстояния; и

[0023] блок объединения, сконфигурированный для соответствующего объединения всех классов, которые могут быть объединены, если классы, которые могут быть объединены, существуют, при этом упомянутый блок получения выполняет шаг получения взвешенного расстояния между двумя классами согласно весовому коэффициенту, соответствующему межобъектному расстоянию в отношении всех объединяемых классов, до тех пор, пока количество классов после объединения не будет тем же, что и количество классов до объединения, и для получения результата кластеризации.

[0024] В сочетании со вторым аспектом настоящего изобретения, в первой возможной реализации этого второго аспекта, устройство дополнительно включает:

[0025] блок статистики, сконфигурированный для получения отношения соответствия между межобъектным расстоянием и вероятностью того, что два объекта являются одним и тем же объектом, согласно статистике по образцовым объектам;

[0026] блок определения, сконфигурированный для определения отношения отображения между межобъектным расстоянием и упомянутым весовым коэффициентом согласно упомянутому отношению соответствия, при этом упомянутый весовой коэффициент определяют в соответствии с упомянутой вероятностью.

[0027] В сочетании с первой возможной реализацией второго аспекта настоящего изобретения, во второй возможной реализации этого второго аспекта, упомянутый блок определения включает:

[0028] подблок запроса, сконфигурированный для запроса упомянутого отношения соответствия с целью получения вероятности того, что два объекта, соответствующие конкретному межобъектному расстоянию, являются одним и тем же человеком;

[0029] подблок определения, сконфигурированный для определения того, что упомянутая вероятность является упомянутым весовым коэффициентом, соответствующим упомянутому межобъектному расстоянию.

[0030] В сочетании с первой возможной реализацией второго аспекта настоящего изобретения или второй возможной реализацией второго аспекта настоящего изобретения, в третьей возможной реализации этого третьего аспекта упомянутое взвешенное расстояние представляет собой взвешенное расстояние между первым классом и вторым классом, при этом упомянутый блок получения включает:

[0031] первый подблок получения, сконфигурированный для получения наибольшего расстояния сходства между любым из объектов в упомянутом первом классе и всеми объектами упомянутого второго класса, и первого весового коэффициента, соответствующего этому наибольшему расстоянию сходства;

[0032] второй подблок получения, сконфигурированный для получения первого однонаправленного взвешенного расстояния между упомянутым первым классом и упомянутым вторым классом, согласно упомянутому наибольшему расстоянию сходства и соответствующему первому весовому коэффициенту, в отношении всех объектов упомянутого первого класса;

[0033] третий подблок получения, сконфигурированный для получения второго однонаправленного расстояния между упомянутым вторым классом и упомянутым первым классом; и

[0034] четвертый подблок получения, сконфигурированный для получения взвешенного расстояния между упомянутым первым классом и упомянутым вторым классом согласно упомянутым первому однонаправленному взвешенному расстоянию и второму однонаправленному взвешенному расстоянию.

[0035] В сочетании с третьей возможной реализации второго аспекта настоящего изобретения, в четвертой возможной реализацией этого второго аспекта упомянутый второй подблок получения включает:

[0036] пятый подблок получения, сконфигурированный для получения наибольшего расстояния сходства между любым из объектов в упомянутом первом классе и всеми объектами упомянутого второго класса, и первого весового коэффициента, соответствующего этому наибольшему расстоянию сходства;

[0037] шестой подблок получения, сконфигурированный для получения минимального взвешенного расстояния между объектом в упомянутом первом классе и всеми объектами упомянутого второго класса, согласно произведению упомянутого наибольшего расстояния сходства и упомянутого соответствующего первого весового коэффициента;

[0038] седьмой подблок получения, сконфигурированный для получения среднего взвешенного расстояния по расстояниям между объектом в упомянутом первом классе и другими объектами, за исключением объекта, который соответствует упомянутому наибольшему расстоянию сходства в упомянутом втором классе;

[0039] восьмой подблок получения, сконфигурированный для получения взвешенного расстояния между объектом в упомянутом первом классе и упомянутом вторым классом, в соответствии с упомянутым минимальным взвешенным расстоянием и упомянутым средним взвешенным расстоянием; и

[0040] девятый подблок получения, сконфигурированный для получения первого однонаправленного взвешенного расстояния между упомянутым первым классом и упомянутым вторым классом в соответствии со взвешенными расстояниями между всеми объектами в упомянутом первом классе и упомянутым вторым классом, и весовыми коэффициентами, соответствующими этим взвешенным расстояниям.

[0041] В соответствии с третьим аспектом вариантов осуществления настоящего изобретения предложено оконечное устройство, включающее:

[0042] процессор; и память, сконфигурированную для хранения инструкций, исполняемых упомянутым процессором;

[0043] при этом упомянутый процессор сконфигурирован:

[0044] для получения взвешенного расстояния между двумя классами согласно весовому коэффициенту, соответствующему межобъектным расстояниям в отношении всех объединяемых классов, при этом упомянутый весовой коэффициент определяют в соответствии со сходством двух объектов, соответствующих межобъектному расстоянию;

[0045] для определения, имеются ли классы, которые могут быть объединены, в соответствии со взвешенным расстоянием между двумя классами и заранее заданным пороговым значением расстояния; и

[0046] если два класса могут быть объединены, для соответствующего объединения всех классов, которые могут быть объединены, и для возврата к выполнению шага получения взвешенного расстояния между двумя классами согласно весовому коэффициенту, соответствующему межобъектному расстоянию в отношении всех объединяемых классов, до тех пор, пока количество классов после объединения не будет тем же, что и количество классов до объединения, и для получения результата кластеризации.

[0047] Технические решения, предложенные в вариантах осуществления настоящего изобретения, могут давать следующие полезные результаты: в способе кластеризации получают взвешенные расстояния между классами согласно весовым коэффициентам, соответствующим межобъектным расстояниям, при этом весовой коэффициент определяют согласно сходству между двумя объектами, т.е. межобъектное расстояние является взвешенным, и затем в способе кластеризации выполняют объединение классов, взвешенные расстояния между которыми отвечают условию объединения, при этом выполнение способа не завершают до тех пор, пока количество классов после объединения не будет тем же, что и количество классов после объединения, и затем получают результат кластеризации. Поскольку взвешенное расстояние связано со сходством между двумя объектами, различные межобъектные расстояния обеспечивают различный вклад, и чем больше сходство, тем большим будет соответствующий вклад. Таким образом, обеспечивается повышение точности результата кластеризации.

[0048] Нужно понимать, что и предшествующее общее описание, и подробное описание, приведенное ниже, являются исключительно иллюстративными и пояснительными, и не ограничивают настоящее изобретение.

Краткое описание чертежей

[0049] На приложенных чертежах, которые входят в состав настоящего описания и являются его неотъемлемой частью, проиллюстрированы варианты осуществления, соответствующие настоящему изобретению. Приложенные чертежи, вместе с описанием, служат для разъяснения замысла настоящего изобретения:

[0050] фиг. 1 представляет собой блок-схему алгоритма, иллюстрирующую способ кластеризации в соответствии с одним из примеров осуществления настоящего изобретения;

[0051] фиг. 2 представляет собой блок-схему алгоритма, иллюстрирующую шаг S110 на фиг. 1 в соответствии с одним из примеров осуществления настоящего изобретения;

[0052] фиг. 3 представляет собой блок-схему алгоритма, иллюстрирующую шаг S111 на фиг. 2 в соответствии с одним из примеров осуществления настоящего изобретения;

[0053] фиг. 4 представляет собой блок-схему алгоритма с иллюстрацией получения весового коэффициента в соответствии с одним из примеров осуществления настоящего изобретения;

[0054] фиг. 5 представляет собой блок-схему, иллюстрирующую устройство для кластеризации в соответствии с одним из примеров осуществления настоящего изобретения;

[0055] фиг. 6 представляет собой блок-схему, иллюстрирующую другое устройство для кластеризации в соответствии с одним из примеров осуществления настоящего изобретения;

[0056] фиг. 7 представляет собой блок-схему, иллюстрирующую оконечное устройство в соответствии с одним из примеров осуществления настоящего изобретения; и

[0057] Фиг. 8 представляет собой блок-схему, иллюстрирующую сервер в соответствии с одним из примеров осуществления настоящего изобретения.

[0058] Конкретные варианты осуществления изобретения в настоящем документе и на приложенных чертежах приведены исключительно для примера и будут боле подробно рассмотрены ниже. Чертежи не имеют целью сколь-либо ограничить объем настоящего изобретения. Напротив, они приведены для иллюстрации замысла изобретения специалистам в данной области техники на примерах конкретных вариантов осуществления изобретения.

Подробное описание изобретения

[0059] Фиг. 1 представляет собой блок-схему алгоритма, иллюстрирующую способ кластеризации в соответствии с одним из примеров осуществления настоящего изобретения. В соответствии с иллюстрацией фиг.1 способ кластеризации может включать следующие шаги.

[0060] На шаге S110 получают взвешенное расстояние между двумя классами согласно весовому коэффициенту, соответствующему межобъектным расстояниям в отношении всех объединяемых классов, при этом упомянутый весовой коэффициент определяют согласно сходству между объектами.

[0061] Если допустить, что объектами являются изображения человеческих лиц, то при помощи способа кластеризации, предложенного в настоящем изобретении, изображения одного и того же человека могут быть собраны вместе с формированием одного кластера. Характеристические признаки в изображении лица преобразуют в группу векторов, поэтому межобъектное расстояние представляет собой расстояние между векторами. При этом, помимо изображений, способ кластеризации, предложенный в настоящем изобретении, может также применяться и к другим данным.

[0062] Перед кластеризацией сначала выполняют инициализацию: каждый объект относят к одному классу и вычисляют расстояния между этими классами, т.е. расстояния между объектами, входящими в этим классы (например, близость косинусов, евклидово расстояние и т.п.)

[0063] Чем больше сходство между объектами, тем большее значение имеет соответствующий весовой коэффициент; и наоборот, чем меньше сходство между объектами, тем соответствующий весовой коэффициент имеет меньшее значение. Например, весовой коэффициент может быть определен в соответствии с вероятностью того, что два объекта, соответствующие конкретному межобъектному расстоянию, являются одним и тем же объектом. Или, весовой коэффициент получают с использованием взвешенной кернфункции , где w - весовой коэффициент, a d - межобъектное расстояние. Например, ; или весовой коэффициент может быть также получен с использованием заранее заданного порога, числовое значение которого в данном описании не уточняется.

[0064] В одном из вариантов осуществления настоящего изобретения, в соответствии с иллюстрацией фиг. 2, шаг S110 может включать описанные ниже шаги S111-S113.

[0065] На шаге S111 получают первое однонаправленное взвешенное расстояние между первым классом и вторым классом в соответствии со взвешенными расстояниями между всеми объектами в первом классе и в втором классе, и весовыми коэффициентами, соответствующими этим взвешенным расстояниям.

[0066] В одном из вариантов осуществления настоящего изобретения, в соответствии с иллюстрацией фиг. 3, шаг S111 может включать следующие шаги S1111-S1113.

[0067] На шаге S1111 получают наибольшее расстояние сходства между любым из объектов в первом классе и всеми объектами второго класса, и первый весовой коэффициент, соответствующий этому наибольшему расстоянию сходства.

[0068] Допустим, что первый класс обозначен за А, а второй класс обозначен за В. Вычисляют взвешенное расстояние между классом А и классом В. Сначала вычисляют расстояния d(Ai, В) между любым из объектов Аi в классе А и всеми объектами в классе В, и затем получают наибольшее расстояние сходства между объектом Ai и всеми объектами в классе В. В данном варианте осуществления настоящего изобретения используется близость косинусов. То есть, межобъектное сходство, соответствующее максимальной близости косинусов, dmax(Ai,В), является наибольшим.

[0069] В одном из примеров осуществления настоящего изобретения получение весового коэффициента может выполняться в соответствии с вероятностью того, что два объекта, соответствующие конкретному межобъектному расстоянию, являются одним и тем же объектом. В соответствии с иллюстрацией фиг. 4 это может включать следующие шаги.

[0070] На шаге S100 получают отношение соответствия между межобъектным расстоянием и вероятностью того, что два объекта являются одним и тем же объектом, согласно статистике по образцовым объектам.

[0071] Например, в случае распознавания лиц, диапазон близости косинусов cosθ для двух изображений лица может быть равен [0, 1] по признакам высокой размерности, и при этом согласно статистическим данным по большому количеству изображений лиц, делают вывод, что если близость косинусов лежит в диапазоне [0,45, 1], вероятность того, что два объекта являются одним и тем же человеком, собственно, составляет 98%; если близость косинусов лежит в диапазоне [0.35, 0.45], вероятность того, что два объекта являются одним и тем же человеком, собственно, составляет 70%; если близость косинусов лежит в диапазоне [0,25, 0,35], вероятность того, что два объекта являются одним и тем же человеком, собственно, составляет 40%; если близость косинусов лежит в диапазоне [0,15, 0,25], вероятность того, что два объекта являются одним и тем же человеком, собственно, составляет 10%; и если близость косинусов лежит в диапазоне [0, 0, 15], вероятность того, что два объекта являются одним и тем же человеком, собственно, составляет 0,1%

[0072] Согласно приведенным выше статистическим результатам соотношение между весовым коэффициентом и близостью косинусов может быть задано с помощью следующей формулы (1):

[0073]

[0074] Формула (1) является отношением соответствия между близостью косинусов и вероятностью того, что два объекта являются одним и тем же человеком. Согласно соотношению между расстояниями и соответствующими вероятностями могут выводиться заключения и по другим типам расстояний, которые в настоящем документе перечислены не будут.

[0075] На шаге S200 определяют отношение отображения между межобъектным расстоянием и весовым коэффициентом согласно упомянутому отношению соответствия, при этом весовой коэффициент определяют в соответствии с упомянутой вероятностью.

[0076] Получают межобъектное расстояние и затем определяют, в каком из диапазонов формулы (1) это межобъектное расстояние находится. Наконец, в соответствии с формулой (1) определяют отношение отображения между межобъектным расстоянием и весовым коэффициентом. Весовой коэффициент, полученный описанным выше методом на основе dmax(Ai,В) будет равен W(dmax(Ai,B))

[0077] На шаге S1112 получают минимальное взвешенное расстояние (максимальную близость косинусов) между объектом в первом классе и всеми объектами второго класса в соответствии с произведением наибольшего расстояния сходства и соответствующего первого весового коэффициента.

[0078] Минимальное взвешенное расстояние ϕmax(Ai,В) между объектом Аi и классом В получают согласно формуле (2):

[0079]

[0080] На шаге S1113 получают среднее взвешенное расстояние по расстояниям между объектом в упомянутом первом классе и другими объектами, за исключением объекта, который соответствует упомянутому наибольшему расстоянию сходства в упомянутом втором классе.

[0081] Допустим, что расстояние между объектом Ai в классе А и объектом b является наибольшим, тогда среднее взвешенное расстояние ϕavg(Ai,B) между объектом Ai и остальными объектами, за исключением объекта b в классе В, получают согласно формуле (3):

[0082]

[0083] На шаге S1114 получают взвешенное расстояние между объектом в первом классе и вторым классом, в соответствии с минимальным взвешенным расстоянием и средним взвешенным расстоянием.

[0084] На основе минимального взвешенного расстояния ϕmax(Ai,В) и среднего взвешенного расстояния ϕavg(Ai,B) между объектом Ai и классом В, взвешенное расстояние ϕ (Ai,В) между объектом Ai и классом В получают согласно формуле (4):

[0085]

[0086] На шаге S1115 получают первое однонаправленное взвешенное расстояние между первым классом и вторым классом в соответствии со взвешенными расстояниями между всеми объектами в первом классе и вторым классом, и весовым коэффициентом, соответствующим наибольшему расстоянию сходства.

[0087] Первое однонаправленное взвешенное расстояние S(A, В) между классом А и классом D получают согласно формуле (5):

[0088]

[0089] В формуле (5) W(dmax(Ai,B)) обозначает весовой коэффициент, соответствующий максимальной близости косинусов (минимальному расстоянию) dmax(Ai,В) между объектом Ai в классе А и всеми объектами в классе В.

[0090] На шаге S112 получают второе однонаправленное взвешенное расстояние между вторым классом и первым классом.

[0091] Вычисляют второе однонаправленное взвешенного расстояния S(B, А) между классом В и классом, что аналогично вычислению первого однонаправленного взвешенного расстояния между классом А и В и не будет описано повторно.

[0092] На шаге S113, получают взвешенное расстояние между первым классом и вторым классом согласно первому однонаправленному взвешенному расстоянию и второму однонаправленному взвешенному расстоянию.

[0093] Взвешенное расстояние Н(А, В) между классом А и классом В вычисляют согласно формуле (6):

[0094]

[0095] На шаге S120 определяют, имеются ли классы, которые могут быть объединены, в соответствии со взвешенным расстоянием между двумя классами и заранее заданным пороговым значением расстояния. Если классы, которые могут быть объединены существуют выполняют шаг S130; а если классов, которые могут быть объединены не существуют, выполняют шаг S140.

[0096] Заранее заданное пороговое значение может быть выбрано в соответствии с типами данных различных объектов, или может быть выбрано в соответствии с типом вычисляемого межобъектного расстояния (например, близость косинусов, евклидово расстояние и т.п.) Например, объектами могут быть изображения лиц, и при этом межобъектным расстоянием может быть близость косинусов. В этом случае пороговое значение расстояния может быть выбрано равным 0,3-0,35.

[0097] Для различных типов межклассовых расстояний, используемых при вычислении взвешенного расстояния, условия для определения возможности объединения двух классов также могут быть различными.

[0098] Когда взвешенные межклассовые расстояния получают согласно близости косинусов между классами, то определяют, не меньше ли взвешенное расстояние между двумя классами заданного порогового значения, и если взвешенное расстояние не меньше заранее заданного порогового значения расстояния, это означает, что сходство между классами является большим, и классы могут быть объединены.

[0099] Когда взвешенные межклассовые расстояния вычисляют на основе евклидового расстояния или других расстояний, то определяют, является ли взвешенное расстояние между двумя классами не большим заданного порогового значения, и если взвешенное расстояние не больше заранее заданного порогового значения расстояния, это означает, что сходство между классами является большим, и классы могут быть объединены.

[00100] Взвешенное расстояние, предложенное в вариантах осуществления настоящего изобретения, получают с использованием минимального взвешенного расстояния и среднего взвешенного расстояния между классами, таким образом, не происходит уклона в сторону классов, имеющих большое количество объектов, но классы, в том числе имеющие малое количество объектов, рассматриваются всесторонне, что хорошо подходит для применения к кластеризации человеческих лиц. Соответственно, кластеризация с помощью взвешенного расстояния позволяет повысить точность кластеризации.

[00101] При объединении двух классов, на шаге S130, соответствующим образом объединяют все классы, которые могут быть объединены.

[00102] На шаге S140 определяют, является количество классов после объединения меньшим, чем количество классов перед объединением, если да, возвращаются к выполнению шага S110; и если нет, переходят к шагу S150.

[00103] Если количество классов после объединения меньше, чем количество классов до объединения, возвращаются к выполнению шага получения взвешенного расстояния между двумя классами согласно весовому коэффициенту, соответствующему межобъектному расстоянию в отношении всех объединяемых классов, до тех пор, пока количество классов после объединения не будет тем же, что и количество классов до объединения, и для получение результата кластеризации, т.е. пока не останется больше классов, которые могут быть объединены, и получают результат кластеризации.

[00104] На шаге S150 получают результат кластеризации.

[00105] Сходство объектов, объединенных в одном классе, является высоким, а их несходство - низким. Если в качестве объектов выбраны изображения лиц, то изображения лица, помещенного в один класс, будут изображениями одного и того же человека.

[00106] В способе кластеризации, предложенном в вариантах осуществления настоящего изобретения, получают взвешенные расстояния между классами согласно весовым коэффициентам, соответствующим межобъектным расстояниям, при этом весовой коэффициент определяют согласно сходству между двумя объектами, т.е. межобъектное расстояние является взвешенным, и затем в способе кластеризации выполняют объединение классов, взвешенные расстояния между которыми отвечают условию объединения, при этом выполнение способа не завершают до тех пор, пока количество классов после объединения не будет тем же, что и количество классов после объединения, и затем получают результат кластеризации. Поскольку взвешенное расстояние связано со сходством между объектами, то если сходство между объектами различно, то соответствующий вклад в результат кластеризации также будет различным, причем чем больше сходство, тем большим будет соответствующий вклад. Таким образом, обеспечивается повышение точности результата кластеризации.

[00107] Фиг. 5 представляет собой блок-схему, иллюстрирующую устройство для кластеризации в соответствии с одним из примеров осуществления настоящего изобретения. В соответствии с иллюстрацией фиг. 5 устройство включает блок 100 получения, блок 200 определения и блок 300 объединения.

[00108] Блок получения 100 сконфигурирован для получения взвешенного расстояния между двумя классами согласно весовому коэффициенту, соответствующему межобъектным расстояниям в отношении всех объединяемых классов, при этом упомянутый весовой коэффициент определяют в соответствии со сходством двух объектов, соответствующих межобъектному расстоянию.

[00109] Блок 100 получения может включать первый подблок получения, второй подблок получения, третий подблок получения и четвертый подблок получения.

[00110] Первый подблок получения сконфигурирован для получения наибольшего расстояния сходства между любым из объектов в упомянутом первом классе и всеми объектами упомянутого второго класса, и первого весового коэффициента, соответствующего этому наибольшему расстоянию сходства.

[00111] Второй подблок получения сконфигурирован для получения первого однонаправленного взвешенного расстояния между первым классом и вторым классом, согласно наибольшему расстоянию сходства и первому весовому коэффициенту, в отношении всех объектов первого класса.

[00112] В одном из вариантов осуществления настоящего изобретения второй подблок получения может включать пятый подблок получения, шестой подблок получения, седьмой подблок получения, восьмой подблок получения и девятый подблок получения.

[00113] Пятый подблок получения сконфигурирован для получения наибольшего расстояния сходства между любым из объектов в первом классе и всеми объектами второго класса, и первого весового коэффициента, соответствующего этому наибольшему расстоянию сходства.

[00114] Шестой подблок получения сконфигурирован для получения минимального взвешенного расстояния между объектом в первом классе и всеми объектами второго класса, согласно произведению наибольшего расстояния сходства и соответствующего первого весового коэффициента;

[00115] Седьмой подблок получения сконфигурирован для получения среднего взвешенного расстояния по расстояниям между объектом в первом классе и другими объектами, за исключением объекта, который соответствует наибольшему расстоянию сходства во втором классе.

[00116] Восьмой подблок получения сконфигурирован для получения взвешенного расстояния между объектом в первом классе и вторым классом, в соответствии с минимальным взвешенным расстоянием и упомянутым средним взвешенным расстоянием.

[00117] Девятый подблок получения сконфигурирован для получения первого однонаправленного взвешенного расстояния между первым классом и вторым классом в соответствии со взвешенными расстояниями между всеми объектами в первом классе и вторым классом, и весовыми коэффициентами, соответствующими этим взвешенным расстояниям.

[00118] Третий подблок получения сконфигурирован для получения второго однонаправленного расстояния между вторым классом и первым классом.

[00119] Четвертый подблок получения сконфигурирован для получения взвешенного расстояния между первым классом и вторым классом согласно упомянутым первому однонаправленному взвешенному расстоянию и второму однонаправленному взвешенному расстоянию.

[00120] Блок 200 определения сконфигурирован для определения, имеются ли два класса, которые могут быть объединены, в соответствии со взвешенным расстоянием между двумя классами и заранее заданным пороговым значением расстояния.

[00121] Блок 300 объединения сконфигурирован для соответствующего объединения всех классов, которые могут быть объединены, если какие-либо два класса могут быть объединены, и для обеспечения выполнения, блоком получения, шага получения взвешенного расстояния между двумя классами согласно весовому коэффициенту, соответствующему межобъектному расстоянию в отношении всех объединяемых классов, до тех пор, пока количество классов после объединения не будет тем же, что и количество классов до объединения, т.е. пока классы, которые могут быть объединены, не перестанут существовать, и для получения результата кластеризации.

[00122] В устройстве для кластеризации, предложенном в вариантах осуществления настоящего изобретения, при помощи блока получения получают взвешенные расстояния между классами согласно весовым коэффициентам, соответствующим межобъектным расстояниям, при этом весовой коэффициент определяют согласно сходству между двумя объектами, т.е. межобъектное расстояние является взвешенным, затем определяют, при помощи блока определения, имеются ли классы, которые могут быть объединены, согласно взвешенному расстоянию, и затем, с помощью блока объединения, объединяют классы, взвешенные расстояния между которыми отвечают условию объединения, при этом выполнение способа не завершают до тех пор, пока количество классов после объединения не будет тем же, что и количество классов после объединения, в результате чего получают результат кластеризации. Поскольку взвешенное расстояние связано со сходством между объектами, то если сходство между объектами различно, то соответствующий вклад в результат кластеризации также будет различным, причем чем больше сходство, тем большим будет соответствующий вклад. Таким образом, обеспечивается повышение точности результата кластеризации.

[00123] Фиг. 6 представляет собой блок-схему, иллюстрирующую другое устройство для кластеризации в соответствии с одним из примеров осуществления настоящего изобретения. В соответствии с иллюстрацией фиг. 6 устройство включает блок 400 статистики, блок 500 определения, блок 100 получения, блок 200 определения и блок 300 объединения. При этом блоки, наименования и числовые обозначения которых аналогичны варианту осуществления настоящего изобретения на фиг. 5, имеют те же самые функции и не будут описаны повторно.

[00124] Блок 400 статистики сконфигурирован для получения отношения соответствия между межобъектным расстоянием и вероятностью того, что два объекта являются одним и тем же объектом, согласно статистике по образцовым объектам.

[00125] Блок 500 определения сконфигурирован для определения отношения отображения между межобъектным расстоянием и весовым коэффициентом согласно упомянутому отношению соответствия, при этом весовой коэффициент определяют в соответствии с упомянутой вероятностью.

[00126] Блок определения может включать подблок запроса и подблок определения.

[00127] Подблок запроса сконфигурирован для запроса упомянутого отношения соответствия с целью получения вероятности того, что два объекта, соответствующие конкретному межобъектному расстоянию, являются одним и тем же человеком.

[00128] Подблок определения сконфигурирован для определения того, что упомянутая вероятность является весовым коэффициентом, соответствующим упомянутому расстоянию.

[00129] Блок 300 получения, имеющий соединение с блоком 500 определения сконфигурирован для получения взвешенного расстояния между двумя классами согласно весовому коэффициенту, соответствующему межобъектному расстоянию.

[00130] В устройстве для кластеризации, предложенном в вариантах осуществления настоящего изобретения, сначала получают отношение соответствия между межобъектным расстоянием и вероятностью того, что два объекта являются одним и тем же человеком, в соответствии с большим количеством образцовых объектов с целью определения соответствующего весового коэффициента, и затем получают взвешенное расстояние между классами, затем определяют классы, которые могут быть объединены, согласно взвешенному расстоянию, и затем классы, которые могут быть объединены, объединяют до тех пор, пока количество классов после объединения не будет тем же самым, что и количество классов до объединения, и таким образом получают результат кластеризации. Поскольку взвешенное расстояние связано с вероятностью того, что два объекта являются одним и тем же объектом, оно позволяет учесть ситуации, в которых вероятность того, что два объекта являются одним и тем же объектом, меняется с изменением расстояния между двум объектами, в результате чего различные межобъектные расстояния обеспечивают различные вклады, причем чем больше значение вероятности, тем больше соответствующий вклад. Таким образом, предложенный результат кластеризации позволяет повысить точность результатов кластеризации.

[00131] В отношении устройств, предложенных в рассмотренных выше вариантах осуществления настоящего изобретения, конкретные методы выполнения операций для индивидуальных модулей из их состава были подробно описаны в вариантах осуществления настоящего изобретения, относящихся к способам кластеризации, и не будут приведены повторно.

[00132] Фиг. 7 представляет собой блок-схему, иллюстрирующую оконечное устройство 800 для кластеризации в соответствии с одним из примеров осуществления настоящего изобретения. Например, устройство 800 может представлять собой мобильный телефон, компьютер, терминал цифрового вещания, устройство обмена сообщениями, игровую приставку, планшетный компьютер, медицинское устройство, тренажерное оборудование, карманный персональный компьютер и т.п.

[00133] В соответствии с иллюстрацией фиг. 7 устройство 800 может включать один или более следующих компонентов: процессорный компонент 802, память 804, компонент 806 электропитания, мультимедийный компонент 808, аудиокомпонент 810, интерфейс 812 ввода-вывода (input/output, I/O), измерительный компонент 814 и компонент 816 связи.

[00134] Процессорный компонент 802, как правило, осуществляет общее управление функционированием оконечного устройства 800, например, операциями, связанными с отображением, телефонными вызовами, обменом данными, работой с камерой и операциями записи. Процессорный компонент 802 может включать один или более процессоров 820, исполняющих инструкции с целью выполнения всех шагов описанных выше способов или части этих шагов. Также, процессорный компонент 802 может включать один или более модулей, обеспечивающих взаимодействие между процессорным компонентом 802 и другими компонентами. Например, процессорный компонент 802 может включать мультимедийный модуль, обеспечивающий взаимодействие между мультимедийным компонентом 808 и процессорным компонентом 802.

[00135] Память 804 сконфигурирована для хранения различных типов данных с целью поддержки функционирования устройства 800. Примерами подобных данных могут служить инструкции любых приложений или методов, исполняемых на устройстве 800, контактные данные, данные телефонной книги, сообщения, изображения, видеоданные и т.п. Память 804 может быть реализована с использованием энергозависимых или энергонезависимых устройств любого типа, а также их комбинаций, например, статической памятью с произвольным доступом (static random access memory, SRAM), электрически перепрограммируемой памяти «только для чтения» (erasable programmable read-only memory, EPROM), программируемой памяти «только для чтения» (programmable read-only memory, PROM), памяти «только для чтения», магнитной памяти, флэш-памяти, магнитного или оптического диска.

[00136] Компонент 806 электропитания обеспечивает электропитание различных компонентов оконечного устройства 800. Компонент 806 электропитания может включать систему управления электропитанием, один или более источников питания, а также любые другие компоненты, связанные с производством, управлением и распределением электрической энергии в оконечном устройстве 800.

[00137] Мультимедийный компонент 808 включает экран, который обеспечивает интерфейс вывода между оконечным устройством 800 и пользователем. В некоторых из вариантов осуществления настоящего изобретения экран может включать дисплей на жидких кристаллах (liquid crystal display, LCD) и сенсорную панель (touch panel, TP). Если экран включает сенсорную панель, то в этом случае экран может быть реализован как сенсорный экран, принимающий сигналы ввода от пользователя. Сенсорная панель включает один или более датчиков касания, предназначенных для регистрации касаний, скольжений и других жестов на сенсорной панели. Датчики касания могут не только регистрировать границы операций касания или скольжения, но также измерять период времени и величину давления, связанные с этими операциями. В некоторых вариантах осуществления настоящего изобретения мультимедийный компонент 808 включает фронтальную камеру и/или тыловую камеру. Фронтальная камера и/или тыловая камера могут принимать внешние мультимедийные данные, когда оконечное устройство 800 находится в определенном режиме работы, например, в режиме фотографирования или в режиме видеосъемки. Как фронтальная камера, так и тыловая камера могут представлять собой фиксированные системы оптических линз или иметь функциональность фокусировки и оптического зуммирования.

[00138] Аудиокомпонент 810 сконфигурирован для вывода и/или ввода аудиосигналов. Например, аудиокомпонент 810 включает микрофон ("MIC"), сконфигурированный для приема внешнего аудиосигнала, когда оконечное устройство 800 находится в определенном режиме работы, например, в режиме вызова, в режиме записи или в режиме распознавания голоса. Принятые аудиосигналы могут затем быть сохранены в памяти 804 или переданы при помощи компонента 816 связи. В некоторых из вариантов осуществления настоящего изобретения аудиокомпонент 810 включает также громкоговоритель для вывода аудиосигналов.

[00139] Интерфейс 812 ввода/вывода обеспечивает интерфейс между процессорным компонентом 802 и модулями периферийных интерфейсов, например, клавиатуры, поворотного-нажимного переключателя («колеса»), кнопок и т.п. Кнопки могут включать, без ограничения перечисленным, «домашнюю» кнопку, кнопку громкости, кнопку «пуск» или кнопку блокировки.

[00140] Измерительный компонент 814 включает один или более датчиков, обеспечивающих оценку состояния различных элементов оконечного устройства 800. Например, измерительный компонент 814 может определять состояние устройства 800: «открыто» или «закрыто», относительное расположение компонентов, например, дисплея и клавиатуры оконечного устройства 800, изменение положения оконечного устройства 800 или одного из компонентов устройства 800, присутствие или отсутствие контакта пользователя с оконечным устройством 800, ориентацию или ускорение/замедление оконечного устройства 800 и изменение температуры оконечного устройства 800. Измерительный компонент 814 может включать датчик близости, сконфигурированный для обнаружения присутствия приближенных объектов без физического контакта с ними. Измерительный компонент 814 может также включать светочувствительный датчик, например, датчик изображений CMOS или CCD, для использования в приложениях формирования изображений. В некоторых из вариантов осуществления настоящего изобретения измерительный компонент 814 может также включать акселерометрический датчик, гироскопический датчик, магнитный датчик, датчик давления или датчик температуры.

[00141] Компонент 816 связи сконфигурирован для обеспечения связи, проводной или беспроводной, между оконечным устройством 800 и другими устройствами. Оконечное устройство 800 может осуществлять доступ к беспроводной сети, основанной на таких стандартах связи, как WiFi, 2G или 3G, или их комбинации. В одном из примеров осуществления настоящего изобретения компонент 816 связи принимает широковещательный сигнал или соответствующую широковещательную информацию от внешней широковещательной системы управления по широковещательному каналу. В одном из примеров осуществления настоящего изобретения компонент 816 связи включает также модуль ближней бесконтактной связи (near field communication, NFC) для обеспечения связи в ближней зоне. Например, NFC-модуль может быть реализован на базе технологии радиочастотной идентификации (radio frequency identification, RFID), технологии ассоциации передачи данных в инфракрасном диапазоне (infrared data association, IrDA), технологии сверхширокой полосы пропускания (ultra-wideband, UWB), технологии Bluetooth (ВТ) или других технологий.

[00142] В примерах осуществления настоящего изобретения оконечное устройство 800 может быть реализовано с использованием одной или более заказных интегральных схем (ASIC), цифровых сигнальных процессоров (DSP), цифровых устройств обработки сигналов (digital signal processing devices, DSPD), программируемых логических устройств (programmable logic devices, PLD), электрически программируемых вентильных матриц (field programmable gate arrays, FPGA), процессорах, контроллерах, микроконтроллерах, микропроцессорах или других электронных блоках, предназначенных для исполнения описанных выше способов.

[00143] В примерах осуществления настоящего изобретения предложен также машиночитаемый носитель для хранения данных, включающий инструкции, например, содержащиеся в памяти 804 и исполняемые процессором 820 в оконечном устройстве 800 с целью выполнения описанных выше способов. К примеру, машиночитаемый носитель для хранения данных может представлять собой память ROM, память с произвольным доступом (random access memory, RAM), CD-ROM, магнитную ленту, гибкий диск, оптическое запоминающее устройство для хранения данных и т.п.

[00144] Машиночитаемый носитель для хранения данных, при исполнении инструкций на этом носителе при помощи процессора терминального устройства, обеспечивает исполнение этим терминальным устройством способа кластеризации, включающего:

[00145] получение взвешенного расстояния между двумя классами согласно весовому коэффициенту, соответствующему межобъектному расстоянию в отношении всех объединяемых классов, при этом упомянутый коэффициент определяют в соответствии со сходством между двумя объектами согласно межобъектному расстоянию; определение, имеются ли классы, которые могут быть объединены, в соответствии с упомянутым взвешенным расстоянием между двумя классами и заранее заданным пороговым значением расстояния; если классы, которые могут быть объединены, существуют, соответствующее объединение всех классов, которые могут быть объединены, и возврат к выполнению шага получения взвешенного расстояния в отношении всех объединяемых классов до тех пор, пока количество классов после объединения не будет тем же самым, что и количество классов перед объединением, и получение результата кластеризации.

[00146] Альтернативно, способ дополнительно включает: получение отношения соответствия между межобъектным расстоянием и вероятностью того, что два объекта являются одним и тем же объектом, в соответствии со статистикой по образцовым объектам; и определение отношения отображения между межобъектным расстоянием и упомянутым весовым коэффициентом согласно упомянутому отношению соответствия, при этом упомянутый весовой коэффициент определяют в соответствии с упомянутой вероятностью.

[00147] Альтернативно, определение упомянутого отношения отображения между межобъектным расстоянием и весовым коэффициентом согласно упомянутому соответствующему соответствия выполняют следующим образом:

[00148] запрашивают упомянутое отношение соответствия для получения вероятности того, что два объекта, соответствующие конкретному межобъектному расстоянию, являются одним и тем же объектом; и определяют, что эта вероятность является весовым коэффициентом, соответствующим упомянутому межобъектному расстоянию.

[00149] Альтернативно, упомянутое взвешенное расстояние представляет собой взвешенное расстояние между первым классом и вторым классом; при этом получение взвешенного расстояния между двумя классами согласно весовому коэффициенту, соответствующему межобъектному расстоянию в отношении всех объединяемых классов выполняют следующим образом:

[00150] получают первое однонаправленное взвешенное расстояние между первым классом и вторым классом, согласно расстояниям между всеми объектами первого класса и всеми объектами второго класса, и соответствующими весовыми коэффициентами; получают второе однонаправленное взвешенное расстояние между вторым классом и первым классом; и получают взвешенное расстояние между первым классом и вторым классом в соответствии с упомянутыми первым однонаправленным взвешенным расстоянием и вторым однонаправленным взвешенным расстоянием.

[00151] Альтернативно, получение упомянутого первого однонаправленного взвешенного расстояния между первым классом и вторым классом в соответствии со взвешенными расстояниями между всеми объектами в первом классе и вторым классом, и весовыми коэффициентами, соответствующими этим взвешенным расстояниям, выполняют следующим образом:

[00152] получают наибольшее расстояние сходства между любым из объектов в упомянутом первом классе и всеми объектами упомянутого второго класса, и первый весовой коэффициент, соответствующий этому наибольшему расстоянию сходства; получают минимальное взвешенное расстояние между объектом в упомянутом первом классе и всеми объектами упомянутого второго класса, согласно произведению упомянутого наибольшего расстояния сходства и упомянутого соответствующего первого весового коэффициента; получают среднее взвешенное расстояние по расстояниям между объектом в упомянутом первом классе и другими объектами, за исключением объекта, который соответствует упомянутому наибольшему расстоянию сходства в упомянутом втором классе; получают взвешенное расстояние между объектом в упомянутом первом классе и упомянутым вторым классом, в соответствии с упомянутым минимальным взвешенным расстоянием и упомянутым средним взвешенным расстоянием; и получают первое однонаправленное взвешенное расстояние между упомянутым первым классом и упомянутым вторым классом в соответствии со взвешенными расстояниями между всеми объектами в упомянутом первом классе и упомянутым вторым классом, и весовыми коэффициентами, соответствующими этим взвешенным расстояниям.

[00153] Фиг. 13 представляет собой структурную блок-схему сервера в вариантах осуществления настоящего изобретения. К примеру, сервер 1900 может быть значительно отличающимся по конфигурации или характеристикам, и может включать один или более центральных процессорных блоков (central processing units, CPU) 1922 (например, один или более процессоров) и память 1932, один или боле носителей 1930 (например, одно или более запоминающих устройств большой емкости) для хранения прикладных программ 1942 или данных 1944. При этом память 1932 и носитель 1930 могут представлять собой устройство временного или постоянного хранения. Программы, хранимые на носителе 1930 могут включать один или более модулей (не показаны на чертежах), при этом каждый из модулей может включать набор инструкций для выполнения операций в оконечном устройстве. Также, CPU 1922 может быть выполнен с возможностью связи с носителем 1930 и исполнения, на сервере 1900, набора операционных инструкций, хранимых на носителе 1930.

[00154] Сервер 1900 может также включать один или более источников 1926 питания, один или более проводных или беспроводных сетевых интерфейсов 1950, а также один или более интерфейсов 1958 ввода-вывода, одну или более клавиатур 1956 и/или одну или более операционных систем 1941, например, Windows Server™, Mac OS X™, Unix™, Linux™, FreeBSD™ или аналогичные операционные системы.

[00155] В примерах осуществления настоящего изобретения предложен также машиночитаемый носитель для хранения данных, включающий инструкции, например, содержащиеся в памяти 1922 и исполняемые процессором 1922 в оконечном устройстве с целью выполнения описанных выше способов. К примеру, машиночитаемый носитель для хранения данных может представлять собой память ROM, память с произвольным доступом (random access memory, RAM), CD-ROM, магнитную ленту, гибкий диск, оптическое запоминающее устройство для хранения данных и т.п.

[00156] Машиночитаемый носитель для хранения данных, при исполнении инструкций на этом носителе при помощи процессора терминального устройства, обеспечивает исполнение этим терминальным устройством способа кластеризации, включающего:

[00157] получение взвешенного расстояния между двумя классами согласно весовому коэффициенту, соответствующему межобъектным расстояниям в отношении всех объединяемых классов, при этом упомянутый весовой коэффициент определяют в соответствии со сходством двух объектов, соответствующих межобъектному расстоянию;

[00158] определение, имеются ли классы, которые могут быть объединены, в соответствии со взвешенным расстоянием между двумя классами и заранее заданным пороговым значением расстояния;

[00159] если существуют какие-либо два класса, которые могут быть объединены, соответствующее объединение всех классов, которые могут быть объединены, и возврат к выполнению шага получения взвешенного расстояния между двумя классами согласно весовому коэффициенту, соответствующему межобъектному расстоянию в отношении всех объединяемых классов, до тех пор, пока количество классов после объединения не будет тем же, что и количество классов до объединения, и получение результата кластеризации.

[00160] Альтернативно, способ дополнительно включает: получение отношения соответствия между межобъектным расстоянием и вероятностью того, что два объекта являются одним и тем же объектом, в соответствии со статистикой по образцовым объектам; и определение отношения отображения между межобъектным расстоянием и упомянутым весовым коэффициентом согласно упомянутому отношению соответствия, при этом упомянутый весовой коэффициент определяют в соответствии с упомянутой вероятностью.

[00161] Альтернативно, определение упомянутого отношения отображения между межобъектным расстоянием и весовым коэффициентом согласно упомянутому соответствующему соответствия выполняют следующим образом:

[00162] запрашивают упомянутое отношение соответствия для получения вероятности того, что два объекта, соответствующие конкретному межобъектному расстоянию, являются одним и тем же объектом; и определяют, что эта вероятность является весовым коэффициентом, соответствующим упомянутому межобъектному расстоянию.

[00163] Альтернативно, упомянутое взвешенное расстояние представляет собой взвешенное расстояние между первым классом и вторым классом; при этом получение взвешенного расстояния между двумя классами согласно весовому коэффициенту, соответствующему межобъектному расстоянию в отношении всех объединяемых классов выполняют следующим образом:

[00164] получают первое однонаправленное взвешенное расстояние между первым классом и вторым классом, согласно расстояниям между всеми объектами первого класса и всеми объектами второго класса, и соответствующими весовыми коэффициентами; получают второе однонаправленное взвешенное расстояние между вторым классом и первым классом; и получают взвешенное расстояние между первым классом и вторым классом в соответствии с упомянутыми первым однонаправленным взвешенным расстоянием и вторым однонаправленным взвешенным расстоянием.

[00165] Альтернативно, получение упомянутого первого однонаправленного взвешенного расстояния между первым классом и вторым классом в соответствии со взвешенными расстояниями между всеми объектами в первом классе и вторым классом, и весовыми коэффициентами, соответствующими этим взвешенным расстояниям, выполняют следующим образом:

[00166] получают наибольшее расстояние сходства между любым из объектов в упомянутом первом классе и всеми объектами упомянутого второго класса, и первый весовой коэффициент, соответствующий этому наибольшему расстоянию сходства; получают минимальное взвешенное расстояние между объектом в упомянутом первом классе и всеми объектами упомянутого второго класса, согласно произведению упомянутого наибольшего расстояния сходства и упомянутого соответствующего первого весового коэффициента; получают среднее взвешенное расстояние по расстояниям между объектом в упомянутом первом классе и другими объектами, за исключением объекта, который соответствует упомянутому наибольшему расстоянию сходства в упомянутом втором классе; получают взвешенное расстояние между объектом в упомянутом первом классе и упомянутым вторым классом, в соответствии с упомянутым минимальным взвешенным расстоянием и упомянутым средним взвешенным расстоянием; и получают первое однонаправленное взвешенное расстояние между упомянутым первым классом и упомянутым вторым классом в соответствии со взвешенными расстояниями между всеми объектами в упомянутом первом классе и упомянутым вторым классом, и весовыми коэффициентами, соответствующими этим взвешенным расстояниям.

[00167] Нужно понимать, что настоящее изобретение не ограничено конкретной структурой, описанной выше и проиллюстрированной на чертежах, и может быть подвержено модификациям и изменениям в пределах его объема. Предполагается, что объем настоящего изобретения ограничен только приложенной формулой изобретения.

[00168] Следует понимать, что в соответствующем контексте указывающие на отношения термины, такие как «первый» или «второй», применяются исключительно для отличения одного объекта или операции от другого объекта или другой операции, при этом они не обязательно подразумевают или требуют наличия реального порядка или отношения между этими объектами или операциями. При этом термины «включает», «содержит» или любые другие их варианты подразумевают неисключающее включение, то есть, процедура, способ, изделие или устройство, которые включают последовательность элементов, могут включать не только эти, но и другие элементы, не перечисленные явно, а также могут включать дополнительные элементы, изначально присущие процедуре, способу, изделию или устройству. Без дополнительного ограничения, элементы, определенные выражением «включает», не исключают факта включения процессом, способом, изделием или устройством других аналогичных элементов.

[00169] Приведенное выше является всего лишь подробным описанием вариантов осуществления настоящего изобретения, на основании которого специалисты в данной области техники должны понять замысел настоящего изобретения или быть способными реализовать настоящее изобретение на практике. Специалистам в данной области техники могут быть очевидными множество различных модификаций этих вариантов осуществления настоящего изобретения Общий замысел, заданный в контексте настоящего изобретения, может быть реализован и в других вариантах осуществления изобретения, в пределах сущности и объема настоящего изобретения. Таким образом, настоящее изобретение не ограничено вариантами его осуществления, проиллюстрированными в данном документе. Настоящее изобретение следует понимать как соответствующее максимально широкому объему, отвечающему замыслу и новым отличительным особенностям, описанным в данном документе.

1. Способ кластеризации, включающий:

получение взвешенного расстояния между двумя классами согласно весовому коэффициенту, соответствующему межобъектным расстояниям в отношении всех объединяемых классов, при этом упомянутый весовой коэффициент определяют в соответствии со сходством двух объектов, соответствующих межобъектному расстоянию, при этом упомянутое взвешенное расстояние представляет собой взвешенное расстояние между первым классом и вторым классом; при этом получение упомянутого взвешенного расстояния между двумя классами включает:

получение первого однонаправленного взвешенного расстояния между упомянутым первым классом и упомянутым вторым классом в соответствии с расстояниями между всеми объектами упомянутого первого класса и всеми объектами упомянутого второго класса и соответствующими весовыми коэффициентами, при этом получение первого однонаправленного взвешенного расстояния включает:

получение наибольшего расстояния сходства между любым из объектов в упомянутом первом классе и всеми объектами упомянутого второго класса и первого весового коэффициента, соответствующего этому наибольшему расстоянию сходства;

получение минимального взвешенного расстояния между объектом в упомянутом первом классе и всеми объектами упомянутого второго класса согласно произведению упомянутого наибольшего расстояния сходства и упомянутого соответствующего первого весового коэффициента;

получение среднего взвешенного расстояния по расстояниям между объектом в упомянутом первом классе и другими объектами, за исключением объекта, который соответствует упомянутому наибольшему расстоянию сходства в упомянутом втором классе;

получение взвешенного расстояния между объектом в упомянутом первом классе и упомянутым вторым классом в соответствии с упомянутым минимальным взвешенным расстоянием и упомянутым средним взвешенным расстоянием; и

получение первого однонаправленного взвешенного расстояния между упомянутым первым классом и упомянутым вторым классом в соответствии со взвешенными расстояниями между всеми объектами в упомянутом первом классе и упомянутым вторым классом и весовыми коэффициентами, соответствующими этим взвешенным расстояниям;

получение второго однонаправленного расстояния между упомянутым вторым классом и упомянутым первым классом; и

получение взвешенного расстояния между упомянутым первым классом и упомянутым вторым классом согласно упомянутым первому однонаправленному взвешенному расстоянию и второму однонаправленному взвешенному расстоянию;

определение, имеются ли классы, которые могут быть объединены, в соответствии со взвешенным расстоянием между двумя классами и заранее заданным пороговым значением расстояния; и

если существуют классы, которые могут быть объединены, соответствующее объединение всех классов, которые могут быть объединены, и возврат к выполнению шага получения взвешенного расстояния между двумя классами согласно весовому коэффициенту, соответствующему межобъектному расстоянию в отношении всех объединяемых классов, до тех пор, пока количество классов после объединения не будет тем же, что и количество классов до объединения, и получение результата кластеризации.

2. Способ по п. 1, дополнительно включающий:

получение отношения соответствия между межобъектным расстоянием и вероятностью того, что два объекта являются одним и тем же объектом согласно статистике по образцовым объектам; и

определение отношения отображения между межобъектным расстоянием и упомянутым весовым коэффициентом согласно упомянутому отношению соответствия, при этом упомянутый весовой коэффициент определяют в соответствии с упомянутой вероятностью.

3. Способ по п. 2, отличающийся тем, что определение упомянутого отношения отображения между межобъектным расстоянием и весовым коэффициентом согласно упомянутому отношению соответствия выполняют следующим образом:

запрашивают упомянутое отношение соответствия для получения вероятности того, что два объекта, соответствующие конкретному межобъектному расстоянию, являются одним и тем же объектом; и

определяют, что эта вероятность является весовым коэффициентом, соответствующим упомянутому межобъектному расстоянию.

4. Устройство для кластеризации, включающее:

блок получения, сконфигурированный для получения взвешенного расстояния между двумя классами согласно весовому коэффициенту, соответствующему межобъектным расстояниям в отношении всех объединяемых классов, при этом упомянутый весовой коэффициент определяют в соответствии со сходством двух объектов, соответствующих межобъектному расстоянию, при этом упомянутое взвешенное расстояние представляет собой взвешенное расстояние между первым классом и вторым классом, при этом упомянутый блок получения включает:

первый подблок получения, сконфигурированный для получения наибольшего расстояния сходства между любым из объектов в упомянутом первом классе и всеми объектами упомянутого второго класса и первого весового коэффициента, соответствующего этому наибольшему расстоянию сходства;

второй подблок получения, сконфигурированный для получения первого однонаправленного взвешенного расстояния между упомянутым первым классом и упомянутым вторым классом согласно упомянутому наибольшему расстоянию сходства и соответствующему первому весовому коэффициенту;

третий подблок получения, сконфигурированный для получения второго однонаправленного расстояния между упомянутым вторым классом и упомянутым первым классом; и

четвертый подблок получения, сконфигурированный для получения взвешенного расстояния между упомянутым первым классом и упомянутым вторым классом согласно упомянутым первому однонаправленному взвешенному расстоянию и второму однонаправленному взвешенному расстоянию;

при этом упомянутый второй подблок получения включает:

пятый подблок получения, сконфигурированный для получения наибольшего расстояния сходства между любым из объектов в упомянутом первом классе и всеми объектами упомянутого второго класса и первого весового коэффициента, соответствующего этому наибольшему расстоянию сходства;

шестой подблок получения, сконфигурированный для получения минимального взвешенного расстояния между объектом в упомянутом первом классе и всеми объектами упомянутого второго класса согласно произведению упомянутого наибольшего расстояния сходства и упомянутого соответствующего первого весового коэффициента;

седьмой подблок получения, сконфигурированный для получения среднего взвешенного расстояния по расстояниям между объектом в упомянутом первом классе и другими объектами, за исключением объекта, который соответствует упомянутому наибольшему расстоянию сходства в упомянутом втором классе;

восьмой подблок получения, сконфигурированный для получения взвешенного расстояния между объектом в упомянутом первом классе и упомянутым вторым классом в соответствии с упомянутым минимальным взвешенным расстоянием и упомянутым средним взвешенным расстоянием; и

девятый подблок получения, сконфигурированный для получения первого однонаправленного взвешенного расстояния между упомянутым первым классом и упомянутым вторым классом в соответствии со взвешенными расстояниями между всеми объектами в упомянутом первом классе и упомянутым вторым классом и весовыми коэффициентами, соответствующими этим взвешенным расстояниям;

блок определения, сконфигурированный для определения, имеются ли классы, которые могут быть объединены в соответствии со взвешенным расстоянием между двумя классами и заранее заданным пороговым значением расстояния; и

блок объединения, сконфигурированный для соответствующего объединения всех классов, которые могут быть объединены, если классы, которые могут быть объединены, существуют, и для управления упомянутым блоком получения для выполнения шага получения взвешенного расстояния между двумя классами согласно весовому коэффициенту, соответствующему межобъектному расстоянию в отношении всех объединяемых классов, до тех пор, пока количество классов после объединения не будет тем же, что и количество классов до объединения, и для получения результата кластеризации.

5. Устройство по п. 4, дополнительно включающее:

блок статистики, сконфигурированный для получения отношения соответствия между межобъектным расстоянием и вероятностью того, что два объекта являются одним и тем же объектом согласно статистике по образцовым объектам;

блок определения, сконфигурированный для определения отношения отображения между межобъектным расстоянием и упомянутым весовым коэффициентом согласно упомянутому отношению соответствия, при этом упомянутый весовой коэффициент определяют в соответствии с упомянутой вероятностью.

6. Устройство по п. 5, отличающееся тем, что упомянутый блок определения включает:

подблок запроса, сконфигурированный для запроса упомянутого отношения соответствия для получения вероятности того, что два объекта, соответствующие конкретному межобъектному расстоянию, являются одним и тем же объектом; и

подблок определения, сконфигурированный для определения того, что упомянутая вероятность является упомянутым весовым коэффициентом, соответствующим упомянутому межобъектному расстоянию.

7. Оконечное устройство, включающее:

процессор; и

память, сконфигурированную для хранения инструкций, исполняемых упомянутым процессором, для выполнения способа по п. 1.



 

Похожие патенты:

Группа изобретений относится к области вычислительной техники. Техническим результатом является повышение точности распознавания объектов.

Изобретение относится к компьютерной технике, а именно, к технологиям автоматизированного заказа перевозок. Техническим результатом является уменьшение вероятности отказа в бронировании за счет выделения атрибутов перевозки посредством фотографирования и направления выделенных атрибутов в систему бронирования.

Изобретение относится к способам кластеризации данных, в частности к кластеризации изображений. Техническим результатом является повышение точности результатов кластеризации.

Изобретение относится к области биометрической идентификации пользователя. Способ идентификации пользователя содержит обнаружение касания пальцем пользователя чувствительной к касанию области на мобильном устройстве, сбор данных, относящихся к отпечатку пальца, в течение заданного времени, причем данные, относящиеся к отпечатку пальца, включают в себя информацию касательно рисунка гребней, рисунка потовых желез и динамики микроциркуляции крови в пальце.

Изобретение относится к области обработки изображений. Технический результат – обеспечение устранения ручной установки параметров косметической обработки.

Изобретение относится к области управления полномочиями. Технический результат – снижение вычислительной нагрузки, связанной с предотвращением модификации конфигураций терминала неавторизованным пользователем.

Группа изобретений относится к области систем "умного дома" и касается способов уборки мусора и устройств для уборки мусора. Устройство контроля получает данные контроля контролируемой области.

Изобретение относится к области распознавания конфиденциальной фотографии. Технический результат – расширение арсенала технических средств для распознавания конфиденциальной фотографии.

Изобретение относится к устройству обнаружения трехмерных объектов и к способу обнаружения трехмерных объектов. Техническим результатом является повышение эффективности обнаружения трехмерного объекта.

Изобретение относится к технологиям бесконтактного человеко-машинного взаимодействия. Техническим результатом является повышение робастности слежения за перемещением головы пользователя путем повышения производительности работы с системой и снижения уровня ошибок выделения объектов.

Изобретение относится к области графических интерфейсов пользователя для управления расписаниями в портативном терминале. Техническим результатом является обеспечение индикации того, к каким из ключевых слов относятся найденные записи расписания в случае поиска по нескольким ключевым словам.

Изобретение относится к области поисковых систем в общем смысле, в частности к способу и устройству для создания рекомендуемого списка содержимого. Техническим результатом является уменьшение времени для предоставления релевантных рекомендаций содержимого для конкретного пользователя.

Группа изобретений относится к поисковым системам. Технический результат – реализация назначения расширенного арсенала технических средств для предоставления пользователю страницы результатов поиска на электронном устройстве.

Изобретение относится к области поиска в Интернете. Технический результат заключается в эффективной организации и управлении кэшем браузера.

Изобретение относится к облачному сетевому сервису. Технический результат заключается в определении спам-активности в облачном сервисе.

Изобретение относится к трансляции информации. Техническим результатом является обеспечение автоматического получения и воспроизведение информации, соответствующей жизненной схеме.

Изобретение относится к технологиям для пометки терминала. Техническим результатом является обеспечение возможности сервером формировать идентификационную информацию терминала.

Группа изобретений относится к средствам для предоставления предложений тематического поиска. Технический результат – предоставление точных результатов поиска для пользователя.

Изобретение относится к семантической классификации оцифрованных киноматериалов и информационного поиска в архивах оцифрованных киноматериалов. Техническими результатами являются повышение точности сегментации фильмов на сцены, повышение точности классификации сцен по заранее заданному перечню классов, повышение быстродействия процесса извлечения семантических признаков из кадров кинофильма, сокращение дополнительных затрат на программирование при увеличении размерности вектора признаков, сокращение объема данных для хранения индекса для выполнения информационного поиска кинофрагментов по текстовым запросам, запросам в структурированной форме и запросам по образцу, сокращение времени выполнения индексации и повышение точности и чувствительности информационного поиска.

Изобретение относится к области распространения контента в сети. Технический результат – защищенное распространение файла одному или нескольким пользовательским устройствам.

Группа изобретений относится к технологиям предоставления пользователям продвигаемой информации. Техническим результатом является обеспечение предпросмотра ссылок предпросмотра за счет предпросмотра продвигаемой информации, посредством шаблонов предпросмотра. Предложен способ для подбора продвигаемой информации. Способ содержит этап, на котором осуществляют предоставление контента пользователю посредством устройства с сенсорным экраном. Далее согласно способу определяют часть контента, выделенного пользователем посредством действий с сенсором, где контент отображается на сенсорном экране устройства с сенсорным экраном и каждая точка на сенсорном экране функционирует как активная ссылка в ответ на касание. Далее согласно способу осуществляют генерирование метаданных, связанных, по крайней мере, с частью выделенного пользователем контента и контекстом предоставленного пользователю контента, и отражающих цели пользователя. 3 н. и 57 з.п. ф-лы, 10 ил.
Наверх