Основанное на профиле извлечение содержимого для систем средств выдачи рекомендаций



Основанное на профиле извлечение содержимого для систем средств выдачи рекомендаций
Основанное на профиле извлечение содержимого для систем средств выдачи рекомендаций
Основанное на профиле извлечение содержимого для систем средств выдачи рекомендаций

 


Владельцы патента RU 2577189:

ФУНКЕ ДИДЖИТАЛ ТВ ГАЙД ГМБХ (DE)

Изобретение относится к области выдачи рекомендаций пользователям сети. Технический результат - эффективное управление выдачей рекомендаций. Устройство для управления системой средства выдачи рекомендаций, содержащее селектор признаков для выбора из упомянутых пар признаков-значений, выделяемых упомянутым выделителем признаков-значений, тех пар признаков-значений, которые являются наиболее характерными для упомянутого профиля пользователя, причем упомянутый выделитель признаков-значений выполнен с возможностью выделения пар признаков-значений на основе отрицательных оценок пользователя, так что формируются запросы, которые исключают результаты с признаками-значениями, соответствующими отрицательным оценкам. 3 н. и 5 з.п. ф-лы, 3 ил.

 

Область техники, к которой относится изобретение

Настоящее изобретение относится к устройству, способу и компьютерному программному продукту для управления системой средства выдачи рекомендаций для извлечения содержимого.

Уровень техники

Накопители на жестких дисках и технологии сжатия цифровых видеосигналов создали возможность для обеспечения телевидения (TV) в прямом эфире со сдвигом во времени и записи большого количества телевизионных шоу в высоком качестве, без необходимости заботиться о доступности лент или других съемных носителей данных. В то же время, преобразование в цифровую форму аудиовизуальных сигналов увеличило количество источников содержимого для обычного пользователя. Сотни каналов являются доступными при использовании простой параболической антенны и телевизионного приемника. Огромное количество видеоклипов ежедневно помещают в Интернете через различные службы, и все главные производители содержимого уже делают все свои библиотеки содержимого доступными в Интернете. В результате этого, тысячи потенциально интересных программ ежедневно становятся доступными и могут быть записаны и сохранены локально для более позднего доступа.

Однако ввиду такого огромного количества предлагаемых элементов содержимого выбор отдельного содержимого становится серьезной проблемой. Информация, которая не соответствует профилю пользователя, должна быть отфильтрована, и должен быть выбран правильный элемент содержимого, который соответствует потребностям и предпочтениям пользователя (например, профилю пользователя).

Системы средств выдачи рекомендаций рассматривают эти проблемы, оценивая степень желательности определенного элемента содержимого для определенного профиля пользователя и автоматически классифицируя элемент содержимого. Это может быть сделано посредством сравнивания характеристик элемента содержимого (например, признаков, метаданных и т.д.) с профилем пользователя или с подобными профилями других пользователей. Таким образом, системы средств выдачи рекомендаций можно рассматривать как инструменты для того, чтобы отфильтровывать нежелательное содержимое и предлагать вниманию пользователя интересное содержимое.

Использование технологии средства выдачи рекомендаций уверенно проникает на рынок. Среди различных примеров, веб-сайты предлагают средство выдачи рекомендаций, чтобы поддерживать пользователей в нахождении элементов содержимого (например, кинофильмов), которые им нравятся, а устройства электронного оборудования (например, персональные видеомагнитофоны) используют средство выдачи рекомендаций для автоматической фильтрации элементов содержимого. Системы средств выдачи рекомендаций применяются все больше и больше, чтобы индивидуализировать или персонализировать услуги и продукцию посредством изучения профиля пользователей, при этом для выведения оценок новых элементов содержимого могут использоваться технические приемы машинного обучения.

Средство выдачи рекомендаций обычно предлагается в виде автономных услуг или модулей, или в виде дополнительных устройств (например, сменных плат) к существующим услугам или модулям. Они все больше появляются в таких потребительских устройствах, как телевизионные приемники или видеомагнитофоны. Для средства выдачи рекомендаций обычно требуется обратная связь с пользователем для изучения предпочтений пользователя. Неявное изучение освобождает пользователя от необходимости явным образом оценивать элементы, и оно может быть получено с помощью наблюдения за действиями пользователя, такими как покупки, загрузки, выборы элементов для воспроизведения или удаления и т.д. Выявляемые действия пользователя могут быть интерпретированы средством выдачи рекомендаций и преобразованы в оценку. Например, средство выдачи рекомендаций может интерпретировать действие покупки как положительную оценку, или, в случае элементов видеоинформации, общая продолжительность просмотра больше/меньше 50% может подразумевать положительную/отрицательную оценку.

Пример средства выдачи рекомендаций представлен в US 2008 0104127 A1, где описана управляющая система для информационных средств, которая способна рекомендовать элементы содержимого пользователю на основании их уместности. Для поиска элементов содержимого, система сначала формирует критерии поиска, которые выводятся из данных персонализации, формируемых посредством мониторинга поведения пользователя и/или получения явных предпочтений пользователя. Например, критерии поиска могут быть строкой: "Сильвестр Сталлоне", если данные персонализации выдают, что пользователю нравится этот артист. Такой критерий поиска отсылается в базу данных сведений относительно элементов мультимедиа для поиска соответствующих элементов содержимого. Соответствующие элементы содержимого оцениваются и, если оцениваемые элементы являются уместными, в конечном счете рекомендуются пользователю.

Грубо говоря, существует два типа систем средств выдачи рекомендаций, основанных на сообществе пользователей и основанных на метаданных.

Первый тип известен как совместная фильтрация, при которой либо (i) члены сообщества характеризуются оценками, которые они дают элементам, либо (ii) элементы характеризуются оценками, которые они получают от членов сообщества. Затем эти характеристики используются для определения сходства среди пользователей или элементов, соответственно. Для определенного члена сообщества и определенного элемента, который еще не был оценен этим членом, эти сходства используются, чтобы выводить для этого члена оценку для данного элемента посредством объединения оценок подобных пользователей или подобных элементов, соответственно.

Второй тип систем средств выдачи рекомендаций использует доступные метаданные относительно элементов, которые обычно поступают в форме признаков и ассоциированных значений или списков значений. Статистические данные оценок пользователя используются для создания профиля этого пользователя в отношении пар признаков-значений с указанием для этих пар степени желательности. Для нового элемента, который еще не был оценен этим пользователем, используются его метаданные, и степени желательности каждой существующей пары признаков-значений объединяются, чтобы получить суммарную оценку. Простой, но популярный алгоритм в этом контексте называют «наивным Байесом» (naive Bayes), и он применяет классификацию по Байесу.

Пользователям персональных видеомагнитофонов хотелось бы иметь доступ к любому предлагаемому содержимому, независимо от его источника. Независимо от того, может ли содержимое передаваться по телевидению (и таким образом представлено в электронной программе передач (EPG)), или оно предлагается в библиотеке видео по требованию, или где-либо в другом месте в Интернете, пользователи хотели бы иметь к нему доступ, и система средства выдачи рекомендаций должна быть в состоянии обеспечивать рекомендации для видеоинформации независимо от ее расположения или источника. Независимо от того, основана ли она на совместной фильтрации или основана на содержимом, система средства выдачи рекомендаций должна иметь доступ ко всем элементам, для которых должны быть сформированы рекомендации. Например, средство выдачи рекомендаций для библиотеки видео по требованию должно получать доступ ко всем элементам библиотеки видео по требованию, чтобы быть в состоянии вычислять для каждого элемента вероятность того, что данному пользователю он может понравиться, и, в конечном счете, выбирать список наиболее популярных элементов.

Однако фильтрация всех баз данных и оценивание всех элементов на основании профиля пользователя не работают для очень больших распределенных баз данных, не только потому, что это неэффективно и не масштабируемо, но особенно потому, что это требует доступа ко всем элементам всех баз данных, для которых должны быть сформированы рекомендации.

РАСКРЫТИЕ ИЗОБРЕТЕНИЯ

Цель изобретения состоит в том, чтобы обеспечить эффективное управление для систем средств выдачи рекомендаций, которое обеспечивает рекомендации для элементов удаленных баз данных без необходимости получать доступ ко всем элементам базы данных.

Эта цель достигается устройством по п. 1, способом по п. 6 и компьютерным программным продуктом по п. 7 формулы изобретения.

Соответственно, профиль пользователя, обычно используемый средством выдачи рекомендаций для прогнозирования оценок пользователя, применяется для формирования целевого запроса для источников содержимого, выдающего совокупность результатов, которые могут быть отмечены или оценены средством выдачи рекомендаций и представлены пользователю в качестве предложений. Пары признаков-значений, выделенные из профиля пользователя, используются для формирования целевого запроса, подлежащего отправке источникам содержимого. Результаты объединяются и оцениваются средством выдачи рекомендаций, чтобы обеспечить список рекомендуемых, весьма уместных элементов. Следовательно, система средства выдачи рекомендаций не должна иметь полного доступа ко всем базам данных или другим типам источников содержимого, чтобы производить уместные рекомендации.

Селектор признаков обеспечен для выбора из пар признаков-значений, выделяемых выделителем признаков-значений, тех пар признаков-значений, которые являются наиболее характерными для упомянутого профиля пользователя. Таким образом, запрос может быть ограничен наиболее характерными парами признаков-значений.

Селектор признаков выполнен с возможностью использования алгоритма Relief, например, алгоритма Relief, описанного в работе Kira, K., & Rendell, L. (1992): The feature selection problem: Traditional methods and a new algorithm (Проблема выбора признаков: традиционные способы и новый алгоритм), Proceedings of the 10th National Conference on Artificial Intelligence, San Jose, CA, July 12-16, 129-134 (Материалы 10-й национальной конференции по искусственному интеллекту, Сан-Хосе, Калифорния, 12-16 июля) или его видоизменения, для выбора наиболее характерных пар признаков-значений. Таким образом, может быть обеспечена эффективная процедура отбора.

В соответствии со вторым аспектом, который может быть объединен с вышеупомянутым первым аспектом, формулирование запроса и оценка результатов могут повторяться до тех пор, пока не будет получено предварительно определенное количество соответствующих элементов содержимого.

В соответствии с третьим аспектом, который может быть объединен с вышеупомянутым первым или вторым аспектом, если существует несколько отличительных значений, связанных с единственным признаком, то это обеспечивает преимущество, заключающееся в том, что во время формирования запроса могут быть включены и выключены различные признаки, чтобы получающимся в результате набором элементов можно было управлять итеративным способом. Это может быть обобщено для множества признаков, и система может отслеживать, какие значения одних и тех же или различных признаков приводят к наилучшим результатам, и располагать их по приоритетам, чтобы улучшать этап формирования запроса и сокращать количество требуемых повторений.

В соответствии с четвертым аспектом, который может быть объединен с любым из вышеупомянутых первым - третьем аспектов, выделитель поиска признаков-значений может быть выполнен с возможностью выделения пар признаков-значений, основываясь по меньшей мере на одной из положительной и отрицательной оценок пользователя. Таким образом, могут быть сформированы запросы, которые включают и/или исключают значения признаков.

В соответствии с пятым аспектом, который может быть объединен с любым из вышеупомянутых первого - четвертого аспектов, формирователь запросов может быть выполнен с возможностью расширения запроса, используя тезаурус или онтологию.

В соответствии с шестым аспектом, который может быть объединен с любым из вышеупомянутых первого - пятого аспектов, формирователь запросов может быть выполнен с возможностью расширения запроса до категорий, отличающихся от категорий профиля пользователя. Таким образом, могут быть обеспечены междоменные рекомендации.

В соответствии с седьмым аспектом, который может быть объединен с любым из вышеупомянутых первого - шестого аспектов, профиль пользователя может быть выведен из системы средства выдачи рекомендаций.

В соответствии с восьмым аспектом, который может быть объединен с любым из вышеупомянутых первого - седьмого аспектов, могут подсчитываться совместные встречаемости пар признаков-значений, и только те пары признаков-значений, которые имеют достаточное количество совместных встречаемостей, могут быть объединены в запросе. Таким образом, количество неудачных попыток запросов может быть сокращено.

Следует отметить, что вышеупомянутое устройство может быть реализовано в виде дискретных схем аппаратного средства с дискретными компонентами аппаратного средства в виде интегральной схемы, в виде компоновки модулей с микросхемами или в виде устройства обработки сигналов или компьютерного устройства или микросхемы, управляемой подпрограммой программного обеспечения или программой, хранящейся в запоминающем устройстве.

КРАТКОЕ ОПИСАНИЕ ЧЕРТЕЖЕЙ

Теперь изобретение будет описано, посредством примера, на основании вариантов осуществления в отношении прилагаемых чертежей, на которых:

фиг. 1 показывает блок-схему системы средства выдачи рекомендаций в соответствии с вариантом осуществления настоящего изобретения;

фиг. 2 показывает блок-схему последовательности операций процедуры для основанного на профиле поиска содержимого в соответствии с вариантом осуществления настоящего изобретения; и

фиг. 3 показывает таблицу с выборкой признаков-значений примерного профиля пользователя.

ОСУЩЕСТВЛЕНИЕ ИЗОБРЕТЕНИЯ

Теперь будут описаны варианты осуществления настоящего изобретения на основании примерной системы средства выдачи рекомендаций, которая формирует оценки на элементах содержимого, таких как книги, телепрограммы, кинофильмы и т.д.

Фиг. 1 показывает блок-схему системы средства выдачи рекомендаций в соответствии с первым вариантом осуществления, которая выполнена с возможностью поиска элементов содержимого из различных источников 103 содержимого. Источники 103 содержимого обеспечивают, например, по меньшей мере аудио/видеоинформацию в виде широковещательной передачи или в запрашиваемом виде. Кроме того, источники 103 содержимого могут обеспечивать информационные данные, например, информацию EPG в периоде вертикального обратного хода луча видеосигнала или метаданные стандарта MPEG-7 (Экспертной группы по вопросам движущегося изображения) на сегментах конкретного элемента содержимого (например, на границах сцен кинофильма). Услуга электронной программы передач (EPG) в Интернете может обеспечивать, например, информационные данные в телепрограммах. Такие информационные данные, получаемые из источников содержимого или Интернет-услуг, можно поставлять по меньшей мере в один фильтр 105 предварительного выбора (F), который ассоциирован с каналом персонализированного содержимого и фильтрует элементы содержимого соответствующим образом, например, посредством логических правил. Следует отметить, что может быть обеспечено любое количество каналов персонализированного содержимого. Выход фильтра 105 предварительного выбора соединен с механизмом 107 средства выдачи рекомендаций (RE). Таким образом, каждый канал персонализированного содержимого может иметь ассоциированный с ним собственный механизм 107 средства выдачи рекомендаций. Механизм 107 средства выдачи рекомендаций и, следовательно, канал персонализированного содержимого имеют ассоциированный с ними профиль (P) 109 пользователя. Вывод механизма 107 средства выдачи рекомендаций соединен с планировщиком (SCH) 111. Планировщик 111 соединен с устройством 113 хранения данных (например, набором накопителей на жестких дисках) и с селектором (SEL) 115. Источник 103 содержимого может быть соединен с селектором 115, который может содержать по меньшей мере один набор средств локализации содержимого (например, устройство настройки или подобное устройство), который позволяет локализировать один или больше элементов содержимого для записи на устройстве 113 хранения данных. Вывод селектора 115 соединен с устройством 113 хранения данных.

Дополнительно, первый вариант осуществления выполнен с возможностью обеспечения рекомендаций для элементов источников 103 содержимого (например, удаленных баз данных), не имея необходимости получать доступ ко всем элементам базы данных, при условии, что соответствующая база данных источников 103 содержимого имеет интерфейс запросов. Основная идея состоит в том, что профиль 109 пользователя, обычно используемый механизмом 107 средства выдачи рекомендаций для того, чтобы прогнозировать оценки пользователя, применяется для формирования целевого запроса для источников 103 содержимого, выдающих совокупность результатов, которые могут быть отмечены механизмом 107 средства выдачи рекомендаций и представлены пользователю в качестве предложений.

Например, для пользователя, которому нравятся кинофильмы о боевых искусствах, система автоматически выбирает из профиля пользователя значения признаков, которые выделяются, то есть имеют высокую степень желательности. В случае, если ключевые слова используются в качестве желательных признаков, такими значениями признаков могут быть "боевые искусства", "каратэ", или имена актеров, такие как "Брюс Ли" или "Чак Норрис". Тогда пары признаков-значений используются для формирования запроса, подлежащего отправке всему списку источников 103 содержимого (например, механизмам поиска видеоинформации и библиотекам видео по требованию). Результаты объединяются и оцениваются механизмом 107 средства выдачи рекомендаций, чтобы обеспечить список из N наиболее популярных позиций рекомендуемых уместных элементов.

Для выполнения этого, система средства выдачи рекомендаций в соответствии с первым вариантом осуществления содержит выделитель 116, или функцию выделения признаков-значений (FVE), который выполнен с возможностью получения доступа и анализа профиля 109 пользователя, чтобы извлекать комбинации пар признаков-значений, которые выделяются, например, которые имеют высокие положительные или отрицательные оценки. Факультативно, может быть обеспечен дополнительный селектор 117, или функция выбора признаков (FS), для использования только некоторое количество приоритетных значений признаков из совокупности результатов, которые являются наиболее характерными для определенного профиля пользователя. Здесь, для выбора признаков-значений также могут использоваться высокие отрицательные оценки, которые в запросе будут исключены.

Анализ профиля пользователя, выполняемый выделителем 116 поиска признаков-значений и вспомогательным селектором 117 признаков, сопровождается формирователем 118, или функцией формирования запросов, который принимает выделяемые пары признаков-значений и формирует запрос, используя данные пары признаков-значений, которые получены из анализа профиля пользователя. Затем сформированный запрос предоставляется источникам 103 содержимого.

Далее описана работа устройства, представленного на фиг. 1. Информационные данные текущего элемента содержимого, которые подлежат воспроизведению на канале персонализированного содержимого, собираются от источников 103 содержимого или через другие средства, например, через передачу в периоде вертикального обратного хода луча аналогового радиосигнала вещательного телевидения или через транспортные потоки цифрового широковещательного видеосигнала (DVB), или комбинации любых из вышеупомянутых средств. Элементом содержимого может быть телепрограмма, поток данных, содержащий видеоданные и/или аудиоданные, или сегмент программы и т.д.

Информационные данные могут содержать множество атрибутов и значений атрибутов, связанных с элементом содержимого, таких как заголовок, артисты, режиссер и жанр. Каждый профиль 109 основан на информационных данных вместе с данными, указывающими на "желательность" или "нежелательность" для пользователя. Оценка "желательности" и "нежелательности" может быть основана на обратной связи или элементах содержимого, которые проходят через связанный фильтр 105 предварительного выбора. Эта обратная связь может быть задана как явная оценка пользователями, которые используют определенный канал персонализированного содержимого. Оценки могут быть сделаны несколькими способами. Например, пользователь, используя устройство дистанционного управления, может указать для выбранного в настоящий момент элемента содержимого или данного атрибута текущего элемента содержимого свою оценку ("желательный" или "нежелательный"), нажимая соответствующие кнопки на пользовательском интерфейсе (например, устройстве дистанционного управления), при передаче текущего элемента содержимого. В качестве альтернативы, может наблюдаться поведение пользователя. Например, если пользователь просматривает текущий элемент содержимого в течение больше чем предварительно определенный временной интервал (например, 20 минут), это может автоматически указывать на "желательность". В более усовершенствованной установке, степень "желательности" может обеспечиваться или вычисляться в дискретном или непрерывном масштабе вместо только бинарной классификации на "желательный" или " нежелательный".

Когда информационные данные элемента содержимого проходят через фильтр 105, эти информационные данные направляются в механизм 107 средства выдачи рекомендаций, который вычисляет пристрастную степень или оценку "желательности", основанную на связанном с ними профиле 109 пользователя, для этого последующего элемента содержимого. Затем информационные данные, связанные с последующим элементом содержимого, передаются, наряду с вычисленной оценкой, планировщику 111, который впоследствии вычисляет планирование записи, которое будет использоваться для планирования записи элементов содержимого, предлагаемых механизмом 107 средства выдачи рекомендаций, на устройстве 113 хранения данных. В частности, планировщик 111 прежде всего может рассматривать элементы содержимого с высокой степенью или оценкой желательности, в то время как он все еще рассматривает соответствующее новое содержимое для каждого канала персонализированного содержимого. С этой целью, планирование записи, вычисленное планировщиком 111, используется для того, чтобы давать команду планировщику 115 выбирать доступные элементы содержимого из соответствующего одного из источников 103 содержимого для записи их на устройстве 113 хранения данных.

Профили использования или пользователя могут быть выведены при использовании трех основных способов: неявное профилирование; явное профилирование; и профилирование с обратной связью. Способы неявного профилирования незаметно выводят профиль использования содержимого из статистических данных использования пользователя, например, из наборов просматриваемых и не просматриваемых телевизионных представлений. Способы явного профилирования выводят профили использования содержимого из ответов пользователя на вопросы, которые включают в себя явные вопросы о том, что пользователю нравится и не нравится. Способы профилирования с обратной связью выводят профили использования из элементов содержимого, для которых пользователь обеспечил оценки степени желательности или нежелательности.

Фиг. 2 показывает блок-схему последовательности операций основанной на профиле процедуры поиска содержимого, которая может быть применена в первом варианте осуществления.

Первый этап "анализ профиля пользователя" состоит из анализа профиля пользователя извлечения комбинаций пар признаков-значений, которые больше всего выделяются. Они могут быть парами признаков-значений с высоким количеством положительных оценок по сравнению с другими комбинациями признаков-значений, и это может быть выполнено выделителем 116 признаков-значений и вспомогательным селектором 117 признаков, представленными на фиг. 1.

Фиг. 3 показывает таблицу с выборкой признаков-значений примерного профиля пользователя для признака 'ключевого слова'. На фиг. 3, ключевые слова "Япония", "Каратэ", "Боевые искусства" и "Токио" выделяются относительно остальной части ключевых слов в отношении количества положительных оценок. Пользователь дал положительную оценку десяти элементам, имеющим такие значения признаков. Эти четыре пары признаков-значений переходят на второй этап фиг. 2, "формирование запроса". На этом этапе формируется запрос с использованием данных пар признаков-значений, и это может быть выполнено формирователем 118 запросов, представленным на фиг. 1. Точная форма запроса для выполнения это запроса зависит от механизма поиска или базы данных источников 103 содержимого. Для механизмов поиска определяемого пользователем текста, запрос может состоять из списка значений пар признаков-значений. В приведенном выше примере это может иметь следующий вид: ["Япония" "Каратэ" "Боевые искусства" "Токио"]. Для баз данных или механизмов поиска, которые позволяют определять различные поля в запросе, приведенный выше пример может привести к запросу: [ключевое слово: "Япония" ключевое слово: "каратэ" ключевое слово: "боевые искусства" ключевое слово: "Токио"].

На третьем этапе запрос предъявляется совокупности механизмов поиска или баз данных, которые, возможно, содержат соответствующие элементы. Следует отметить, что различным механизмам поиска или базам данных источников 103 содержимого могут быть предъявлены разные запросы, чтобы соответствовать различным форматам и прикладным программным интерфейсам (API). Затем получаются и объединяются результаты так, чтобы сформировать один список связанных элементов. Из этого списка могут быть удалены элементы, которые пользователь уже видел или ранее поместил в черный список. Затем, на четвертом этапе, остающиеся элементы оцениваются механизмом 107 средства выдачи рекомендаций, на основании чего выводится первый профиль 109 пользователя. Результат представляет собой отсортированный список связанных элементов с теми элементами в верхней части, которые имеют высокую вероятность быть желательными для пользователя. Теперь, на пятом этапе процедуры, список оцениваемых элементов готов для Предоставления пользователю.

Этапы "формирования запроса", "предъявления запроса и получения результатов" и "оценки элементов в соответствии с профилем пользователя" могут повторяться до тех пор, пока не будет получено достаточное количество высоко оцениваемых соответствующих элементов. При каждом повторении может использоваться отличающийся набор пар признаков-значений, начиная с широкого набора, определяющего очень конкретный запрос, который может привести к слишком малочисленным результатам, и удаляя пары признаков-значений, таким образом делая запрос менее определенным, чтобы получить больше результатов. В приведенном выше примере, при первом запросе ["Япония" "Каратэ" "Боевые искусства" "Токио"] может быть получено 164 результата на базе данных видеоинформации, при втором запросе, ["Япония" "Каратэ" "Боевые искусства"], без ключевого слова "Токио", может быть получено 1180 результатов, а при третьем запросе, ["Япония" "Каратэ"], без ключевых слов "Токио" и "Боевые искусства", может быть получено 5760 результатов.

В качестве альтернативы, можно отслеживать совместную встречаемость признаков-значений (признаков-значений, которые появляются в одном и том же элементе), и предпочтительно образовывать только такие комбинации, в которых количество совместных встречаемостей достаточно высокое, чтобы сократить количество неудачных попыток запросов.

Когда используется множество пар признаков-значений, соответствующих одному и тому же признаку, как в приведенных выше примерах, в которых все пары признаков-значений соответствуют "ключевому слову" признака, при каждом повторении, формирование запроса может включать и исключать различные признаки. Например, один запрос может быть сформирован с использованием значений признаков "ключевого слова", а другой с использованием, например, значений признаков "актеров". Система может отслеживать, которые признаки приводят к лучшим результатам, и располагать их в соответствии с приоритетом, чтобы улучшить этап формирования запроса и сократить количество требуемых повторений.

В соответствии со вторым вариантом осуществления, система средства выдачи рекомендаций может быть модифицирована так, чтобы использовать только N наиболее популярных признаков, обнаруженных при использовании процедуры отбора признаков, которая может быть выполнена на вспомогательном селекторе 117 признаков, представленном на фиг. 1. N наиболее популярных признаков могут быть признаками, которые являются самыми характерными для определенного профиля.

Примером такой процедуры отбора признаков может быть алгоритм Relief, который основан на взвешивании признаков. Диагональным элементам проекционной матрицы разрешено принимать значения действительных чисел вместо двоичных единиц. Это обеспечивает возможность для применения некоторых хорошо обоснованных методик оптимизации и позволяет эффективно реализовывать алгоритм. Среди существующих алгоритмов взвешивания признаков, алгоритм Relief, как описано, например, в работе K. Kira и L. А. Rendell, A practical approach to feature selection (Практический подход к выбору признаков), Proc. 9th Int. Conf. Mach. Learn. (9-ая Международная конференция по машинному обучению) (1992), стр. 249 - 256, считается одним из самых удачных благодаря его простоте и эффективности. Недавно было показано, что алгоритм Relief представляет собой онлайновый алгоритм, который решает проблему оптимизации выпуклости (convex optimization), нацеленную на максимизацию, основанную на допустимом пределе целевой функции. Допустимый предел определяется на основании классификатора одного ближайшего соседа. По сравнению со способами фильтрации, алгоритм Relief обычно выполняется лучше благодаря обратной связи по рабочей характеристике нелинейного классификатора при поиске полезных признаков. По сравнению со стандартными способами упаковки, благодаря оптимизированию проблемы выпуклости, алгоритм Relief избегает какого-либо исчерпывающего или эвристического комбинаторного поиска, и таким образом может быть эффективно реализован. В качестве расширения первого и второго вариантов осуществления, также могут применяться отрицательные оценки профиля пользователя, чтобы создавать запросы, которые исключают результаты со значениями признаков, соответствующими отрицательным оценкам (например, ["Япония" "Каратэ" "Боевые искусства" "Токио" исключают: "Индия"]).

Этап формирования запроса, выполняемый формирователем 118 запросов, представленным на фиг. 1, также может включать в себя вспомогательную операцию "расширения запроса", которая расширяет запрос на основании данных пар признаков-значений, используя, например, тезаурус или онтологию. Это также может применяться для предотвращения несоответствий терминологии между базами данных.

Следует отметить, что поиск может быть расширен до элементов категорий, отличающихся от исходного профиля. Например, информация о книгах может быть получена, например, от Интернет-магазина и предложена на основании профиля телезрителя (междоменная рекомендация).

Следует отметить, что настоящее изобретение может быть применено к любой системе средства выдачи рекомендаций для телевизионных абонентских приставок, телевизионных приемников, мобильных телефонов, персональных цифровых секретарей (PDA), персональных компьютеров (PC), персональных видеомагнитофонов (PVR), аудиосистем (включая переносные аудиосистемы), Интернет-услуг (включая аудио и видеосистемы), и всех устройств, в которых средства выдачи рекомендаций используются для сбора, фильтрации и предоставления элементов содержимого от множества источников их пользователям. Таким образом, изобретение не ограничивается средствами выдачи рекомендаций для содержимого телевизионных передач или фильмов, но может быть применено к музыке, театральным представлениям, книгам и всем типам продуктов и услуг, для которых могут быть созданы средства выдачи рекомендаций.

Таким образом, описаны устройство, способ и компьютерный программный продукт для управления системой средства выдачи рекомендаций, при этом профиль пользователя, обычно используемый средством выдачи рекомендаций для прогнозирования оценок пользователя, применяется для формирования целевого запроса для удаленной базы данных, приводящего к совокупности результатов, которые могут быть отмечены средством выдачи рекомендаций и представлены пользователю в качестве предложений.

Хотя изобретение было проиллюстрировано и подробно описано на чертежах и в вышеприведенном описании, такое иллюстрирование и описание следует рассматривать как приведенные для примера, но не в качестве ограничения. Изобретение не ограничивается раскрытыми вариантами осуществления. Из представленного раскрытия специалистам в данной области техники будут очевидны другие модификации. Такие модификации могут содержать другие признаки, которые уже известны в данной области техники и которые могут использоваться вместо или в дополнение к признакам, уже описанным в данном описании.

Изменения раскрытых вариантов осуществления специалистам в данной области техники могут быть поняты и реализованы ими на основании изучения чертежей, раскрытия и прилагаемой формулы изобретения. В формуле изобретения термин "содержащий" не исключает другие элементы или этапы, и единственное число не исключает множество элементов или этапов. Одиночный процессор или другой модуль может выполнять по меньшей мере функции, представленные на фиг. 1 и 2, основываясь на соответствующих подпрограммах программного обеспечения. Компьютерная программа может храниться/распространяться на подходящем носителе, таком как оптический носитель для хранения информации или полупроводниковый носитель, поставляемый вместе или в виде части другого аппаратного обеспечения, но также может распространяться в других формах, например, через Интернет или другие проводные или беспроводные телекоммуникационные системы. Сам факт, что определенные меры содержатся во взаимно отличающихся зависимых пунктах формулы изобретения, не указывает, что комбинация этих мер не может использоваться с выгодой. Любые ссылочные позиции в пунктах формулы изобретения не должны рассматриваться как ограничение ее объема.

1. Устройство для управления системой средства выдачи рекомендаций, причем упомянутое устройство содержит
выделитель (116) признаков-значений для анализа профиля (109) пользователя и для выделения пар признаков-значений, которые характеризуют пользователя упомянутой системы средства выдачи рекомендаций,
формирователь (118) запросов для формирования на основе пар признаков-значений, выделенных упомянутым выделителем (116) признаков-значений, запроса, подлежащего отправке по меньшей мере одному источнику (103) содержимого, и
механизм (107) средства выдачи рекомендаций для оценки результатов, полученных в ответ на упомянутый запрос, чтобы предоставить упомянутому пользователю рекомендацию,
при этом упомянутое устройство отличается тем, что оно дополнительно содержит селектор (117) признаков для выбора из упомянутых пар признаков-значений, выделяемых упомянутым выделителем (116) признаков-значений, тех пар признаков-значений, которые являются наиболее характерными для упомянутого профиля (109) пользователя, причем упомянутый выделитель (116) признаков-значений выполнен с возможностью выделения пар признаков-значений на основе отрицательных оценок пользователя, так что формируются запросы, которые исключают результаты с признаками-значениями, соответствующими отрицательным оценкам.

2. Устройство по п. 1, в котором упомянутый выделитель (116) признаков-значений выполнен с возможностью выделения пар признаков-значений, основываясь на положительных оценках пользователя.

3. Устройство по п. 1, в котором упомянутый формирователь (118) запросов выполнен с возможностью расширения упомянутого запроса, используя тезаурус или онтологию.

4. Устройство по п. 1, в котором упомянутый формирователь (118) запросов выполнен с возможностью расширения упомянутого запроса до категорий, отличающихся от категорий упомянутого профиля (109) пользователя.

5. Устройство по п. 1, в котором упомянутый профиль (109) пользователя получен от упомянутой системы средства выдачи рекомендаций.

6. Устройство по п. 1, в котором селектор признаков выполнен с возможностью использования алгоритма Relief в качестве алгоритма выбора признаков для выбора упомянутых наиболее характерных пар признаков-значений.

7. Способ управления системой средства выдачи рекомендаций, причем упомянутый способ содержит этапы, на которых:
анализируют профиль пользователя и выделяют пары признаков-значений, которые характеризуют пользователя упомянутой системы средства выдачи рекомендаций,
формулируют, на основании выделенных пар признаков-значений, запрос, подлежащий отправке по меньшей мере одному источнику (103) содержимого, оценивают результаты, полученные в ответ на упомянутый запрос, чтобы предоставить упомянутому пользователю рекомендацию,
повторяют упомянутые этапы формулирования и оценки до тех пор, пока не будет получено предварительно определенное количество соответствующих элементов содержимого, и
подсчитывают совместные встречаемости пар признаков-значений, которые появляются в одном и том же элементе, и объединяют в упомянутом запросе только пары признаков-значений с достаточным количеством совместных встречаемостей,
причем пары признаков-значений выделяют на основе отрицательных оценок пользователя, так что формируются запросы, которые исключают результаты с признаками-значениями, соответствующими отрицательным оценкам.

8. Носитель данных, хранящий компьютерный программный продукт, причем компьютерный программный продукт содержит средство кодирования для осуществления этапов способа по п. 7 при исполнении на компьютерном устройстве.



 

Похожие патенты:

Изобретение относится к предоставлению контактной информации между абонентами сети, в частности к системе и способу для глобальной службы каталогов с использованием объектов электронной визитной карточки (ЕВС).

Изобретение относится к области поиска информации в компьютерных сетях. Техническим результатом является ускорение поиска информации.

Изобретение относится к области телекоммуникации, в частности к способам управления данными в базе данных каталога. Техническим результатом является предотвращение или снижение неправильного обнаружения конфликтов во время управления данными в базе данных каталога.

Изобретение относится к области поисковых систем. Технический результат - обеспечение предоставления настраиваемых для пользователя изображений на основании пользовательского запроса или пользовательских данных.

Группа изобретений относится к средствам управления состоянием объекта с помощью мобильного устройства. Технический результат заключается в возможности управления состоянием объекта, как являющегося финансовым продуктом, так и не являющимся таковым, в повышении безопасности управления состоянием объекта, в снижении возможности проведения мошеннических действий за счет использования разных каналов для управления и запроса сведений о состоянии объекта, в повышении надежности и безопасности системы за счет хранения конфиденциальных сведений об объекте отдельно от сведений о его состоянии.

Предложена система управления личными данными и событиями на транспортном средстве. Изобретение включает в себя систему транспортного средства и способ управления личными данными и событиями пользователя.

Изобретение относится к вычислительной технике, а именно к носителям информации. Технический результат - обеспечение формата расширяемой файловой системы для портативных носителей информации.

Изобретение относится к устройствам вычислительной техники и может быть использовано для разработки, представления, обновления и хранения информационно-методических ресурсов.

Изобретение относится к компьютерной технике, а именно к автоматизированным поисковым системам. Техническим результатом является повышение точности представления пользователям релевантной информации за счет формирования контекстных поисковых запросов, связанных с семантическим представлением данных.

Изобретение относится к области безопасности. Технический результат - эффективная защита контента.

Изобретение относится к вычислительным устройствам. Технический результат заключается в повышении скорости обработки данных браузером. Способы и устройства содержат: сервер и, по меньшей мере, два web-браузера, функционирующих, по меньшей мере, на двух различных вычислительных устройствах. Каждый браузер сообщает результаты обработки и рендеринга web-страниц серверу. Сервер собирает данные. Сервер формирует метаданные от объединенных браузеров. Сервер передает сформированные метаданные, по меньшей мере, одному вычислительному устройству. Вычислительное устройство выполняет рендеринг web-страницы с помощью, по меньшей мере, фрагмента предоставленных метаданных. Метаданные могут идентифицировать фрагменты JavaScript, которые могут быть обработаны параллельно. Метаданные могут идентифицировать фрагмент библиотеки, который не должен загружаться. Метаданные могут идентифицировать фрагмент web-страницы, рендеринг которого может быть выполнен первым, до второго фрагмента web-страницы. Возврат метаданных вычислительному устройству может помогать вычислительному устройству в синтаксическом разборе, анализе или выполнении запроса web-страницы. 10 н. и 124 з.п. ф-лы, 24 ил.
Изобретение относится к вычислительной технике, в частности к алгоритмам и методам индексации и поиска информационных объектов, для которых задана метрика (функция вычисления расстояния). Техническим результатом является повышение эффективности поиска информационных объектов, для которых задана метрика сравнения, за счет повышения скорости поиска и снижения требуемого объема вычислений. В способе индексации и поиска многомерных данных, для которых задана метрика и не накладывается никаких других ограничений, индекс строится на наборе предзаданных опорных объектов и радиусов колец вокруг каждого объекта. Способ индексации и поиска многомерных данных включает построение индекса, алгоритмы добавления и удаления объектов, алгоритмы поиска объектов, ближайших к заданному или находящихся на указанном расстоянии от заданного, выбор опорных объектов при построении индекса. 2 н. и 2 з.п. ф-лы.

Изобретение относится к области музыкальной терапии. Технический результат заключается в создании персонифицированной базы данных благотворных звуков. В частности, изобретение относится к способу для создания персонифицированной базы данных звуков и музыкальных композиций. Определяют предпочтительные значения характеристик звука элементов первой базы данных, содержащей звуки, создавая тем самым первый фильтр. Применяют упомянутый первый фильтр ко второй базе данных, содержащей элементы, такие как звуки, тем самым создавая отфильтрованную вторую базу данных. Применяют второй фильтр к первой базе данных, содержащей элементы, такие как звуки, тем самым создавая отфильтрованную первую базу данных. Объединяют упомянутую отфильтрованную первую базу данных с упомянутой отфильтрованной второй базой данных, тем самым предоставляя персонифицированную базу данных звуков. 3 н. и 8 з.п. ф-лы, 2 ил.

Изобретение относится к области электронной коммуникации через сеть передачи данных. Технический результат - эффективная кластеризация хранящихся на сервере объектов, связанных с пользователем. Способ структуризации хранящихся объектов в связи с пользователем на сервере включает в себя: получение через сеть передачи данных от электронного устройства, связанного с пользователем, первого запроса на кластеризацию для привязки первых метаданных первого подмножества объектов в по меньшей мере первый кластер; получение метаданных, связанных с каждым объектом из первого подмножества; на основе, по меньшей мере, части метаданных, создание первой привязки метаданных первого подмножества объектов по меньшей мере к одному кластеру; передачу через сеть передачи данных первой привязки метаданных электронному устройству, причем первая привязка метаданных позволяет электронному устройству отображать первое подмножество объектов, собранных по меньшей мере в один первый кластер; получение через сеть передачи данных от электронного устройства указания на действие пользователя в первом подмножестве, которое отображается на электронном устройстве, причем действие пользователя инициирует изменение первого подмножества объектов во второе подмножество объектов; получение метаданных, связанных с каждым объектов из второго подмножества; на основе по меньшей мере метаданных, связанных со вторым подмножеством объектом, создание второй привязки метаданных второго подмножества объектов по меньшей мере ко второму кластеру, и передачу второй привязки вторых метаданных электронному устройству, причем вторая привязка метаданных позволяет электронному устройству отображать подмножество объектов, собранных по меньшей мере во второй кластер. 2 н. и 36 з.п. ф-лы, 3 ил.

Изобретение относится к области представления пользователям результатов информационного поиска, а именно к формированию персонализированной модели ранжирования на электронном устройстве, связанном с пользователем. Технический результат заключается в повышении релевантности предоставляемой пользователю информации, наиболее соответствующей его индивидуальным потребностям. Для этого осуществляют получение данных от сервера поисковой системы через коммуникационную сеть, содержащих информацию о свойствах, характерных для ресурса. Затем производят оценку взаимодействия пользователя с веб-ресурсом, выполняемого пользователем посредством использования электронного устройства, и определение значений параметров для веб-ресурса на основе взаимодействия пользователя. На основании полученных значений параметров, а также свойств, характерных для ресурса, формируют персонализированную модель ранжирования. 4 н. и 44 з.п. ф-лы, 4 ил.

Изобретение относится к машинам баз данных и может быть использовано для построения средств нечисловой обработки информации. Технический результат заключается в расширении функциональных возможностей за счет обеспечения поиска двух строк, содержащих по восемнадцать произвольно заданных символов, в проходящем потоке символов. Устройство поиска информации содержит запоминающее устройство (1) объемом 2048×3 бит, синхронный двоичный счетчик (2), цифровой мультиплексор (3), цифровой компаратор (4), элемент ИСКЛЮЧАЮЩЕЕ ИЛИ (5), мажоритарный элемент (6), первый и второй двухразрядные регистры (71 и 72). За счет указанного аппаратурного состава обеспечивается поиск двух строк, содержащих по восемнадцать произвольно заданных символов, в проходящем потоке символов. В результате достигнуто расширение функциональных возможностей устройства поиска информации. 2 ил.

Изобретение относится к области пользовательского интерфейса для проведения информационного поиска. Технический результат заключается в возможности увеличения количества различных приложений, в которых может быть проведен поиск в отношении поисковых запросов, вводимых в единый централизованный интерфейс. Для этого модуль поиска системного уровня принимает регистрационную информацию поискового интерфейса пользователя системного уровня для приложения вычислительного устройства. Регистрационная информация включает в себя указание того, как модуль поиска системного уровня может запускать приложение. Регистрационная информация добавляется в хранилище регистраций, и приложение включается в качестве приложения из одного или нескольких приложений, в которых можно проводить поиск с использованием поискового интерфейса пользователя системного уровня. 2 н. и 8 з.п. ф-лы, 13 ил.

Группа изобретений относится к области вычислительной техники, может быть использована в специализированных устройствах аппаратной поддержки типовых операций задач распознавания образов, в аппаратной поддержке в высокопроизводительных системах и устройствах параллельной обработки символьной информации, в аппаратных средствах поддержки вывода в информационно-поисковых и экспертных системах, осуществляющих обработку строк (строковых данных), и позволяет реализовать операции поиска по образцу и модификации строки на основе ассоциативной памяти. Техническим результатом является обеспечение реверсивной обработки строк. Способ содержит этапы, на которых: символы обрабатываемой строки замещаются первой подстрокой модификатора при двумерном представлении обрабатываемой строки, выполняется параллельный межстрочный сдвиг влево символов обрабатываемой строки при ее двумерном представлении, вторая подстрока модификатора вставляется в строку матрицы, удаляются незначащие символы обрабатываемой строки при ее одномерном представлении в выделенной маской ее части с помощью последовательного сдвига вправо, при этом маска формируется динамически для выделения рабочей части обрабатываемой строки на четвертом шаге. 2 н.п. ф-лы, 6 ил.

Изобретение относится к области построения корпуса документов. Технический результат заключается в обеспечении автоматизации анализа корпуса документов для определения тем корпуса документов. Технический результат достигается за счет выполнения классификации, с использованием классификатора, каждого документа во втором наборе документов по одной или более темам из числа исходных тем, где классификация включает определение неклассифицированного подмножества документов из второго набора документов, которые не были отнесены ни к одной из исходных тем, кластеризацию неклассифицированного подмножества документов по новым темам, не входящим в исходные темы, и классификацию каждого документа из неклассифицированного подмножества документов по одной или более темам из числа новых тем. 3 н. и 16 з.п. ф-лы, 7 ил.

Изобретение относится к устройству для обработки данных в логической системе с компьютерной поддержкой. Техническим результатом является обеспечение возможности создания или выполнения критичных к времени запросов и логических выводов без увеличения объема требуемой памяти. Устройство (V) для обработки данных содержит устройство (R) логических выводов с блоком (RP) рассуждений, источник (4, 5) данных и приложение (1). Устройство (R) на основании данных вырабатывает логические выводы на основе семантической модели, содержащей терминологические понятия онтологии, и экземпляра модели семантической модели, содержащего конкретные экземпляры терминологических понятий онтологии. Источник (4, 5) предоставляет данные для обработки посредством устройства (R). Приложение (1) направляет запрос (А) на устройство (R) и получает результаты логических выводов от устройства (R). Устройство (R) на основе наступающего события источника (4, 5), в особенности к определенным моментам времени, получает основанные на событии данные от источника (4, 5) для генерации причинного и/или основанного на времени логического вывода. Информации об основанных на событии данных источника (4, 5) включают в себя временные и причинные компоненты. 3 н. и 21 з.п. ф-лы, 1 ил.
Наверх