Верификация контента собственного приложения

Изобретение относится к средствам верификации согласованности между контентом собственного приложения и контентом соответствующего веб-ресурса, который предоставляется отдельно от контента собственного приложения. Технический результат заключается в обеспечении согласованности результатов поиска. Осуществляют доступ к данным, описывающим, для собственного приложения, пары адресов из первых адресов и вторых адресов, при этом каждая пара адресов является первым адресом и соответствующим вторым адресом. При этом каждый первый адрес является доступным посредством собственного приложения и с которого собственное приложение принимает первый контент, и каждый второй адрес является адресом для веб-ресурса, который соответственно предоставляет второй контент. Для каждой пары адресов осуществляют: прием первого контента для первого адреса и прием второго контента для второго адреса, определения, являются ли первый контент и второй контент согласованным контентом. Только для каждой пары адресов, для которой первый контент и второй контент определяются как согласованный контент, подтверждают пару адресов и сохраняют в данных подтверждения индекса для пары адресов. 3 н. и 15 з.п. ф-лы, 5 ил.

 

ПРЕДПОСЫЛКИ СОЗДАНИЯ ИЗОБРЕТЕНИЯ

[0001] Интернет предоставляет доступ к широкому многообразию информации. Например, файлы цифрового изображения, видео и/или аудио файлы, как впрочем и ресурсы веб-страницы для конкретных предметов или конкретных новостных статей, являются доступными через Интернет. В отношении ресурсов веб-страницы, многие из этих ресурсов предназначены для того, чтобы способствовать выполнению конкретных функций, таких как обеспечение банковского обслуживания, бронирование мест в отеле, осуществление покупок, и т.д., или чтобы предоставлять информацию, такую как онлайновые энциклопедии, базы данных фильмов, новости, и т.д.

[0002] В распоряжении имеется многообразие поисковых машин для идентификации конкретных ресурсов, доступных через Интернет. Эти поисковые машины осуществляют обход и индексирование разнообразных ресурсов веб-страницы. Поисковые машины затем используют индексы, чтобы определять, какие ресурсы являются наиболее соответствующими поисковым вопросам (queries), и предоставлять результаты поиска, которые ссылаются на ресурсы в ответ на вопросы.

[0003] С появлением планшетных компьютеров и интеллектуальных телефонов, собственные приложения, которые способствуют выполнению точно таких же функций, выполнению которых способствуют посредством использования ресурсов веб-страницы, или предоставлению точно такого же контента посредством использования веб-страниц, в настоящее время предоставляются в больших количествах.

СУЩНОСТЬ ИЗОБРЕТЕНИЯ

[0004] Данное техническое описание описывает технологии для верификации контента собственного приложения.

[0005] В общем, один инновационный аспект предмета изобретения, описываемого в данном техническом описании, может быть воплощен в способах, которые включают в себя действия в виде осуществления доступа к данным, описывающим, для собственного приложения, пары адресов из первых адресов и вторых адресов, при этом каждая пара адресов является первым адресом и соответствующим вторым адресом, при этом каждый первый адрес является доступным посредством собственного приложения и с которого собственное приложение принимает первый контент, и каждый второй адрес является адресом для веб-ресурса, который соответственно предоставляет второй контент; для каждой пары адресов: приема первого контента для первого адреса, приема второго контента для второго адреса, определения, являются ли первый контент и второй контент согласованным контентом, и только для каждой пары адресов, для которой первый контент и второй контент определяются как согласованный контент, подтверждения пары адресов и сохранения данных подтверждения для пары адресов в индексе. Другие варианты осуществления данного аспекта включают в себя соответствующие системы, устройство, и компьютерные программы, выполненные с возможностью выполнения действий способов, закодированных на компьютерных запоминающих устройствах.

[0006] Конкретные варианты осуществления предмета изобретения описываемого в данном техническом описании могут быть реализованы таким образом, чтобы реализовывать одно или более из следующих преимуществ. Поисковая машина верифицирует то, что контент собственного приложения является согласованным с контентом соответствующего веб-сайта перед индексированием ссылки для собственного приложения в отношении контента. Верификация гарантирует то, что поисковая машина, при подаче результатов поиска собственного приложения в ответ на вопрос, является предоставляющей доступ к информации, которая будет удовлетворять информационные потребности пользователя.

[0007] В некоторых реализациях, поисковой машине требуется только проиндексировать контент, который предоставляется согласованным образом посредством веб-сайта и посредством собственных приложений в одном индексе, а не по отдельности в индексе для веб-ресурсов и другом индексе для собственных приложений. Это сокращает общее обслуживание двух совокупностей.

[0008] В некоторых вариантах осуществления, подтверждение способствует подаче результатов поиска собственного приложения для собственных приложений, которые, как известно, предоставляют согласованный контент с веб-ресурсом. Таким образом, веб-ресурс может быть использован в качестве прокси количественной оценки для собственного приложения. Это обеспечивает возможность согласованной количественной оценки между собственным приложением и соответствующим ресурсом при количественной оценке и ранжировании результатов поиска.

[0009] В заключение, посредством использования разнообразных методик верификации контента, процесс верификации является надежным в отношении разнообразных отличий форматирования и отображения между собственным приложением и соответствующим веб-ресурсом.

[0010] Подробности одного или более вариантов осуществления предмета изобретения, описываемого в данном техническом описании, излагаются на сопроводительных чертежах и в описании ниже. Другие признаки, аспекты, и преимущества предмета изобретения станут очевидны из описания, чертежей, и формулы изобретения.

КРАТКОЕ ОПИСАНИЕ ЧЕРТЕЖЕЙ

[0011] Фиг. 1 является структурной схемой примерной среды, в которой контент для собственных приложений подвергается верификации в качестве согласованного с веб-контентом.

[0012] Фиг. 2 является блок-схемой примерного процесса для верификации контента собственного приложения.

[0013] Фиг. 3 является блок-схемой примерных процессов подтверждения.

[0014] Фиг. 4 является блок-схемой примерного процесса для генерирования и предоставления результатов поиска собственного приложения.

[0015] Фиг. 5 является иллюстрацией страницы результатов поиска, которая включает в себя результат поиска собственного приложения.

[0016] Подобные ссылочные числа и обозначения на различных чертежах указывают подобные элементы.

ПОДРОБНОЕ ОПИСАНИЕ

[0017] Используемое в данном документе, собственное приложение работает независимо от приложения браузера на устройстве пользователя. Собственное приложение является приложением специально предназначенным для работы в конкретной операционной системе устройства пользователя и встроенном программном обеспечении машины и не внутри браузера. Собственные приложения, таким образом, отличаются от браузеров, основанных на браузере приложений и визуализируемых браузером ресурсов. Последние требуют чтобы все, или, по меньшей мере, некоторые, элементы или инструкции загружались с веб-сервера всякий раз, когда создается их экземпляр или они визуализируются. Основанные на браузере приложения и визуализируемые браузером ресурсы могут быть обработаны посредством всех мобильных устройств с веб-возможностями внутри браузера и, таким образом, не являются особыми для операционной системы, какими являются собственные приложения. Кроме того, используемый в данном документе результат поиска собственного приложения является результатом поиска, который соответствует конкретному собственному приложению и который, когда выбирается, вызывает конкретное собственное приложение.

[0018] Издатель (или третьи стороны) может предоставлять адреса контента (например, URI, URL, или параметры командной строки) для собственного приложения и соответствующие адреса веб-ресурса, которые, как подразумевается, предоставляют тот же самый или сходный контент, что и собственное приложение. Такой контент именуется «согласованным контентом» поскольку он предоставляется как посредством собственного приложения, так и посредством веб-ресурса. Тем не менее по разнообразным причинам, контент предоставляемый посредством собственного приложения, может быть несогласованным с контентом, предоставляемым посредством веб-ресурса. Несогласованность может возникать из-за неправильной спецификации адреса, неспособности обеспечения данных серверного средства, которые подаются собственному приложению, или по любой другой причине, которая может вызвать несогласованности.

[0019] Соответственно, система, такая как поисковая машина, осуществляет верификацию контента между собственным приложением и веб-ресурсом. В некоторых реализациях, система осуществляет доступ к данным, описывающим, для собственного приложения, пары адресов из первых адресов и вторых адресов. Каждая пара адресов задает первый адрес и соответствующий второй адрес, где каждый первый адрес является доступным посредством собственного приложения и с которого собственное приложение принимает первый контент, и каждый второй адрес является адресом для веб-ресурса, который соответственно предоставляет второй контент. Для каждой пары адресов, система принимает первый контент для первого адреса и второй контент для второго адреса. Затем система определяет, являются ли первый контент и второй контент согласованным контентом. Если контент является согласованным, тогда пара адресов является верифицированной. Контент определяется как согласованный, если один или более процессы сравнения, такие как выявление совпадения сущностей, сходство N-грамм, выявление совпадения фраз, и сходство признаков, указывают пороговый уровень согласованности между первым и вторым контентом. Только для пар адресов, для которых первый контент и второй контент определяются как согласованный контент, система сохраняет в индексе данные подтверждения для пары адресов.

[0020] Данные подтверждения способствуют подаче результатов поиска собственного приложения для собственных приложений, которые, как известно, предоставляют согласованный контент с веб-ресурсом. Для операции поиска, система принимает поисковый запрос для устройства пользователя. Поисковый запрос включает в себя вопрос и данные для идентификации собственных приложений, установленных на устройстве пользователя. Система также принимает данные, идентифицирующие веб-ресурсы, отвечающие на вопрос. Система затем определяет, включает ли какой-либо веб-ресурс из веб-ресурсов, отвечающих на вопрос, контент, для которого согласованный контент является доступным посредством собственного приложения, установленного на устройстве пользователя. В ответ на положительное определение, система генерирует результат поиска собственного приложения, который предписывает собственному приложению, установленному на устройстве пользователя, запросить согласованный контент, когда результат поиска собственного приложения выбирается на устройстве пользователя. Результаты поиска веб-ресурса и результат поиска собственного приложения затем предоставляются устройству пользователя.

[0021] Эти признаки и другие признаки описываются более подробно ниже.

[0022] Фиг. 1 является структурной схемой примерной среды 100, в которой контент для собственных приложений подвергается верификации в качестве согласованного с веб-контентом. Компьютерная сеть 102, такая как Интернет, соединяет веб-сайты 104 издателя ресурса, издателей 106 приложения, устройства 108 пользователя и поисковую систему 110.

[0023] Веб-сайт 104 издателя ресурса включает в себя один или более веб-ресурсы 105, ассоциированные с доменом и которые размещаются на одном или более серверах в одном или более местоположениях. Как правило, веб-сайт издателя ресурса является совокупностью веб-страниц, отформатированных на языке гипертекстовой разметки (HTML), которые содержат текст, изображения, мультимедийный контент, и элементы программирования. Каждый веб-сайт 104 обслуживается посредством издателя контента, который является субъектом, который управляет, осуществляет администрирование и/или владеет веб-сайтом 104.

[0024] Ресурс 105 веб-страницы является любыми данными, которые могут быть предоставлены посредством веб-сайта 104 издателя через сеть 102 и которые имеют адрес ресурса, например, унифицированный указатель ресурса (URL). Веб-ресурсы могут быть страницами HTML, файлами изображений, видео файлами, аудио файлами, и источниками канала, чтобы назвать только несколько. Ресурсы могут включать в себя встроенную информацию, например, мета-информацию и гиперссылки, и/или встроенные инструкции, например, сценарии клиентской стороны. Ресурсы могут быть оптимизированными для сред настольной системы или мобильных сред, особенно когда издатель 105 поддерживает мобильный внешний вид.

[0025] Издатель 105 также может предоставлять собственное приложение 107. Как описано выше, собственное приложение 107 является приложением специально предназначенным для работы в конкретной операционной системе устройства пользователя и встроенном программном обеспечении машины. Многие издатели 104 предоставляют один и тот же контент как в веб-ресурсах, так и собственных приложениях. Администрирование доставки такого контента осуществляется посредством серверного средства 120 издателя. Серверное средство 120 издателя включает в себя хранилище 122 издателя, которое хранит контент, который предоставляет издатель, веб-сервер 124, который предоставляет контент из хранилища издателя в качестве веб-ресурсов (например, веб-страниц), сервер 126 данных собственного приложения, который обрабатывает запросы от собственного приложения. Контент хранилища 122 издателя доступен для представления как в веб-ресурсах, так и в собственном приложении. Соответственно, такой контент именуется «согласованным» контентом.

[0026] Примерами таких издателей являются новостные издатели, которые могут иметь «мобильное новостное небольшое приложение» для чтения новостного контента на мобильном устройстве. Новостной контент (например, текст новостного сюжета), предоставленный на веб-ресурсе 105, является точно таким же или очень сходным с контентом, который предоставляется посредством собственного приложения 107.

[0027] Архитектура серверного средства 120 издателя является лишь иллюстративной, и также могут быть использованы другие системы, которые предназначены, чтобы предоставлять согласованный контент двум или более разным средам.

[0028] Устройство 108 пользователя является электронным устройством, которое находится под управлением пользователя. Устройство 108 пользователя, как правило, выполнено с возможностью запроса и приема ресурсов 105 веб-страницы и собственных приложений 107 через сеть 102. Примерные устройства 108 пользователя включают в себя персональные компьютеры, устройства мобильной связи, и планшетные компьютеры.

[0029] Веб-индекс 112 является индексом контента издателя, который был, например, построен из обхода веб-сайтов 104 издателя, посредством приема каналов данных от веб-сайтов 104 издателя, или посредством других подходящих способов сбора и индексирования данных.

[0030] Индекс 114 собственного приложения хранит данные, относящиеся к собственным приложениям 107. Индекс 114 приложения хранит, например, список собственных приложений, предоставленных посредством издателей 105, и идентификаторы, которые идентифицируют собственные приложения. Кроме того, в некоторых реализациях, издатели 104 могут указывать, что определенные собственные приложения 107 используются, чтобы осуществлять доступ к и отображать согласованные данные, и данная информация может быть сохранена в индексе приложения. Например, издатель новостей может указывать, что приложение чтения новостей, которое он предоставляет, отображает согласованный контент, который отображается на веб-сайте издателя новостей. Данными, указывающими данную взаимосвязь, может быть, например, кортеж, который объединяет в пару идентификатор собственного приложения с именем домена (или другими идентификаторами или указателями ресурса) издателя, и парами адресов, которые описывают пары из адресов для собственного приложения и веб-ресурсов, которые предоставляют согласованный контент.

[0031] Устройства 108 пользователя представляют поисковые вопросы поисковой системе 110. В ответ на каждый вопрос, поисковая система 110 осуществляет доступ к веб-индексу 112 и индексу 114 приложения, чтобы идентифицировать контент, который является релевантным вопросу. Поисковая система 110 может, например, идентифицировать ресурсы и приложения в форме результатов поиска веб-ресурса и результатов поиска собственного приложения, соответственно. Как только сгенерированы, результаты поиска предоставляются устройству 108 пользователя, от которого был принят вопрос.

[0032] Результат поиск веб-ресурса является данными, сгенерированными посредством поисковой системы 110, которые идентифицируют веб-ресурс, на основании контента ресурса, который удовлетворяет конкретному поисковому вопросу. Результат поиска веб-ресурса для ресурса может включать в себя заглавие веб-страницы, фрагмент текста, извлеченного из ресурса, и унифицированный идентификатор ресурса (URI) для ресурса, например, унифицированный указатель ресурса (URL) веб-страницы. Когда выбирается на устройстве пользователя, результат поиска веб-ресурса предписывает устройству сгенерировать запрос в отношении ресурса, расположенного в URL. Веб-ресурс, который принимается, затем отображается в приложении браузера.

[0033] Результат поиска собственного приложения указывает собственное приложение. Генератор 116 результата поиска собственного приложения генерирует результат поиск собственного приложения в ответ на поиск индекса 114 приложения и/или веб-индекса 112, как описывается более подробно ниже. Когда выбирается на устройстве пользователя, результат поиск собственного приложения предписывает собственному приложению, установленному на устройстве пользователя, запросить согласованный контент. Как только собственное приложение принимает запрошенный контент, собственное приложение отображает контент в интерфейсе пользователя собственного приложения.

[0034] Как описано выше, адреса контента адреса контента, URI, URL, или параметры командной строки, для собственного приложения и соответствующий адрес веб-ресурса, который, как подразумевается, предоставляет один и тот же или сходный контент, что и собственное приложение, могут быть предоставлены издателями или третьими сторонами. Одним примером таких адресов контента являются внешние ссылки, которая является инструкцией, указывающей конкретный экземпляр среды собственного приложения и выполнены с возможностью предписания собственному приложению создавать экземпляр экземпляра среды указанного собственного приложения, когда выбирается на устройстве пользователя. Внешняя ссылка может включать в себя конкретные адреса, по которым собственное приложение должно адресовать запросы контента. В качестве альтернативы, адреса могут быть сохранены внутри исполняемого собственного приложения, и каждый раз, когда создается экземпляр собственного приложения, оно запрашивает контент по адресу. В таких ситуациях издатель может предоставлять адреса, или система, как например, верификатор 120 контента собственного приложения/веб-контента, описываемый более подробно ниже, может создавать экземпляр собственного приложения и отслеживать адреса, по которым собственное приложение отправляет запросы контента.

[0035] Верификатор 120 контента собственного приложения/веб-контента осуществляет верификацию того, является ли контент от собственного приложения и контент для соответствующего веб-ресурса согласованным. Верификатор 120 контента осуществляет доступ к карте 122 адресов, которая хранит список пар адресов для собственных приложений и веб-сайтов. Пары адресов могут быть предоставлены посредством издателя или третьих сторон, или могут быть извлечены посредством верификатора 120 контента, или получены и тем и другим способом. Работа верификатора 120 контента описывается более подробно со ссылкой на Фиг. 2 и 3 ниже.

[0036] Фиг. 2 является блок-схемой примерного процесса 200 для верификации контента собственного приложения. Процесс 200 может быть реализован в устройстве обработки данных одного или более компьютеров в связи для передачи данных.

[0037] Процесс 200 осуществляет доступ к паре адресов из первого адреса для собственного приложения и второго адреса для веб-ресурса (202). Каждая пара адресов является первым адресом и соответствующим вторым адресом. Каждый первый адрес является доступным посредством собственного приложения и с которого собственное приложение принимает первый контент, и каждый второй адрес является адресом для веб-ресурса, который соответственно предоставляет второй контент. Вновь, пары адресов могут быть предоставлены как описано выше. В качестве альтернативы, в некоторых реализациях, верификатор контента может отслеживать запросы контента, выпускаемые из собственного приложения. Если запросы контента являются совместимыми с веб-адресом веб-ресурса, таким как URL, например, тогда два адреса сохраняются в качестве пары адресов.

[0038] Процесс 200 принимает первый контент для адреса (204). Верификатор 120 контента, например, может исполнять собственное приложение и отслеживать данные, которые принимаются в ответ на запросы контента собственного приложения. Контент может быть собран разнообразными способами. Например, устройство обработки данных может быть оснащено, чтобы опрашивать обработчики текста, обработчики списка и обработчики вида собственного приложения, чтобы извлекать текст и данные изображения для обработки. В качестве альтернативы или в дополнение, могут отслеживаться ответы на запросы контента и данные извлекаться из ответов. Также могут быть использованы другие подходящие способы сбора данных, предоставляемых для и/или отображаемых посредством собственного приложения.

[0039] Процесс 200 принимает второй контент для второго адреса (206). В случае веб-ресурса, контент, который принимается, является, например, контентом, который должен быть визуализирован, как часть документа языка разметки браузера. Для других сред, могут быть использованы те же самые или сходные процессы сбора данных, как описанные со ссылкой на этап (204) выше.

[0040] Процесс 200 определяет, являются ли первый контент и второй контент согласованным контентом (208). Контент определяется как согласованный, если один или более процессы сравнения, такие как выявление совпадения сущностей, сходство N-грамм, выявление совпадения фраз, и сходство признаков, указывают пороговый уровень согласованности между первым и вторым контентом. Более подробный примерный процесс для определения, являются ли согласованными контент для собственного приложения и контент для веб-ресурса, описывается со ссылкой на Фиг. 3 ниже.

[0041] Если процесс 200 определяет, что первый контент и второй контент являются согласованным контентом, тогда процесс 200 подтверждает пару адресов и сохраняет данные подтверждения в индексе ресурса (210). Например, запись для URL в веб-индексе 112 может быть обновлена, чтобы включать в себя адрес для собственного приложения и идентификатор собственного приложения. Данная поисковая система 110, при обработке результатов поиска позже, может затем генерировать соответствующий результат поиска собственного приложения, если веб-ресурс, на который ссылается URL, должен предоставляться устройству пользователя в качестве веб-результата поиска. Генерирование результата поиска собственного приложения для веб-результата поиска описывается более подробно со ссылкой на Фиг. 4 и 5 ниже.

[0042] И наоборот, если процесс 200 не определяет, что первый контент и второй контент являются согласованным контентом, тогда процесс 200 не подтверждает пару адресов (212). Таким образом, для адресов собственного приложения, которые определяются как не имеющие контент согласованный с соответствующим веб-ресурсом, не будет сгенерирован результат поиска собственного приложения для этого адреса.

[0043] Фиг. 3 является блок-схемой примерных процессов подтверждения. Процесс 300 может быть реализован в устройстве обработки данных одного или более компьютеров в связи для передачи данных. Процесс 300 может включать в себя одну или более проверки согласованности контента. Например, как показано на Фиг. 3, проверки согласованности включают в себя проверку 310 сходства N-грамм, проверку 320 совпадения сущностей, проверку 330 совпадения фраз, и проверку 340 сходства вектора признаков. Каждая проверка процесса генерирует данные, такие как меры сходства или совпадения, которые указывают уровень согласованности между контентом собственного приложения и контентом веб-ресурса.

[0044] Процесс 300 извлекает первые N-граммы из первого контента и вторые N-граммы из второго контента (312). N-граммы могут быть, например, биграммами и триграммами. Контент может быть подвергнут синтаксическому анализу, чтобы создать N-граммы, или N-граммы могут быть извлечены, если они существуют в предварительно заданном словаре N-грамм.

[0045] Процесс 300 определяет меру сходства N-граммы на основании первых и вторых N-грамм (314). Чем выше мера сходства, тем выше согласованность между первым и вторым контентом. Может быть использовано многообразие процессов измерения сходства. Например, идентифицированные N-граммы могут быть использованы, чтобы наполнять разряженный вектор для каждого набора контента, и сходство может быть основано на оценке косинусного сходства. Также могут быть использованы другие процессы измерения сходства.

[0046] В некоторых реализациях, форматирование, позиция, или известность N-грамм могут быть использованы, чтобы взвешивать N-граммы. Например, N-граммы в заглавиях могут быть взвешены выше, чем N-граммы в заголовках, а N-граммы в заголовках могут быть взвешены выше, чем N-граммы в тексте, подчиненном заголовку, и т.д. На основании этих относительных весовых коэффициентов, совпадения N-грамм в заглавиях или заголовках, следовательно, могут быть более свидетельствующими о согласованном контексте, чем совпадения N-грамм в тексте, подчиненном заголовку.

[0047] N-граммы также могут быть взвешены обратно пропорционально их соответствующим частотам. Это основано на допущении, что редкие N-граммы являются более свидетельствующими о лежащем в основе контенте, чем очень частые N-граммы. Чтобы проиллюстрировать, N-граммы, такие как стоповые слова или общераспространенные слова встречаются много более чаще, чем N-граммы, такие как имя человека, или название местоположения, и т.д. Вновь, на основании этих относительных весовых коэффициентов, совпадения менее частых N-грамм, следовательно, являются более свидетельствующими о согласованном контенте, чем совпадения очень частых N-грамм.

[0048] Процесс 300 идентифицирует первые сущности, описанные в первом контенте, и вторые сущности, описанные во втором контенте (322). Сущности, которые идентифицированы, являются конкретной темой рассуждения, такими как разные понятия и вещи, которые являются узлами в графе знаний. Сущности, отображенные в графе знаний, соединены посредством отношений сущностей.

[0049] Процесс 300 определяет меру совпадения сущностей на основании идентифицированных первой и второй сущностей (324). Мера совпадения сущностей измеряет совпадения между первыми сущностями и вторыми сущностями, и является пропорциональной количеству совпавших сущностей и количеству идентифицированных сущностей. Совпадения между идентифицированными сущностями являются сигналом согласованности, тогда как несовпадения являются сигналом несогласованности.

[0050] Процесс 300 определяет первые фразы из первого контента и вторые фразы из второго контента (332). В некоторых реализациях, фразы отличаются от N-грамм в том, что фразы обычно отделены посредством пунктуации и определяются посредством моделей языка, или выделяются посредством форматирования контента, или смещаются посредством тэгов разметки. Например, контент может включать в себя некоторое количество записей, отформатированных в соответствии с шаблоном главного заголовка, сопровождаемого заголовками списка, подчиненными главному заголовку, и где каждый заголовок списка включает в себя параграф текста, подчиненного заголовку списка. Текст каждого из главного заголовка, заголовков списка, и параграфов каждый может быть рассмотрен в качестве отдельной фразы для выявления совпадения фраз.

[0051] Процесс 300 определяет меру совпадения фраз на основании идентифицированных первых и вторых фраз (334). Мера совпадения фраз измеряет совпадения между первыми фразами и вторыми фразами, и является пропорциональной количеству совпавших фраз и количеству идентифицированных фраз. Совпадения могут быть идентифицированы посредством точных совпадений, совпадения основанных на удовлетворенной пороговой величине расстояния редактирования, или на основании одной или более других методик выявления совпадения. Совпадения между идентифицированными фразами являются сигналом согласованности, тогда как несовпадения являются сигналом несогласованности.

[0052] Процесс 300 определяет первый вектор признаков контента из первого контента и второй вектор признаков контента из второго контента (342). Векторы признаков представляют собой признаки форматирования контента. Например, векторы признаков могут описывать заглавие, заголовки, и подзаголовки, и соответствующий контента.

[0053] Процесс 300 определяет меру сходства признаков на основании первого вектора признаков контента и второго вектора признаков контента (344). Мера сходства признаков измеряет сходство между первым контентом и вторым контентом на основании признаков. Может быть использовано многообразие процессов измерения сходства. Чем выше мера сходства, тем выше согласованность между первым и вторым контентом.

[0054] Процесс 300 определяет, является ли контент согласованным на основании мер сходства и совпадения (350). Контент собственного приложения может быть определен как согласованный, если любая мера проверки согласованности проходит пороговую величину, или в качестве альтернативы, если большинство мер проверки согласованности проходят соответствующую пороговую величину, или на основании некоторой другой функции мер проверки согласованности.

[0055] Процессы выше описаны в контексте одного веб-ресурса или одного веб-сайта для собственного приложения. Тем не менее, многие издатели могут обслуживать несколько разных сайтов. Например, многие издатели имеют первый сайт оптимизированный для настольных устройств и второй сайт оптимизированный для мобильного устройства. Собственное приложение также может иметь адреса для каждого из этих сайтов. В таких ситуациях, если контент собственного приложения является согласованным с любым из сайтов, тогда контент определяется как согласованный.

[0056] В некоторых реализациях, повторяющийся или «стереотипный» контент, присутствующий в веб-ресурсе и/или присутствующий в собственном приложении, может не приниматься в расчет или игнорироваться, поскольку информационная ценность стереотипного контента часто меньше, много меньше, чем не стереотипного контента. Многообразие процессов обнаружения стереотипа может быть использовано, чтобы обнаруживать стереотип, включая историческое обнаружение контента, обнаружение одинакового контента по нескольким адресам, и т.д.

[0057] Идентификация собственных приложений и генерирование результатов поиска собственного приложения, описанные со ссылкой на Фиг. 1, описываются более подробно со ссылкой на Фиг. 4, которая является блок-схемой примерного процесса 400 для генерирования и предоставления результатов поиска собственного приложения. Процесс 400 может быть реализован в устройстве обработки данных одного или более компьютеров в связи для передачи данных.

[0058] Процесс 400 принимает поисковый запрос для устройства пользователя (402). Поисковый запрос включает в себя вопрос, который включает в себя одно или более понятий и данные идентификации для идентификации собственных приложений, установленных на устройстве пользователя. Как показано на Фиг. 1, элемент 1 потока изображает поисковый запрос, переданный от устройства пользователя к поисковой системе 110.

[0059] В некоторых реализациях, данные идентификации являются идентификаторами собственного приложения, которые идентифицируют собственные приложения, установленные на устройстве пользователя. Например, приложение браузера может быть выполнено с возможностью доступа к данным реестра или другим данным конфигурации устройства пользователя, которые включают в себя список установленных собственных приложений. В качестве альтернативы, в другой реализации, данные идентификации для идентификации собственных приложений установленных на устройстве пользователя являются идентификатором устройства пользователя, который уникальным образом идентифицирует устройство пользователя. Поисковая система 110 (или другая система в связи для передачи данных с поисковой машиной) может осуществлять доступ к данным учетной записи для идентификатора устройства, при этом данные учетной записи указывают собственные приложения установленные на устройстве. Учетная запись, например, может быть учетной записью пользователя через которую пользователь покупает собственные приложения для инсталляции на устройстве пользователя. Если учетная запись привязана к более чем одному устройству пользователя, где каждое устройство может иметь разные установленные собственные приложения, тогда данные идентификации могут быть сочетанием идентификатора устройства и идентификатора учетной записи отличного от идентификатора устройства. Поскольку оба идентификатора привязаны к учетной записи, данные учетной записи указывают собственные приложения установленные на каждому устройстве пользователя, привязанном к учетной записи. Данные учетной записи могут быть сохранены в данных 114 собственного приложения, или могут быть доступны посредством генератора 116 результата поиска собственного приложения.

[0060] Процесс 400 принимает данные, идентифицирующие веб-ресурсы, отвечающие на вопрос (404). Например, генератор 116 результата поиска собственного приложения принимает данные, идентифицирующие ресурсы, которые определены как отвечающие на вопрос. Примером таких данных является список из URL (или других идентификаторов ресурса), и, для каждого ресурса, оценка, указывающая релевантность контента ресурса вопросу. Поисковая система 110 может определять веб-ресурсы, которые являются отвечающими, и предоставлять данные генератору 116 результата поиска собственного приложения.

[0061] Процесс 400 определяет собственное приложение установленное на устройстве пользователя (406). Например, генератор 116 результата поиска собственного приложения обрабатывает данные идентификации, предоставленные в поисковом запросе, чтобы определить собственные приложения. Если данные идентификации являются списком идентификаторов собственных приложений, тогда генератор 116 результата поиска собственного приложения осуществляет доступ к данным 114 собственного приложения, используя идентификаторы собственного приложения. В качестве альтернативы, если данные идентификации для идентификации собственных приложений, установленных на устройстве пользователя, являются идентификатором устройства пользователя (и/или идентификатором учетной записи), который уникальным образом идентифицирует устройство пользователя, тогда генератор 116 результата поиска собственного приложения осуществляет доступ к данным собственного приложения, чтобы осуществить поиск данных учетной записи (или осуществляет доступ к данным учетной записи, если данные учетной записи не хранятся в данных 114 собственного приложений), чтобы определить собственные приложения, установленные на устройстве пользователя.

[0062] Процесс 400 определяет, что первый веб-ресурс из веб-ресурсов, отвечающих на вопрос, включает в себя контент, для которого согласованный контент является доступным посредством собственного приложения, установленного на устройстве пользователя (408). Например, первый веб-ресурс может быть опубликован издателем ресурса с первым именем домена. Издатель 104 возможно указал, что конкретное собственное приложение, которое было идентифицировано на этапе 406, используется, чтобы осуществить доступ и отобразить согласованные данные, которые будут отображаться в первом веб-ресурсе. Верификатор 120 контента, верифицировав пары адресов собственных приложений, имеет сохраненные данные верификации в индексе 112, который указывает на то, что имеется в распоряжении результат поиска собственного приложения для первого веб-ресурса. Соответственно, первый веб-ресурс определяется как включающий в себя контент, для которого согласованный контент является доступным посредством собственного приложения, установленного на устройстве пользователя.

[0063] Процесс 400 генерирует поиск результата поиска собственного приложения, который включает в себя данные запроса собственного приложения, которые предписывают собственному приложению, установленному на устройстве пользователя, запросить согласованный контент (410). Результат поиска собственного приложения включает в себя данные запроса, которые предписывают собственному приложению запросить контент, который будет отображен в первом веб-ресурсе. Тип данных запроса, которые предоставляются, зависит от собственного приложения. Например, некоторые собственные приложения могут осуществлять принятие URL веб-страницы в качестве ввода и затем передавать URL веб-страницы серверу 126 данных собственного приложения в серверном средстве 120 издателя. Сервер 126 данных собственного приложения затем использует URL чтобы осуществлять доступ к хранилищу 122 издателя и идентифицировать контент, чтобы предоставлять собственному приложению. Например, сервер 126 данных собственного приложения может быть выполнен с возможностью извлечения соответствующего контента для каждого ресурса веб-страницы и предоставления контента собственному приложению. В таких реализациях, результат поиска собственного приложения может включать в себя командную строку с URL в качестве аргумента командной строки, которая пропускается к серверному средству 120 издателя, когда запускается собственное приложение, в ответ на выбор результата поиска собственного приложения.

[0064] Процесс 400 предоставляет результаты поиска веб-ресурса и результат поиска собственного приложения устройству пользователя (412). Например, предоставление результатов поиска веб-ресурса и результата поиска собственного приложения изображены на Фиг. 1 посредством элемента 2 потока. По приему, устройство 108 пользователя визуализирует результаты поиска для отображения.

[0065] Фиг. 5 является иллюстрацией страницы 500 результатов поиска, которая включает в себя результат поиска собственного приложения. Отображаемыми на странице 500 результатов поиска являются результаты 520, 530, и 540 поиска, которые отвечают на вопрос «текущие новости», отображаемый в поле 504 ввода поиска. Результаты 520 и 540 поиска являются веб-результатами поиска, сгенерированными в ответ на поиск веб-индекса 112 ресурсов. Каждый результат 520 и 540 поиска ссылается на ресурс, который может быть визуализирован в приложении браузера на устройстве пользователя и включает в себя URL ссылку на ресурс, и другие данные 522 и 542, такие как фрагмент текста, извлеченного для ресурса на который ссылаются.

[0066] Результат 530 поиска является результатом поиска собственного приложения, который генерируется в ответ на то, что генератор 116 результата поиска собственного приложения определяет, что веб-ресурс включает в себя контент для которого согласованный контент является доступным посредством собственного приложения, установленного на устройстве пользователя. Результат 530 поиска собственного приложения может включать в себя, например, фрагмент 532 текста и изображение 534 отображения собственного приложения. Фрагмент 532 может быть извлечен из веб-ресурса. В данном примере, фрагмент 532 является рубрикой и текстом новостного сюжета. Изображение 534 может быть, например, изображением интерфейса пользователя собственного приложения. Изображение 534 помогает визуально отличить результат 530 поиска собственного приложения от результатов поиска веб-ресурса.

[0067] Встроенными в собственное приложение являются данные запроса, которые собственное приложение использует, чтобы запросить контент после запуска. Данные запроса могут быть, например, URL ресурса, который включает в себя согласованный контент. URL, тем не менее, не показан с тем, чтобы избежать путаницы в отношении того, что результат 530 поиска собственного приложения является результатом поиска веб-ресурса.

В некоторых реализациях, выбор изображения 534, или любой другой части результата 532 поиска собственного приложения, на устройстве пользователя предписывает запуск собственного приложения и запрос контента, который является релевантным поисковому вопросу. Отметим, что если собственное приложение не было установлено на устройстве 108 пользователя, тогда результатом 530 поиска будет результат поиска веб-ресурса вместо результата поиска собственного приложения. Подобно, если собственное приложение для «Источника Новостей Три» было установлено на устройстве 108 пользователя, тогда веб-результат 540 поиска будет результатом поиска собственного приложения, которое будет вызывать собственное приложение для «Источника Новостей Три».

[0068] Варианты осуществления предмета изобретения и операции, описываемые в данном техническом описании, могут быть реализованы в цифровой электронной схеме, или компьютерном программном обеспечении, встроенном программном обеспечении, или аппаратном обеспечении, включающем в себя структуры, раскрываемые в данном техническом описании, и их структурные эквиваленты, или в сочетаниях одного или более из них. Варианты осуществления предмета изобретения, описываемые в данном техническом описании, могут быть реализованы в качестве одной или более компьютерных программ, т.е. одного или более модулей из инструкций компьютерной программы, закодированных на компьютерном запоминающем носителе информации для исполнения посредством, или чтобы управлять работой, устройства обработки данных. В качестве альтернативы или в дополнение, инструкции программы могут быть закодированы в искусственно сгенерированном распространяемом сигнале, например, генерируемом машиной электрическом, оптическом, или электромагнитном сигнале, который генерируется, чтобы кодировать информацию для передачи подходящему устройству приемнику для исполнения посредством устройства обработки данных. Компьютерный запоминающий носитель информации может быть, или быть включен в, машиночитаемым запоминающим устройством, машиночитаемой запоминающей подложкой, массивом или устройством памяти с произвольным или последовательным доступом, или сочетанием одного или более из них. Более того, несмотря на то, что компьютерный запоминающий носитель информации не является распространяемым сигналом, компьютерный запоминающий носитель информации может быть источником или местом назначения инструкций компьютерной программы, закодированных в искусственно сгенерированном распространяемом сигнале. Компьютерный запоминающий носитель информации также может быть, или быть включен в, одним или более отдельными физическими компонентами или носителями информации (например, несколькими CD, дисками, или другими запоминающими устройствами).

[0069] Операции, описываемые в данном техническом описании, могут быть реализованы в качестве операций, выполняемых посредством устройства обработки данных над данными, хранящимися на одном или более машиночитаемых запоминающих устройствах или принимаемых от других источников.

[0070] Понятие «устройство обработки данных» охватывает все виды аппаратур, устройств, и машин для обработки данных, включая, в качестве примера, программируемый процессор, компьютер, систему на кристалле, или множество, или сочетания, из вышеупомянутого. Устройство также может включать в себя, в дополнение к аппаратному обеспечению, код, который создает среду исполнения для компьютерной программы о которой идет речь, например, код, который составляет встроенное программное обеспечение процессора, стек протоколов, систему администрирования базы данных, операционную систему, кроссплатформенную среду выполнения, виртуальную машину, или сочетание одного или более из них. Устройство и среда исполнения могут реализовывать несколько разных инфраструктур вычислительной модели, такие как веб-услуги, инфраструктуры распределенных вычислений и сетевых вычислений.

[0071] Компьютерная программа (также известная как программа, программное обеспечение, приложение программного обеспечения, сценарий, или код), может быть написана на любой форме языка программирования, включая компилируемые или интерпретируемые языки, декларативные или процедурные языки, и она может быть развернута в любой форме, включая в качестве стационарной программы или в качестве модуля, компонента, подпрограммы, объекта, или другой единицы пригодной для использования в вычислительной среде. Компьютерная программа может, но не требуется, соответствовать файлу в файловой системе. Программа может быть сохранена в части файла, который удерживает другие программы или данные (например, один или более сценарии, хранящиеся в документе на языке разметки), в одном файле, предназначенном для программы о которой идет речь, или в нескольких скоординоированных файлах (например, файлах, которые хранят один или более модули, подпрограммы, или части кода). Компьютерная программа может быть развернута для исполнения на одном компьютере или на нескольких компьютерах, которые располагаются в одном месте или распределены по нескольким местам и являются взаимно-соединенными посредством сети связи.

[0072] Процессы и логические потоки, описываемые в данном техническом описании, могут быть выполнены посредством одного или более программируемых процессоров, исполняющих одну или более компьютерные программы, чтобы выполнять действия посредством оперирования над входными данными и генерирования выходных. Процессоры, пригодные для исполнения компьютерной программы, включают в себя, в качестве примера, как общего, так и специального назначения микропроцессоры, и любой один или более процессоры любого вида цифрового компьютера. В целом, процессор будет принимать инструкции и данные из постоянной памяти или памяти с произвольным доступом или как из той, так и другой. Неотъемлемыми элементами компьютера являются процессор для выполнения действий в соответствии с инструкциями и одно или более устройства памяти для хранения инструкций и данных. В целом, компьютер будет также включать в себя, или будет оперативно связан, чтобы принимать данные от или пересылать данные к, или осуществлять как то, так и другое действие, одно или более устройства массовой памяти для хранения данных, например, магнитные, магнитооптические диски, или оптические диски. Тем не менее компьютеру не требуется иметь такие устройства. Более того, компьютер может быть воплощен в другом устройстве, например, мобильном телефоне, персональном цифровом помощнике (PDA), мобильном аудио или видео проигрывателе, игровой консоли, приемнике Системы Глобального Позиционирования (GPS), или портативном запоминающем устройстве (например флэш-накопителе универсальной последовательной шины (USB)), чтобы назвать лишь несколько. Устройства пригодные для хранения инструкций компьютерной программы и данных включают в себя все формы энергонезависимой памяти, носителей информации и устройств памяти, включая в качестве примера устройства полупроводниковой памяти, например, EPROM, EEPROM, и устройства флэш-памяти; магнитные диски, например, внутренние жесткие диски или съемные диски; магнитооптические диски; и диски CD-ROM и DVD-ROM. Процессор и память могут быть дополнены, или включены в, логическую схему особого назначения.

[0073] Для обеспечения взаимодействия с пользователем, варианты осуществления предмета изобретения, описываемого в данном техническом описании, могут быть реализованы на компьютере с устройством отображения, например монитором CRT (электронно-лучевая трубка) или LCD (жидкокристаллический дисплей), для отображения информации пользователю, и клавиатурой и координатно-указательным устройством, например, мышью или шаровым манипулятором, посредством которых пользователь может обеспечивать ввод в компьютер. Другие виды устройств также могут быть использованы, чтобы обеспечивать взаимодействие с пользователем; например, обеспечиваемая пользователю обратная связь может быть любой формой сенсорной обратной связи, например, визуальной обратной связью, слуховой обратной связью, или тактильной обратной связью; и ввод от пользователя может быть принят в любой форме, включая акустический, речевой, или тактильный ввод. В дополнение, компьютер может взаимодействовать с пользователем посредством отправки документов к и приема документов от устройства, которое используется пользователем; например, посредством отправки веб-страниц к веб-браузеру на пользовательском устройстве пользователя в ответ на запросы, принятые от веб-браузера.

[0074] Варианты осуществления предмета изобретения, описываемого в данном техническом описании, могут быть реализованы в вычислительной системе, которая включает в себя компонент серверной части, например, как сервер данных, или которая включает в себя компонент промежуточного слоя, например, сервер приложений, или которая включает в себя компонент клиентской части, например, компьютер пользователя с графическим интерфейсом пользователя или Веб-браузер, посредством которого пользователь может взаимодействовать с реализацией предмета изобретения, описываемого в данном техническом описании, или любом сочетании из одного или более таких компонентов серверной части, промежуточного слоя, или клиентской части. Компоненты системы могут быть взаимно-соединены посредством любой формы или средства связи для передачи цифровых данных, например, сети связи. Примеры сетей связи включают в себя локальную сеть («LAN») и глобальную сеть («WAN»), меж-сеть (например, Интернет), и одноранговые сети (например, самоорганизующиеся одноранговые сети).

[0075] Вычислительная система может включать в себя пользователей и серверы. Пользователь и сервер, как правило, удалены друг от друга и, как правило, взаимодействуют через сеть связи. Взаимосвязь пользователя и сервера возникает в силу компьютерных программ, работающих на соответствующих компьютерах, и имеющих взаимосвязь пользователь-сервер друг с другом. В некоторых вариантах осуществления, сервер передает данные (например, страницу HTML) устройству пользователя (например, в целях отображения данных и приема ввода пользователя от пользователя, взаимодействующего с устройством пользователя). Данные, генерируемые на устройстве пользователя (например, результат взаимодействия пользователя), могут быть приняты от устройства пользователя на сервере.

[0076] Несмотря на то, что техническое описание содержит много особых подробностей реализации, они не должны толковаться в качестве ограничений объема любых изобретений или того, что может быть заявлено, а наоборот в качестве описаний признаков особых для конкретных вариантов осуществления конкретных изобретений. Определенные признаки, которые описываются в данном техническом описании в контексте отдельных вариантов осуществления, также могут быть реализованы в сочетании в едином варианте осуществления. И наоборот, разнообразные признаки, которые описываются в контексте единого варианта осуществления также могут быть реализованы в нескольких вариантах осуществления по-отдельности или в любом пригодном суб-сочетании. Более того, несмотря на то, что признаки могут быть описаны выше в качестве действующих в некоторых сочетаниях и первоначально заявленные как токовые, один или более признаки из заявленного сочетания могут в некоторых случаях быть исключены из сочетания, и заявленное сочетание может быть направлено на суб-сочетания или вариацию суб-сочетания.

[0077] Подобным образом, несмотря на то, что операции изображаются на чертежах в конкретной очередности, это не должно быть понято, как требующее того, что такие операции должны выполняться в конкретной показанной очередности или в последовательной очередности, или что все иллюстрируемые операции должны выполняться, чтобы достичь требуемых результатов. При некоторых обстоятельствах, преимущественным может быть многозадачность и параллельная обработка. Более того, разделение разнообразных компонентов системы в вариантах осуществления описанных выше не должно быть понято, как требующее такого разделения во всех вариантах осуществления, и должно быть понятно, что описанные компоненты программы и системы могут, как правило, быть объединены вместе в единый продукт программного обеспечения или упакованы в несколько продуктов программного обеспечения.

[0078] Таким образом, были описаны конкретные варианты осуществления предмета изобретения. Другие варианты осуществления находятся в рамках объема нижеследующей формулы изобретения. В некоторых случаях, действия, изложенные в формуле изобретения, могут быть выполнены в другой очередности и по-прежнему достигать требуемых результатов. В дополнение, процессы, изображенные на сопроводительных фигурах, не обязательно требуют конкретной показанной очередности, или последовательной очередности, чтобы достигать требуемых результатов. В некоторых вариантах осуществления, преимущественным может быть многозадачность и параллельная обработка.

1. Реализуемый компьютером способ верификации контента, выполняемый посредством устройства обработки данных, содержащего один или более компьютеров в связи для передачи данных, при этом способ содержит этапы, на которых:

осуществляют доступ к данным, описывающим, для собственного приложения, пары адресов из первых адресов и вторых адресов, при этом каждая пара адресов является первым адресом и соответствующим вторым адресом, при этом каждый первый адрес является доступным посредством собственного приложения и тем, с которого собственное приложение принимает первый контент и отображает этот первый контент на устройстве пользователя, и каждый второй адрес является адресом для веб-ресурса, который соответственно предоставляет второй контент для отображения в качестве части веб-ресурса в веб-браузере на устройстве пользователя;

для каждой пары адресов:

принимают первый контент для первого адреса, при этом первый контент, который принимают, является контентом для отображения в собственном приложении пользователю;

принимают второй контент для второго адреса, при этом второй контент, который принимают, является контентом для отображения в приложении веб-браузера пользователю;

определяют, основываясь на сравнении первого контента, который собственное приложение отображает на устройстве пользователя, со вторым контентом, который веб-браузер отображает на устройстве пользователя, являются ли первый контент и второй контент согласованным контентом;

только для каждой пары адресов, для которой первый контент и второй контент определяются как согласованный контент, подтверждают пару адресов и сохраняют данные подтверждения для пары адресов в индексе.

2. Способ по п. 1, дополнительно содержащий этапы, на которых:

принимают поисковый запрос для устройства пользователя, при этом поисковый запрос включает в себя:

вопрос, который включает в себя одно или более понятий; и

данные идентификации, идентифицирующие собственное приложение как установленное на устройстве пользователя;

принимают данные, идентифицирующие веб-ресурсы, отвечающие на вопрос;

определяют, что адресация к первому веб-ресурсу из веб-ресурсов, отвечающих на вопрос, осуществляется посредством второго адреса подтвержденной пары адресов для собственного приложения и в ответ на данное определение генерирование результата поиска собственного приложения включает первый адрес подтвержденной пары адресов; и

предоставляют результаты поиска веб-ресурса и результат поиска собственного приложения устройству пользователя.

3. Способ по п. 1, в котором этап, на котором определяют, являются ли первый контент и второй контент согласованным контентом, содержит этапы, на которых:

извлекают первые N-граммы из первого контента;

извлекают вторые N-граммы из второго контента;

определяют меру сходства N-грамм на основании первых N-грамм и вторых N-грамм, при этом мера сходства N-грамм измеряет сходство между первым контентом и вторым контентом.

4. Способ по п. 1, в котором этап, на котором определяют, являются ли первый контент и второй контент согласованным контентом, содержит этапы, на которых:

идентифицируют, из графа знаний и первого контента, первые сущности, описываемые в первом контенте;

идентифицируют, из графа знаний и второго контента, вторые сущности, описываемые в первом контенте; и

определяют меру совпадения сущностей на основании первых сущностей и вторых сущностей, при этом мера совпадения сущностей измеряет совпадения между первыми сущностями и вторыми сущностями.

5. Способ по п. 1, в котором этап, на котором определяют, являются ли первый контент и второй контент согласованным контентом, содержит этапы, на которых:

определяют первый вектор признаков контента, который представляет собой признаки форматирования первого контента;

определяют второй вектор признаков контента, который представляет собой признаки форматирования второго контента; и

определяют меру сходства признаков на основании первого вектора признаков контента и второго вектора признаков контента, при этом мера сходства признаков измеряет сходство между первым контентом и вторым контентом.

6. Способ по п. 1, в котором этап, на котором определяют, являются ли первый контент и второй контент согласованным контентом, содержит этапы, на которых:

извлекают первые фразы из первого контента;

извлекают вторые фразы из второго контента;

определяют меру совпадения фраз на основании первых фраз и вторых фраз, при этом мера совпадения фраз измеряет сходство между первым контентом и вторым контентом.

7. Долговременный машиночитаемый запоминающий носитель информации, хранящий инструкции, исполняемые посредством устройства обработки данных, и которые по такому исполнению предписывают устройству обработки данных выполнить операции, содержащие:

осуществление доступа к данным, описывающим, для собственного приложения, пары адресов из первых адресов и вторых адресов, при этом каждая пара адресов является первым адресом и соответствующим вторым адресом, при этом каждый первый адрес является доступным посредством собственного приложения и тем, с которого собственное приложение принимает первый контент и отображает этот первый контент на устройстве пользователя, и каждый второй адрес является адресом для веб-ресурса, который соответственно предоставляет второй контент для отображения в качестве части веб-ресурса в веб-браузере на устройстве пользователя;

для каждой пары адресов:

прием первого контента для первого адреса, при этом первый контент, который принимают, является контентом для отображения в собственном приложении пользователю;

прием второго контента для второго адреса, при этом второй контент, который принимают, является контентом для отображения в приложении веб-браузера пользователю;

определение, основываясь на сравнении первого контента, который собственное приложение отображает на устройстве пользователя, со вторым контентом, который веб-браузер отображает на устройстве пользователя, являются ли первый контент и второй контент согласованным контентом;

только для каждой пары адресов, для которой первый контент и второй контент определяются как согласованный контент, подтверждение пары адресов и сохранение данных подтверждения для пары адресов в индексе.

8. Долговременный машиночитаемый запоминающий носитель информации по п. 7, при этом операции дополнительно содержат:

прием поискового запроса для устройства пользователя, при этом поисковый запрос включает в себя:

вопрос, который включает в себя одно или более понятий; и

данные идентификации, идентифицирующие собственное приложение как установленное на устройстве пользователя;

прием данных, идентифицирующих веб-ресурсы, отвечающие на вопрос;

определение, что адресация к первому веб-ресурсу из веб-ресурсов, отвечающих на вопрос, осуществляется посредством второго адреса подтвержденной пары адресов для собственного приложения и в ответ на данное определение генерирование результата поиска собственного приложения включает первый адрес подтвержденной пары адресов; и

предоставление результатов поиска веб-ресурса и результата поиска собственного приложения устройству пользователя.

9. Долговременный машиночитаемый запоминающий носитель информации по п. 7, при этом определение, являются ли первый контент и второй контент согласованным контентом, содержит:

извлечение первых N-грамм из первого контента;

извлечение вторых N-грамм из второго контента;

определение меры сходства N-грамм на основании первых N-грамм и вторых N-грамм, при этом мера сходства N-грамм измеряет сходство между первым контентом и вторым контентом.

10. Долговременный машиночитаемый запоминающий носитель информации по п. 7, при этом определение, являются ли первый контент и второй контент согласованным контентом, содержит:

идентификацию, из графа знаний и первого контента, первых сущностей, описываемых в первом контенте;

идентификацию, из графа знаний и второго контента, вторых сущностей, описываемых в первом контенте; и

определение меры совпадения сущностей на основании первых сущностей и вторых сущностей, при этом мера совпадения сущностей измеряет совпадения между первыми сущностями и вторыми сущностями.

11. Долговременный машиночитаемый запоминающий носитель информации по п. 7, при этом определение, являются ли первый контент и второй контент согласованным контентом, содержит:

определение первого вектора признаков контента, который представляет собой признаки форматирования первого контента;

определение второго вектора признаков контента, который представляет собой признаки форматирования второго контента; и

определение меры сходства признаков на основании первого вектора признаков контента и второго вектора признаков контента, при этом мера сходства признаков измеряет сходство между первым контентом и вторым контентом.

12. Долговременный машиночитаемый запоминающий носитель информации по п. 7, при этом определение, являются ли первый контент и второй контент согласованным контентом, содержит:

извлечение первых фраз из первого контента;

извлечение вторых фраз из второго контента;

определение меры совпадения фраз на основании первых фраз и вторых фраз, при этом мера совпадения фраз измеряет сходство между первым контентом и вторым контентом.

13. Система верификации контента, содержащая

устройство обработки данных; и

программное обеспечение, хранящееся на долговременном машиночитаемом запоминающем носителе информации, хранящем инструкции, исполняемые посредством устройства обработки данных и которые по такому исполнению предписывают устройству обработки данных выполнить операции, содержащие:

осуществление доступа к данным, описывающим, для собственного приложения, пары адресов из первых адресов и вторых адресов, при этом каждая пара адресов является первым адресом и соответствующим вторым адресом, при этом каждый первый адрес является доступным посредством собственного приложения и тем, с которого собственное приложение принимает первый контент и отображает этот первый контент на устройстве пользователя, и каждый второй адрес является адресом для веб-ресурса, который соответственно предоставляет второй контент для отображения в качестве части веб-ресурса в веб-браузере на устройстве пользователя;

для каждой пары адресов:

прием первого контента для первого адреса, при этом первый контент, который принимают, является контентом для отображения в собственном приложении пользователю;

прием второго контента для второго адреса, при этом второй контент, который принимают, является контентом для отображения в приложении веб-браузера пользователю;

определение, основываясь на сравнении первого контента, который собственное приложение отображает на устройстве пользователя, со вторым контентом, который веб-браузер отображает на устройстве пользователя, являются ли первый контент и второй контент согласованным контентом;

только для каждой пары адресов, для которой первый контент и второй контент определяются как согласованный контент, подтверждение пары адресов и сохранение в индексе данных подтверждения для пары адресов.

14. Система по п. 13, при этом операции дополнительно содержат:

прием поискового запроса для устройства пользователя, при этом поисковый запрос включает в себя:

вопрос, который включает в себя одно или более понятий; и

данные идентификации, идентифицирующие собственное приложение как установленное на устройстве пользователя;

прием данных, идентифицирующих веб-ресурсы, отвечающие на вопрос;

определение, что адресация к первому веб-ресурсу из веб-ресурсов, отвечающих на вопрос, осуществляется посредством второго адреса подтвержденной пары адресов для собственного приложения и в ответ на данное определение генерирование результата поиска собственного приложения включает первый адрес подтвержденной пары адресов; и

предоставление результатов поиска веб-ресурса и результата поиска собственного приложения устройству пользователя.

15. Система по п. 14, при этом определение, являются ли первый контент и второй контент согласованным контентом, содержит:

извлечение первых N-грамм из первого контента;

извлечение вторых N-грамм из второго контента;

определение меры сходства N-грамм на основании первых N-грамм и вторых N-грамм, при этом мера сходства N-грамм измеряет сходство между первым контентом и вторым контентом.

16. Система по п. 14, при этом определение, являются ли первый контент и второй контент согласованным контентом, содержит:

идентификацию, из графа знаний и первого контента, первых сущностей, описываемых в первом контенте;

идентификацию, из графа знаний и второго контента, вторых сущностей, описываемых в первом контенте; и

определение меры совпадения сущностей на основании первых сущностей и вторых сущностей, при этом мера совпадения сущностей измеряет совпадения между первыми сущностями и вторыми сущностями.

17. Система по п. 14, при этом определение, являются ли первый контент и второй контент согласованным контентом, содержит:

определение первого вектора признаков контента, который представляет собой признаки форматирования первого контента;

определение второго вектора признаков контента, который представляет собой признаки форматирования второго контента; и

определение меры сходства признаков на основании первого вектора признаков контента и второго вектора признаков контента, при этом мера сходства признаков измеряет сходство между первым контентом и вторым контентом.

18. Система по п. 14, при этом определение, являются ли первый контент и второй контент согласованным контентом, содержит:

извлечение первых фраз из первого контента;

извлечение вторых фраз из второго контента;

определение меры совпадения фраз на основании первых фраз и вторых фраз, при этом мера совпадения фраз измеряет сходство между первым контентом и вторым контентом.



 

Похожие патенты:

Изобретение относится к медицине, а именно к рентгенохирургическим методам диагностики сердечной недостаточности (СН), и может быть использовано для ранней диагностики сердечной недостаточности.

Изобретение относится к средствам для процесса демонстрации сетевых данных. Технический результат заключается в повышении скорости ответа сетевых данных.

Изобретение относится к интерфейсу пользователя в системе освещения в транспортном средстве. Технический результат заключается в повышении удобства эксплуатации.

Изобретение относится к области вычислительной техники. Техническим результатом является управление синдикацией контента.

Изобретение относится к области связи. Технический результат заключается в обеспечении возможности совместного использования определенного файла чертежа рабочего стола.

Изобретение относится к области отображения диаграммы на мобильном устройстве. Технический результат – обеспечение отображения диаграммы для предоставления возможности интуитивного распознавания и модификации диаграммы пользователю.

Изобретение относится к области цифровых данных. Технический результат направлен на обеспечение функции автоматизированного определения мест установки УС с привязкой к геоинформационным данным.

Группа изобретений относится к вычислительной технике и может быть использована для вычисления градиента. Техническим результатом является обеспечение вычисления градиента основанной на данных функциональной модели.

Изобретение относится к области управления системой хранения данных. Техническим результатом изобретения является понижение нагрузки на систему хранения данных.

Изобретение относится к области обработки данных изображений. Технический результат заключается в повышении скорости конфигурирования и визуализации геообъектов из различных источников за счет автоматического масштабирования и центрирования электронного атласа на основе критерия наглядности.

Изобретение относится к области обнаружения вредоносных файлов. Технический результат заключается в классификации объектов с использованием модели обнаружения вредоносных объектов.

Изобретение относится к способам контроля исполнения исследуемого программного обеспечения с целью обнаружения поведения, характерного для вредоносного программного обеспечения.

Изобретение относится к средствам управления правом транзакции в сервере управления цифровыми правами. Технический результат заключается в обеспечении возможности установки правил перепродажи контента.

Изобретение относится к способу динамического управления техническими средствами. Осуществляют прием первой неформализованной входной последовательности символов, включающей идентификационный признак, вводят код размещения для проверки принятых последовательностей, аналогичным образом принимают другие неформализованные последовательности символов и записывают их в адрес постоянного запоминающегося устройства в соответствии с их кодом размещения, производят контроль всей совокупности принятых последовательностей, формируют команды управления при положительном результате проверки для использования их при изменении режимов работы технических средств.

Изобретение относится к автоматизации операций управления на виртуальных машинах. Техническим результатом изобретения является обеспечение безопасного сетевого взаимодействия.

Изобретение относится к способу проверки подлинности изделия. Техническим результатом является снижение транзакционных издержек, повышение производительности процедуры передачи изделий.

Изобретение относится к области технологий связи и раскрывают терминал, устройство и способ обработки события отпечатка пальца. Технический результат заключается в уменьшении количества рабочих процедур для переключения прикладной программы.

Изобретение относится к технологиям сетевой связи. Технический результат заключается в повышении скорости передачи данных.

Изобретение относится преимущественно к технологии передачи данных. Технический результат заключается в повышении уровня защиты от не авторизованного восстановления сообщения электронной почты по информации для подтверждения отправки сообщения.

Изобретение относится к удостоверениям, проверяемым криптографическим методом, выбранным в соответствующем пространстве имен, для виртуального вычислительного узла в сетях провайдера.

Изобретение относится к области использования больших баз данных. Технический результат заключается в сокращении времени выполнения поискового запроса. Технический результат достигается за счет считывания в текущем блоке списка словопозиций, b⋅M бит, которые содержат М усеченных ссылок, причем М-n из М усеченных ссылок являются ссылками базы данных; и если n>0, для каждой модификации от k=1 до n, определения расширенного значения модификации как vk⋅2b и добавления расширенного значения модификации к pk-й из М усеченных ссылок, пронумерованных от 0 до М-1 для предоставления n дополнительных ссылок базы данных с использованием шаблона кодирования, причем шаблон кодирования блока включает: базовую длину b, относящуюся к М усеченных ссылок; число n модификаций в текущем блоке; если n>0, одно или несколько значений vk модификации текущего блока, причем k находится в пределах от 1 до n; если n>0, одно или несколько позиций pk модификации в текущем блоке; считывания указателя из заголовка текущего блока списка словопозиций; использования указателя для извлечения протокола декодирования из таблицы протоколов декодирования. 2 н. и 22 з.п. ф-лы, 18 ил.

Изобретение относится к средствам верификации согласованности между контентом собственного приложения и контентом соответствующего веб-ресурса, который предоставляется отдельно от контента собственного приложения. Технический результат заключается в обеспечении согласованности результатов поиска. Осуществляют доступ к данным, описывающим, для собственного приложения, пары адресов из первых адресов и вторых адресов, при этом каждая пара адресов является первым адресом и соответствующим вторым адресом. При этом каждый первый адрес является доступным посредством собственного приложения и с которого собственное приложение принимает первый контент, и каждый второй адрес является адресом для веб-ресурса, который соответственно предоставляет второй контент. Для каждой пары адресов осуществляют: прием первого контента для первого адреса и прием второго контента для второго адреса, определения, являются ли первый контент и второй контент согласованным контентом. Только для каждой пары адресов, для которой первый контент и второй контент определяются как согласованный контент, подтверждают пару адресов и сохраняют в данных подтверждения индекса для пары адресов. 3 н. и 15 з.п. ф-лы, 5 ил.

Наверх