Оптимизированный процесс визуализации в браузере - заявка 2016148864 на патент на изобретение в РФ

1. Компьютерная система, содержащая:
по меньшей мере один процессор; и
память, хранящую инструкции, которые при их исполнении по меньшей мере одним процессором предписывают системе:
генерировать первый результат визуализации веб-страницы, причем первый результат визуализации визуализируется с включенным использованием сценариев,
генерировать второй результат визуализации веб-страницы, причем второй результат визуализации визуализируется с отключенным использованием сценариев,
определять, являются ли различия в первом результате визуализации и втором результате визуализации независимыми от контента, и
когда различия являются независимыми от контента, идентифицировать URL для веб-страницы как URL, независимый от контента.
2. Компьютерная система по п. 1, в которой определение того, являются ли различия в первом результате визуализации и втором результате визуализации независимыми от контента, включает в себя:
идентификацию внешней ссылки в первом результате визуализации, отсутствующей во втором результате визуализации; и
определение, в ответ на идентификацию внешней ссылки, того, что различия не являются независимыми от контента.
3. Компьютерная система по п. 1, в которой определение того, являются ли различия в первом результате визуализации и втором результате визуализации независимыми от контента, включает в себя:
идентификацию маркера в первом результате визуализации, который отсутствует во втором результате визуализации; и
определение того, в ответ на идентификацию маркера, что различия не являются независимыми от контента.
4. Компьютерная система по п. 3, в которой стоп-слова и числа удаляются до идентификации маркера.
5. Компьютерная система по п. 1, в которой определение того, являются ли различия в первом результате визуализации и втором результате визуализации независимыми от контента, включает в себя:
идентификацию количества маркеров в первом результате визуализации, которые отсутствуют во втором результате визуализации;
определение того, что данное количество соответствует порогу; и
определение, в ответ на определение, что упомянутое количество соответствует порогу, того, что различия не являются независимыми от контента.
6. Компьютерная система по п. 1, в которой определение того, являются ли различия в первом результате визуализации и втором результате визуализации независимыми от контента, включает в себя:
вычисление оценки сходства между основным компонентом первого результата визуализации и основным компонентом второго результата визуализации;
определение того, соответствует ли оценка сходства порогу сходства; и
определение того, что различия являются независимыми от контента, когда оценка сходства соответствует порогу сходства.
7. Компьютерная система по п. 1, в которой инструкции дополнительно включают в себя инструкции, которые при их исполнении по меньшей мере одним процессором предписывают системе:
для каждой из множества веб-страниц в записях выборки:
генерировать первый результат визуализации веб-страницы, причем первый результат визуализации визуализируется с включенным использованием сценариев,
генерировать второй результат визуализации веб-страницы, причем второй результат визуализации визуализируется с отключенным использованием сценариев,
сравнивать первый результат визуализации со вторым результатом визуализации для определения того, является ли веб-страница независимой от контента,
сохранять URL для веб-страницы в списке URL, независимых от контента, когда веб-страница является независимой от контента, и
сохранять URL для веб-страницы в списке URL, зависимых от контента, когда веб-страница не является независимой от контента; и
определять по меньшей мере один шаблон с использованием списка URL, независимых от контента; и
сохранять шаблон в хранилище данных для URL, независимых от контента.
8. Компьютерная система по п. 7, в которой инструкции дополнительно включают в себя инструкции, которые при их исполнении по меньшей мере одним процессором предписывают системе:
определять, применяется ли шаблон к URL в списке URL, зависимых от контента; и
сохранять шаблон в хранилище данных для URL, независимых от контента, когда не удается применить шаблон к URL в списке URL, зависимых от контента.
9. Компьютерная система по п. 7, в которой инструкции дополнительно включают в себя инструкции, которые при их исполнении по меньшей мере одним процессором предписывают системе:
определять процентную долю URL, которые совпадают с шаблоном, которые являются URL, зависимыми от контента; и
сохранять шаблон в хранилище данных для URL, независимых от контента, когда данная процентная доля меньше, чем один процент.
10. Способ, содержащий этапы, на которых:
генерируют, с использованием по меньшей мере одного процессора, первый результат визуализации веб-страницы, причем первый результат визуализации визуализируется с включенным использованием сценариев;
генерируют, с использованием по меньшей мере одного процессора, второй результат визуализации веб-страницы, причем второй результат визуализации визуализируется с отключенным использованием сценариев;
сравнивают первый результата визуализации со вторым результатом визуализации для определения того, является ли веб-страница независимой от контента; и
сохраняют унифицированный указатель ресурса (URL) для веб-страницы в списке URL, независимых от контента, когда веб-страница является независимой от контента.
11. Способ по п. 10, в котором этап, на котором сравнивают первый результат визуализации со вторым результатом визуализации, включает в себя этапы, на которых:
вычисляют оценку сходства между основным компонентом первого результата визуализации и основным компонентом второго результата визуализации; и
определяют, соответствует ли оценка сходства порогу сходства,
при этом веб-страница является независимой от контента, когда оценка сходства соответствует порогу сходства.
12. Способ по п. 10, дополнительно содержащий этапы, на которых для каждой из множества веб-страниц в записях выборки:
генерируют первый результат визуализации веб-страницы, причем первый результат визуализации визуализируется с включенным использованием сценариев,
генерируют второй результат визуализации веб-страницы, причем второй результат визуализации визуализируется с отключенным использованием сценариев,
сравнивают первый результат визуализации со вторым результатом визуализации для определения того, является ли веб-страница независимой от контента,
сохраняют URL для веб-страницы в списке URL, независимых от контента, когда веб-страница является независимой от контента, и
сохраняют URL для веб-страницы в списке URL, зависимых от контента, когда веб-страница не является независимой от контента;
определяют по меньшей мере один шаблон из списка URL, независимых от контента; и
сохраняют этот шаблон в хранилище данных для URL, независимых от контента.
13. Способ по п. 12, дополнительно содержащий этапы, на которых:
определяют, совпадает ли шаблон с URL из списка URL, зависимых от контента; и
сохраняют шаблон в хранилище данных для URL, независимых от контента, когда шаблон не совпадает с URL из списка URL, зависимых от контента.
14. Способ по п. 12, дополнительно содержащий этапы, на которых:
определяют первое количество URL в списке URL, независимых от контента, которые совпадают с шаблоном;
определяют второе количество URL в списке URL, зависимых от контента, которые совпадают с шаблоном; и
сохраняют шаблон в хранилище данных для URL, независимых от контента, когда второе количество меньше, чем один процент от суммы первого количества и второго количества.
15. Способ, содержащий этапы, на которых:
принимают запрос на визуализацию веб-страницы, идентифицируемой посредством URL;
до осуществления визуализации, определяют, что URL является URL, независимым от контента; и
визуализируют веб-страницу с отключенным использованием сценариев, независимо от настроек браузера касаемо использования сценариев, в ответ на определение того, что URL является URL, независимым от контента.
16. Способ по п. 15, в котором этап, на котором определяют, что URL является URL, независимым от контента, включает в себя этап, на котором определяют, что URL совпадает с предварительно определенным шаблоном в хранилище данных для URL, независимых от контента.
17. Способ по п. 15, в котором этап, на котором определяют, что URL является URL, независимым от контента, включает в себя этап, на котором:
определяют, что URL является независимым от контента для типа браузера, обрабатывающего запрос на визуализацию веб-страницы.
18. Способ по п. 15, в котором этап, на котором определяют, что URL является URL, независимым от контента, включает в себя этап, на котором:
определяют запрос к службе, причем служба определяет, является ли URL URL, независимым от контента; и
принимают ответ от службы, указывающий, что URL является URL, независимым от контента.
Наверх