Патенты автора РОМАНЕНКО Александр Александрович (RU)

Изобретение относится к определению демографического профиля пользователя мобильного устройства на самом мобильном устройстве, хранящем обученную мультиязычную тематическую модель и обученную демографическую модель. Технический результат – повышение защиты конфиденциальных данных пользователя при определении его демографического профиля. Способ определения демографического профиля пользователя мобильного устройства на самом мобильном устройстве, хранящем обученную мультиязычную тематическую модель и обученную демографическую модель, содержит этапы, на которых собирают, на мобильном устройстве, содержимое веб-страниц, просмотренных пользователем на мобильном устройстве, осуществляют, на мобильном устройстве, предобработку содержимого веб-страниц для приспособления содержимого веб-страниц под тематическую модель, обрабатывают, на мобильном устройстве, предобработанное содержимое веб-страниц тематической моделью для получения векторов скрытых тем, ассоциированных с содержимым веб-страниц, просмотренных пользователем на своем мобильном устройстве, извлекают из полученных векторов скрытых тем вектор признаков пользователя; определяют, на мобильном устройстве, демографический профиль пользователя посредством обработки извлеченного вектора признаков пользователя демографической моделью. 2 н. и 17 з.п. ф-лы, 4 ил., 1 табл.

Изобретение относится к способу выделения временных выражений в текстах на естественном языке. Технический результат заключается в предоставлении возможности и использовании маркировки неразмеченных текстовых данных в алгоритме машинного обучения для разметки временных выражений в тексте на естественном языке. В способе разделяют текст на два непересекающихся поднабора: неразмеченных текстовых данных для тестирования и неразмеченных текстовых данных для обучения, размечают неразмеченные текстовые данные для тестирования, чтобы получить «золотое» множество, создают список регулярных выражений и механизм для разметки текстовых данных посредством списка регулярных выражений и осуществляют разметку неразмеченных текстовых данных для обучения для получения с грамматически размеченного текста и с частичной маркировкой временных выражений, обеспечивают обучение алгоритма машинного обучения с использованием размеченных текстовых данных, разметку неразмеченных текстовых данных для тестирования, посредством алгоритма машинного обучения. 6 з.п. ф-лы, 2 ил.

 


Наверх