Патенты автора Гаращук Руслан Владимирович (RU)

Изобретение относится к области вычислительной техники. Технический результат заключается в повышении точности обнаружения повторяющихся операций пользовательского интерфейса. Технический результат достигается за счет выполнения следующих этапов: определение набора перекрывающихся шинглов в последовательности событий пользовательского интерфейса; группирование шинглов во множество кластеров шинглов на основании выбранной метрики сходства шинглов; выбор кластера шинглов, имеющего максимальное значение выбранной внутришингловой метрики сходства; идентификация повторяющейся операции пользовательского интерфейса, представленной выбранным кластером шинглов. 3 н. и 17 з.п. ф-лы, 10 ил.

Изобретение относится к вычислительным системам. Технический результат заключается в расширении арсенала средств. Способ автоматического создания шаблонов продукционных правил в системах извлечения информации, включающий получение первого текстового фрагмента, содержащего первый идентификатор первого текстового токена, причем первый токен ссылается на первый информационный объект из первой категории информационных объектов, отображение, генерирующего шаблон, множества языковых характеристик первого токена, получение, генерирующего шаблон, атрибутов первого ввода, идентифицирующего атрибуты шаблона из множества лингвистических характеристик первого информационного объекта, генерирование первого шаблона, создание первого продукционного правила для первого шаблона, применение первого продукционного правила к частям первого текста на естественном языке, соответствующим первому шаблону, отображение, генерирующего шаблон, второго информационного объекта, идентифицированного с помощью продукционных правил в первом тексте на естественном языке. 3 н. и 14 з.п. ф-лы, 19 ил.

Изобретение относится к обработке естественного языка. Технический результат направлен на автоматизацию процесса получения высокоточных размеченных текстов практически любого объема и содержания в соответствии с выбранным способом разметки и их использования в соответствии с выбранным способом разметки и их использования для машинного обучения в задачах обработки естественного языка. Способ создания обучающих выборок включает: выполнение вычислительной системой лексико-морфологического анализа текста на естественном языке, выполнение синтактико-семантического анализа текста на естественном языке для получения множества семантических структур, выбор из лексических, грамматических, синтаксических и семантических атрибутов семантических структур набора выходных атрибутов; и создание выходного текста и индекса, включающего символические идентификаторы одного или более значения атрибутов из выходного набора атрибутов, где каждый атрибут связан с соответствующей частью текста на естественном языке, и указанное одно или более значение атрибутов сопровождается значением вероятности. 3 н. и 17 з.п. ф-лы, 14 ил.

 


Наверх