Патенты автора Суходолов Дмитрий Андреевич (RU)

Изобретение относится к области вычислительной техники для обработки естественного языка. Технический результат заключается в повышении эффективности обработки естественного языка в части выявления информационных объектов и отношений между ними. Технический результат достигается за счет идентификации с помощью первой модели классификатора для обработки первого множества атрибутов классификации, извлеченных из семантико-синтаксических структур, множества корневых составляющих, таких, что каждая корневая составляющая из множества корневых составляющих связана со спаном из множества спанов, где спан является фрагментом текста, и каждый спан представляет атрибут информационного объекта определенного онтологического класса; идентификации с помощью второй модели классификатора для обработки второго множества атрибутов классификации, извлеченных из семантико-синтаксических структур, дочерних составляющих каждой составляющей из множества корневых составляющих; и определения с помощью третьей модели классификатора для обработки третьего множества атрибутов классификации, извлеченных из семантико-синтаксических структур, связаны ли первый спан из множества спанов и второй спан из множества спанов с одним и тем же информационным объектом. 3 н. и 17 з.п. ф-лы, 19 ил.

Изобретение относится к области обработки естественного языка, а именно к извлечению и поиску информации по коллекции документов. Технический результат - эффективная идентификация информационных объектов, представленных в документе, и информационных объектов в хранилище документов. Способ автоматической идентификации информационных объектов, представленных в документе, и информационных объектов в хранилище документов, соответствующих одному и тому же объекту реального мира, способ для компьютерной системы, заключающийся в том, что выполняют поиск шаблонов глобальной идентификации и комбинаций шаблонов глобальной идентификации в документе, выполняют поиск тех же шаблонов глобальной идентификации и их комбинаций в хранилище документов, производят поиск пар информационных объектов, информационного объекта из документа и информационного объекта из хранилища, удовлетворяющих одним и тем же комбинациям шаблонов, проверяют найденные пары на непротиворечивость и выбирают из них те информационные объекты, которые могут быть объединены и сохранены в хранилище в один объект, и добавляют информацию об одном или более информационном объекте из документа в хранилище документов. 3 н. и 18 з.п. ф-лы, 8 ил.

 


Наверх