Патенты автора Зеленков Юрий Григорьевич (RU)

Изобретение относится к системам обработки исходного цифрового текста и целевого цифрового текста. Технический результат заключается в повышении скорости обработки данных. Способ содержит получение исходного цифрового текста, содержащего множество исходных предложений; парсинг множества исходных предложений на исходные лексические элементы; создание для каждого из одного или нескольких лексических элементов исходного контекстного параметра; получение целевого цифрового текста, содержащего множество целевых предложений; парсинг множества целевых предложений на целевые лексические элементы; создание для каждого одного или нескольких целевых лексических элементов целевого контекстного параметра; выбор первого исходного лексического элемента, обладающего первым исходным контекстным параметром; сравнение первого исходного контекстного параметра с множеством целевых контекстных параметров для определения целевого контекстного параметра, обладающего наименьшим значением разницы; сопоставление первого исходного лексического элемента с первым целевым лексическим элементом, который связан с данным целевым контекстным параметром. 2 н. и 18 з.п. ф-лы, 19 ил.

Изобретение относится к способам и серверам для автоматического создания тезауруса. Техническим результатом является расширение арсенала технических средств автоматического создания цифрового тезауруса. В способе автоматического создания цифрового тезауруса выполняют парсинг цифрового текста и определение первого и второго лексических элементов. Для каждой записи о первом элементе выбирают n-е число последовательных элементов, соседних с первым элементом, создают первый контекстный параметр для первого элемента, включающий указание на каждый элемент из n-го числа последовательных элементов и частоты совместного вхождения каждого элемента с первым элементов в цифровом тексте. Для каждой записи второго элемента выбирают n-е число последовательных элементов, соседних для второго элемента, создают второй контекстный параметр. Определяют параметр связи лексических элементов для первого элемента и второго элемента путем анализа взаимосвязи и анализа совместного вхождения записей. 2 н. и 18 з.п. ф-лы, 11 ил.

Изобретение относится к электронным устройствам и способам обработки текста. Техническим результатом является расширение арсенала технических средств создания краткого изложения цифрового текста. В способе создания краткого изложения цифрового текста создают краткое изложение цифрового текста путем выбора предложений из цифрового текста на основе вычисленной величины предложения. Величина предложения вычисляется на основе самого цифрового текста без использования онтологических словарей. Определяют величину предложения путем первоначального разбора предложения на одну или несколько концептуальных фраз и дальнейшего определения для данного предложения цифрового текста: неконтекстуальной величины для этих концептуальных фраз и контекстуальной величины для этих концептуальных фраз. 3 н. и 21 з.п. ф-лы, 4 ил.

Изобретение относится к способу и системе транскрипции лексической единицы из первого алфавита во второй. Техническим результатом является расширение арсенала технических средств транскрипции лексической единицы из первого алфавита во второй алфавит. В способе транскрипции лексической единицы из первого алфавита во второй алфавит получают пару, содержащую лексическую единицу в первом алфавите и соответствующую ей транскрипцию во втором алфавите. Причем лексическая единица и транскрипция разделены на сегменты. При этом внутри пары каждый сегмент лексической единицы обладает соответствующим сегментом в транскрипции лексической единицы, и каждая лексическая единица представляет собой последовательность последовательно чередующихся гласных и согласных сегментов, один гласный сегмент или один согласный сегмент. Определяют для каждого заданного сегмента лексической единицы его контекст. Обучают сервер вычислению теоретического символа второго алфавита, представляющего собой транскрипцию конкретного заданного сегмента на основе контекста конкретного заданного сегмента лексической единицы. 2 н. и 28 з.п. ф-лы, 3 ил.

 


Наверх