Патенты автора Зуев Константин Алексеевич (RU)

Изобретение относится к способу и системе случайной аугментации данных для использования в обучении моделей машинного обучения. Техническим результатом является повышение эффективности создания обучающих выборок данных для модели машинного обучения без ограничения на количество аугментаций исходного изображения. Способ содержит этапы: получения одного или более первых изображений, ассоциированных с обучающей выборкой изображений для обучения модели машинного обучения; предоставления одного или более первых изображений в качестве первого входа для первого множества слоев вычислительных блоков, причем первое множество слоев использует фильтры изображений; предоставления первого результата первого множества слоев вычислительных блоков в качестве второго входа для второго слоя вычислительных блоков, при этом второй слой использует для вычислений случайные наборы параметров; получение параметров искажений от второго слоя вычислительных блоков; создание одного или более вторых изображений на основе одного или более первых изображений и параметров искажений; получение в качестве третьего выхода одного или более вторых изображений и добавление одного или более вторых изображений к обучающей выборке изображений для обучения модели машинного обучения. 3 н. и 17 з.п. ф-лы, 11 ил.

Группа изобретений относится к области вычислительной техники и может быть использована для обнаружения текстовых полей в электронных документах с использованием нейронных сетей. Техническим результатом является повышение точности обнаружения текстовых полей. Способ содержит этапы, на которых извлекают из электронного документа множество признаков слов, где множество признаков включает множество символьных векторов, представляющих слова, имеющиеся на изображении; обрабатывают множество признаков слов с использованием нейронной сети, включающей множества слоев нейронной сети; обнаруживают процессорным устройством множество текстовых полей в электронном документе исходя из результата работы нейронной сети, на основании пространственной информации, указывающей на расположение указанных текстовых полей в электронном документе; и присваивают процессорным устройством каждое из текстовых полей одному из множества типов полей исходя из результата работы нейронной сети, с учетом отнесения на основании указанных признаков слов каждого из слов указанных текстовых полей к одному из заранее определенных классов, где каждый из заранее определенных классов соответствует одному из типов текстовых полей. 3 н. и 17 з.п. ф-лы, 8 ил.

В настоящем документе представлены системы и способы для получения изображения, по меньшей мере, части документа и определения множества точек деления, делящих изображение на потенциальные сегменты; создания графа линейного деления (ГЛД), содержащего множество вершин с использованием множества точек деления и множества ребер, соединяющих множество вершин; идентификации пути ГЛД, имеющего значение метрики качества выше порогового значения, где путь выбирается из множества путей ГЛД и содержит одно или более ребер, а значение метрики качества выводится с использованием нейронной сети, классифицирующей каждый из множества пикселей изображения; а также создания одного или более блоков изображения, где каждый из одного или более блоков соответствует ребру идентифицированного пути и представляет часть изображения, связанного с типом объекта. 3 н. и 17 з.п. ф-лы, 10 ил.

Группа изобретений относится к медицине, а именно к системам и способам обработки изображений и анализа данных в компьютерной томографии, и может быть использовано для обработки данных изображений медицинской визуализации. Система содержит энергонезависимый машиночитаемый носитель данных, содержащий исполняемые команды для реализации способа обработки данных изображений медицинской визуализации, при этом система содержит: память; процессор, связанный с указанной памятью. Получают множество исходных изображений медицинской визуализации исследуемого организма. Проводят обработку с помощью первой сверточной нейронной сети множества исходных изображений для получения одного или более изображений псевдорадиоизотопной эмиссии (псевдо-РЭ) исследуемого организма. Выполняют обработку с помощью второй сверточной нейронной сети одного или более псевдо-РЭ изображений, где каждое из одного или более псевдо-РЭ изображений иллюстрирует моделируемое распределение радиоактивного маркера в одном или более исследуемом органе в организме, включающую определение вероятности содержания в одном или более из исходных изображений из множества исходных изображений диагностически значимых признаков изображения, ассоциированных с определенным медицинским диагнозом, относящимся к исследуемому организму. Классифицируют с помощью второй сверточной нейронной сети одного или более указанных исходных изображений из множества исходных изображений относительно предопределенного медицинского диагноза для исследуемого организма. Группа изобретений обеспечивает повышение точности постановки медицинского диагноза. 3 н. и 22 з.п. ф-лы, 8 ил.

Изобретение относится к обработке естественного языка. Техническим результатом является повышение точности интерпретации информации и снижение вычислительной сложности при обработке за счет создания универсальной технологии построения приложений для обработки на основе накопленных в системе знаний о языке и мире. В способе создания программ обработки естественного языка строят семантическую иерархию независимых от языка семантических сущностей, их свойств, возможных атрибутов, их взаимоотношений. Создают универсальную модель, релевантную по отношению к произвольному языку, включающую модели семантических, морфологических, лексических и синтаксических описаний. Создают первую программу обработки произвольного естественного языка. Наполняют данными зависимых от языка моделей морфологических описаний, лексических описаний и синтаксических описаний сущности указанного семантического описания. Создают вторую программу для обработки естественного языка на основе семантической иерархии, первой универсальной программы и зависимых от языка морфологических описаний, лексических описаний и синтаксических описаний. Используют вторую программу для обработки естественного языка. 17 н. и 3 з.п. ф-лы, 18 ил.

Изобретение относится к способам автоматической обработки текста на естественном языке. Техническим результатом является повышение точности синтаксического и семантического анализа, выражающейся в распознавании смысла текста, точности машинного перевода, релевантности результатов информационного поиска. Технический результат достигается за счет возможности динамически в автоматическом режиме пополнять словари, реестры слов, семантические описания языка новыми словами, вследствие чего повышается эффективность систем, решающих задачи автоматической обработки текста. Компьютерное устройство получает текст, содержащий слово. Слово сравнивается со словами из реестра значений. Реестр значений содержит слова и соответствующие им понятия. При соотнесении слова со словом из реестра значений выявляется соответствующее понятие для слова путем сравнения каждого понятия, относящегося к слову из реестра, со словом. При выявлении соответствующего понятия для слова это понятие назначается для слова. При невыявлении соответствующего понятия для слова для данного слова добавляется новое понятие в реестр значений на основе этого слова. 3 н. и 18 з.п. ф-лы, 18 ил.

Изобретение относится к выполнению синтаксического анализа текста. Технический результат - оценка всех возможных синтаксических комбинаций быстро и без потери истинного смысла текста. Для этого в некоторых вариантах осуществления этот способ включает выполнение грубого синтаксического анализа текста, построение графа обобщенных составляющих текста и фильтрацию дуг графа обобщенных составляющих с помощью комбинированного классификатора, который включает древесный классификатор и один или несколько линейных классификаторов. Комбинированный классификатор обучается с использованием параллельного анализа неразмеченных двуязычных текстовых корпусов. 5 н. и 18 з.п. ф-лы, 5 ил.

Изобретение относится к компьютерной технике, а именно к анализу текстов. Технический результат - эффективная обработка новых слов, отсутствующих в используемом реестре значений, добавление этих понятий в реестр значений и использование их во время дальнейшего анализа. Способ разрешения семантической неоднозначности, содержащий: получение с помощью вычислительного устройства первого текста на первом языке; обнаружение по меньшей мере одного неизвестного слова в первом тексте на первом языке; выбор по меньшей мере одного второго языка, причем первый язык отличается от любого из выбранных вторых языков; для каждого второго языка получение вычислительным устройством первого набора текстов на первом языке и второго набора текстов на втором языке, причем тексты первого набора на первом языке выровнены по отношению к текстам второго набора текстов на втором языке; сопоставление неизвестного слова с по меньшей мере одним словом во втором наборе текстов, выровненным с по меньшей мере одним неизвестным словом; выявление семантического класса, соответствующего по меньшей мере одному сопоставленному слову; и назначение семантического класса по меньшей мере одному неизвестному слову. 3 н. и 12 з.п. ф-лы, 18 ил.

Изобретение относится к компьютерной технике, а именно к анализу текстов. Технический результат - эффективная обработка новых слов, отсутствующих в используемом реестре значений, добавление этих понятий в реестр значений и использование их во время дальнейшего анализа. Способ выявления семантического значения неизвестного слова в задачах автоматической обработки естественного языка, содержащий: получение вычислительным устройством неизвестного слова; определение процессором вычислительного устройства множества потенциальных семантических классов для назначения неизвестному слову; построение процессором с использованием корпусов текстов классификатора для неизвестного слова; классификацию неизвестного слова, основанную, по меньшей мере частично, на встроенном классификаторе, с помощью по меньшей мере одного семантического класса из множества потенциальных семантических классов; и добавление неизвестного слова в семантическую иерархию в качестве экземпляра по меньшей мере одного семантического класса. 3 н. и 18 з.п. ф-лы, 18 ил.

Изобретение относится к технологиям поиска. Техническим результатом является повышение точности поиска информации за счет обеспечения возможности получения пользователем только релевантных результатов поиска за счет использования семантических запросов. В способе организации поиска в корпусах электронных текстов для компьютерной системы предварительно осуществляют семантико-синтаксический анализ корпуса текстов с определением и сохранением в памяти значений лингвистических параметров предложений, включая сопоставление слов предложения некоторого множества возможных лексических значений - каждое с соответствующей оценкой вероятности вхождения этого лексического значения в предложение, и построением семантических структур предложений, составляющих тексты корпуса текстов, и их последующим индексированием и сохранением индексов. Осуществляют поиск фрагментов в предварительно проиндексированных корпусах электронных текстов, удовлетворяющих запросу. Производят оценку релевантности результатов и ранжируют результаты поиска в соответствии со степенью релевантности. 2 н. и 38 з.п. ф-лы, 25 ил.

 


Наверх