Устройство для содержательного анализа текстовой информации



Устройство для содержательного анализа текстовой информации
Устройство для содержательного анализа текстовой информации

 


Владельцы патента RU 2568272:

БУРБА Александр Алексеевич (RU)
РУСЯЕВА Елена Юрьевна (RU)
ПОЛТАВСКИЙ Александр Васильевич (RU)

Изобретение относится к вычислительной технике, а именно к идентификации текстовой информации в случаях определения ее автора. Технический результат - повышение уровня достоверности определения авторства текстовой информации. Устройство содержит группы входных регистров, входные регистры группы блоков деления, группу блоков вычитания по модулю, накопительный сумматор, блок деления, блок сравнения, блок индикации, генератор тактовых импульсов и распределитель импульсов. 2 ил., 1 табл.

 

Изобретение относится к вычислительной технике и может быть использовано при расчетах, связанных с идентификацией текстовой информации в случаях определения ее автора.

Заявителям неизвестно о том, чтобы такая техническая задача решалась подобным образом. Это объясняется тем, что отсутствуют числовые методы содержательного анализа различных частей текстовой информации.

Техническим результатом заявленного решения является повышение уровня достоверности определения авторства текстовой информации и расширение арсенала технических средств. Это дает возможность принимать более объективные решения при защите авторских прав создателей текстовой информации.

Числовой содержательный анализ текстовой информации осуществляется следующим образом. Два отрывка текстовой информации можно сравнить путем сопоставления информации о вероятностях появления какой-либо буквы в двух различных отрывках. Среднее значение разности ΔPср между вероятностью появления i-й буквы отрывка «а» Pаi, и вероятностью появления j-й буквы отрывка «б» Pбj оценивается по следующей формуле:

Δ P с р = 1 n k 1 n | P а i P б j | k , k = 1, n , ( 1 )

i=1, …, mаi, j=1, …, mбj,

где n - количество букв в алфавите

mаi - количество i-й буквы в отрывке «а»,

mбj - количество j-й буквы в отрывке «б».

Сравнивая величину ΔPср с допустимым значением ΔPд, можно сделать вывод о принадлежности двух отрывков «а» и «б» текстовой информации одному автору. Если ΔPср≤ΔPд, то отрывки «а» и «б» принадлежат одному автору. В противном случае (ΔPср>ΔPд) авторы этих отрывков различны.

Вероятности Pаi, и Pбj определяются по следующим формулам:

P а i = m а i N а , i = 1 , m а , ( 2 )

P б i = m б i N б , j = 1, , m б , ( 3 )

где Nа - общее количество букв в отрывке «а»,

Nб - общее количество букв в отрывке «б».

Для иллюстрации разработанного подхода целесообразно рассмотреть пример. В качестве объектов содержательного анализа можно использовать стихотворения Иосифа Бродского «Одиссей Телемаку» (отрывок «а») и «На смерть Жукова» (отрывок «б»).

Одиссей Телемаку

Мой Телемак,

Троянская война

окончена. Кто победил - не помню.

Должно быть, греки: столько мертвецов

вне дома бросить могут только греки…

И все-таки ведущая домой

дорога оказалась слишком длинной,

как будто Посейдон, пока мы там

теряли время, растянул пространство.

Мне неизвестно, где я нахожусь,

что передо мной. Какой-то грязный остров,

кусты, постройки, хрюканье свиней,

заросший сад, какая-то царица,

трава да камни… Милый Телемак,

все острова похожи друг на друга,

когда так долго странствуешь, и мозг

уже сбивается, считая волны,

глаз, засоренный горизонтом, плачет,

и водяное мясо застит слух.

Не помню я, чем кончилась война,

и сколько лет тебе сейчас, не помню.

Расти большой, мой Телемак, расти.

Лишь боги знают, свидимся ли снова.

Ты и сейчас уже не тот младенец,

перед которым я сдержал быков.

Когда б не Паламед, мы жили вместе.

Но, может быть, и прав он: без меня

ты от страстей Эдиповых избавлен,

и сны твои, мой Телемак, безгрешны.

На смерть Жукова

Вижу колонны замерших внуков,

гроб на лафете, лошади круп.

Ветер сюда не доносит мне звуков

русских военных плачущих труб.

Вижу в регалии убранный труп:

в смерть уезжает пламенный Жуков.

Воин, пред коим многие пали

стены, хоть меч был вражьих тупей,

блеском маневра о Ганнибале

напоминавший средь волжских степей.

Кончивший дни свои глухо, в опале,

как Велизарий или Помпей.

Сколько он пролил крови солдатской

в землю чужую! Что ж, горевал?

Вспомнил ли их, умирающий в штатской

белой кровати? Полный провал.

Что он ответит, встретившись в адской

области с ними? «Я воевал».

К правому делу Жуков десницы

больше уже не приложит в бою.

Спи! У истории русской страницы

хватит для тех, кто в пехотном строю

смело входили в чужие столицы,

но возвращались в страхе в свою.

Анализ этих текстов показывает, что общее количество букв в отрывке «a» Nа=745, a в отрывке «б» Nб=611. Количество букв в русском алфавите n=33. Количество i-й буквы mаi в отрывке «а» и j-й буквы mбj в отрывке «б» приведены в таблице 1, вероятности появления i-й буквы отрезка «а» Pаi, и i-й буквы отрезка «б» Pбj, определяемые по формулам, соответственно (2) и (3), представлены также в таблице 1.

Таблица 1
Вероятности появления различных букв в двух стихотворениях.
Буквы русского алфавита
А Б В Г Д Е Е Ж З И Й
mаi 60 14 25 16 25 60 1 8 13 40 18
Pаi 0,081 0,019 0,034 0,021 0,034 0,081 0,001 0,011 0,017 0,054 0,024
mбj 36 10 45 6 12 41 1 12 6 54 15
Pбj 0,059 0,016 0,074 0,010 0,020 0,067 0,002 0,020 0,010 0,088 0,025
|Pаi-Pбj| 0,022 0,003 0,040 0,011 0,014 0,014 0,001 0,009 0,007 0,034 0,001
Продолжение таблицы 1
Буквы русского алфавита
К Л М Н О П Р С Т У Ф
mаi 33 30 34 46 83 15 33 45 54 12 0
Pаi 0,044 0,040 0,046 0,062 0,111 0,020 0,044 0,060 0,072 0,016 0
mбj 23 35 18 34 61 20 30 33 34 24 1
Pбj 0,038 0,057 0,029 0,056 0,100 0,033 0,049 0,054 0,056 0,039 0,002
|Pаi-Pбj| 0,006 0,017 0,017 0,006 0,011 0,013 0,005 0,006 0,016 0,023 0,002
Окончание таблицы 1
Буквы русского алфавита
Х Ц Ч Ш Щ Ъ Ы Б Э Ю Я
mаi 5 4 8 6 1 0 16 13 1 5 17
Pаi 0,007 0,005 0,011 0,008 0,001 0 0,021 0,017 0,001 0,007 0,023
mбj 14 3 7 6 3 0 10 8 0 7 2
Pбj 0,023 0,005 0,011 0,010 0,005 0 0,016 0,013 0, 0,011 0,003
|Pаi-Pбj| 0,016 0 0 0,002 0,004 0 0,005 0,004 0,001 0,004 0,020

В нижней строке таблицы 1 размещены величины модуля разности |Pаi-Pбj|.

Сумма этих величин равна 0,334, среднее значение разности ΔPср между вероятностью появления i-й буквы отрывка «а» Pаi и вероятностью появления i-й буквы отрывка «б» Pбj оценивается по формуле (1):

Δ P с р = 1 33 0,334 = 0,01

Если принять допустимое значение этой вероятности ΔPд=0,02, то можно делать вывод о том, что отрывки «а» и «б» принадлежат одному автору.

Технический результат достигается тем, что устройство для содержательного анализа текстовой информации содержит первую и вторую группы входных регистров, состоящие из n элементов, с первого по четвертый входные регистры, первую и вторую группы блоков деления, состоящие из n элементов, группу блоков вычитания по модулю, состоящую из n элементов, накопительный сумматор, блок деления, блок сравнения, блок индикации, генератор тактовых импульсов и распределитель импульсов (РИ), тактовый вход которого соединен с выходом генератора тактовых импульсов, первый выход РИ - с входами записи первой и второй групп входных регистров, а также с входами записи первого, второго, третьего и четвертого входных регистров, второй выход - с входами считывания первой и второй групп входных регистров, а также первого и второго входных регистров, третий и четвертый выходы - с входами считывания соответственно третьего и четвертого входных регистров, информационные входы с первого по n-й элементов первой группы входных регистров являются входом задания исходной информации, на которые поступают значения mаi, характеризующие количество i-й буквы в отрывке «а», информационные входы с первого по n-й элементов второй группы входных регистров являются входом задания исходной информации, на которые поступают значения mбj, характеризующие количество j-й буквы в отрывке «б», информационные входы с первого по четвертый входных регистров являются входами задания исходной информации, на которые поступают соответственно значение Νа, характеризующее общее количество букв отрывка «а», значение Νб, характеризующее общее количество букв в отрывке «б», значение n, характеризующее количество букв в алфавите, значение ΔPд, характеризующее величину допустимого значения средней разности между вероятностью появления i-й буквы отрывка «а» и вероятностью появления j-й буквы в отрывке «б», выходы, с первого по n-й, элементов первой и второй групп входных регистров соединены с входами делимого каждого соответствующего элемента соответственно первой и второй групп блоков деления, входы делителя которых подключены к выходам соответственно первого и второго входных регистров, а выходы - соответственно к выходам уменьшаемого и к входам вычитаемого группы блоков вычитания по модулю, выходы которых соединены с входами, с первого по n-й, накопительного сумматора, выход которого подключен к входу делимого блока деления, вход делителя которого соединен с выходом третьего входного регистра, а выход - с информационным входом блока сравнения, пороговый вход которого подключен к выходу четвертого входного регистра, а выход - к входу блока индикации.

На фиг. 1 представлена функциональная схема устройства для содержательного анализа текстовой информации (для ликвидации громоздкости связи между РИ и управляющими входами соответствующих блоков показаны не полностью, а обозначены путем нумерации входов и выходов); на фиг. 2 изображена циклограмма работы заявленного устройства (на оси ординат обозначены номера входов РИ, а по оси абсцисс - число тактов), причем длительность различных вычислительных операций (сложение и вычитание - один такт, деление - двенадцать тактов) в верхней части фиг. 2.

Устройство для содержательного анализа текстовой информации (фиг. 1) содержит первую 1 и вторую 2 группы входных регистров, каждая из которых состоит из n элементов, первый 3, второй 4, третий 5 и четвертый 6 входные регистры, первую 7 и вторую 8 группы блоков деления, каждая из которых состоит из n элементов, группу 9 блоков вычитания по модулю, состоящую из n элементов, накопительный сумматор 10, блок 11 деления, блок 12 сравнения, блок 13 индикации, генератор 14 тактовых импульсов и распределитель 15 импульсов.

Устройство для содержательного анализа текстовой информации работает следующим образом. На информационные входы с первого по n-й элементов первой группы 1 входных регистров (фиг. 1) засылаются соответственно величины mа1, …mаi, …mаn, а на информационные входы с первого по n-й элементов второй группы 2 входных регистров подаются соответственно значения mб1, …mбi, …mбn.

На информационные входы первого 3, второго 4, третьего 5 и четвертого 6 входных регистров направляются соответственно величины Nа, Nб, n и ΔPд. При этом управляющий сигнал на входы записи всех элементов этих групп входных регистров и входных регистров подается с первого выхода РИ 15, темп работы которого задается генератором 14 тактовых импульсов.

По сигналу со второго выхода РИ 15 на входы считывания первой 1 и второй 2 групп входных регистров величины mаi и mбj с их выходов засылаются на входы делимого соответственно первой 7 и второй 8 групп блоков деления. На входы делителя этих групп направляются по сигналу со второго выхода РИ 15 с выходов соответственно первого 3 и второго 4 входных регистров значения Nа и Nб. С выходов первой 7 и второй 8 групп блоков деления величины Pаi, и Pбj, определяемые по формулам (2) и (3), поступают соответственно на входы уменьшаемого и входы вычитаемого группы 9 блоков вычитания по модулю. С выходов этой группы величины |Pаi-Pбj|k засылаются на входы накопительного сумматора 10, с выхода которого значение 1 n k 1 n | P а i P б j | k , подается на вход делимого блока 11 деления. На вход делителя этого блока по сигналу с третьего выхода РИ 15 направляется с выхода третьего входного регистра 5 величина n. С выхода блока 11 деления значение ΔPср, определяемое по формуле (1), поступает на информационный вход блока 12 сравнения, на пороговый вход которого по сигналу с четвертого выхода РИ 15 засылается с выхода четвертого входного регистра 6 величина ΔPд.

Если ΔPср≤ΔPд (отрывки «а» и «б» принадлежат одному автору) на выходе блока 12 сравнения появится сигнал, который приведет к загоранию блока 13 индукции. В противном случае, когда ΔPср>ΔPд сигнала на выходе блока 12 сравнения не будет и блок 13 индукции не засветится, это будет свидетельствовать о том, что отрывки «а» и «б» принадлежат разным авторам. Порядок функционирования блоков устройства представлен на циклограмме его работы (фиг. 2).

Таким образом, технический результат достигается не за счет математического аппарата, а за счет технических средств (блоков и элементов), упомянутых в процессе описания работы устройства, осуществляющего повышение уровня достоверности определения авторства текстовой информации и расширение арсенала технических средств.

Промышленная применимость изобретения обосновывается тем, что оно может быть использовано в разных областях (отраслях) при расчетах, связанных с идентификацией текстовой информации в случаях определения ее автора с целью принятия объективных решений при защите авторских прав создателей текстовой информации.

Устройство для содержательного анализа текстовой информации, содержащее первую и вторую группы входных регистров, состоящие из n элементов, с первого по четвертый входные регистры, первую и вторую группы блоков деления, состоящие из n элементов, группу блоков вычитания по модулю, состоящую из n элементов, накопительный сумматор, блок деления, блок сравнения, блок индикации, генератор тактовых импульсов и распределитель импульсов (РИ), тактовый вход которого соединен с выходом генератора тактовых импульсов, первый выход РИ - с входами записи первой и второй групп входных регистров, а также с входами записи первого, второго, третьего и четвертого входных регистров, второй выход - с входами считывания первой и второй групп входных регистров, а также первого и второго входных регистров, третий и четвертый выходы - с входами считывания соответственно третьего и четвертого входных регистров, информационные входы с первого по n-й элементов первой группы входных регистров являются входом задания исходной информации, на которые поступают значения mаi, характеризующие количество i-й буквы в отрывке «а», информационные входы с первого по n-й элементов второй группы входных регистров являются входом задания исходной информации, на которые поступают значения mбj, характеризующие количество j-й буквы в отрывке «б», информационные входы с первого по четвертый входных регистров являются входами задания исходной информации, на которые поступают соответственно значение Νа, характеризующее общее количество букв отрывка «а», значение Νб, характеризующее общее количество букв в отрывке «б», значение n, характеризующее количество букв в алфавите, значение ΔP, характеризующее величину допустимого значения средней разности между вероятностью появления i-й буквы отрывка «а» и вероятностью появления j-й буквы в отрывке «б», выходы, с первого по n-й, элементов первой и второй групп входных регистров соединены с входами делимого каждого соответствующего элемента соответственно первой и второй групп блоков деления, входы делителя которых подключены к выходам соответственно первого и второго входных регистров, а выходы - соответственно к выходам уменьшаемого и к входам вычитаемого группы блоков вычитания по модулю, выходы которых соединены с входами, с первого по n-й, накопительного сумматора, выход которого подключен к входу делимого блока деления, вход делителя которого соединен с выходом третьего входного регистра, а выход - с информационным входом блока сравнения, пороговый вход которого подключен к выходу четвертого входного регистра, а выход - к входу блока индикации.



 

Похожие патенты:

Изобретение относится к способу, устройству и машиночитаемому носителю для обеспечения соревнования между пользователями в реальном времени. Технический результат заключается в повышении быстродействия проведения соревнований реального времени.

Изобретение относится к системам автоматизации. Технический результат заключается в повышении скорости получения и обработки данных.

Изобретение относится к способу заполнения электронной таблицы. Технический результат заключается в автоматизации и повышении эффективности ввода и расчета данных.

Изобретение относится к боевым информационно-управляющим системам и может быть использовано для управления подготовкой и пуском ракет (противоракет, торпед, управляемых снарядов и т.п.), в которые ввод данных полетного задания осуществляется от обеспечивающих систем.

Изобретение относится к многопроцессорным вычислительным средам, а именно к транзакционной обработке внутри таких вычислительных сред. Техническим результатом является повышение скорости выполнения команды начать транзакцию благодаря сохранению содержимого только тех регистров, которые прямо указаны маской сохранения регистров общего назначения.

Изобретение относится к разработке и изготовлению редукторов преимущественно для малоразмерных авиационных турбовинтовых двигателей. Способ включает этапы: ввода исходных данных, составления максимального количества вариантов конструкции, фильтрации по геометрическим параметрам, на котором выбирается группа редукторов, для которых возможно построить структурную схему, составления эскизов кинематических схем редукторов по топологическим связям с определением основных параметров зубчатых колес, определения необходимости планетарной передачи в редукторе и сборки планетарной передачи.

Изобретение относится к способу и системе моделирования дорожных характеристик в регионе, где движется транспортное средство. Техническим результатом является повышение эффективности обнаружения движения транспортного средства.

Данное изобретение относится к вычислительной технике. Технический результат - обеспечение в автоматизированном режиме выбора значений параметров внешней среды, согласованных с оптимальным управлением равновесным случайным процессом (РСП).

Изобретение относится к компьютерной технике, а именно к цифровым вычислительным системам для определения качества сравниваемых сложных систем, средств, изделий и различных объектов, описываемых значительным числом разнородных единичных показателей.

Изобретение относится к трансфузиологии и предназначается для использования в лечебных учреждениях при планировании и переливании пациенту компонентов консервированной донорской крови.

Изобретение относится к обработке цифровых данных с помощью компьютерных систем, а именно к методам обработки данных, специально предназначенных для специфических функций, мобильных приложений. Техническим результатом является автоматическое извлечение полезного контента из установочных файлов мобильных приложений для дальнейшего индексирования, машинной обработки данных и хранения полезного контента мобильных приложений в базе данных на сервере для дальнейшего обеспечения поиска. Способ извлечения полезного контента из установочных файлов мобильных приложений для дальнейшей машинной обработки данных содержит этапы, на которых загружают из Интернета на сервер установочный файл приложения, представляющий всегда некий архив; подбирают к нему разархиватор; в случае успешного подбора разархиватора разархивируют загруженный установочный файл в каталог с файлами; анализируют полученный каталог, составляют список файлов, содержащихся в нем; выбирают из списка файл для дальнейшего анализа; подбирают программное обеспечение для чтения файла путем перебора всех известных форматов; в случае успешного подбора программного обеспечения для чтения файла анализируют выбранный файл на предмет поиска первичного контента; формируют список адресов внутреннего размещения первичного контента в виде набора строк; переходят к анализу следующего файла до тех пор, пока в каталоге есть файлы; проводят анализ текстового содержимого списка адресов внутреннего размещения первичного контента и разделяют текст каждой строки на набор символов, идентифицирующих способ хранения соответствующей единицы контента, набор символов, идентифицирующий документ, к которому относится данная единица контента, и набор символов, идентифицирующий тип этой единицы контента; разделяют строки адресов внутреннего размещения единицы контента по способу хранения на служебный контент и полезный контент; служебный контент удаляют; выделяют в оставшемся списке группы строк с адресами внутреннего размещения единиц контента, имеющие полностью совпадающие по месторасположению и тексту группы символов, отражающие способ хранения контента; проводят статистическую фильтрацию выделенных групп; проводят анализ текстового содержимого строк списка адресов по набору символов, идентифицирующих документ, и выделяют группы адресов единиц контента, относящихся к каждому документу полезного контента приложения; выкачивают из приложения полезный контент, относящийся к каждому документу, в отдельный файл, тем самым формируя документы приложения; индексируют полученные файлы документов приложения на предмет принадлежности к нему, тем самым формируют описание его контента; сохраняют в базе данных название приложения, ссылку на приложение и описание приложения; загружают установочный файл нового приложения и повторяют все описанные последовательности; производят машинную обработку полученной базы данных; хранят созданный индексируемый массив базы данных на сервере; используют для поисковых запросов пользователей, поступающих через Интернет. 12 з.п. ф-лы, 2 ил.

Способ относится к области электрорадиотехники, а именно к технике радиосвязи, и может быть использован в системах передачи данных, использующих фазоманипулированные сигналы, без введения избыточности, для поддержания тактовой синхронизации для сигналов с фазовой манипуляцией или квадратурно-амплитудной модуляцией, в кодовых конструкциях которых используются блоковые помехоустойчивые коды и CRC. Техническим результатом является возможность поддерживать тактовую синхронизацию по информационному сигналу без передачи дополнительных синхронизирующих сигналов, что повышает скорость передачи информации при сохранении технической скорости передачи. Сущность способа тактовой синхронизации по информационным сигналам с проверкой по CRC заключается в последовательных демодуляции принятого сигнала, декодировании кодовых слов с исправлением ошибок и проверке факта декодирования по результатам вычисления CRC, т.е. остатка деления на полином. При нулевом остатке к информационному блоку вычисляют и добавляют CRC, осуществляют кодирование помехоустойчивым кодом, модулируют и рассчитывают взаимокорреляционную функцию (ВКФ) с принятым из канала связи сигналом. 1 ил.

Изобретение относится к информационным системам, позволяющим анализировать публикационную и издательскую активность сотрудников научно-образовательных организаций. Технический результат заключается в повышении скорости и многозадачности процедуры аналитической обработки данных об издательской активности сотрудников научно-образовательной организации. Система содержит: модуль области публикационных объектов и модуль для вычислений и анализа, состоящий из блока запросов и блока отчетов. Отдельным модулем выделен модуль пространства сотрудников, выполненный в виде трех блоков: блока управления описанием объектов сотрудников, блока генерации отчетов и коммутационного блока, при этом модуль соединен через коммутационный блок с модулем области публикационных объектов, выполненным в виде трех блоков: блока управления описанием публикационных объектов, блока генерации отчетов, коммутационного блока, а также с модулем для вычислений и анализа, выполненным в виде трех блоков: блока запросов, блока отчетов, коммутационного блока. Модуль области публикационных объектов и модуль для вычислений и анализа соединены через соответствующие коммутационные блоки. 6 з.п. ф-лы, 2 ил.

Изобретение относится к области автоматизированного управления технологическими процессами и может применяться для экстренных вычислений при контроле чрезвычайных ситуаций на основе динамической модели для широкого класса предметно-ориентированных приложений в сложной программно-аппаратной среде. Технический результат - повышение быстродействия при ликвидации опасной ситуации. Способ состоит в следующем: формируют на пульте блока управления команду на организацию контроля чрезвычайной ситуации на основе Грид-системы и функционального блока, реализующего идентификацию текущей ситуации с помощью нейронных сетей, и оценку опасности ситуации в зависимости от уровня действующих возмущений, блока оперативного контроля и прогноза развития ситуации на основе интерпретирующей и прогнозирующей нейросетевых моделей вырабатывают стратегические решения по интеллектуальной поддержке контроля ситуаций на основе управляющих воздействий в зависимости от особенностей ситуации в контурах программного и адаптивного управления, а также в контуре самообучения, определяют время, необходимое для выработки и принятия решения, и производят оценку безопасного времени нахождения объекта в текущей ситуации с учетом допустимых значений определяющих параметров. 4 ил., 3 табл.

Группа изобретений относится к области электротехники. Технический результат заключается в увеличении производительности и надежности грузовых платформ за счет локализации объектов в режиме реального времени внутри складских сооружений и за счет увеличения количества одновременно отслеживаемых на складе грузовых платформ. Для этого предложены способ и устройство автоматического контроля перемещения складских грузовых платформ, в которых суть сводится к обработке информации результатов контроля в N контрольных точках, при этом разбивают складское помещение на зоны размещения складских грузовых платформ, в этих зонах задают контрольные точки присутствия складских грузовых платформ, которые последовательно нумеруют, масштабируют токи от каждой контрольной точки, масштабированные токи от каждой контрольной точки суммируют в точке суммирования и передают через канал связи в орган обработки информации, где преобразуют данный ток в пропорциональное напряжение, из которого вычитается напряжение, пропорциональное суммарным координатам уже размещенных в помещении склада складских грузовых платформ, и по величине напряжения идентифицируют координаты i положения складских грузовых платформ. 2 н.п. ф-лы, 3 ил.

Группа изобретений относится к медицине. Способ обнаружения мощности сигнала тона сердца для диагностирования ишемической болезни сердца ИБС осуществляют с помощью системы для обнаружения мощности на низких частотах. При этом записывают акустические данные с помощью акустического датчика, размещенного на груди пациента, и генерируют акустические сигналы SA. Идентифицируют диастолические или систолические периоды в заданном периоде времени сохраненных акустических данных и формируют сигнал SP периода. Применяют фильтр к сигналу SP, формируют сигнал SLFB диапазона низких частот и сигнал SHFB диапазона высоких частот. Оценивают мощность в диапазонах низких частот и приводят оцененную мощность к другому более высокочастотному диапазону. Вычисляют показатель мощности на низких частотах на основе оцененной и приведенной мощности и формируют сигнал SLFP показателя мощности на низких частотах. Оценивают характеристику в диапазонах высоких частот, вычисляют показатель характеристики на высоких частотах на основе оцененной характеристики и формируют сигнал SHFF показателя характеристики на высоких частотах, причем упомянутой характеристикой является мощность. Объединяют показатели мощности на низких частотах и на высоких частотах и сравнивают результирующее значение совокупного отношения мощностей со значением эталонной характеристики для ИБС для формирования совокупного сигнала S′CAD риска ИБС. Применение изобретений позволит повысить точность диагностики ИБС. 5 н. и 11 з.п. ф-лы, 12 ил.

Настоящее изобретение относится к области автоматического определения значений в естественном языке, а именно к способам и системам обработки естественного языка, обработки текстов и массивов текстов на естественном языке. Техническим результатом является определение тональности на основе анализа текстовой информации. Настоящее изобретение обеспечивает способ проведения анализа текстовых данных, а также систему для проведения анализа текстовых данных и энергонезависимый машиночитаемый носитель информации. Способ настоящего изобретения включает получение текстовых данных; выполнение глубинного синтактико-семантического анализа текстовых данных; извлечение сущностей и фактов из текстовых данных на основе результатов глубинного синтактико-семантического анализа, которое включает в себя извлечение тональностей с использованием тонального словаря, построенного с использованием семантической иерархии. Согласно изобретению используется метод анализа тональности на уровне сущностей и аспектов, или другими словами направленный анализ тональности текстовых данных. Преимуществом направленного анализа тональности является тот факт, что он позволяет выявить не только саму тональность (отрицательную, положительную и т.д.), но и объект, и субъект тональности. 3 н. и 18 з.п. ф-лы, 19 ил.

Изобретение относится к обработке массивов данных, содержащих текст на естественном языке. Техническим результатом является повышение точности и скорости навигации по элементам массива данных за счет обеспечения предварительного преобразования структурированного массива данных и дальнейшего формирования логически, грамматически и орфографически верной структуры данных. В способе преобразования структурированного исходного массива данных формируют исходную структуру данных исходного массива данных. Идентифицируют в исходных элементах контекстные термины и формируют базу данных контекстных терминов. Используя информацию, содержащуюся в сформированной базе данных, в исходной структуре данных идентифицируют структурно-сложные языковые конструкции, содержащие контекстные термины, структурно-сложные языковые конструкции, не содержащие контекстные термины, структурно-простые языковые конструкции, содержащие контекстные термины, и структурно-простые языковые конструкции, не содержащие контекстные термины. Осуществляют преобразования над языковыми конструкциями и формируют итоговую структуру данных структурированного исходного массива данных. 4 н. и 15 з.п. ф-лы, 19 ил., 6 табл.

Изобретение относится к технологиям нефтедобычи, а именно к способам мониторинга процессов добычи и поддержания пластового давления на основе обработки данных телеметрии нейросетевым алгоритмом. Предложен способ нейросетевого анализа данных телеметрии по фонду скважин, заключающийся в том, что регистрируют данные о расходе жидкости на скважинах, осуществляют предварительную обработку и представляют их в виде n-размерных векторов, создают m n-размерных векторов справочной информации, служащей входными данными для нейросетевого алгоритма и характеризующей состояния скважин за определенный временной период, и сравнивают n-размерные вектора расходов с созданным в результате обучения множеством узлов самоорганизующейся карты Кохонена. При этом исходное множество m n-размерных векторов служит в качестве входных данных для алгоритма самообучения карты Кохонена и данных для определения принадлежности номера скважины к узлу обученной карты Кохонена. А результат отображения номеров скважин на узлах карты Кохонена служит обнаружению явлений взаимовлияния и интерференции скважин. Предложенный способ позволяет увеличить эффективность разработки месторождения за счет выбора рациональных режимов эксплуатации скважин на основе обнаруженных явлений интерференции и взаимовлияния скважин в процессе их эксплуатации. 2 ил.

Изобретение относится к области распознавания речи. Техническими результатами являются уменьшение задержки распознавания речи, увеличение точности распознавания речи, а также увеличение общего грамматического охвата в распознавании речи. При распознавании речи применяется общая грамматика как набор зависящих от контекста грамматик для распознавания входных данных, каждая из которых отвечает за конкретный контекст. Грамматики вместе охватывают всю область. Используются множественные распознавания параллельно по отношению к одним и тем же входным данным, причем каждое распознавание использует зависящие от контекста грамматики. Множественные промежуточные результаты распознавания от различных пар распознаватель-грамматика согласуются посредством запуска повторного распознавания с помощью динамически составленной грамматики на основе множественных результатов распознавания и знаний другой области или выбора победителя с помощью статистического классификатора, работающего по классифицирующим признакам, извлеченным из множественных результатов распознавания и знаний другой области. 5 н. и 17 з.п. ф-лы, 9 ил.
Наверх