Способ ввода сведений в базу данных и устройство для его осуществления

Авторы патента:

Фомов Олег Петрович (RU)

Фомов Сергей Петрович (RU)

Филаткин Сергей Владимирович (RU)

G06F7/36 - подборка в сочетании с сортировкой

G06F17/30 - информационный поиск; структуры баз данных для этой цели

Владельцы патента RU 2569565:

Акционерное общество "Ракетно-космический центр "Прогресс" (АО "РКЦ "Прогресс") (RU)

Изобретение относится к области технической кибернетики и предназначено для ввода сведений в базы данных системы с исключением повторной записи уже имеющихся данных. Технический результат заключается в снижении затраченного времени и количества ошибок при вводе информации в базу данных за счет автоматизации процесса. При занесении данных в базу данных приемник из входного массива записей из базы данных приемника запрашивают записи из независимых таблиц, соответствующих независимым записям входного массива, сравнивают с записями входного массива, при необходимости дополнительно записывают недостающие записи, полученными при этом уникальными ключами и уникальными ключами, уже имевшимися в базе данных до ввода сведений, дополняют подчиненные записи входного массива и после этого записывают данные в соответствующие подчиненные таблицы базы данных. 2 н.п. ф-лы, 8 ил.

Предлагаемое изобретение относится к области технической кибернетики и может быть использовано в информационных (автоматизированных, информационно-аналитических, поддержки принятия решений) системах (ИС) для организации ввода сведений от различных источников информации в базы данных.

Известен способ, принципы которого могут быть использованы при организации ввода сведений от различных источников информации в базу данных [1], при котором элементы системы представляют многопараметрическими многоуровневыми иерархически упорядоченными и объединенными в сетевой граф структурами и формируют сведения о непосредственной и через атрибуты (параметры) взаимосвязи элементов системы описанием связей, представленных простыми и содержательными связями с описанием содержательного характера каждой.

Недостатком этого способа является то, что система ориентирована только на информационные объекты с заранее определенной структурой и невозможна организация ввода сведений от различных источников информации в базы данных.

Известен способ генерации уникальных ключей во взаимодействующих базах данных, изложенный в [2]. Наиболее перспективным считается способ генерации новых ключей для записей, загружаемых в базу данных из баз данных источников. Новый ключ генерируется с помощью специального алгоритма (чаще всего используют генерацию возрастающей последовательности целых чисел). При этом используется специальная структура метаданных (таблица или несколько таблиц) для хранения соответствий между ключами баз данных источников и ключами, сгенерированными в базе данных приемнике, а также процедуры для управления данной структурой.

Недостатком известного способа является то, что обеспечивается только уникальность записей в базе данных приемнике, когда данные получают от нескольких баз данных источников. В известном способе не обеспечивается исключение многократного хранения одних и тех же по содержанию данных по тем или иным причинам повторенных при передаче от нескольких баз данных источников. Кроме этого на практике не всегда есть возможность организовать каналы обмена между базами данных. Например, часто передают структурированные данные в виде файлов процессоров электронных таблиц (наиболее распространена практика передачи структурированных данных файлами Excel). В этом случае, как правило, отсутствуют уникальные ключи, обеспечивающие представление связей между записями данных сложной структуры.

Известен способ ввода сведений из электронных таблиц (например, из таблиц Excel) в базы данных [3], при котором образуют новую таблицу в базе данных, колонки которой образуют соответствующими колонкам электронной таблицы, а записи (строки таблицы) формируют из данных, внесенных в ячейки электронной таблицы соответствующих колонок. Указанный известный способ реализует в том числе и диалоговый режим, обеспечивающий дополнительные возможности пользователю, например выбор части колонок в электронной таблице, данные из которых необходимо внести в базу данных, переименование колонок вновь образуемой таблицы базы данных и другие возможности.

Недостатком этого способа ввода данных является невозможность ввода данных в существующие таблицы баз данных, в которых уже есть данные, и обеспечения корректного совмещения данных от нескольких источников и имеющихся в базе данных в единый логически связанный информационный массив.

Наиболее близким к предлагаемому является способ информационного обмена между базами данных информационных систем [4], в котором за счет введения централизованной службы идентификации данных формируют централизованные (в рамках информационной системы) уникальные ключи для типов записей данных (ИТО - "идентификаторы типов объектов"), указывают отдельные типы, для которых необходима централизованная идентификация экземпляров объектов, формируют централизованные (в рамках информационной системы) уникальные ключи для отдельных экземпляров записей данных (ЦИДЭ - "централизованные идентификаторы экземпляров"), хранят в базах данных информационной системы таблицы соответствия ЦИДЭ и уникальных ключей базы данных ("таблицы наличия экземпляров"), хранят в базах данных информационной системы таблицы признаков необходимости сопровождения информационных объектов ЦИДЭ ("таблицы признаков сопровождения") с привязкой этих признаков к ключам типов записей - ИТО и соответствующими процедурами при приеме данных исключают повторные записи данных, которые уже занесены в базы данных приемника и которые вновь поступают в составе данных от новых источников. Обеспечивается также корректное совмещение данных от нескольких источников в единый логически связанный информационный массив, что существенно повышает функциональные возможности системы.

Способ реализуется в системе информационного обмена, содержащей базы данных информационной системы, канал обмена между базами данных, а каждая база данных содержит устройство метаданных, устройство формирования массивов записей для обмена и устройство приема записей при обмене, при этом устройство метаданных содержит блок хранения уникальных ключей для типов записей данных и признаков необходимости сопровождения, входы и выходы которого соединены соответственно с первыми выходами и с первыми входами блока обслуживания запросов к устройству метаданных, вторые выходы и вторые входы которого соединены соответственно с входами и выходами блока хранения соответствия ключей записей базы данных и ключей экземпляров, при этом вторые канальные входы и вторые канальные выходы блока обслуживания запросов к устройству метаданных соединены через четвертый канал со вторыми канальными выходами и вторыми канальными входами блока управления формированием массива записей для обмена устройства формирования массива записей для обмена, которое содержит также блок хранения записей для обмена, входы и выходы которого соединены с выходами и входами блока управления формированием массива записей для обмена, первые канальные выходы которого соединены с каналом обмена между базами данных, а первые канальные входы соединены через третий канал со вторыми канальными выходами реляционной базы данных, с третьими канальными выходами и первыми канальными входами которой соединены через второй канал первые канальные входы и первые канальные выходы блока управления преобразованием массива и занесением записей в базу данных устройства приема записей при обмене, которое содержит также блок хранения массива записей принятого при обмене и блок хранения результатов анализа и преобразования массива записей, входы и выходы которых соединены соответственно со вторыми выходами, вторыми входами, первыми выходами и первыми входами блока управления преобразованием массива и занесением записей в базу данных, третьи канальные входы которого соединены с каналом обмена между базами данных, а вторые канальные входы и вторые канальные выходы через пятый канал соединены с третьими канальными выходами и третьими канальными входами блока обслуживания запросов к устройству метаданных, четвертые канальные входы которого соединены через шестой канал с первыми канальными выходами реляционной базы данных, а первые канальные входы и первые канальные выходы через первый канал соединены с канальными выходами и канальными входами блока обслуживания запросов баз данных и обмена устройства службы централизованной идентификации данных информационной системы, которое содержит также блок ввода данных, выходы которого соединены с первыми входами блока формирования и хранения уникальных ключей для типов записей данных и признаков необходимости сопровождения, выход и вторые входы которого соединены с первыми входами и первыми выходами блока обслуживания запросов баз данных и обмена, вторые выходы и вторые входы которого соединены с входами и выходами блока формирования и хранения уникальных ключей для экземпляров записей данных

Недостатком этого способа, как и способа [2], является ввод данных только по каналам обмена данными между базами данных, и остается невозможным ввод сведений, представленных другими способами передачи данных, в частности с помощью файлов процессоров электронных таблиц.

Целью предлагаемого способа является расширение функциональных возможностей информационной системы за счет исключения повторной записи данных, которые уже занесены в базу данных приемник и которые вновь поступают в составе данных от нового источника в виде файлов процессоров электронных таблиц, а также корректный ввод новых данных от нескольких источников в единый логически связанный информационный массив.

Цель достигается реализацией заявляемых способа ввода сведений в базы данных информационных систем и устройства для его осуществления.

Сущность предлагаемого изобретения состоит в следующем.

При предлагаемом способе ввода сведений в базу данных информационной системы для ввода данных формируют входной массив записей экземпляров информационных объектов, значений свойств (атрибутов) экземпляров объектов в совокупности ячеек, например в виде файлов процессоров электронных таблиц, а в базе данных приемнике заносят в базу данных экземпляры информационных объектов, значения свойств экземпляров и образуют уникальные ключи записей базы данных приемника, а в отличие от известных способов формируют запросы информационных объектов, их атрибутов и уникальных ключей записей из независимых таблиц базы данных приемника, соответствующих независимым информационным объектам входного массива записей, сравнивают атрибуты информационных объектов, полученных из базы данных с атрибутами информационных объектов входного массива записей, выявляют наличие или отсутствие информационных объектов, соответствующих информационным объектам во входном массиве записей в базе данных приемнике, записывают при необходимости отсутствующие информационные объекты и их атрибуты в соответствующие таблицы базы данных приемника, образованными при этой записи уникальными ключами, а также уникальными ключами, имевшимися в соответствующих таблицах базы данных приемника до ввода данных из входного массива записей, дополняют записи подчиненных информационных объектов входного массива записей и записывают подчиненные информационные объекты из входного массива записей с их атрибутами и дополненными уникальными ключами в соответствующие подчиненные таблицы базы данных приемника.

Устройство для реализации способа содержит каналы записи и чтения данных, базу данных приемника, блок записи данных в приемную базу данных, блок запросов к приемной базе данных, причем первые информационные входы-выходы блока запросов к приемной базе данных и блока записи данных в приемную базу данных соединены с каналами записи и чтения данных и в отличие от известных в устройство включен блок диалоговой обработки сведений входного массива, информационные входы которого являются информационными входами устройства, первые информационные входы-выходы соединены со вторыми информационными входами-выходами блока запросов к приемной базе данных, вторые информационные входы-выходы соединены со вторыми информационными входами-выходами блока записи данных в приемную базу данных.

При выполнении предлагаемого способа с использованием предлагаемого устройства достигается технический результат, заключающийся в:

- выявлении в принимаемых записях информационных объектов, уже имеющихся в базе данных, и предотвращения повторной записи таких объектов;

- совмещении данных от нескольких источников и имеющихся в базе данных приемнике в единый логически связанный информационный массив.

Этим повышаются функциональные возможности ИС.

Осуществление предложенного способа ввода сведений в базу данных информационной системы и устройства поясняется фиг.1-8.

Реализация предлагаемого способа ввода сведений в базу данных информационной системы возможна в предлагаемом устройстве для его осуществления. Структура устройства ввода сведений в базу данных 1 показана на фиг.1, где:

1 - устройство ввода сведений в базу данных;

2 - блок диалоговой обработки сведений входного массива;

3 - блок записи данных в приемную базу данных;

4 - блок запросов к приемной базе данных;

5 - приемная база данных;

6 - информационные входы устройства 1 и блока 2;

7 - каналы записи и чтения данных из базы данных приемника 5.

Для осуществления способа ввода данных в предлагаемое устройство ввода сведений в базу данных 1 включен блок диалоговой обработки сведений входного массива 2. В процессе работы информационной системы на информационные входы 6 устройства 1, являющиеся также информационными входами блока диалоговой обработки сведений входного массива, поступают данные входного массива.

В процессе работы блок 2 запрашивает с помощью блока запросов 4 через каналы 7 в приемной базе данных 5 данные, соответствующие независимым сведениям во входном массиве, включая и уникальные ключи приемной базы данных. С помощью блока записи данных в приемную базу данных 3 осуществляются записи данных в приемную базу данных 5.

С помощью блока диалоговой обработки сведений входного массива 2:

- формируют шаблоны для данных, поступающих от различных источников;

- формируют в шаблонах массивы со списками данных, существующих в таблицах базы данных приемника; такие массивы формируются для независимых сведений во входных массивах; независимыми сведениями являются такие данные, которые не являются подчиненными при вводе в таблицы приемной базы данных (в таких таблицах нет «внешних» ключей, связывающих записи таблиц с записями других «родительских» таблиц);

- вносят записи входных массивов в указанные шаблоны;

- сравнивают записи входных массивов с записями соответствующих массивов со списками данных, существующих таблицам базы данных приемника, идентифицируя тем самым наличие или отсутствие аналогичных записей в базе данных приемника;

- заносят независимые (не имеющие связей подчинения) записи из входных массивов в таблицы базы данных приемника, причем только те записи, которые в них отсутствуют;

- переадресовывают связи в подчиненных записях входных массивов или на уникальные ключи вновь образованных независимых записей или переадресовывают связи на уникальные ключи, уже имевшиеся в базе данных приемнике до начала обработки входного массива, и заносят такие идентифицированные записи входных массивов в подчиненные таблицы базы данных приемника.

Создают шаблоны данных, например для файлов процессоров электронных таблиц. Шаблоны представляют собой разметки ячеек, предусматривающие хранение записей сведений по различным типам информационных объектов из входных массивов записей с наборами их свойств, которые используются при формировании входных массивов сведений или при их преобразовании. При анализе таких шаблонов выявляют информационные объекты, которые могут дублироваться в базе данных приемнике при внесении данных от нескольких источников (от нескольких входных массивов). Такие ячейки шаблона дополняют массивами со списками, которые связываются с соответствующими таблицами базы данных приемника.

В процессе работы информационной системы при выполнении ввода сведений из входного массива данных в базу данных приемник в качестве первой операции выполняют перемещение данных входного массива в шаблон данных.

Второй операцией сравнивают независимые записи входного массива с существующими записями в соответствующих таблицах принимающей базы данных и выявляют отсутствующие в базе данных записи. Для записей, имеющихся в принимающей базе данных, выбирают соответствующие записи в массивах со списками (при этом идентифицируются имеющиеся в базе данных уникальные ключи записей).

Третьей операцией те независимые записи из входного массива, которые отсутствуют в соответствующей таблице приемной базы данных, записывают в базу данных. Полученные при записи уникальные ключи возвращают в шаблон (обновляют содержимое массивов со списками).

Четвертой операцией записывают в базу данных подчиненные записи входного массива и дополняют эти записи соответствующими ключами связей подчинения, причем для записей, уже имевшихся в базе данных приемнике, используют уже имевшиеся в базе данных уникальные ключи записей независимых таблиц, а для записей, которых не было в базе данных, используют вновь сформированные уникальные ключи (полученные при выполнении третьей операции).

Это позволяет осуществить при занесении данных из обменного массива записей корректное сжатие информации (не заносятся уже имеющиеся в базе данных информационные объекты и их свойства) и совмещение данных от нескольких источников данных в единый логически связанный информационный массив с данными уже имевшимися в базе данных приемнике, что обеспечивает расширение функциональных возможностей информационной системы и сокращает затраты на эксплуатацию ИС за счет исключения необходимости систематического решения вопросов, связанных с некорректным размножением в базах данных приемника одних и тех же информационных объектов, поступающих от нескольких источников данных.

В качестве примера рассмотрим базу данных ИС, предназначенной для обобщения сведений по оборудованию, необходимому ряду предприятий, участвующих в реализации каких-либо производственных программ. Структура таблиц базы данных (информационная модель) приведена на фиг.2, где:

8 - таблица базы данных для хранения записей по реализуемым программам;

9 - таблица базы данных для хранения записей по предприятиям, участвующим в реализации программ;

10 - таблица базы данных для хранения записей по типам оборудования;

11 - таблица базы данных для хранения записей по годам;

12 - таблица базы данных для хранения записей по заявкам предприятий на оборудование (эта таблица является подчиненной, другие упомянутые выше четыре таблицы являются независимыми).

Пример входного массива, сведения по которому необходимо ввести в базу данных, приведен на фиг.3 (заявка предприятия на оборудование, необходимое для реализации программы), где:

13 - сведения входного массива данных по программе работ; эти сведения являются независимыми;

14 - сведения о предприятии, подготовившем заявку на оборудование; независимые сведения;

15 - сведения о периоде времени поставки оборудования (по заявке предприятия); независимые сведения;

16 - сведения о типах необходимого оборудования (независимые сведения), его количестве и стоимости («подчиненные» сведения).

Пример записей в таблицах принимающей базы данных до и после ввода сведений из входного массива (фиг.3) приведен на фиг.4 и фиг.5. Показан случай, когда имевшихся в базе данных достаточно, чтобы при вводе сведений из входного массива не вносить никаких записей в независимые таблицы «ГОД» и «ПРОГРАММЫ», но необходимо дополнять записями независимые таблицы «ПРЕДПРИЯТИЕ», «ОБОРУДОВАНИЕ» и зависимую таблицу «ЗАЯВКИ ПРЕДПРИЯТИЙ».

Примеры возвращаемых в блок 2 массивов списков записей из принимающей базы данных приведены на фиг.6.

Сравнением записей запроса и независимых сведений во входном массиве блок 2 (вторая операция) выявляет записи (и соответственно уникальные ключи записей), которые уже имеются в соответствующих независимых таблицах приемной базы данных. Пример диалогового окна блока 2 (при выполнении второй операции) приведен на фиг.7, где:

17 - возвращение блоком 2 результата сравнения в случае, когда в приемной базе данных в независимой таблице есть запись, соответствующая независимым сведениям во входном массиве;

18 - возвращение блоком 2 результата сравнения в случае, когда в приемной базе данных в независимой таблице нет записи, соответствующей независимым сведениям во входном массиве;

19 - управляющие элементы диалогового окна для выполнения третьей операции («Записать данные в независимые таблицы» и «Обновить запросы к БД») и четвертой операции предлагаемого способа («Внести заявку в БД» - внесение данных в подчиненную таблицу приемной базы данных).

При выявлении независимых записей, которые присутствуют во входном массиве, но отсутствуют в независимых таблицах приемной базы данных, выполняют третью операцию - внесение дополнительных записей в независимые таблицы приемной базы данных («Записать данные в независимые таблицы» и «Обновить запросы к БД»). Пример диалогового окна, формируемого блоком 2 после выполнения третьей операции предлагаемого способа, приведен на фиг.8, где: 20 - пример обновленной ячейки.

Заявляемый способ обеспечивает, как и известный способ, генерацию новых ключей для записей, загружаемых в базу данных от новых источников, чем обеспечивается уникальность записей в базе данных. В то же время предлагаемый способ позволяет:

- идентифицировать записи данных во входных массивах данных, поступивших от разных источников;

- поставить в соответствие типы записей входных массивов с таблицами базы данных приемника;

- поставить в соответствие записи входных массивов с существующими записями в таблицах базы данных приемника или идентифицировать их отсутствие;

- выполнить процедуру внесения входных массивов данных в таблицы базы данных приемника, при которой исключается повторение одних и тех же записей, совпадающих в различных входных массивах.

В результате применения предлагаемого способа, по сравнению с известными способами, достигается технический результат, заключающийся в повышении функциональных возможностей ИС за счет реализации возможности совмещения данных от нескольких источников в базе данных приемнике в единый логически связанный информационный массив.

Выше представленные способ и устройство позволяют уменьшить затраты на эксплуатацию ИС из-за исключения необходимости систематического решения вопросов, связанных с некорректным размножением в базах данных приемника одних и тех же информационных объектов, поступающих от нескольких источников.

Источники информации

1. Патент РФ №2225033, кл. G06N 1/00, 2004.

2. К.Лисянский. Архитектурные решения и моделирование хранилищ и витрин данных. Директор ИС, №3, 2002 г., издательство "Открытые Системы".

3. Описание систем управления базами данных (например, Access). Патент РФ №2351010, 27.03.2007.

1. Способ ввода сведений в базу данных информационной системы, при котором для ввода данных формируют входной массив записей экземпляров информационных объектов, значений свойств (атрибутов) экземпляров объектов, а в базе данных приемнике заносят в базу данных экземпляры информационных объектов, значения свойств экземпляров и образуют уникальные ключи записей базы данных приемника, отличающийся тем, что формируют входной массив записей экземпляров информационных объектов, значений свойств (атрибутов) экземпляров объектов в совокупности ячеек в виде файлов процессоров электронных таблиц, формируют запросы информационных объектов, их атрибутов и уникальных ключей записей из независимых таблиц базы данных приемника, соответствующих независимым информационным объектам входного массива записей, сравнивают атрибуты информационных объектов, полученных из базы данных, с атрибутами информационных объектов входного массива записей, выявляют наличие или отсутствие информационных объектов, соответствующих информационным объектам во входном массиве записей в базе данных приемнике, записывают, при необходимости, отсутствующие информационные объекты и их атрибуты в соответствующие таблицы базы данных приемника, образованными при этой записи уникальными ключами, а также уникальными ключами, имевшимися в соответствующих таблицах базы данных приемника до ввода данных из входного массива записей, дополняют записи подчиненных информационных объектов входного массива записей и записывают подчиненные информационные объекты из входного массива записей с их атрибутами и дополненными уникальными ключами в соответствующие подчиненные таблицы базы данных приемника.

2. Устройство для реализации способа по п.1, содержащее каналы записи и чтения данных, базу данных приемник, блок записи данных в приемную базу данных, блок запросов к приемной базе данных, причем первые информационные входы-выходы блока запросов к приемной базе данных и блока записи данных в приемную базу данных соединены с каналами записи и чтения данных, отличающееся тем, что в устройство включен блок диалоговой обработки сведений входного массива, информационные входы которого являются информационными входами устройства, первые информационные входы-выходы соединены со вторыми информационными входами-выходами блока запросов к приемной базе данных, вторые информационные входы-выходы соединены со вторыми информационными входами-выходами блока записи данных в приемную базу данных.

Изобретение относится к области техники, связанной с Интернет-технологиями, и в частности к системе и способу уведомления об обновлении. Технический результат заключается в обеспечении возможности динамического отслеживания многообразия сетевых ресурсов, включая те, что не поддерживают вывод RSS, и уведомления пользователей, после того как соответствующие сетевые ресурсы обновляются.

Устройство для упорядочения массива чисел // 1444830

Изобретение относится к области вьгаислительной техники и может быть использовано для упорядочения двумерных массивов чисел по строкам (столбцам ) массива. .

Пороговый элемент // 296106

Устройство хранения неисправности и способ хранения неисправности // 2566337

Изобретение относится к обнаружению неисправностей в транспортных средствах. Техническим результатом является повышение точности диагностирования неисправностей.

Система информационного обеспечения законодательного процесса представительных органов власти // 2565525

Изобретение относится к вычислительной технике, в частности к системе информационного обеспечения законодательного процесса представительных органов власти. Техническим результатом является повышение быстродействия системы путем локализации диапазона адресов поиска данных законопроектов в базе данных сервера системы.

Метод построения корпуса текстов на основе интернет-форумов // 2565473

Изобретение относится к системам и методам создания корпусов текстов для различных исследовательских и других целей. Техническим результатом является повышение точности отделения текстов пользователей от остального контента веб-страниц при автоматическом построении корпуса текстов.

Способ и устройство для восстановления резервной базы данных // 2565109

Изобретение относится к средствам для восстановления резервной базы данных. Технический результат заключает в обеспечении совместимости резервных копий с последующими версиями при восстановлении базы данных.

Единая система классификации и кодирования объектов технической эксплуатации железнодорожной телекоммуникационной инфраструктуры // 2564637

Изобретение относится к единой системе классификации и кодирования (ЕСКК) объектов технической эксплуатации железнодорожной телекоммуникационной инфраструктуры.

Способ кластеризации результатов поиска в зависимости от семантики // 2564629

Настоящее изобретение относится к технологиям поиска информации в электронных ресурсах и способам представления результатов поиска. Технический результат состоит в повышении точности и скорости поиска информации.

Обобщенный способ обработки содержания структурированного отчета dicom // 2564248

Изобретение относится к установлению соответствия стандартных измерений локальным измерениям. Техническим результатом является повышение надежности при формировании данных о пациенте.

Система обработки информации, способ обработки информации и носитель записи // 2563150

Изобретение относится к системе, способу и носителю информации для обработки информации. Технический результат - возможность безопасной передачи и вывода информации через сеть.

Система и метод семантического поиска // 2563148

Изобретение относится к технологиям поиска. Техническим результатом является повышение точности поиска информации за счет обеспечения возможности получения пользователем только релевантных результатов поиска за счет использования семантических запросов.

Способ и устройство для добавления адреса гиперссылки в закладку // 2562397

Изобретение относится к области добавления адреса гиперссылки в закладку. Технический результат - упрощение доступа, поиска и хранения web-контента.

Способ, система для отображения действий друзей и компьютерная запоминающая среда // 2571401

Изобретение относится к средствам отображения действий друзей. Технический результат заключается в уменьшении времени получения требуемой информации о действиях друзей. Генерируют информацию о действиях из действий друзей согласно цепочке отношений друзей. Классифицируют информацию о действиях согласно заданному правилу классификации для получения соответствующей классифицированной выборки. Получают ввод пользователя, содержащего условие фильтрации, соответствующее классифицированной выборке, причем условие фильтрации отличается от заданного правила классификации. Извлекают отфильтрованную информацию о действиях из соответствующей классифицированной выборки посредством фильтрации информации о действиях в соответствующей классифицированной выборке на основе условия фильтрации. Извлекают атрибут, связанный с правилом классификации, из информации о действиях согласно заданному правилу классификации. Классифицируют информацию о действиях согласно атрибутам для формирования классифицированной выборки. Отображают извлеченную отфильтрованную информацию о действиях. 3 н. и 9 з.п. ф-лы, 6 ил.

Способ двухуровневого поиска информации в предварительно преобразованном структурированном массиве данных // 2571406

Изобретение относится к области поиска релевантной информации в массивах данных, содержащих текст на естественном языке. Техническим результатом является повышение точности поиска информации. В способе поиска релевантной информации в структурированном исходном массиве данных формируют поисковый запрос. Идентифицируют массив данных, соответствующий запросу, семантическую часть, соответствующую запросу, и логическую конструкцию, содержащую семантическую часть. Демонстрируют идентифицированную логическую конструкцию. Выбирают идентифицированную логическую конструкцию и идентифицируют связанные с ней через связанные семантические части другие логические конструкции. Причем упомянутая идентификация осуществляется на основании сведений из карты связей компонентов. Идентифицируют логические конструкции, содержащие связанные семантические части, и демонстрируют логические конструкции, содержащие связанные семантические части, или демонстрируют отсутствие логических конструкций, содержащих связанные семантические части. 4 н. и 11 з.п. ф-лы, 19 ил., 6 табл.

Способ формирования карты связей компонентов преобразованного структурированного массива данных // 2571407

Изобретение относится к обработке массивов данных, содержащих текст на естественном языке. Техническим результатом является повышение релевантности результатов поиска за счет обеспечения корректной карты связей компонентов логических конструкций. В способе формирования карты связей идентифицируют компоненты семантических частей, причем компонент содержит не более одного значения компонента, и формируют таблицу компонентов. Идентифицируют семантические части, содержащие и не содержащие компоненты. Идентифицируют компоненты, которых содержится более одного в семантических частях, идентифицируют сочетания компонентов и формируют карту сочетаний компонентов. Идентифицируют значения компонентов в карте сочетаний. В семантических частях, не содержащих компонентов, идентифицируют понятия, семантически совпадающие со значениями компонентов, и формируют таблицу совпадающих понятий. Идентифицируют семантическую часть, не содержащую компонентов и содержащую более одного понятия. Идентифицируют семантическую часть, содержащую более одного компонента, значения которых семантически совпадают с понятиями. Формируют карту сочетаний совпадающих понятий. Формируют карту связей компонентов. 4 н. и 8 з.п. ф-лы, 19 ил., 6 табл.

Мера качества для службы контекста данных // 2571535

Изобретение относится к работам на месторождении. Технический результат - извлечение флюида из пластов-коллекторов в наземные установки, используя выходные данные, сгенерированные с использованием главного приложения на основании результата поиска. Технический результат достигается тем, что выполняют: извлечение контекстной информации из главного приложения; сортировку контекстной информации на совокупность аспектов релевантности, для каждого из которых генерируют профиль поиска, с использованием которого запрашивают первую совокупность поисков; прием совокупности элементов данных месторождения, определяющих атрибут объекта месторождения, полученных от первой совокупности поисков; получение меры качества; передачу элемента данных месторождения как результат поиска главному приложению, если мера качества превышает заранее определенный порог согласованности; запрос второй совокупности поисков, которую ограничивают часто используемой фразой; генерирование выходных данных на основе второго результата поиска и выполнение работы на месторождении с использованием выходных данных. 3 н. 17 з.п. ф-лы, 16 ил.

Способ поиска похожих электронных документов, размещенных на устройствах хранения данных // 2571539

Изобретение относится к способам поиска на устройствах хранения данных электронных документов, похожих стилистически и по смыслу на выбранный документ. Техническим результатом является повышение точности поиска подобных электронных документов в массиве документов различного стиля. В способе поиска похожих по смысловому содержимому электронных документов, размещенных на устройствах хранения данных, осуществляют загрузку двух электронных документов. Определяют параметры поиска путем задания правил формирования множества уникальных слов, формируют множество взвешенных уникальных слов и взвешенных связей между ними. Строят семантическую сеть и производят поиск похожих по смыслу документов путем сравнения семантических сетей. При этом дополнительно задают правила формирования стилистических образов документов путем определения размера матриц частот переходов и выбора элементов матриц частот переходов. Причем элементы матриц частот переходов представляют собой одно из: биграммы и триграммы. Затем формируют матрицы частот переходов документов и сравнивают матрицы частот переходов документов на подобие путем вычисления коэффициента сходства. 2 ил.

Классификация изображений документов на основании контента // 2571545

Изобретение относится к технологиям классификации изображений посредством оптического распознавания символов. Техническим результатом является повышение эффективности классификации документов, основанной на заранее заданных признаках. Предложен способ классификации одного или нескольких изображений документов на основе их контента с использованием устройства с процессором. Способ включает в себя этап, на котором получают изображения документа. Далее согласно способу осуществляют доступ к хранящемуся в памяти набору признаков и анализируют изображения документа для определения расположения блоков. А также осуществляют распознавание изображения документа с использованием технологии оптического распознавания символов для получения данных цифрового контента, представляющих текстовый контент или потенциальный графический контент. 3 н. и 24 з.п. ф-лы, 3 ил.

Способ и сервер для поиска соседнего пользователя в службах социальных сетей // 2571573

В данном изобретении предложены способ и сервер для поиска соседних пользователей в службах социальных сетей (SNS) для увеличения точности результата поиска. Технический результат, состоящий в увеличении точности результата поиска, достигается за счет применения способа поиска соседних пользователей в службах социальных сетей. Указанный способ предусматривает реализацию этапов, на которых: получают информацию о местоположении и идентификаторе (ID) пользователя от клиентского терминала пользователя X; определяют ячейку Y, к которой принадлежит информация о местоположении; сохраняют ID пользователя, информацию о местоположении и время сообщения о пользователе X в списке ячейки Y, причем ячейка Y представляет собой одну из ячеек в массиве ячеек, полученном разделением земной поверхности на ячейки. Ищут пользователей в ячейке Y и в других ячейках, причем ячейка Y и указанные другие ячейки образуют массив из N ячеек. Классифицируют указанных пользователей в соответствии с расстояниями между указанными пользователями и пользователем; и отправляют классифицированные ID пользователей указанных пользователей и расстояния между указанными пользователями и пользователем X в клиентский терминал пользователя X. 2 н. и 3 з.п. ф-лы, 7 ил.

Способ поиска информации в предварительно преобразованном структурированном массиве данных // 2572367

Изобретение относится к области поиска релевантной информации в массивах данных, содержащих текст на естественном языке. Техническим результатом является повышение точности поиска информации. В способе поиска релевантной информации в структурированном исходном массиве данных формируют поисковый запрос, содержащий поисковый термин. Идентифицируют массив данных в исходном массиве данных, соответствующий поисковому термину. Исходный массив данных содержит логические конструкции, представляющие собой взаимосвязанные суждения, являющиеся логическими разделами логических конструкций, состоящими из первых и вторых семантических частей. Первые части являются смысловыми ядрами логических разделов и состоят из элементов, являющихся субъектами и предикатами суждений. Вторые семантические части состоят из признаков элементов смысловых ядер суждений. Идентифицируют грамматически и орфографически верную семантическую часть логических разделов логических конструкций исходного массива данных, содержащую поисковый термин. Идентифицируют логическую конструкцию, содержащую идентифицированную семантическую часть, и демонстрируют идентифицированную логическую конструкцию. 4 н. и 11 з.п. ф-лы, 19 ил., 6 табл.