Создание политики управления доступом на основе предпочтений конфиденциальности клиента

Изобретение относится к созданию политики управления доступом и конфигурированию системы управления доступом с помощью политики управления доступом. Техническим результатом является повышение точности определения набора документов, к которым применяется политика доступа. Система для формирования политики управления доступом содержит пользовательский интерфейс (1) для предоставления пользователю возможности указывать тему (10) и набор разрешений (15), анализатор (2) документов, подсистему (3) ассоциации, средство (5) поиска свойств и средство (6) выбора документов. Анализатор (2) документов анализирует содержимое множества документов (11), чтобы найти набор документов (13), имеющих отношение к теме (10). Средство (5) поиска свойств анализирует содержимое документов (11), чтобы найти отличительное свойство (12) документов, имеющих отношение к теме (10). Средство (6) выбора документов выбирает набор документов (13), основываясь на отличительном свойстве (12). Подсистема (3) ассоциации ассоциирует набор разрешений (15) с набором документов (13), чтобы получить политику (4) управления доступом. 4 н. и 8 з.п. ф-лы, 5 ил.

 

ОБЛАСТЬ ТЕХНИКИ, К КОТОРОЙ ОТНОСИТСЯ ИЗОБРЕТЕНИЕ

Настоящее изобретение имеет отношение к созданию политики управления доступом. Кроме того, настоящее изобретение имеет отношение к конфигурированию системы управления доступом с помощью политики управления доступом.

УРОВЕНЬ ТЕХНИКИ

Электронные медицинские записи, а также электронные персональные медицинские записи все чаще используются, чтобы заменить записи на бумаге в профессиональной медицине и при оказании медицинской помощи на дому.

Информированное согласие является очень важным процессом в профессиональном здравоохранении, в котором пациент принимает некоторые решения в отношении, в частности, использования его данных о здоровье медицинскими работниками. Во многих странах пациент имеет законные права скрывать или ограничивать доступ к определенным частям его электронных медицинских записей. Например, пациент может ограничить доступ к документам, касающимся психического здоровья или злоупотребления наркотиками, так, чтобы только психиатр пациента имел доступ к этим документам. В еще одном примере, такой ограниченный доступ препятствует тому, чтобы другие имели доступ к записям пациента, имеющим отношение к СПИДу. Различные механизмы безопасности были разработаны, чтобы технологически способствовать этому праву, такие как использование запечатанных конвертов в системе Spine NHS в Великобритании или аналогичного механизма в системе NICTIZ в Нидерландах.

В сфере личных медицинских записей пациент несет полную ответственность за определение, кто имеет доступ к его записям. Очень часто пациент желает реализовать очень сложные политики, особенно в том случае, если пациент желает предоставить доступ определенным медицинским работникам, семье или друзьям. В некоторых случаях пациент может пожелать заблокировать их от возможности получить доступ к определенным частям его записей.

HL-7, IHE и HITSP стандартизируют взаимодействия, связанные с согласием пациента, а также форматы, в которых согласие может быть задано. HL-7 определяет директиву согласия CDA R2, в то время как IHE разработал профиль основных положений конфиденциальности согласия пациента. Рабочая группа предпочтений конфиденциальности HITSP собрала требования, имеющие отношение к предпочтениям конфиденциальности пациента в отношении медицинских записей. HL-7 также стандартизировала словари, используемые для управления доступом, такие как объектный словарь, который описывает отличающиеся типы данных электронных медицинских записей. Эти типы данных используются системой управления доступом, которая назначает разрешения/ограничения для разных пользователей в отношении этих типов данных.

"Patient-centric authorization framework for sharing electronic health records", Jing Jin и др., SACMAT'09, 3-5 июня, 2009, Стреза, Италия, раскрывает потребность в безопасном, удобном и простом механизме, который позволяет пользователям быстро и легко авторизировать различные медицинские филиалы для получения доступа к их критически важным записям или подгруппе данных в них. В статье раскрыта модель, в которой семантика и структурный состав документов EHR формулируется в виде иерархической структуры, где внутренние вложенные объекты отмечены и ассоциированы со свойствами, чтобы адресовать важные критерии для совместного использования медицинских данных, таких как типы данных, намеченные цели и информация критической важности. И отдельные примеры EHR, и агрегированная виртуальная составная EHR одинаково моделируются в виде маркированной иерархической структуры. Соответствующие свойства распределяются по категориям в трех аспектах: источник, критическая важность и тип объекта.

РАСКРЫТИЕ ИЗОБРЕТЕНИЯ

Было бы полезно иметь улучшенную систему для создания политики управления доступом. Для более эффективного решения этой задачи первый аспект настоящего изобретения предоставляет систему, содержащую

пользовательский интерфейс для предоставления пользователю возможности указывать тему и набор разрешений;

анализатор документов для анализа содержимого множества документов, чтобы найти набор документов, имеющих отношение к теме; и

подсистему ассоциации для ассоциации набора разрешений с набором документов, чтобы получить политику управления доступом.

Поскольку система принимает во внимание содержимое множества документов, система имеет возможность более точного определения набора документов, к которым пользователь намеревается применить набор разрешений. Это может обеспечить лучший результат, чем подход, который принимает во внимание только структуру или глобальную классификацию документов или записей. Пользователь может быть более уверенным, что тема хорошо преобразуется в набор документов, которые относятся к этой теме. Кроме того, становится легче для пользователя создавать детальную политику управления доступом, потому что пользователь меньше связан с любой иерархической структурой, в которой хранятся документы, и, таким образом, пользователю необходимо менее подробно знать структуру информационной системы.

Анализатор документов может содержать средство поиска свойств для анализа содержимого множества документов, чтобы найти, по меньшей мере, одно отличительное свойство документов, имеющих отношение к теме. Анализатор документов может дополнительно содержать средство выбора документов для выбора набора документов, основываясь на отличительном свойстве. Средство поиска свойств помогает улучшить выбор соответствующих документов. Найдя отличительное свойство документов, относящихся к теме, становится возможным выбрать набор документов посредством поиска документов, имеющих это свойство. Посредством анализа содержимого документов, чтобы найти отличительное свойство, нет необходимости определять все возможные свойства всех возможных тем заранее, что было бы трудоемкой и способствующей ошибкам работой. Кроме того, средство поиска свойств может дать более надежные результаты в среде, где темы и свойства документов, относящиеся к ней, подвергаются изменениям. Более того, во многих случаях невозможно определить общий шаблон для конкретной темы, так как каждый экземпляр записи может отличаться. Например, может быть проблематичным заранее идентифицировать все возможные типы данных электронной медицинской записи, в которой информация о СПИДе в случае конкретного пациента, больного СПИДом, может быть сохранена. Поэтому решение, которое может найти их во время работы, является предпочтительным.

Анализатор документов может содержать средство предварительного выбора для выбора множества документов, которые анализируются посредством средства поиска свойств, основываясь на теме. Это помогает определить это множество документов. Например, средство предварительного выбора документов выбирает множество документов, имеющих отношение к теме. Такой выбор может быть выполнен посредством сравнения типа документа с темой, либо посредством анализа содержимого документов и выбора документов, содержимое которых содержит одно или более слов, имеющих отношение к теме.

Анализатор документов может содержать средство выбора типа данных для выбора, по меньшей мере, одного типа данных, основываясь на теме. Средство предварительного выбора документов может быть выполнено с возможностью выбора множества документов выбранного типа данных. Это эффективный способ найти множество документов, которые применимы, чтобы найти, по меньшей мере, одно отличительное свойство.

Пользовательский интерфейс может быть выполнен с возможностью предоставления пользователю возможности адаптировать набор документов, найденных посредством анализатора документов, чтобы получить адаптированный набор документов, при этом подсистема ассоциации выполнена с возможностью ассоциировать политику управления доступом с адаптированным набором документов. Это позволяет системе принимать во внимание точную настройку выбора, сделанного пользователем. Система может быть выполнена с возможностью, основываясь на сделанном пользователем выборе, получать дополнительные отличительные свойства и повторно искать эти отличительные свойства на основе методов машинного обучения для улучшения будущего использования системы.

Пользовательский интерфейс может быть выполнен с возможностью предоставлять пользователю возможность внести изменения, по меньшей мере, в одно отличительное свойство, найденное посредством средства поиска свойств, при этом средство выбора документов выполнено с возможностью выбора набора документов, основываясь на модифицированном отличительном свойстве. Это предоставляет пользователю возможность уточнить свойства, используемые для выбора документов, с которыми пользователь не согласен, например, чтобы откорректировать свойство, найденное посредством средства поиска. Такие изменения могут быть использованы для улучшения алгоритмов, используемых в средстве поиска, при будущем использовании, используя метод машинного обучения, например.

Изменение может содержать удаление одного или более отличительных свойств, по меньшей мере, одного отличительного свойства. Например, если пользователь предполагает, что одно из свойств не имеет отношения к нему, пользователь может просто удалить это свойство так, чтобы удаленное свойство не использовалось в это время для выбора документов.

Тема может содержать ключевое слово. Это позволяет анализатору документов использовать методы соответствия строк, чтобы найти тему, если ключевое слово встречается в документе. В качестве альтернативы, тема может быть представлена посредством, например, иконки, которая может быть отображена на экране, предоставляя возможность пользователю выбрать одно из множества графических представлений тем, например. Внутри тема может быть представлена посредством ключевого слова в системе. Тема может быть также представлена посредством совокупности ключевых слов, например слов, которые являются синонимами, или слов, которые семантически тесно связаны друг с другом. Тема также может содержать тип документа.

Анализатор документов может быть выполнен с возможностью поиска ключевого слова в содержимом документов. Это способствует эффективной реализации анализатора документов.

Анализатор документов может быть выполнен с возможностью находить дополнительные ключевые слова, основываясь на содержимом документов, содержащих ключевые слова, и выбирать набор документов, основываясь на дополнительных ключевых словах. Это нахождение дополнительных ключевых слов может быть основано на анализе частоты или на другой информации и/или методах обработки естественного языка, чтобы найти дополнительные ключевые слова, которые имеют отношение к ключевым словам, изначально указанным пользователем.

По меньшей мере, одно отличительное свойство может содержать тип данных или ключевое слово. Эти два вида свойств являются весьма подходящими для реализации тщательного и/или эффективного процесса выбора.

Средство поиска свойств может быть выполнено с возможностью применения обработки естественного языка и/или способа поиска информации по содержимому множества документов. Такие методы, в сущности известные в данной области техники, могут быть применены, чтобы успешно найти отличительное свойство.

Система может содержать подсистему управления доступом, выполненную с возможностью быть сконфигурированной посредством политики управления доступом, полученной посредством подсистемы ассоциации. Подсистема управления доступом, сконфигурированная с помощью политики контроля доступа, может осуществлять управление доступом, следуя желаниям пользователя.

В еще одном аспекте изобретение предоставляет рабочую станцию, содержащую систему, описанную выше.

В еще одном аспекте изобретение предоставляет способ создания политики управления доступом, содержащий этапы, на которых

создают политику управления доступом, включающую в себя предоставление пользователю возможности указывать тему и набор разрешений;

анализируют содержимое множества документов, чтобы найти набор документов, имеющих отношение к теме; и

ассоциируют набор разрешений с набором документов, чтобы получить политику управления доступом.

В еще одном аспекте изобретение предоставляет компьютерный программный продукт, содержащий инструкции, предписывающие процессорной системе выполнять способ, описанный выше.

Специалистам в данной области техники будет понятно, что два или более вариантов осуществления, реализаций и/или аспектов настоящего изобретения могут быть комбинированы любым подходящим способом.

Модификации и разновидности, рабочей станции, системы, способа и/или компьютерного программного продукта, которые соответствуют описанным модификациям и разновидностям системы, могут быть осуществлены специалистом в данной области техники на основе настоящего описания.

КРАТКОЕ ОПИСАНИЕ ЧЕРТЕЖЕЙ

Эти и/или другие аспекты изобретения очевидны и будут объяснены со ссылкой на варианты осуществления, описанные ниже. На чертежах:

фиг.1 - блок-схема системы для создания политики управления доступом посредством системы управления доступом;

фиг.2 - блок-схема еще одной системы для создания политики управления доступом посредством системы управления доступом;

фиг.3 - блок-схема последовательности операций способа создания политики управления доступом;

фиг.4 - блок-схема системы управления доступом, включающей в себя систему для создания политики управления доступом; и

фиг.5 - схематичное изображение пользовательского интерфейса для создания политики управления доступом.

ОСУЩЕСТВЛЕНИЕ ИЗОБРЕТЕНИЯ

Способы поиска информации могут быть основаны на статистике терминов в сборнике текстовых документов, то есть, используя количество вхождений термина в документе (частота термина) и/или в совокупности (частота в сборнике), и количестве документов, содержащих термин. Это объяснено в "Baeza-Yates, R., и Ribeiro-Neto, B. (1999). Modern Information Retrieval. Эссекс, Великобритания: ACM Press (далее: Baeza-Yates и др.)". Кроме того, поиск информации, такой статистической информации, наряду с доступными онтологиями, может быть полезным, помогая пользователю определять различные свойства, относящиеся к сбору данных, о которых идет речь.

Клиенты/пациенты обычно имеют предпочтения конфиденциальности с очень высоким уровнем и не знакомы со структурой электронных медицинских записей (EHR) и объектными словарями, используемыми системой EHR, такой как система HL-7, описанная выше. Они испытывают трудности в определении их политик конфиденциальности и разрешений, так как существует большое расхождение между их предпочтениями, с одной стороны, и словарями, используемыми в системах управления доступом, с другой стороны. Таким образом, существует необходимость преобразования их предпочтений высокого уровня в машиночитаемые политики, которые ограничивают использование их медицинских данных, с помощью хорошо управляемого, детального метода.

Например, пациент/клиент может пожелать настроить его предпочтения для его личной медицинской записи (PHR), импортируемой из электронной медицинской записи из его госпиталя. Например, предположим, что он хочет совместно использовать его записи с несколькими пользователями, но хочет скрыть некоторую информацию, такую, как тот факт, что он имел определенное заболевание (например, психическое расстройство, наркомания или СПИД). Он не хочет пересматривать все свои записи в базе данных одну за другой и исключать и/или задавать разрешения для каждого экземпляра своей записи в базе данных, которые содержат критически важную информацию. Не достаточно исключить конкретные типы данных, так как пациент/клиент не может предусмотреть все типы данных и записей, которые могут содержать критически важную информацию. Вместо этого пациент хочет донести до системы IT в очень простой форме, что он хочет скрыть все записи, относящиеся к критически важной информации, например все записи, из которых третье лицо могло бы понять, что у пациента/клиента СПИД. Пациент/клиент хотел бы, чтобы система преобразовала эту высокоуровневую политику (например, ключевое слово "СПИД") в машиночитаемую политику управления доступом, которая определяет разрешения или ограничения на уровне экземпляров типов данных (объектов), заданных посредством, например, словаря HL-7. Политика управления доступом, сформированная посредством системы, может быть определена на уровне типов данных. Однако она также может быть определена на уровне экземпляров объектов данных, например, указывая разрешения для отдельных документов. Например, электронная медицинская запись может содержать, среди других типов данных, также тип данных "предписание назначения", и электронная медицинская запись может иметь несколько экземпляров этого типа данных. Возможно, что только один экземпляр типа "предписание назначения" содержит критически важную информацию, например информацию, имеющую отношение к СПИДу. Только этот конкретный экземпляр типа "предписание назначения" ассоциируется с отдельными разрешениями, имеющими отношение к СПИДу. Другие экземпляры типа "предписание назначения" могут быть ассоциированы с набором разрешений, применимых в целом к экземплярам типа "предписание назначения".

Система и способ, раскрытые в этом описании, могут быть использованы, чтобы преобразовать вводимую клиентом/пациентом информацию (предпочтение конфиденциальности) в машиночитаемую политику управления доступом. Вводимая клиентом информация, т.е. предпочтения конфиденциальности, может быть в виде набора записей (идентификатор пользователя, разрешение, ключевое слово). Например, набор записей (Доктор Джон Смит, Чтение, СПИД) будет означать, что доктор Джон Смит может читать записи клиента, имеющие отношение к СПИДу. Машиночитаемая политика может быть в виде набора записей (идентификатор пользователя, разрешение, идентификатор объекта данных). Последняя запись может указывать объект данных, к которому пользователь имеет конкретное разрешение. Методы, раскрытые в этом описании, могут быть использованы, чтобы преобразовывать ключевое слово или тему, указанные пациентом, в набор объектов в электронной медицинской записи, которые содержат информацию, относящуюся к ключевым словам.

Фиг.1 иллюстрирует аспекты системы для формирования политики управления доступом. Прямоугольниками (например, 1) обозначены функциональные блоки системы. Параллелограммы (например, 10) представляют элементы данных. Стрелки указывают потоки информации между функциональными блоками. Разделение функциональности между функциональными блоками представлено только в качестве примера. Система может быть реализована, по меньшей мере, частично на компьютерной системе. Такая компьютерная система может быть реализована в виде отдельной рабочей станции, которая имеет предпочтительный доступ к оперативной базе данных. Система также может быть реализована на сервере и может быть предоставлена посредством веб-интерфейса или пользовательского интерфейса на основе клиент-сервер. Другие реализации также возможны. Общие элементы компьютерной системы, такие как жесткий диск, клавиатура, дисплей, коммуникационный порт и тому подобные, известны специалистам в данной области техники и не будут описаны здесь более подробно.

Система может содержать пользовательский интерфейс 1 для предоставления возможности одному или более пользователям взаимодействовать с системой. Этот интерфейс может быть основан на технологии веб или реализован другим подходящим способом. Пользовательский интерфейс может иметь много других элементов пользовательского интерфейса и обеспечивать другие функциональные возможности, которые не описаны в данном описании. В данном описании описываются только те элементы пользовательского интерфейса, которые необходимы для правильного понимания методов, раскрытых в этом описании. Пользовательский интерфейс 1 может быть выполнен с возможностью предоставления пользователю возможности указывать тему 10 и набор 15 разрешений. Например, пользовательский интерфейс может отображать список тем в виде текстового или графического представления (иконок), представляющего различные темы, которые могут быть объектом управления доступом, и предоставлять пользователю возможность выбирать одну или несколько тем посредством прикосновения или нажатия на текстовое или графическое представление. В качестве альтернативы, пользователю может быть представлено текстовое поле, в котором пользователю предоставляется возможность ввести текстовое выражение, например, одно или несколько ключевых слов или, например, фраз. Тема 10 или темы, полученные таким образом, могут быть сохранены во временной памяти и/или переданы через сеть к компьютерной системе, содержащей анализатор 2 документов. Набор 15 разрешений доступа может быть указан пользователем таким же образом, например, посредством предоставления пользователю возможности выбрать один набор разрешений из списка представлений наборов разрешений. В качестве альтернативы, пользователю может быть представлен список отдельных разрешений и предоставлена возможность выбрать одно или несколько разрешений, показанных для включения или исключения из набора разрешений. В качестве альтернативы, пользователю может быть предоставлена возможность вводить набор разрешений в текстовой форме. Примеры разрешений: разрешения на чтение, запись, изменение, создание, удаление, печать или пересылку. Пользовательский интерфейс 1 дополнительно может быть выполнен с возможностью предоставления пользователю возможности указывать, по меньшей мере, одного пользователя 16, к которому набор 15 разрешений должен быть применен. Например, упомянутый, по меньшей мере, один пользователь 16 может быть отдельным пользователем, множеством конкретно указанных пользователей или группой пользователей. Такая группа пользователей может быть определена по их роли или по организации, например. Пользовательский интерфейс 1 дополнительно может быть выполнен с возможностью предоставлять пользователю возможность задавать множество пар, каждая пара ассоциирует набор 15 разрешений, по меньшей мере, с одним пользователем 16. Эти разрешения и пары, заданные пользователем, затем могут быть ассоциированы с набором выбранных документов, как будет описано ниже.

Система может дополнительно включать в себя анализатор 2 документов для анализа содержания множества 11 документов, чтобы найти набор 13 документов, имеющих отношение к теме 10. Например, может быть осуществлен поиск ключевого слова в документах, и все документы, содержащие ключевое слово могут быть включены в набор 13 документов. Множество 11 документов может состоять из всех документов в электронной медицинской записи, хранящейся в базе 14 данных пациентов. Однако также возможно, чтобы содержимое только подмножества документов в электронной медицинской записи анализировалось. Анализатор документов может выполнять свою задачу несколькими методами, которые будут пояснены ниже.

Система может дополнительно включать в себя подсистему 3 ассоциации для ассоциации набора 15 разрешений с набором 13 документов. Кроме того, по меньшей мере, один пользователь 16, которому набор 15 разрешений предоставляется, может быть ассоциирован с набором 15 разрешений. Таким образом формируется политика 4 управления доступом. Политика 4 управления доступом может содержать набор записей (UID, P, OID)=(ID пользователя, разрешения, ID объекта). Такой набор записей указывает, что пользователь, идентифицированный посредством UID, получил разрешение P в отношении объекта (например, документа или экземпляра типа документа), идентифицированного посредством OID. Например, копия набора 15 разрешений для каждого пользователя 16 или группы пользователей сохраняется в виде набора атрибутов с каждым документом в наборе 13 документов, чтобы сформировать политику 4 управления доступом. В качестве альтернативы сформированные наборы записей (UID, P, OID) могут быть сохранены как политика 4 управления доступом, например, в виде матрицы контроля доступа, набора логических правил или в формате XACML. Такие форматы, в которых политика 4 управления доступом может быть представлена и/или сохранена, в сущности, известны специалистам в этой области техники. Набор 13 документов также может быть зашифрован посредством подсистемы 3 ассоциации, если набор разрешений так предписывает.

Анализатор 2 документов может содержать средство 8 выбора типов данных для выбора, по меньшей мере, одного типа данных, основываясь на теме 10. Этот средство 8 выбора типов данных может быть объединено с пользовательским интерфейсом 1, например, в варианте осуществления, в котором пользовательский интерфейс 1 отображает список типов данных, из которого пользователь может выбрать. В качестве альтернативы пользователю может быть предоставлена возможность указать тему 10, которая преобразуется посредством средства 8 выбора типов данных в один или более соответствующих типов данных. Этот этап преобразования может быть основан на информации, хранящейся в онтологии, такой как SNOMED. Это преобразование или приведение в соответствие может быть достигнуто непосредственно или через этап морфологического поиска (известный, например, из Baeza-Yates и др., с. 168), чтобы лучше обрабатывать введенное без ограничений ключевое слово, т.е. путем сопоставления только основы слова вместо всего введенного без ограничений ключевого слова. Соответствие может быть приведено, например, с помощью существующей онтологии (например, соответствующей кодам SNOMED) и/или используя базу данных, содержащую все типы данных, выбранные другими клиентами, используя то же ключевое слово. Средство 8 выбора типа данных также может быть выполнено с возможностью поиска документов, содержащих ключевое слово, и выбора типов документов из документов, содержащих ключевое слово. Пользовательский интерфейс 1 может быть выполнен с возможностью отображения автоматически выбранных типов данных вместе с примером документа этого типа данных, чтобы предоставить пользователю возможность выбирать (отменять выбор) типы данных для дальнейшей обработки.

Анализатор 2 документов может дополнительно содержать средство 7 предварительного выбора документов для выбора, основываясь на теме 10, множества 11 документов, которые анализируются посредством средства 5 поиска свойств. Например, средство 7 предварительного выбора документов может быть выполнено с возможностью выполнять поиск по ключевому слову одного или более ключевых слов, имеющих отношение к теме 10. Например, сама тема 10 может быть представлена посредством ключевого слова, а средство 7 предварительного выбора документов может быть выполнено с возможностью находить документы, которые содержат это слово. Кроме того, дополнительные ключевые слова могут быть найдены, используя онтологию, и документы, содержащие эти дополнительные ключевые слова, также могут быть включены в это множество документов.

В случае если система содержит средство 8 выбора типов данных, средство 7 предварительного выбора документов может быть выполнено с возможностью выбора множества 11 документов с выбранными типами данных.

Анализатор 2 документов может содержать средство 5 поиска свойств для анализа содержимого множества 11 документов, чтобы найти, по меньшей мере, одно отличительное свойство 12 документов, имеющее отношение к теме 10. Таким отличительным свойством 12 может быть присутствие конкретного ключевого слова в содержимом и/или метаданных документа. Поскольку множество 11 документов, сформированное посредством средства 7 предварительного выбора документов, имеют, по меньшей мере, некоторое содержимое, имеющее отношение к данной теме 10, то можно извлечь из этого содержимого свойства документов, имеющие отношение к теме 10. Например, СПИД имеет отношение к некоторым конкретным препаратам, например, ламивудин, этравирин, типранавир и/или энфувиртид. Поскольку эти термины могут встречаться во множестве 11 документов, система может сделать вывод, что документы, содержащие термины ламивудин, этравирин, типранавир и/или энфувиртид, имеют отличительное свойство документов, имеющих отношение к СПИДу, потому что третье лицо может сделать вывод, что у пациента заболевание, имеющее отношение к СПИДу, если он знает, что эти препараты предписаны.

Такое соотношение между заболеванием и соответствующими препаратами может быть уже включено в онтологию, а если нет, такое соотношение может быть получено из множества 11 документов, и будет несколько документов, в которых диагноз заболевания связан с предписанными препаратами. Следовательно, система может узнать такие ассоциации из документов. В целом, это может быть сделано, используя характерные лексические и информационно-поисковые алгоритмы.

Поиск синонимов ключевого слова. Синонимы могут быть найдены в словаре общего применения, а также в конкретном медицинском словаре, который охватывает медицинскую терминологию. Каждому синониму может быть присвоен номер, представляющий его релевантность по отношению к теме, указанной клиентом.

Поиск наиболее часто используемых терминов во множестве 11 документов, выбранном посредством средства 7 предварительного выбора документов. Наиболее часто используемые термины могут быть выбраны с помощью способа поиска информации, основываясь, например, на частоте термина в документе и/или обратной частоте документа. Например, ряд документов, содержащих термин, например, такой как tf.idf, BM25, языковые модели, см. Baeza-Yates и др., глава 2: Моделирование. Кроме того, информация о близости термина (фраз) может быть использована для оценки релевантности терминов для пользователя, используя методики, известные, например, из "Term Proximity Scoring for Keyword-Based Retrieval Systems", Rasofolo, Y. и Savoy, J., Advances in Information Retrieval (2003). В результате этой стадии список ключевых слов (и/или фраз) с ассоциированной вероятностью релевантности может быть определен.

Повторная оценка верхних k наиболее релевантных терминов, используя релевантный словарь, например медицинский словарь, который содержит основанный на медицинской базе данных список стоп-слов и статистическое распределение медицинского термина. Этот этап полезен, поскольку распределение термина в медицинских отчетах может существенно отклоняться по сравнению с общим распределением термина. В результате, новая оценка релевантности для верхних k терминов может быть определена. Возможно продолжать только c l терминами с наиболее высокой релевантностью, при этом l<k.

Параметры k и l, упомянутые выше, могут быть заданы администратором, клиентом или определены эмпирически, например.

Пользовательский интерфейс 1 может быть выполнен с возможностью отображения списка дополнительных ключевых слов и предоставления пользователю возможности выбрать те, которые он хотел бы включить во вторичный поиск. В необязательном порядке релевантность каждого термина должна быть отображена. В качестве альтернативы, выбор дополнительных ключевых слов выполняется автоматически, и ключевые слова перенаправляются к средству 6 выбора документов без взаимодействия с пользователем.

Отличительные свойства, кроме наличия ключевых слов, также могут поддерживаться, например, могут быть сформированы более сложные логические выражения, включающие в себя одно или нескольких ключевых слов (например, наличие ключевого слова А, но не ключевого слова B), или свойства, имеющие отношение к метаданным или атрибутам документов. По меньшей мере, одно отличительное свойство 12 также может включать в себя тип данных. Средство 5 поиска свойств может быть выполнено с возможностью применения обработки естественного языка и/или способа поиска информации к содержимому множества 11 документов.

Анализатор 2 документов может дополнительно содержать средство 6 выбора документов для выбора набора 13 документов, основываясь на отличительном свойстве 12. В случае если в отличительном свойстве 12 присутствует ключевое слово, поиск по ключевому слову может быть выполнен по всем документам в электронной медицинской записи. В случае логического выражения, это логическое выражение может быть проанализировано во всех документах в электронной медицинской записи.

Средство 6 выбора документов может быть выполнено с возможностью выполнения дополнительного поиска документов, основываясь на отличительном свойстве, например выбранных ключевых словах, в виде расширения запроса (см., например, "Query Expansion", Efthimiadis, E. N., 1996, in: Annual Review of Information Systems and Technology (ARIST)). Этот дополнительный поиск может быть выполнен, используя способ поиска информации, который может быть таким же или аналогичным тому, который использовался на предыдущем этапе. Однако в этом случае законченные записи могут быть проанализированы на основе выбранных ключевых слов, используя способ поиска информации.

Первые, верхние m записей, которые наиболее релевантны выбранным ключевым словам, могут быть идентифицированы (при этом оценивается степень релевантности). Эти записи могут быть ранжированы в порядке убывания в соответствии с релевантностью и, в необязательном порядке, представлены пользователю для выбора. После этого релевантность записей может быть агрегирована, основываясь на их ассоциации с типами данных. Список верхних n типов данных может быть представлен пользователю в порядке убывания. Как и на предыдущем этапе, выбор m и n может быть либо определен эмпирически, либо предварительно выбран пользователем. Пользователю может быть предоставлена возможность выбрать, какие типы данных и/или записи он также хотел бы добавить к набору ограниченных типов данных. При выборе типа данных автоматический выбор записей, принадлежащих к этому типу данных, может быть реализован, например.

Пользовательский интерфейс 1 может быть выполнен с возможностью отображения множества 13 документов, найденных посредством анализатора 2 документов. Пользовательский интерфейс дополнительно может быть выполнен с возможностью предоставлять пользователю возможность адаптировать набор 13 документов для получения адаптированного набора 13' документов. Подсистема 3 ассоциации может быть, соответственно, выполнена с возможностью ассоциировать набор 15 разрешений с адаптированным набором 13' документов. В качестве альтернативы, набор 13 документов обрабатывается посредством подсистемы 3 ассоциации без вмешательства пользователя.

Как упоминалось выше, пользовательский интерфейс 1 может быть выполнен с возможностью предоставлять пользователю возможность внести изменения, по меньшей мере, в одном отличительном свойстве 12, найденном посредством средства 5 поиска свойств, а средство 6 выбора документов может быть выполнено с возможностью выбора набора 13 документов, основываясь на модифицированном отличительном свойстве 12'.

Система может дополнительно включать в себя подсистему 9 управления доступом, выполненную с возможностью быть сконфигурированной посредством политики 4 управления доступом, полученной посредством подсистемы 3 ассоциации. Подсистема 9 управления доступом может быть выполнена с возможностью принудительно применять набор 15 разрешений в отношении множества 13 документов и, по меньшей мере, одного пользователя 16. Такие системы управления доступом, в сущности, известны в данной области техники и могут быть построены специалистом в данной области техники, принимая во внимание настоящее описание.

Фиг.2 иллюстрирует аналогичную систему для формирования политики управления доступом. Только отличия от системы на фиг.1 описаны здесь. Аналогичные объекты указаны на фиг.2 с использованием тех же ссылочных номеров. В системе на фиг.2 тема содержит ключевое слово 210. Анализатор 202 документов выполнен с возможностью поиска ключевого слова 210 в содержимом документов 214 электронной медицинской записи, чтобы получить множество 211 документов, содержащих ключевое слово 210. Анализатор 202 документов может быть выполнен с возможностью находить дополнительные ключевые слова 212, основываясь на содержимом документов 211, содержащих ключевое слово 210, методом, изложенным в настоящем описании, а также выбирать набор 13 документов на основе дополнительного ключевого слова 212.

На фиг.3 показана блок-схема последовательности операций способа создания политики управления доступом. Способ может содержать этап 301, на котором предоставляют пользователю возможность указать тему и набор разрешений. Способ может перейти к этапу 302, на котором анализируют содержимое множества документов, чтобы найти набор документов, имеющих отношение к теме. Способ может перейти к этапу 303, на котором ассоциируют набор разрешений с набором документов, чтобы получить политику управления доступом. На этом способ может завершиться. В качестве альтернативы, способ может продолжиться на этапе 304, на котором предписывают доступ к набору документов в соответствии с ассоциированным набором разрешений. Варианты и расширения способа могут быть осуществлены специалистом в данной области техники, принимая во внимание описание системы в данном описании. Например, пользователю может быть предоставлена возможность указать пользователя или пользователей, которым предоставляется набор разрешений. На этапе 303 ассоциация может быть продолжена так, чтобы набор разрешений ассоциировался и с набором документов, и с указанным пользователем или пользователями. Способы и системы, описанные здесь, могут быть реализованы, по меньшей мере, частично посредством программных средств, таких как компьютерный программный продукт.

Поднабор записей (или документов) может быть идентифицирован в записях (клиента) EHR/PHR, которые содержат информацию, имеющую отношение к определенной клиентом теме, например ключевому слову. Это может быть сделано в три этапа.

Прямое сопоставление (на основе онтологии, например): идентифицируют типы данных, которые содержат записи (например, документы), релевантные предпочтениям конфиденциальности клиента. Прямое сопоставление может быть установлено между ключевым словом (например, СПИД), указанным пользователем в его или ее предпочтениях конфиденциальности, и типами данных, которые содержат релевантные документы. Это соответствие может быть установлено, например, на основе существующей онтологии (например, соответствующих кодов SNOMED). Типы данных и/или документы, для которых определено, что они имеют отношение к ключевому слову, заданному пользователем, помечаются, и доступ к ним ограничивается, как задано в предпочтениях конфиденциальности клиента. Также возможно, например, выполнять прямой поиск документов, содержащих ключевое слово или ключевое слово, имеющее отношение к заданному пользователем ключевому слову в соответствии с существующей онтологией. Таким образом, этап выбора типов документов может быть пропущен.

Извлечение дополнительных ключевых слов: на втором этапе дополнительные ключевые слова могут быть извлечены из релевантных документов (или типов данных), идентифицированных на первом этапе. Например, ключевым словом может быть наименование препарата, упомянутое в одной из записей, которое прямо сопоставимо с первоначально заданным ключевым словом.

Идентификация дополнительной записи: остальные записи находятся, используя определенное пользователем ключевое слово плюс дополнительные ключевые слова, извлеченные на втором этапе. Это задействует дополнительные типы данных и/или записи, которые клиент может использовать, чтобы задать свои политики конфиденциальности.

Кроме того, релевантность (показатель достоверности) выбранных ключевых слов, записей или типов данных может быть рассчитана на каждом этапе и может быть представлена на дисплее, чтобы помочь пользователю при задании его политики конфиденциальности. Ограниченное количество и/или верхние x объектов могут быть возвращены пользователю для автоматизации или ускорения процесса задания. Политика управления доступом, определенная пользователем, применяется к идентифицированным записям.

Отметим, что предыдущие три этапа могут задействовать взаимодействие с пользователем на всех этапах для определения политики безопасности. Однако поднабор или все эти этапы могут быть автоматизированы, в частности, когда достаточно эмпирических результатов (типичных профилей выбора пользовательской политики) и достаточно велика база данных политик конфиденциальности пользователей. В таком случае определение политик безопасности может быть реализовано с меньшим взаимодействием с пользователем и меньшим объемом возвращаемой информации в течение различных этапов. Например, на последнем этапе только менее релевантные типы данных и наиболее конкретные записи могут быть показаны, в то время как система автоматически включит типы данных и записи, релевантность которых выше эмпирически определенного порогового значения.

На фиг.4 показана схема с общим представлением окружения системы 403 для формирования политики доступа. Входом системы 403 является электронная медицинская запись, содержащая множество 401 документов. Дополнительным входом системы 403 является онтология 402. Система 403 содержит пользовательский интерфейс 405 и анализатор 404 документов. Как условно показано стрелками между анализатором 404 документов и пользовательским интерфейсом 405, может быть три стадии взаимодействия: первое указание темы посредством, например, ключевого слова; первый выбор пользователем типов данных/документов предложенных анализатором 404 документов; и окончательный выбор пользователем типов данных/документов предложенных анализатором 404 документов. Результат 409 может содержать сопоставление 408 первоначальной темы/ключевого слова 406 в наборе 407 типов данных/документов. Чтобы создать политику управления доступом, набор разрешений может быть ассоциирован с набором 407 документов. Эти ассоциации могут быть использованы несколькими способами, например, с помощью персонального диспетчера 409 предпочтений, чтобы сохранять политику управления доступом и/или сопоставление 408 в персональном профиле пользователя для использования в будущем. Это позволяет пользователю легче применять разрешения к документам, имеющим отношение к этому ключевому слову. Система 410 контроля доступа может работать под управлением политики управления доступом. Компонент 411 машинного обучения может быть выполнен с возможностью создания сопоставлений общего использования между ключевыми словами и типами данных/дополнительными ключевыми словами, основываясь на сопоставлении 408. Эти сопоставления общего использования могут быть результатом сопоставлений 408, производимых различными пользователями, и знания, заключенные в них, могут быть использованы для улучшения составляющих автоматической обработки анализатора 403 документов, используя методы машинного обучения, в сущности, известные в данной области техники. Таким образом, взаимодействие с пользователем анализатора 403 документов может быть уменьшено или полностью исключено.

Фиг.5 - схематичное изображение макета пользовательского интерфейса, который может быть сформирован посредством пользовательского интерфейса 1, который предоставляет пользователю возможность выбирать из некоторого количества типов данных и/или документов. Такой макет интерфейса может быть использован, чтобы предоставить пользователю возможность сделать выбор на отличающихся интерактивных этапах процесса создания политики управления доступом. В KWD введенное пользователем ключевое слово или указанные темы могут быть показаны. В DT1, DT2,..., DTm могут быть показаны отличающиеся типы данных, считающиеся релевантными ключевому слову/теме. В R1_DT1, R2_DT1,..., Rn_DT2 показаны документы типа DT1 данных. В R1_DT2, R2_DT2,..., Rn_DT2 показаны документы типа DT2 данных. В R1_DTm, R2_DTm,..., Rn_DTm показаны документы типа DTm данных. Таким образом, показаны m типов данных и n документов для каждого типа. Следует отметить, что количество документов, показанное для каждого типа, не должно быть одинаковым для каждого типа. Около каждого типа данных и документов показан флажок, который предоставляет пользователю возможность выбрать 501 или отменить 502 выбор конкретного типа данных или документа, которые будут включены в следующий этап обработки. Включение документов типа DT2, выбор 501, обычно означает автоматическое включение всех документов R1_DT2, R2_DT2,..., Rn_DT2 этого типа DT2 документов. Такие детали могут быть учтены в пользовательском интерфейсе 1. Возможно исключить либо типы DT1, DT2,..., DTm документов, либо отдельные документы Rx_DTy из пользовательского интерфейса 1 в случае, если, и, следовательно, их ввод не ожидается в этот конкретный момент в процедуре.

Следует иметь в виду, что настоящее изобретение также распространяется на компьютерные программы, в частности компьютерные программы на носителе, выполненном с возможностью осуществления изобретения на практике. Программа может быть в виде исходного кода, объектного кода, промежуточного исходного кода и объектного кода, например, в частично скомпилированной форме или в любой другой форме, подходящей для использования при реализации способа в соответствии с изобретением. Следует также иметь в виду, что такая программа может иметь много отличающихся архитектурных конструкций. Например, программный код, реализующий функциональные возможности способа или системы в соответствии с настоящим изобретением, может быть подразделен на одну или более подпрограмм. Много отличающихся методов распределения функциональных возможностей по этим подпрограммам будут очевидны специалистам в данной области техники. Подпрограммы могут быть сохранены вместе в одном исполняемом файле, чтобы сформировать автономную программу. Такой исполняемый файл может содержать выполняемые компьютером инструкции, например инструкции процессору и/или инструкции интерпретатору (например, инструкции интерпретатору Java). В качестве альтернативы, один или несколько или все подпрограммы могут быть сохранены, по меньшей мере, в одном внешнем файле библиотеки и связываться с основной программой либо статически, либо динамически, например, во время выполнения. Основная программа содержит, по меньшей мере, один вызов, по меньшей мере, одной из подпрограмм. Подпрограммы также могут содержать вызовы друг друга. Вариант осуществления, имеющий отношение к компьютерному программному продукту, содержит выполняемые компьютером инструкции, соответствующие каждому этапу обработки, по меньшей мере, одного из способов, изложенных в данном описании. Эти инструкции могут быть подразделены на подпрограммы и/или сохранены в одном или более файлов, которые могут быть связаны статически или динамически. Еще один вариант осуществления, имеющий отношение к компьютерному программному продукту, содержит выполняемые компьютером инструкции, соответствующие каждому средству, по меньшей мере, одной из систем и/или продуктов, раскрытых в данном описании. Эти инструкции могут быть подразделены на подпрограммы и/или сохранены в одном или более файлов, которые могут быть связаны статически или динамически.

Носителем компьютерной программы может быть любой модуль или устройство, выполненное с возможностью содержать программы. Например, носитель может включать в себя носитель данных, такой как ROM, например CD ROM или полупроводниковое ROM, или магнитный носитель записи, например гибкий диск или жесткий диск. Кроме того, носитель может быть передающимся носителем, таким как электрический или оптический сигнал, который может быть передан через электрический или оптический кабель или посредством радио или других средств. Когда программа реализована в таком сигнале, носитель может состоять из такого кабеля или другого устройства или средства. В качестве альтернативы, носитель может представлять собой интегральную схему, в которую вложена программа, упомянутая интегральная схема выполнена с возможностью выполнять или использоваться при выполнении релевантного способа.

Следует отметить, что вышеупомянутые варианты осуществления иллюстрируют, но не ограничивают изобретение, и что специалисты в данной области техники способны разработать множество альтернативных вариантов осуществления, не выходя за рамки объема прилагаемой формулы изобретения. В формуле изобретения любые ссылочные позиции, заключенные в скобки, не должны быть истолкованы как ограничивающие формулу изобретения. Использование глагола "содержит" и его сопряжений не исключает присутствия элементов или этапов, отличных от указанных в формуле изобретения. Упоминание элемента в единственном числе не исключает наличия множества таких элементов. Настоящее изобретение может быть реализовано посредством аппаратных средств, содержащих несколько отдельных элементов, а также посредством соответствующим образом запрограммированного компьютера. В пунктах формулы изобретения, относящихся к устройству, перечисляются несколько средств, при этом некоторые из этих средств могут быть воплощены посредством одного и того же элемента аппаратных средств. Тот факт, что конкретные действия изложены во взаимно отличающихся, зависимых пунктах формулы изобретения, не означает, что комбинация этих действий не может быть выгодно использована.

1. Система для формирования политики управления доступом, содержащая
пользовательский интерфейс (1) для предоставления пользователю возможности указывать тему (10) и набор разрешений (15);
анализатор (2) документов для анализа содержимого множества документов (11), чтобы найти набор документов (13), имеющих отношение к теме (10); и
подсистему (3) ассоциации для ассоциации набора разрешений (15) с набором документов (13), чтобы получить политику (4) управления доступом,
при этом анализатор (2) документов содержит средство (5) поиска свойств для анализа содержимого множества документов (11), чтобы найти, по меньшей мере, одно отличительное свойство (12) документов, имеющих отношение к теме (10), и средство (6) выбора документов для выбора набора документов (13), основываясь на отличительном свойстве (12);
при этом анализатор (2) документов также содержит средство (8) выбора типов данных для выбора, по меньшей мере, одного типа данных, основываясь на теме (10), причем тема (10) преобразуется посредством средства (8) выбора типов данных в один или более соответствующих типов данных; и
средство (7) предварительного выбора документов для выбора, основываясь на теме (10), множества документов (11), причем средство (7) предварительного выбора документов выполнено с возможностью выбора множества документов (11) одного или более соответствующих типов данных.

2. Система по п. 1, в которой пользовательский интерфейс (1) выполнен с возможностью предоставлять пользователю возможность адаптировать набор документов (13), найденный посредством анализатора (2) документов, чтобы получить адаптированный набор документов (13′), и в которой подсистема (3) ассоциации выполнена с возможностью ассоциировать набор разрешений (15) с адаптированным набором документов (13′).

3. Система по п. 1, в которой пользовательский интерфейс (1) выполнен с возможностью предоставлять пользователю возможность осуществлять изменения, по меньшей мере, в одном отличительном свойстве (12), найденном посредством средства (5) поиска свойств, и в которой средство (6) выбора документов выполнено с возможностью выбирать набор документов (13), основываясь на модифицированном свойстве (12′).

4. Система по п. 1, в которой тема содержит ключевое слово (210).

5. Система по п. 4, в которой анализатор (202) документов выполнен с возможностью поиска ключевого слова (210) в содержимом документов (214).

6. Система по п. 5, в которой анализатор (202) документов выполнен с возможностью находить дополнительные ключевые слова (212), основываясь на содержимом документов (211), содержащих ключевое слово (210), и выбирать набор документов (13), основываясь на дополнительных ключевых словах (212).

7. Система по п. 1, в которой, по меньшей мере, одно отличительное свойство (12) содержит тип данных или ключевое слово.

8. Система по п. 1, в которой средство (5) поиска свойств выполнено с возможностью применять обработку естественного языка и/или способ поиска информации к содержимому множества документов (11).

9. Система по п. 1, дополнительно содержащая подсистему (9) управления доступом, выполненную с возможностью ее конфигурирования с помощью политики (4) управления доступом, полученной посредством подсистемы (3) ассоциации.

10. Рабочая станция, содержащая систему по п. 1.

11. Способ создания политики управления доступом, содержащий этапы, на которых
предоставляют (301) пользователю возможность указывать тему и набор разрешений;
анализируют (302) содержимое множества документов, чтобы найти, по меньшей мере, одно отличительное свойство (12) документов, имеющих отношение к теме (10); и
выбирают набор документов, имеющих отношение к теме, основываясь на отличительном свойстве (12); и
ассоциируют (303) набор разрешений с этим набором документов, чтобы получить политику управления доступом; и
выбирают, по меньшей мере, один тип данных, основываясь на теме;
преобразуют тему в один или более соответствующих типов данных; и
предварительно выбирают множество документов (11), причем множество документов (11) является одним или более соответствующих типов данных.

12. Носитель, имеющий компьютерную программу, хранящуюся на нем, при этом компьютерная программа содержит инструкции, предписывающие процессорной системе выполнять способ по п. 11.



 

Похожие патенты:

Изобретение относится к технологиям аутентификации при использовании электронных устройств. Техническим результатом является обеспечение аутентификации посредством установлении собственных элементов ввода, в качестве элементов ввода для аутентификации, для отдельных прикладных программ.

Изобретение относится к безопасности терминалов. Технический результат заключается в повышении эффективности защиты от подделок терминалов.

Изобретение относится к области защиты апплетов от анализа. Техническим результатом является эффективная защита от атак через скрытые каналы.

Изобретение относится к области доступа к данным в Интернет. Технический результат - обеспечение авторизованного доступа к данным хранилища данных изолированным приложением.

Изобретение относится к защите данных. Технический результат заключается в предотвращении утечки конфиденциальной информации при передаче через беспроводную сеть.

Изобретение относится к вычислительной технике. Технический результат заключается в оптимизации модификации разрешений на доступ к защищенному анклаву памяти.

Изобретение относится к защите данных. Технический результат - обеспечение безопасного доступа к записи данных.

Изобретение относится к управлению и контролю различных данных личной идентификации. Технический результат - создание производной идентификации на базе родительской идентификации, при этом между этими двумя идентификациями невозможно отследить на практике.

Изобретение относится к области компьютерной безопасности. Технический результат заключается в повышении безопасности вычислительного устройства.

Изобретение относится к области компьютерной безопасности. Технический результат заключается в минимизации количества ложных срабатываний при обнаружении вредоносного программного обеспечения (ПО).

Изобретение относится к системам распределения и хранения данных. Технический результат заключается в повышении качества обслуживания процесса управления запросами в системе хранения данных.

Изобретение относится к способу и устройству обеспечения исполнения внешнего JavaScript (JS) с использованием расширенного интерфейса JS. Технический результат заключается в предоставлении поиска и просмотра web-страниц с использованием платформы WebApp.

Изобретение относится к области связи. Техническим результатом является повышение эффективности эксплуатации и управления браузером для сервера и клиента, содержащего браузер.

Изобретение относится к технологиям обработки электронных документов. Техническим результатом является обеспечение классификации изображений документов на основе функции классификации.

Изобретение относится к электронному портфолио работника по безопасности производства. Технический результат заключается в обеспечении санкционированного доступа к сведениям о работнике.

Изобретение относится к области хранения пространственных объектов. Техническим результатом является снижение нагрузки на сервер при выборе объектов благодаря использованию односвязного списка.

Изобретение относится к обработке данных. Технический результат заключается в повышении точности оценки сходства массивов бинарных данных.

Изобретение относится к области информационных технологий, в частности к устройствам обработки информации, таким как сервер управления документами. Технический результат заключается в повышении скорости извлечения документов за счет исключения необходимости определения иерархической структуры папок хранения документов.

Изобретение относится к области обработки информации. Технический результат - обеспечение повышения точности процесса поиска и слежения за движущимся объектом в изображениях.

Изобретение относится к технологиям мгновенного обмена сообщениями. Техническим результатом является осуществление автоматизированного приглашения пользователей в группу.
Наверх