Автоматизированное восстановление и передача по инстанции в комплексных распределенных приложениях

Изобретение относится к области сред связи с сетевой структурой. Техническим результатом является сопоставление обнаруженных оповещений с действиями по восстановлению для автоматического разрешения проблем в среде связи с сетевой структурой. Оповещения, основанные на обнаруженных аппаратных и/или программных проблемах в среде комплексного распределенного приложения, сопоставляются с действиями по восстановлению для автоматического разрешения проблем. Несопоставленные оповещения передаются по инстанции назначенным людям или группам посредством циклического способа передачи по инстанции, который включает в себя подтверждающее уведомление о передаче обработки от назначенного человека или группы. Информация, собранная для каждого оповещения, как, впрочем, и решения посредством процесса передачи по инстанции, могут записываться для расширения базы знаний автоматизированного разрешения. 3 н. и 17 з.п. ф-лы, 6 ил.

 

ПРЕДПОСЫЛКИ СОЗДАНИЯ ИЗОБРЕТЕНИЯ

В сегодняшних средах связи с сетевой структурой множество используемых услуг, которые ранее предоставлялись посредством локально исполняемых приложений, предоставляются посредством распределенных услуг. Например, услуги электронной почты, услуги работы с календарем/планирования и сопоставимые предоставляются посредством комплексных систем с сетевой структурой, которые задействуют некоторое количество физических и виртуальных серверов, средств хранения и прочих компонентов, невзирая на географические расстояния. Даже организационные системы, такие как корпоративные сети, могут быть реализованы посредством физически разобщенных групп серверов и т.д.

Несмотря на то что распределенные услуги создают условия для более простого управления установкой, обновлением и эксплуатацией приложений (т.е. вместо установки, обновления и эксплуатации сотен, если не тысяч, локальных приложений, услуга с централизованным управлением может позаботиться о данных задачах), такие услуги все же задействуют некоторое количество приложений, исполняемых на нескольких серверах. При непрерывном управлении такими приложениями с крупномасштабным распределением можно ожидать появления целого ряда проблем. Регулярно могут происходить сбои аппаратного обеспечения, проблемы программного обеспечения и прочие непредсказуемые затруднения. Попытка осуществления управления и восстановления после таких проблем вручную может потребовать наличия непомерно дорогого количества специализированных и со знаниями в определенной области операционных инженеров.

КРАТКОЕ ОПИСАНИЕ СУЩНОСТИ ИЗОБРЕТЕНИЯ

Данное краткое описание сущности изобретения предоставлено в качестве ознакомления в упрощенном виде с подборкой концепций, которые дополнительно описаны ниже в Подробном Описании. Данное Краткое Описание Сущности Изобретения, как не предназначено установить ключевые признаки или неотъемлемые признаки изобретения, так и не предназначено использоваться в качестве средства при определении объема заявленного изобретения.

Варианты осуществления направлены на сопоставление обнаруженных оповещений с действиями по восстановлению для автоматического разрешения проблем в среде связи с сетевой структурой. Несопоставленные оповещения могут передаваться назначенным людям посредством циклического способа передачи по инстанции (эскалации), который включает в себя подтверждающее уведомление о передаче обработки от назначенного человека. В соответствии с некоторыми вариантами осуществления информация, собранная для каждого оповещения, как, впрочем, и решения посредством процесса передачи по инстанции, могут записываться для расширения базы знаний автоматизированного разрешения.

Эти и прочие признаки и преимущества станут очевидны из прочтения нижеследующего подробного описания и рассмотрения связанных с ним чертежей. Должно быть понятно, что предшествующее общее описание и последующее подробное описание служат в качестве объяснения и не ограничивают аспекты в соответствии с тем, что заявлено.

ПЕРЕЧЕНЬ ЧЕРТЕЖЕЙ

Фиг.1 является концептуальной схемой, иллюстрирующей пример среды, в которой обнаружение оповещения может приводить к действию по ремонту или передаче по инстанции оповещения.

Фиг.2 является блок-схемой, иллюстрирующей действия во время передачи по инстанции оповещения.

Фиг.3 является другой концептуальной схемой, иллюстрирующей управление оповещениями в многозонной среде.

Фиг.4 является средой с сетевой структурой, в которой может быть реализована система в соответствии с вариантами осуществления.

Фиг.5 является структурной схемой характерной вычислительной операционной среды, в которой могут быть реализованы варианты осуществления; и

фиг.6 иллюстрирует логическую блок-схему автоматизированного управления оповещениями в среде связи с сетевой структурой в соответствии с вариантами осуществления.

ПОДРОБНОЕ ОПИСАНИЕ

Как кратко описано выше, оповещения в системе с сетевой структурой могут управляться посредством автоматизированного процесса выполнения действий/передачи по инстанции, который использует действия, сопоставленные с оповещениями, и/или передачу по инстанции для разрешения вручную, расширяя при этом базу знаний для части автоматизированных действий и предоставляя собранную информацию назначенным людям, перед которыми поставлена задача решения проблем. В нижеследующем подробном описании делаются ссылки на сопроводительные чертежи, которые составляют его часть и в которых, в качестве иллюстраций, показаны конкретные варианты осуществления или примеры. Эти аспекты могут объединяться, могут использоваться прочие аспекты и могут быть выполнены структурные изменения, не отступая от сущности и объема настоящего раскрытия. Вследствие этого нижеследующее подробное описание не должно рассматриваться как ограничивающее, а объем настоящего изобретения определяется прилагаемой формулой изобретения и ее эквивалентами.

Несмотря на то что варианты осуществления будут описаны в общем контексте программных модулей, которые исполняются совместно с прикладной программой, которая работает в операционной системе на персональном компьютере, специалист в данной области техники должен понимать, что аспекты также могут быть реализованы в сочетании с прочими программными модулями.

Как правило, программные модули включают в себя процедуры, программы, компоненты, структуры данных и структуры прочих типов, которые выполняют конкретные задачи или реализуют конкретные абстрактные типы данных. Более того, специалисту в соответствующей области будет понятно, что варианты осуществления могут быть воплощены на практике при помощи других конфигураций компьютерной системы, включающих в себя переносные устройства, многопроцессорные системы, программируемую или основанную на микропроцессоре потребительскую электронику, мини-компьютеры, компьютеры класса мэйнфрейм и сопоставимые вычислительные устройства. Варианты осуществления также могут быть воплощены на практике в распределенных вычислительных средах, в которых задачи выполняются удаленными устройствами обработки, которые соединены посредством сети связи. В распределенной вычислительной среде программные модули могут размещаться как на локальных, так и удаленных запоминающих устройствах памяти.

Варианты осуществления могут быть реализованы в качестве реализуемого компьютером процесса (способа), вычислительной системы или в качестве изделия, такого как компьютерный программный продукт или машиночитаемый носитель информации. Компьютерный программный продукт может быть компьютерным носителем данных, который читается компьютерной системой и на котором закодирована компьютерная программа, которая содержит инструкции, предписывающие компьютеру или компьютерной системе выполнить характерный процесс(ы). Машиночитаемый носитель данных может быть реализован посредством, например, одного или более из: временной компьютерной памяти, постоянной памяти, накопителя на жестком диске, флэш-накопителя, гибкого диска или компакт-диска и сопоставимого носителя информации. Компьютерный программный продукт также может быть транслируемым по несущей сигналом (например, сигналом с частотной или фазовой модуляцией) или носителем информации, читаемым вычислительной системой, и с закодированной компьютерной программой, состоящей из инструкций для выполнения компьютерного процесса.

На всем протяжении данного описания делаются ссылки на услуги. Используемое здесь понятие услуги описывает любое сетевое/онлайн приложение(я), которое может принимать оповещение в рамках своего обычного функционирования и обрабатывать/сохранять/переадресовывать данную информацию. Такое приложение(ия) может исполняться на одном вычислительном устройстве, нескольких вычислительных устройствах распределенным образом и т.д. Варианты осуществления также могут быть реализованы на размещенной услуге, исполняемой посредством множества серверов или сопоставимых систем. Понятие «сервер» в целом относится к вычислительному устройству, исполняющему одну или более программ собственно программного обеспечения, как правило, в среде с сетевой структурой. Тем не менее, сервер также может быть реализован в качестве виртуального сервера (программного обеспечения), выполняемого на одном или более вычислительных устройствах, рассматриваемых в сети как сервер. Подробности этих технологий и примеры функционирования представлены ниже.

Обращаясь к фиг.1, концептуальная схема 100 иллюстрирует пример среды, в которой обнаружение оповещения может приводить к действию по ремонту или передаче по инстанции оповещения. Как кратко упомянуто ранее, варианты осуществления принимают меры в отношении комплексности услуг технической поддержки посредством автоматизации действий по ремонту и передачи по инстанции оповещений. Например, в распределенной системе услуг технической поддержки машина 103 отслеживания может отправить оповещение 113 машине 102 автоматизации при обнаружении в распределенной системе аппаратной, программной или сочетания аппаратно/программной проблемы. Машина 102 автоматизации может попытаться сопоставить оповещение 113 с действием 112 по ремонту. Если машина 102 автоматизации успешно сопоставляет оповещение 113 с действием 112 по ремонту, то затем машина 102 автоматизации может выполнить действие 112 по ремонту, которое может включать в себя набор инструкций, направленных на разрешение обнаруженной проблемы.

Проблема может быть связана с одним или более устройствами 104 в местоположении 105 географически распределенной услуги. Устройства могут включать в себя любое вычислительное устройство, такое как настольный компьютер, сервер, интеллектуальный телефон, компьютер класса лэптоп и сопоставимые устройства. Устройства 104 могут в дальнейшем включать в себя дополнительные устройства с удаленным доступом, такие как мониторы, аудиооборудование, телевизоры, устройства захвата видео и аналогичные устройства.

Оповещение 113 может включать в себя информацию о состоянии устройства или программы, связанной с обнаруженной проблемой, такую как содержимое памяти устройства, данные сенсоров, последние выполненные инструкции и прочее. Оповещение 113 может дополнительно включать в себя описание проблемы, такое как: при выполнении какой инструкции произошел сбой, исполнение каких инструкций выдает результаты, выходящие за заранее определенные пределы, и аналогичные.

Машина 102 автоматизации может пытаться сопоставить оповещение 113 с действием 112 по ремонту посредством выполнения поиска по базе 114 данных решения проблем. База 114 данных решения проблем может хранить профили оповещений, соотнесенные с действиями по ремонту с дальнейшей классификацией по устройствам или программному обеспечению. Характерным вариантом реализации может быть оповещение устройства связи об «отсутствии соединения», соотнесенное с действием по ремонту, которое заключается в перезапуске сетевого интерфейса устройства связи. Каждое оповещение может быть сопоставлено с одним или более действиями по ремонту. Кроме того, с единым действием по ремонту могут быть сопоставлены одно или более оповещений.

Если машина 102 автоматизации определяет для оповещения нескольких действий по ремонту, то приоритет выполнения может зависеть от заранее определенного приоритета действий по ремонту. Например, в рассматриваемом выше сценарии первичным действием по ремонту может быть перезапуск сетевого интерфейса, за которым следует вторичное действие по ремонту, которое заключается в перезагрузке устройства связи. Заранее определенный приоритет действий по ремонту может вручную вводиться в базу 114 данных решения проблем или определяться автоматически, исходя из схемы оценки успешности действия по ремонту при успешном решении проблемы.

В соответствии с некоторыми вариантами осуществления действие 112 по ремонту может включать в себя сбор дополнительной диагностической информации от устройства и/или программного обеспечения, связанного с проблемой. В соответствии с другими вариантами осуществления дополнительная диагностическая информация может передаваться машине отслеживания в качестве оповещения, повторно запускающего автоматизированный цикл. В ответ на оповещение дополнительная диагностическая информация также может собираться и сохраняться в системе. Сохраненная информация может использоваться для выявления состояния проблемы и обеспечения контекста при передаче по инстанции оповещения назначенному человеку или группе (например, 101).

Если в базе 114 данных решения проблем машиной 102 автоматизации не найдено сопоставленного действия по ремонту, то оповещение 113 может передаваться по инстанции назначенному человеку или группе 101. Назначенный человек или группа 101 могут уведомляться даже в том случае, если сопоставленное действие найдено и выполнено, в целях информирования. Передача оповещения 113 назначенному человеку или группе 101 может определяться из соглашения об именах оповещения 113. Соглашение об именах оповещений может указывать, какой категории персонала поддержки должно передаваться по инстанции оповещение, из таких групп, как: группа поддержки аппаратного обеспечения, группа поддержки программного обеспечения и сопоставимые единицы. Схема соглашения об именах также может использоваться для сопоставления оповещений с действиями по ремонту. Например, имена оповещениям могут быть заданы в иерархическом виде (т.е. система/компонент/имя оповещения), а действия по восстановлению могут сопоставляться с любым из: от всех оповещений для системы (система/*) до специальных действий по восстановлению для конкретного оповещения. В соответствии с некоторыми вариантами осуществления каждое конкретное оповещение может иметь связанную с ним назначенную группу, несмотря на то, что эта группа может по умолчанию быть назначена конкретному значению для всего компонента. Определение того, кому из членов группы должно быть отправлено оповещение, может зависеть от заранее определенного алгоритма сопоставления, который размещается в машине автоматизации для обеспечения осведомленности о графиках групп поддержки. Заранее определенный алгоритм сопоставления может обновляться вручную или автоматически посредством встроенных или внешних систем планирования.

Машина 102 автоматизации может передавать по инстанции оповещение 113 первому назначенному человеку или группе по электронной почте, в виде мгновенного сообщения, текстового сообщения, поискового вызова, голосовой почты или аналогичных средств. Оповещения могут сопоставляться с именами групп, а имена групп могут быть сопоставлены с группами людей, которые дежурят в течение заранее определенных интервалов (например, одного дня, одной недели и т.д.). Часть сопоставления может использоваться для идентификации того, какие люди дежурят в течение заранее заданного интервала. Таким образом, сопоставления оповещений могут быть отделены от отдельных членов группы, состав которых может быть нестабильным. Затем машина 102 автоматизации может ожидать уведомления о передаче обработки от первого назначенного человека или группы. Уведомление о передаче обработки может приниматься машиной 120 автоматизации аналогично тому, каким образом было отправлено оповещение, или оно может приниматься с помощью других средств. Если машина 102 автоматизации не приняла уведомления о передаче обработки в течение заранее определенного времени, то она может выполнить передачу по инстанции оповещения 113 следующему в ротации назначенному человеку или группе в соответствии с тем, как определено заранее определенным алгоритмом сопоставления. Алгоритм автоматизации может продолжать выполнять передачу по инстанции оповещения следующим в ротации назначенным людям или группам до тех пор, пока он не примет уведомления о передаче обработки.

Машина 103 отслеживания может принять ответ обратной связи (например, в виде действия) от устройства или программного обеспечения, после исполнения действия 112 по ремонту, пропуская ответ к машине 102 автоматизации. Затем машина 102 автоматизации может обновить базу 114 данных решения проблем. Статистическая информация, такая как коэффициент успешных попыток для действий по ремонту, может использоваться при изменении приоритета выполнения действий по ремонту. Более того, ответ обратной связи, связанный с действиями, выполненными назначенным человеком или группой, также может записываться в базу 114 данных решения проблем, и таким образом может использоваться алгоритм машинного обучения или аналогичный механизм для: расширения списка действий; сопоставления новых оповещений с существующими действиями; сопоставления существующих оповещений с новыми действиями и т.д. В соответствии с некоторыми вариантами осуществления может выполняться проверка действий машины автоматизации и действий назначенных людей. Система может сохранять регистрационную информацию касаемо того, кто выполнил конкретное действие, когда и в отношении какого устройства или сервера. Затем записи могут использоваться для: устранения проблем, отслеживания изменений в системе и/или разработки новых автоматизированных ответов на оповещение.

В соответствии с дополнительными вариантами осуществления машина 102 автоматизации может выполнить поиск с открытым условием по базе 114 данных решения проблем и определять несколько действий по ремонту в ответ на принятое оповещение. Исполнение одного или группы действий по ремонту может зависеть от заранее определенного приоритета действий по ремонту. С группами оповещений также могут быть сопоставлены группы действий по ремонту. Несмотря на то что оповещение может соотноситься с несколькими сопоставлениями с открытым условием, фактически может применяться наиболее конкретное сопоставление. Например, оповещение обмен/транспортировка/очередность может соотноситься с сопоставлением обмен/*, обмен/транспортировка/* и обмен/транспортировка/очередность. Тем не менее, фактически последнее может быть истинным сопоставлением, так как оно является наиболее конкретным.

Фиг.2 иллюстрирует на схеме 200 действия во время передачи по инстанции оповещения. Машина 202 отслеживания может предоставить (211) обнаруженную проблему в качестве оповещения машине 204 автоматизации. Машина 204 автоматизации может проверить (212) имеющиеся в наличии действия в хранилище 206 действий (базе 114 данных решения проблем на фиг.1) и выполнить (213) действие, если такое имеется в наличии. Если действий в наличии нет, то машина 204 автоматизации может передать (214) по инстанции оповещение владельцу 208 процесса. Оповещение в дальнейшем может быть передано (215) по инстанции другому назначенному лицу 209. Как рассматривалось ранее, передача по инстанции также может выполняться параллельно выполнению определенного действия.

По приему (216, 217) от владельца 208 процесса или другого назначенного лица 209 нового действия, которое должно быть выполнено, машина 204 автоматизации может выполнить (218) новое действие и для дальнейшего использования обновить (219) записи при помощи нового действия. Характерные взаимодействия на схеме 200 иллюстрируют ограниченный сценарий. В функционирование системы автоматизированного восстановления и передачи по инстанции в соответствии с вариантами осуществления также могут быть включены прочие взаимодействия, такие как передача обработки между назначенными людьми, обратная связь от устройств/программного обеспечения, сообщающих о проблеме, и аналогичные взаимодействия.

Фиг.3 является концептуальной схемой, иллюстрирующей на схеме 300 управление оповещением в многозонной среде. В распределенной системе передача по инстанции оповещений может зависеть от заранее определенного приоритета географических зон. Например, заранее определенный приоритет может передавать по инстанции оповещение из зоны, время суток которой соответствует дневному времени, и удерживать оповещение из зоны, время суток которой соответствует ночному времени, когда передачи по инстанции управляются одной группой поддержки для обеих зон. Аналогичным образом, исходя из заранее определенного приоритета, может отдаваться предпочтение действиям по ремонту из разных зон, когда действия по ремонту из разных зон участвуют в праве на решение обнаруженных проблем для одного и того же аппаратного обеспечения, программного обеспечения, ресурсов связи.

Схема 300 иллюстрирует то, каким образом система может реагировать на оповещения из разных зон в соответствии с вариантами осуществления. В соответствии с характерным сценарием машины 303, 313 и 323 отслеживания могут отвечать за отслеживание аппаратных и/или программных проблем в зонах 1, 2 и 3 (304, 314 и 324) соответственно. При обнаружении проблемы каждая из машин отслеживания может передавать оповещения соответствующим машинам 302, 312 и 322 автоматизации, которые могут отвечать за соответствующие зоны. Логика машин автоматизации может распространяться на каждую зону аналогично тому, как распространяется логика отслеживания. В соответствии с некоторыми вариантами осуществления автоматизация может осуществляться между зонами как отслеживание сбоев и восстановление на всей территории. В соответствии с другими вариантами осуществления, машина автоматизации может отвечать за несколько зон. Аналогично цель передачи по инстанции также может быть централизованной или распределенной. Например, система может осуществлять передачу по инстанции разным группам, исходя из времени суток. Машины 303, 313 и 323 отслеживания могут иметь свои собственные отдельные зональные базы данных для управления процессами отслеживания. Машины 302, 312 и 322 автоматизации могут запрашивать базу данных решения проблем (централизованную или распределенную) для сопоставления оповещений с действиями по ремонту.

Если найдено соответствующее действие(я) по ремонту, то машины 302, 312 и 322 автоматизации могут выполнить действие(я) по ремонту на устройствах и/или программах в зонах 304, 314 и 324. Для всех зон также может быть реализована глобальная база 310 данных отслеживания. Если машины 302, 312 и 322 автоматизации не могут найти соотносящиеся действия по ремонту, они могут передать по инстанции оповещения назначенной группе 301 поддержки, исходя из заранее определенных зональных приоритетов, как, например, исходя из организационной структуры. Например, зона 304 может быть сетью акционерного предприятия для организации бизнеса, в то время как зона 324 является сетью обеспечения документооборота. Проблема, обнаруженная в зоне 304, в данном сценарии может иметь более высокий приоритет, чем проблема, обнаруженная в зоне 324. Аналогичным образом при определении зональных приоритетов может учитываться различие во времени суток или рабочих/выходных днях между разными зонами.

В соответствии с некоторыми вариантами осуществления несколько машин автоматизации могут быть назначены разным зонам, и приоритеты передачи по инстанции и/или выполнения действия по ремонту выбираются при помощи алгоритма согласования между машинами автоматизации, как упомянуто выше. В качестве альтернативы решения о приоритетах могут быть получены в ходе процесса наблюдения за зональными машинами автоматизации. Кроме того, машины 302, 312 и 322 автоматизации могут взаимодействовать с зональными базами данных решения проблем, которые включают в себя заданные сопоставления ′действие по ремонту - оповещение′ для разных зон.

Несмотря на то что автоматизация процессов восстановления и передачи по инстанции в распределенных системах были рассмотрены выше, используя характерные сценарии, выполнение конкретных действий по ремонту и передачи по инстанции оповещений совместно с фиг.1, 2 и 3, варианты осуществления этим не ограничиваются. Сопоставление оповещений с действиями по ремонту, задание приоритетов действиям по ремонту, передача по инстанции оповещений и прочие процессы могут быть реализованы, используя прочие операции, приоритеты, оценки и т.д., используя рассмотренные здесь принципы.

Фиг.4 является характерной средой с сетевой структурой, в которой могут быть реализованы варианты осуществления. Сопоставление оповещения с действием по ремонту может быть реализовано через программное обеспечение, выполняемое на одном или более серверах 422, таких как размещенный сервер. Сервер 422 может осуществлять связь с клиентскими приложениями на отдельных вычислительных устройствах, таких как сотовый телефон 411, мобильное вычислительное устройство 412, интеллектуальный телефон 413, компьютер 414 класса лэптоп и настольный компьютер 415 (клиентские устройства) по сети(ям) 410. Клиентские приложения на клиентских устройствах 411-415 могут способствовать взаимодействиям пользователя с услугой, выполняемой на сервере(ах) 422, позволяя осуществлять автоматизированное управление разрешением программных и/или аппаратных проблем, связанных с услугой. Машина(ы) автоматизации и отслеживания может выполняться на любом из серверов 422.

Данные, связанные с операциями, такими как сопоставление оповещения с действием по ремонту, могут храниться в одном или более хранилище данных (например, хранилище 425 или 426 данных), которые могут управляться любым сервером(ами) 422 или сервером 424 базы данных. Автоматизация восстановления и передачи по инстанции обнаруженных проблем в соответствии с вариантами осуществления может инициироваться при обнаружении машиной отслеживания оповещения, как рассматривалось в приведенных выше примерах.

Сеть(и) 410 может быть выполнена в соответствии с любой топологией серверов, клиентов, поставщиков услуги Интернет и средств связи. Система в соответствии с вариантами осуществления может обладать статичной или динамической топологией. Сеть(и) 410 может включать в себя защищенную сеть, такую как корпоративная сеть, незащищенную сеть, такую как беспроводная открытая сеть или Интернет. Сеть(и) 410 обеспечивает связь между описанными здесь узлами. В качестве примера, а не ограничения, сеть(и) 410 может включать в себя беспроводные среды связи, такие как акустические, радиочастотные (RF), инфракрасные или другие беспроводные среды связи.

Для реализации системы автоматизации управления разрешением проблем распределенной системы в соответствии с вариантами осуществления может использоваться множество других конфигураций вычислительных устройств, приложений, источников данных и систем распределения данных. Кроме того, среды с сетевой структурой, рассмотренные на фиг.4, представлены исключительно в целях иллюстрации.

Фиг.5 и связанное с ней рассмотрение предназначены для того, чтобы предоставить краткое, общее описание приемлемой вычислительной среды, в которой могут быть реализованы варианты осуществления. Со ссылкой на фиг.5 проиллюстрирована структурная схема характерной вычислительной операционной среды, такой как вычислительное устройство 500, для приложения услуги в соответствии с вариантами осуществления. В базовой конфигурации вычислительное устройство 500 может быть сервером в системе размещенной услуги и включает в себя, по меньшей мере, один модуль 502 обработки и системную память 504. Вычислительное устройство 500 также может включать в себя множество модулей обработки, которые работают совместно при выполнении программ. В зависимости от конкретной конфигурации и типа вычислительного устройства системная память 504 может быть временной (такой как RAM), постоянной (такой как ROM, флэш-память и т.д.) или неким сочетанием двух вариантов. Системная память 504, как правило, включает в себя операционную систему 505, приемлемую для управления функционированием платформы, такую как операционная система WINDOWS® от MICROSOFT CORPORATION из Редмонда, штат Вашингтон. Системная память 504 также может включать в себя один или более программные модули 506, машину 522 автоматизации и машину 524 отслеживания.

Машины 522 и 524 автоматизации и отслеживания могут быть отдельными приложениями или неотъемлемыми модулями размещенной услуги, которая обрабатывает оповещения системы в соответствии с тем, что рассмотрено выше. Базовая конфигурация проиллюстрирована на фиг.5 компонентами, заключенными внутри пунктирной линии 508.

Вычислительное устройство 500 может иметь дополнительные свойства или функциональные возможности. Например, вычислительное устройство 500 также может включать в себя дополнительные устройства хранения данных (съемные и/или несъемные), такие как, например, магнитные диски, оптические диски или лента. Такие дополнительные запоминающие устройства проиллюстрированы на фиг.5 с помощью съемного запоминающего устройства 509 и несъемного запоминающего устройства 510. Машиночитаемый носитель данных может включать в себя временный или постоянный, съемный или несъемный носитель информации, реализованный любым способом или по любой технологии для хранения информации, такой как машиночитаемые инструкции, структуры данных, программные модули или прочие данные. Системная память 504, съемное запоминающее устройство 509 и несъемное запоминающее устройство 510, все перечисленные компоненты являются примерами машиночитаемого носителя данных. Машиночитаемый носитель данных включает в себя, но не ограничивается, RAM, ROM, EEPROM, флэш-память или другую технологию памяти, CD-ROM, цифровые универсальные диски (DVD) или оптические запоминающие устройства, магнитные кассеты, магнитную ленту, запоминающее устройство на магнитных дисках или прочие магнитные запоминающие устройства или любой другой носитель информации, который может использоваться для хранения требуемой информации и доступ к которому может быть получен вычислительным устройством 500. Любой такой машиночитаемый носитель данных может быть частью вычислительного устройства 500. Вычислительное устройство 500 также может иметь устройство(а) 512 ввода, такие как клавиатура, манипулятор типа мышь, электронное перо, устройство голосового ввода, устройство сенсорного ввода и сопоставимые устройства ввода. Также может быть включено устройство(а) 514 вывода, такое как дисплей, громкоговоритель, принтер и прочие типы устройств вывода. Эти устройства хорошо известны в соответствующей области техники и не требуют здесь подробного рассмотрения.

Вычислительное устройство 500 также может содержать соединения 516 связи, которые позволяют устройству осуществлять связь с прочими устройствами 518, как по беспроводной сети в распределенной вычислительно среде, спутниковой линии связи, сотовой линии связи и посредством сопоставимых механизмов. Прочие устройства 518 могут включать в себя компьютерное устройство(а), которое выполняет распределенные приложения и выполняет сопоставимые операции. Соединение(я) 516 связи является одним примером сред связи. Среды связи в данном случае могут включать в себя машиночитаемые инструкции, структуры данных, программные модули и прочие данные в модулированном сигнале данных, таком как несущая волна или в соответствии с иным механизмом транспортировки, и включают в себя среды доставки информации. Понятие «модулированный сигнал данных» означает сигнал, который обладает одной или более из своих характеристик, устанавливаемых или изменяемых таким образом, чтобы закодировать в сигнале информацию. В качестве примера, а не ограничения среды связи включают в себя проводные среды, такие как проводная сеть или непосредственное проводное соединение, и беспроводные среды, такие как акустические, RF, инфракрасные и прочие беспроводные среды.

Характерные варианты осуществления также включают в себя способы. Эти способы могут быть реализованы любым многообразием вариантов, включая структуры, описанные в данном документе. Одним таким вариантом могут быть машинные операции устройств типов, соответствующих описанным в данном документе.

Другим опциональным вариантом является то, что одна или более отдельных операций способов выполняются совместно с одним или более операторами-людьми, выполняющими часть операции. Не требуется, чтобы эти операторы-люди находились рядом друг с другом, но каждый должен находиться с машиной, которая выполняет часть программы.

Фиг.6 иллюстрирует логическую блок-схему 600 автоматизации управления восстановлением и передачи по инстанции проблем в распределенных системах в соответствии с вариантами осуществления. Процесс 600 может быть реализован на сервере как часть размещенной услуги или на клиентском приложении для взаимодействия с услугой так, как описано ранее.

Процесс 600 начинается с операции 602, на которой машина автоматизации обнаруживает оповещение, отправленное машиной отслеживания в ответ на проблему устройства и/или приложения программного обеспечения внутри системы. На операции 604 машина автоматизации, обладая принятым от машины отслеживания оповещением, может начать сбор информации, связанной с оповещением. Это может сопровождаться попыткой на операции 606 сопоставить оповещение с одним или более действиями по ремонту.

Если на операции 608 принятия решения найдено явное действие, сопоставленное с оповещением, то действие (или действия) может быть выполнено на последующей операции 610. Если в процессе сопоставления не определено явного действия, то на операции 614 оповещение может передаваться по инстанции к назначенному человеку или группе. Операция 614 может сопровождаться опциональными операциями 616 и 618, на которых может быть принято и выполнено новое действие от назначенного человека или группы. На операции 612 при помощи выполненного действия (сопоставленного или нового) могут обновляться записи, и таким образом может расширяться база данных сопоставления или для последующих задач отслеживания и автоматизированного ответа может использоваться статистическая информация, связанная с коэффициентами успешных попыток.

Операции, включенные в процесс 600, представлены в целях иллюстрации. Автоматизация восстановления и передача по инстанции проблем в комплексных распределенных приложениях может быть реализована аналогичными процессами с меньшим числом или с дополнительными этапами, как, впрочем, и в другой очередности операций, используя описанные здесь принципы.

Приведенное выше описание, примеры и данные обеспечивают полное описание изготовления и использования конструкции согласно вариантам осуществления изобретения. Несмотря на то что изобретение было описано языком, присущим структурным признакам и/или методологическим действиям, должно быть понятно, что объем изобретения, определенный в прилагаемой формуле изобретения, не обязательно ограничивается описанными выше конкретными признаками и действиями. Наоборот, описанные выше конкретные признаки и действия раскрыты в качестве характерных форм реализации формулы изобретения и вариантов осуществления.

1. Способ, выполняемый, по меньшей мере частично, в вычислительном устройстве, для автоматизированного восстановления и передачи по инстанции оповещений в распределенных системах, при этом способ содержит этапы, на которых:
принимают от машины отслеживания оповещение, связанное с обнаруженной проблемой;
выполняют поиск с открытым условием по хранилищу действий для определения действий по восстановлению, сопоставленных с этим оповещением;
осуществляют попытку сопоставить данное оповещение с одним из действий по восстановлению путем применения действия по восстановлению, имеющего специфику, связанную с упомянутым оповещением;
обновляют планы множества назначенных лиц, связанных с упомянутым оповещением, из по меньшей мере одной из встроенной и внешней систем планирования;
определяют назначенное лицо из упомянутого их множества для отправки упомянутого оповещения на основе обновленного плана этого назначенного лица, идентифицируя данное назначенное лицо как дежурное;
если упомянутое оповещение сопоставлено с упомянутым действием по восстановлению из хранилища действий, то выполняют это действие по восстановлению в соответствии с заранее определенным приоритетом действий по восстановлению;
в противном случае, передают по инстанции упомянутое оповещение упомянутому назначенному лицу для выполнения нового действия; и
обновляют этим новым действием записи, связанные с сопоставлением оповещений с действиями по восстановлению, и сохраняют регистрационную информацию о назначенном лице, которое выполнило упомянутое новое действие, времени, когда данное новое действие было выполнено, и устройстве или сервере, на котором это новое действие было выполнено.

2. Способ по п. 1, дополнительно содержащий этапы, на которых:
собирают диагностическую информацию, связанную с обнаруженной проблемой;
предоставляют собранную диагностическую информацию упомянутому назначенному лицу, если упомянутое оповещение передается по инстанции; и
используют собранную диагностическую информацию при обновлении записей.

3. Способ по п. 2, в котором собранная диагностическая информация включает в себя по меньшей мере одно из набора, включающего в себя: содержимое памяти устройства, данные, считанные сенсорами, последние исполненные инструкции, инструкции, при исполнении которых произошел сбой, и результаты сбоя, связанные с обнаруженной проблемой.

4. Способ по п. 1, дополнительно содержащий этапы, на которых:
ожидают ответа передачи обработки от упомянутого назначенного лица после передачи по инстанции упомянутого оповещения; и
если ответ передачи обработки не принят в течение заранее определенного периода, то передают по инстанции данное оповещение другому назначенному лицу.

5. Способ по п. 1, в котором назначенное лицо определяется по одному из заранее определенного списка назначенных лиц и соглашения об именах, связанного с упомянутым оповещением, при этом назначенное лицо включает в себя одно из человека и группы.

6. Способ по п. 1, в котором член группы для приема упомянутого оповещения определяется среди назначенной группы на основе одного из алгоритма ротации и информации планирования для назначенной группы.

7. Способ по п. 1, в котором действие по восстановлению выбирается из множества действий по восстановлению, которые являются одним из заранее определенных и автоматически генерируемых на основе схемы оценки успешности действия.

8. Способ по п. 1, в котором при упомянутой передаче по инстанции оповещения упомянутое оповещение передают упомянутому назначенному лицу посредством по меньшей мере одного из набора, включающего в себя электронную почту, мгновенное сообщение, текстовое сообщение, поисковый вызов и голосовую почту.

9. Способ по п. 1, дополнительно содержащий этапы, на которых:
собирают дополнительную диагностическую информацию, связанную с обнаруженной проблемой; и
осуществляют повторную попытку сопоставить упомянутое оповещение с действием по восстановлению на основе этой дополнительной диагностической информации.

10. Способ по п. 1, дополнительно содержащий этапы, на которых:
принимают действие обратной связи от одного из устройства и программы, связанных с обнаруженной проблемой, после выполнения действия по восстановлению; и
обновляют запись коэффициента успешных попыток, связанную с действием по восстановлению.

11. Система для автоматизированного восстановления и передачи по инстанции оповещений в распределенных системах, содержащая:
сервер, исполняющий машину отслеживания и машину автоматизации, при этом машина отслеживания выполнена с возможностью:
отслеживать процессы, связанные с по меньшей мере одним из устройства и приложения программного обеспечения распределенной системы в отдельной зональной базе данных, ассоциированной с множеством разных географических зон,
обнаруживать проблему, связанную с по меньшей мере одним из устройства и приложения программного обеспечения, в пределах отдельной географической зоны распределенной системы, и
передавать оповещение, исходя из обнаруженной проблемы; и
машина автоматизации выполнена с возможностью:
принимать это оповещение,
собирать диагностическую информацию, связанную с обнаруженной проблемой,
выполнять попытку сопоставить оповещение с действием по восстановлению, используя базу данных действий по восстановлению,
взаимодействовать с зональной базой данных решения проблем, включающей в себя заданные действия по ремонту, для сопоставления оповещения с одним из заданных действий по ремонту, чтобы задать действие по восстановлению,
если оповещение сопоставлено с действием по восстановлению, выполнять действие по восстановлению, иначе
передавать по инстанции оповещение назначенному лицу, совместно с собранной диагностической информацией, для выполнения нового действия,
обновлять записи в базе данных действий по восстановлению, чтобы сохранить регистрационную информацию о назначенном лице, которое выполнило упомянутое новое действие, времени, когда данное новое действие было выполнено, и устройстве или сервере, на котором это новое действие было выполнено, и
использовать алгоритм обучения для расширения списка действий, в котором находится упомянутое действие по восстановлению, в базе данных действий по восстановлению, чтобы сопоставить новые оповещения с существующими действиями в этом списке действий и чтобы сопоставить новое оповещение с упомянутым новым действием.

12. Система по п. 11, дополнительно содержащая множество машин отслеживания, причем каждая машина отслеживания выполнена с возможностью отслеживать каждую отдельную географическую зону, исходя из масштаба системы для каждой географической зоны внутри распределенной системы, и передавать оповещения, исходя из проблем, обнаруженных в их соответствующих зонах, при этом машина автоматизации дополнительно выполнена с возможностью либо выполнять сопоставленное действие по восстановлению, либо осуществлять передачу по инстанции к назначенному лицу, применительно к оповещениям из разных зон, исходя из зонального приоритета.

13. Система по п. 12, в которой зональный приоритет включает в себя по меньшей мере одно из набора, включающего в себя заранее определенный приоритет, время суток, рабочий день, выходной день и организационную структуру, ассоциированную с каждой зоной.

14. Система по п. 13, в которой зональный приоритет дополнительно определяется на основе наличия по меньшей мере одного из набора, включающего в себя назначенную группу поддержки, ресурс аппаратного обеспечения, ресурс программного обеспечения и ресурс связи.

15. Система по п. 11, в которой оповещение сопоставляется с множеством действий по восстановлению и действия по восстановлению выполняются в соответствии с заранее определенным приоритетом выполнения.

16. Система по п. 15, в которой приоритет выполнения корректируется на основе записанного показателя успешности действий по восстановлению.

17. Система по п. 11, в которой устройство включает в себя одно из настольного компьютера, компьютера класса лэптоп, переносного компьютера, сервера, интеллектуального телефона, монитора, аудиооборудования, телевизора и устройства захвата видео.

18. Способ, выполняемый, по меньшей мере частично, в вычислительном устройстве, для автоматизированного восстановления и передачи по инстанции оповещений в распределенных системах, при этом способ содержит этапы, на которых:
обнаруживают в машине отслеживания проблему, связанную с по меньшей мере одним из устройства и приложения программного обеспечения, внутри распределенной системы;
передают из машины отслеживания оповещение, исходя из обнаруженной проблемы;
принимают это оповещение в машине автоматизации из множества машин автоматизации, причем каждая машина автоматизации приписана к отличающейся от других географической зоне;
собирают диагностическую информацию, связанную с обнаруженной проблемой;
выполняют поиск с открытым условием по хранилищу действий для определения действий по восстановлению, сопоставленных с данным оповещением;
осуществляют попытку сопоставить упомянутое оповещение с одним из действий по восстановлению из базы данных действий по восстановлению путем применения действия по восстановлению, имеющего специфику, связанную с этим оповещением, при этом действие по восстановлению включает в себя набор инструкций, направленных на решение обнаруженной проблемы;
взаимодействуют с зональной базой данных решения проблем, включающей в себя заданные действия по ремонту, для сопоставления упомянутого оповещения с одним из заданных действий по ремонту, чтобы задать действие по восстановлению;
обновляют планы множества назначенных лиц, связанных с упомянутым оповещением, из по меньшей мере одной из встроенной и внешней систем планирования;
определяют назначенное лицо из упомянутого их множества для отправки упомянутого оповещения на основе обновленного плана этого назначенного лица, идентифицируя данное назначенное лицо как дежурное;
если упомянутое оповещение сопоставлено с одним действием по восстановлению, выполняют это действие по восстановлению;
если оповещение сопоставлено с множеством действий по восстановлению, выполняют эти действия по восстановлению в одной из упомянутого множества машин автоматизации в соответствии с заранее определенным приоритетом выполнения, причем этот заранее определенный приоритет выполнения описывается посредством алгоритма согласования между этим множеством машин автоматизации;
если оповещение не сопоставлено с действием по восстановлению, передают по инстанции упомянутое оповещение упомянутому назначенному лицу, совместно с собранной диагностической информацией;
принимают ответ передачи обработки от этого назначенного лица;
обновляют записи в базе данных действий по восстановлению, используя собранную диагностическую информацию и ответ обратной связи, связанный с выполненными действиями по восстановлению, чтобы расширить базу данных действий по восстановлению статистической информацией, связанной с показателями успешности, которая будет использоваться для последующих задач отслеживания и автоматизированного ответа; и
используют алгоритм обучения для расширения списка действий, в котором находится упомянутое действие по восстановлению, в базе данных действий по восстановлению, чтобы сопоставить новые оповещения с существующими действиями в этом списке действий и чтобы сопоставить новое оповещение с новым действием.

19. Способ по п. 18, в котором действие по восстановлению сопоставляется с одним из одного оповещения и группы оповещений.

20. Способ по п. 18, в котором назначенное лицо определяется по одному из соглашения об именах, связанного с упомянутым оповещением, и алгоритма ротации, исходя из наличия персонала поддержки.



 

Похожие патенты:

Изобретение относится к способу и системе связи по сети между клиентом и сервером, который обрабатывает запросы от клиента к серверу. Технический результат заключается в повышении безопасности осуществления связи с серверными вычислительными устройствами и достигается за счет того, что выполняют прием первым компьютерным устройством, предназначенным для управления первым доменом, запроса от второго компьютерного устройства во втором домене на осуществление связи в качестве и от имени клиента с третьим компьютерным устройством.

В различных вариантах осуществления пользователь взаимодействует с удаленно выполняющимися мобильными приложениями из транспортного средства. Транспортное средство может включать в себя по меньшей мере один компьютер, который включает в себя человеко-машинный интерфейс (HMI) для управления с помощью пользователя.

Изобретение относится к удаленному просмотру и направлено на генерацию и управление возобновляемым контекстом удаленного просмотра на провайдере распределенных вычислений.

Изобретение относится к вычислительной технике, в частности к построению системных сетей для суперкомпьютеров в виде многомерных торов. Технический результат изобретения заключается в возможности существенного уменьшения времени доставки сообщений за счет сокращения диаметра сети (расстояния между узлами в каждом измерении тора) и уменьшения времени ожидания передачи (нахождения в очереди для передачи по сети).

Изобретение относится к вычислительной технике. Технический результат заключается в предоставлении параметров уровня услуг (SLS), необходимых для эксплуатации взаимосвязанного компьютерного узла обновленного инфраструктурного уровня.

Изобретение относится к лабораторному оборудованию и может быть использовано в учебном процессе при получении курсантами военных академий знаний по управлению войсками.

Изобретение относится к лабораторному оборудованию и может быть использовано в учебном процессе при получении курсантами военных академий знаний по управлению войсками.

Изобретение относится к системам аутентификации с использованием аутентификационной информации из веб-обозревателя. Технический результат заключается в обеспечении устройством обработки информации уведомления сервера относительно завершения операции управления без дополнительной обработки по аутентификации.

Изобретение относится к системе контроля территорий и управления силами и средствами охраны. Технический результат заключается в автоматизации управления средствами охраны.

Изобретение относится к вычислительной технике и предназначено для сбора информации от внешних источников, последующей ее обработки и выработки сигналов управления различным корабельным оружием.

Изобретение относится к контролю приложений. Технический результат заключается в уменьшении времени, в течение которого производится анализ файлов клиентом в рамках контроля приложений.

Изобретение относится к вычислительной технике. Технический результат заключается в отслеживании выполнения процессором кода, загруженного в памяти.

Изобретение относится к энергетике. Бытовой электроприбор, включающий в себя нагревательный контур для нагрева жидкости, а также содержащий выборочно запитываемый с помощью переключателя нагревательный элемент для нагрева жидкости, и устройство контроля для контроля работы нагревательного контура.

Изобретение относится к вычислительной технике. Техническим результатом является обеспечение поиска ошибок в программном обеспечении без снижения надежности штатной управляющей вычислительной машины.

Изобретение относится к способу безопасной передачи цифрового файла от одной компьютеризированной системы на другую компьютеризированную систему. Технический результат заключается в повышении надежности передачи при обеспечении управления файлами.

Изобретение относится к области управления компьютерными сетями с использованием алгоритмов искусственного интеллекта. Техническим результатом является снижение времени простоя рабочих объектов компьютерной сети за счет увеличения точности прогноза изменений основных показателей.

Изобретение относится к области адаптивного дистанционного обслуживания подвижных составов с помощью машинного обучения правилам. Техническим результатом является обеспечение автоматического обновления правил, применяемых для группировки диагностической информации, для более точной группировки диагностической информации.

Изобретение относится к устройству для помощи водителю. Технический результат заключается в создании устройства для помощи водителю, обеспечивающего мониторинг аномальных состояний автомобиля.

Изобретение относится к вычислительной технике и автоматике, а именно к области обработки аналоговых и дискретных сигналов, и может быть использовано для сопряжения различных вычислительных систем с исполнительными устройствами и датчиками.

Изобретение относится к способу работы компьютера при автоматическом восстановлении центрального процессора в случае ошибки. Технический результат заключается в том, что в момент фатальной ошибки в CPU микрокомпьютера происходит сброс только CPU без инициализации или сброса всего микрокомпьютера.

Изобретение относится к виртуализации. Технический результат заключается в обеспечении постоянного выполнения одного из гипервизоров в компьютерной системе. Способ организации выполнения более одного гипервизора в одной и той же компьютерной системе, при этом один из гипервизоров должен постоянно выполняться, в котором выполняют код в режиме гипервизора, который должен постоянно выполняться, пока остальные гипервизоры не требуют выполнения кода в режиме гипервизора; отслеживают попытку запуска кода в режиме гипервизора со стороны других гипервизоров; останавливают выполнение кода в режиме гипервизора, который должен постоянно выполняться; сохраняют состояние компьютерной системы при остановке выполнения кода в режиме гипервизора, который должен постоянно выполняться; загружают состояние компьютерной системы для выполнения кода в режиме гипервизора, который произвел попытку запуска; выполняют код в режиме гипервизора, который произвел попытку запуска; отслеживают состояние компьютерной системы для ожидания возможности запуска кода в режиме гипервизора, который должен постоянно выполняться; загружают ранее сохраненное состояние компьютерной системы; запускают код в режиме гипервизора, который должен постоянно выполняться. 1 з.п. ф-лы, 4 ил.
Наверх