Способ обеспечения надежности вычислительных систем при различных архитектурах избыточности

Авторы патента:

Иванов Дмитрий Николаевич (RU)

Клюев Алексей Васильевич (RU)

Ковалев Артем Александрович (RU)

Константиновский Валентин Михайлович (RU)

Скачков Сергей Анатольевич (RU)

G06F11/14 - обнаружение и исправление ошибок в данных с помощью избыточности операций,например с использованием различных последовательностей операций, приводящих к тому же результату (G06F 11/16 имеет преимущество)

Владельцы патента RU 2699056:

Федеральное государственное казенное военное образовательное учреждение высшего образования "Военная академия войсковой противовоздушной обороны Вооруженных Сил Российской Федерации имени Маршала Советского Союза А.М. Василевского" Министерства обороны Российской Федерации (RU)

Изобретение относится к вычислительной технике, в частности к системам, обладающим высоким уровнем отказоустойчивости при обработке информации, к которым предъявляются высокие требования по надежности как аппаратных, так и программных средств. Технический результат предлагаемого изобретения - повышение надежности вычислительных систем при различных архитектурах избыточности. В способе эффективность использования различных видов избыточности определяется по коэффициенту прореживания потока сбоев k_пр, определение величины которого выполняется в следующей последовательности: построение двух моделей вычислительной системы с многовидовой избыточностью, имитация сбоев с помощью модуля генерации сбоев, с помощью модуля генератора тестовых воздействий формируют тестовые воздействия, статистически обрабатывают полученные данные на устройстве оценки сбоеустойчивости вычислительной системы. 8 ил.

Изобретение относится к вычислительной технике, в частности к системам обладающим высоким уровнем отказоустойчивости при обработке информации, к которым предъявляются высокие требования по надежности, как аппаратных, так и программных средств.

Известен ряд технических решений [1, 2, 3], позволяющих за счет введения различных видов избыточности в структуру вычислительной системы, обеспечить требуемый уровень надежности, однако такие решения не позволяют обеспечить оптимального распределения имеющихся ресурсов для получения требуемого уровня надежности.

Наиболее близким к предлагаемому техническому решению является подход предложенный в работе [4], в котором для оптимизации сложной системы обработки информации по критерию надежности определяется вариант системы и способы надежностной реализации каждой из подсистем, которые доставляют экстремум целевой функции Р и обеспечивают успешное решение задач обработки информации с вероятностями не ниже заданных, в условиях ограниченности затрат на проект информационной системы. При этом процесс решения оптимизационной задачи представляет собой многоступенчатую структуру, каждая ступень которой связана с проверкой наличия тех или иных свойств у подмножества вариантов, что ведет к непосредственному сокращению исходного множества вариантов. Предлагаемый в работе [4] алгоритм использует методологию последовательного анализа и отсеивания вариантов путем отсеивания бесперспективных компонент кластерной структуры информационной системы как по ограничениям, так и по целевой функции без построения начальных частей вариантов и их дальнейшего развития.

Следуя [4] предлагается рассматривать систему обработки информации, которая состоит из отдельных подсистем, каждая из которых может быть реализована способами. Отказ любой из подсистем приводит к отказу всей системы в целом. Определение варианта системы осуществляется путем выбора способа реализации каждой подсистемы ν_extr, доставляющей максимум целевой функции

при наличии ограничений

где (j=1, …, n) - совокупность компонент различных типов, которые могут использоваться в j-й подсистеме (количество элементов в множестве Uj равно ξ_j), ν - текущий вариант системы

- надежность (вероятность безотказной работы на заданном интервале времени) элемента j-й подсистемы типа;

- значение р-го ограничивающего фактора, для элемента типа j-й подсистемы;

g_p(ν) - количество р-го ограничивающего фактора израсходованного на всю систему;

- максимально возможное количество р-го ограничивающего фактора для всей системы в целом.

Представленная выше подстановка эквивалентна следующей задаче оптимизации

при наличии указанных ограничений и с учетом, что , так как логарифм является монотонным преобразованием. Для таких функций применяется условие алгоритма отсева по ограничениям [3], нахождение «безусловного» оптимального варианта для каждой рассматриваемой функции (как и проверка условия отсева) требует вычислений значений этих функций не более сравнений этих значений.

Для повышения надежности проектируемой системы обработки информации путем резервирования определяется максимальная и минимальная кратность резервирования (максимальное и минимальное возможное число резервных элементов) для типа j-й подсистемы. Используются постоянные для каждого модуля величины

Максимальную кратность резервирования для каждого элемента определяется по формуле:

Такой способ позволяет определить вводимую избыточность резервных элементов и произвести оптимальный выбор состава компонентов, используемых при формировании надежных структур систем обработки информации, реализуемых в дальнейшем использовании с использованием кластеризации.

Недостатком рассмотренного способа [4] является то, что в нем повышение надежности производится только путем введения структурной избыточности и не рассматриваются вопросы комплексной оптимизации различных видов избыточности. Это не позволяет обеспечить эффективное распределение ресурсов для обеспечения высокого уровня надежности вычислительной системы по отношению как к устойчивым отказам, так и сбоям, наиболее характерным видам отказов для цифровой техники.

Технический результат предполагаемого изобретения - повышение надежности вычислительных систем при различных архитектурах избыточности.

Технический результат достигается тем, что в известном способе [4] предлагается рассматривать вычислительную систему, которая состоит из отдельных подсистем, каждая из которых может быть реализована способами. Отказ любой из подсистем приводит к отказу всей системы в целом. Определение варианта системы осуществляется путем выбора способа реализации каждой подсистемы ν_extr, доставляющий максимум целевой функции

при наличии ограничений

где (J=1, …, n) - совокупность компонент различных типов, которые могут использоваться в j-й подсистеме (количество элементов в множестве U_j равноξ_j), ν - текущий вариант системы

- надежность (вероятность безотказной работы на заданном интервале времени) элемента j-й подсистемы типа;

- значение р-го ограничивающего фактора, для элемента типа j-й подсистемы;

g_p(ν) - количество р-го ограничивающего фактора израсходованного на всю систему;

- максимально возможное количество р-го ограничивающего фактора для всей системы в целом.

Представленная выше подстановка эквивалентна следующей задачи оптимизации

при наличии указанных ограничений и с учетом, что так как логарифм является монотонным преобразованием. Для таких функций применяется условие алгоритма отсева по ограничениям [3], нахождение «безусловного» оптимального варианта для каждой рассматриваемой функции (как и проверка условия отсева) требует вычислений значений этих функций не болеесравнений этих значений. Сначала выполняется отсев элементов по типам ограничений без применения резервирования, в ходе которого множество возможных реализаций вычислительной системы V преобразуется в множество где- совокупность компонент различных типов, которые могут использоваться в j-й подсистеме после отсева по ограничениям.

Для повышения надежности проектируемой вычислительной системы разрабатывается вариант совместного использования различных видов избыточности (структурной, временной, информационной, алгоритмической). Возможность их группирования достигается за счет комплексирования теории алгебры логики, с помощью которой моделируются собственно алгоритм функционирования, а также структурная избыточность вычислительной системы и программного обеспечения (математического пакета), позволяющего имитировать другие виды избыточности.

Эффективность использования различных видов избыточности определяется по коэффициенту прореживания потока сбоев k_пр, определение величины которого выполняется в следующей последовательности:

1) построение двух моделей вычислительной системы с многовидовой избыточностью;

2) имитация сбоев;

3) создание генератора тестовых воздействий;

4) оценка показателя сбоеустойчивости вычислительной системы.

Процедура построения моделей вычислительной системы включает: получение сведений о номенклатуре, серии и количестве ИМС, поиск в базе данных или построение их булевых моделей, выполнение их функционального связывания по принципиальной схеме; создание и реализацию в математическом пакете алгоритмов (фиг. 1, фиг. 2, фиг. 3, фиг. 4). Создание алгоритмов структурной (фиг. 1), временной (фиг. 2), информационной (фиг. 3) и алгоритмической (фиг. 4) избыточности предполагает корректировку моделей вычислительной системы, соответственно множество возможных реализаций вычислительной системы V* преобразуется в множество где - совокупность компонент различных типов, которые могут использоваться в j-й подсистеме после введения избыточности с учетом возможных допусков для каждого из ограничивающих факторов.

Имитация сбоев в модели вычислительной системы предполагает: определение места, времени и кратности (закона распределения плотности вероятности потока сбоев) на основе априори известных статистических данных по сбоям, например по критерию Колмогорова или χ²; синтез алгоритма внесения сбоя кратностью ν в модель, т.е. выбор из множества переменных n модели {х₁, х₂, …, х_i, x_i+1, …, x_i+1+m, x_i+1+m+1,…. x_n} ν элементов, замена для каждого выбранного элемента логического состояния на противоположное.

Создание генератора тестовых воздействий. Тестовое воздействие представляет собой вектор, состоящий из последовательности логических «0» и логических «1» длиной где L_Tj - количество выходных переменных i-го абонента, k - число абонентов вычислительной системы.

Метод формирования тестового воздействия (последовательного перебора, случайный, детерминированных направлений) выбирается при настройке генератора.

Перечисленные методы манипулируют множеством (фиг. 5), размерностью, равной L_Tj=2ⁿ, где n - разрядность шины данных. Метод детерминированных направлений реализуется режимом фильтрации. Применением фильтрации достигается сокращение величины L_Ti, а значит, и временных затрат на вычисление показателя сбоеустойчивости. Правило работы фильтра

F: x₁, х₂,… x_i, …, х_n∈М_х|х₁, х₂, …, х_i, …, х_n ~ у₁, у₂, … y_i, …, у_m.

В результате фильтрации показатель мощности множества входных кодовых наборов Р(М_х) уменьшается, как минимум, на величину ΔР(М_х)>2ⁿ-2^m, если n>m. Для случая n≤m величина ΔР(М_х) определяется статистическим перебором множества Р(М_х)=2ⁿ кортежей входных кодовых наборов и выбором из этого множества кортежей, приводящих к изменению выходных кортежей множества Р(М_y)=2^m (на фиг. 5 отфильтрованные множества входных и выходных кортежей выделены серым тоном).

Оценивать k_пр предлагается в соответствии с информационно-временной статистической моделью изображенной на фиг. 6.

Устройство управления - 1 (фиг. 6) координирует работу модулей модели согласно заданному алгоритму (фиг. 7, фиг. 8) и реализуется в математическом пакете программным способом.

Модуль генератора сбоев - 2 (фиг. 6) вносит по выбранному закону сбой в модель вычислительной системы №2 - 5 (фиг. 6), с определенной интенсивность, характеризующейся значением - количеством сбоев внесенных в модель вычислительной системы единицу времени.

Модуль генератора тестовых воздействий - 3 (фиг. 6) формирует тестовые воздействия с использованием рассмотренного выше метода и подает их на модели вычислительных систем №1 и 2 - (4 и 5 на фиг. 6).

Модель вычислительной системы №1 - 4 (фиг. 6) формирует массив эталонных откликов Мэт на тестовые воздействия.

Модель вычислительной системы №2 - 5 (фиг. 6) формирует массив откликов М_с в условиях имитации сбойных ситуаций.

Схема сравнения - 6 (фиг. 6) проверяет соответствие откликов с выходов моделей вычислительных систем (4 и 5 на фиг. 6), и определяет - количество отказов сбойного характера (сбоев не перехваченных моделью вычислительной системы с конкретной архитектурой избыточности) в единицу времени по количеству несовпадений М_ЭТ и М_с.

Модуль оценки сбоеустойчивости - 7 (фиг. 6) определяет величины показателей сбоеустойчивости по результатам обработки данных, полученных в ходе статистического исследования моделей вычислительных систем (4 и 5 на фиг. 6) по формуле

где λ_OCX - интенсивность потока отказов сбойного характера на выходе модели вычислительной системы, λ_с - интенсивность потока сбоев вносимых в модель вычислительной системы.

Из отобранных вариантов реализации вычислительной системы V** выбирается вариант обладающий максимальным значением k_пр.

Информационно-временная статистическая модель (фиг. 6) позволяет решать задачу количественной оценки сбоеустойчивости в условиях различных сочетаемости и перекрытия видов избыточности, оценивать эффективность системы обнаружения сбоев, определять коэффициент функциональной загруженности подсистем вычислительной системы.

Источники информации

1. Научный журнал «Математические машины и системы» 2002 г. №2 Теслер Г.С. «Концепция создания вычислительных средств с высоким уровнем отказоустойчивости».

2. Патент на изобретение «Способ автоматического управления избыточностью неоднородной вычислительной системы и устройство для его реализации» RU 2612569.

3. Вычислительные методы исследования и проектирования сложных систем. Михалевич B.C., Волкович В.Л. - М.: Наука. Главная редакция физико-математической литературы, 1982.

4. Электронный журнал «ИССЛЕДОВАНО В РОССИИ» 1123 http://zhumal.ape.relarn.ru/articles/2004103.pdf.

Способ обеспечения надежности вычислительных систем при различных архитектурах избыточности, заключающийся в том, что при проектировании вычислительной системы ее разделяют на ряд подсистем, каждая из которых может быть реализована различными способами, определение варианта системы осуществляется путем выбора способа реализации каждой подсистемы ν_extr, доставляющей максимум целевой функции , при наличии ограничений , (р=1, …, q), , р=q+1, …, Q, ν∈V, (j=1, …, n), где , (j=1, …, n) - совокупность компонент различных типов, которые могут использоваться в j-й подсистеме (количество элементов в множестве U_j равно ξ_j), ν - текущий вариант системы , - надежность (вероятность безотказной работы на заданном интервале времени) элемента j-й подсистемы типа, g_p(u_j(lj)) - значение р-го ограничивающего фактора, для элемента типа j-й подсистемы, g_p(ν) - количество р-го ограничивающего фактора, израсходованного на всю систему, - максимально возможное количество р-го ограничивающего фактора для всей системы в целом, при наличии указанных ограничений и с учетом, что , находится максимум функции , сначала выполняется отсев элементов по типам ограничений без применения резервирования, в ходе которого множество возможных реализаций вычислительной системы V преобразуется в множество - совокупность компонент различных типов, которые могут использоваться в j-й подсистеме после отсева по ограничениям, после чего рассматриваются варианты возможного повышения надежности путем введения избыточности с учетом возможных допусков для каждого из ограничивающих факторов , отличающийся тем, что для повышения надежности проектируемой вычислительной системы выбирается вариант совместного использования различных видов избыточности (структурной, временной, алгоритмической, информационной), эффективность варианта совместного использования различных видов избыточности определяется по коэффициенту прореживания потока сбоев k_пр, определение величины которого выполняется в следующей последовательности, последовательно на основе алгебры логики, формируются две идентичные модели каждого из отобранных вариантов построения вычислительной системы с возможными вариантами введения многовидовой избыточности, соответственно множество возможных реализаций вычислительной системы V^* преобразуется в множество , где - совокупность компонент различных типов, которые могут использоваться в j-й подсистеме после введения избыточности с учетом возможных допусков для каждого из ограничивающих факторов, выполняется имитация сбоев путем определения места, времени и кратности (закона распределения плотности вероятности потока сбоев) на основе априори известных статистических данных по сбоям, сымитированные сбои вносятся в одну из моделей, с помощью модуля генератора сбоев, на основе одного из известных методов (например, метода последовательного перебора, метода детерминированных направлений, случайным способом), с помощью модуля генератора тестовых воздействий, формируются тестовые воздействия, которые подаются на обе модели вычислительной системы, выполняется оценка показателя сбоеустойчивости - k_пр - варианта вычислительной системы путем сравнения откликов на тестовые воздействия с выходов обеих моделей вычислительной системы при помощи схемы сравнения и статистической обработки полученных результатов на устройстве оценки сбоеустойчивости, при этом расчет коэффициента прореживания сбоев выполняется по формуле

где - количество сбоев, внесенных в модель вычислительной системы в единицу времени, - количество отказов сбойного характера (сбоев, не перехваченных моделью вычислительной системы с конкретной архитектурой избыточности) в единицу времени, λ_ОСХ - интенсивность потока отказов сбойного характера на выходе модели вычислительной системы, λ_с - интенсивность потока сбоев, вносимых в модель вычислительной системы, из отобранных вариантов реализации вычислительной системы V^**, выбирается вариант, обладающий максимальным значением k_пр.

Изобретение относится к способу, машиночитаемому запоминающему устройству и вычислительному устройству восстановления доступности основывающейся на облаке услуги после отказа.

Система и способ оценки деградации устройства хранения данных и обеспечения сохранности наиболее важных данных // 2697961

Изобретение относится к вычислительной технике. Технический результат заключается в предотвращении потери данных.

Устройство обработки информации, которое администрирует данные на клиентском устройстве, клиентское устройство, способ резервного копирования и носитель данных // 2696349

Изобретение относится к средствам администрирования данных на множестве клиентов. Технический результат заключается в обеспечении устройства обработки информации, которое позволяет непрерывно использовать данные, администрируемые сервером.

Безопасный доступ к данным после сбоя хранилища // 2683167

Группа изобретений относится к вычислительной технике и может быть использована для восстановления доступа к данным после сбоя хранилища данных. Техническим результатом является повышение надежности.

Способ и система распределенного хранения восстанавливаемых данных с обеспечением целостности и конфиденциальности информации // 2680350

Изобретение относится к области вычислительной техники. Техническим результатом является повышение устойчивости системы распределенного хранения информации.

Система и способ для создания выборочных моментальных снимков базы данных // 2676018

Группа изобретений относится к средствам для создания выборочных моментальных снимков базы данных. Технический результат – уменьшение вычислительных затрат при создании моментального снимка.

Способ и устройство для восстановления базы данных резервного узла // 2665884

Изобретение относится к области вычислительной техники. Техническим результатом является восстановление резервной базы данных, которое обеспечивает возможность сократить время для восстановления резервной базы данных.

Способ и устройство для восстановления базы данных резервного узла // 2665884

Восстановление приложения из моментального снимка // 2665307

Изобретение относится к целевому восстановлению данных приложения. Технический результат – повышение эффективности целевого восстановления данных приложения, соответствующих приложению.