Устройство для управления реконфигурацией резервированной вычислительной систем

 

Изобретение относится к вычислительной технике и может быть использовано при построении параллельных вычислительных систем повышенной надежности. Цель изобретения - повышение оперативности диагностирования вычислительных систем с малым резервом времени за счет сокращения времени выявления отказавшего процессора . Устройство для управления реконфигурацией содержит шесть элементов И, два элемента задержки, три группы элементов И, группу элементов ИЛИ, генератор тактовых импульсов, регистр готовности процессоров, первый и второй регистры сдвига, шифратор согласования, элемент ИЛИ, элемент НЕ и триггер блокировки. Устройство позволяет сократить время выявления отказавшего процессора с m , до трех тактов контроля. 4 ил., 2 табл. & Ё

СОЮЗ СОВЕТСКИХ

СОЦИАЛИСТИЧЕСКИХ.

РЕСПУБЛИК

ГОСУДАРСТВЕНН6!Й КОМИТЕТ

ПО ИЗОБРЕТЕНИЯМ И ОТКРЫТИЯМ

ПРИ ГКНТ СССР

ОПИСАНИЕ ИЗОБРЕТЕНИЯ

К АВТОРСКОМУ СВИДЕТЕЛЬСТВУ (21) 4768986/24 (22) 11.12,89 (46) 07.03,92. Бюл. М 9 (72) B.È.Íèêîëàåâ, М.П,Филяев, А.М;Заяц, И.Б.Шубинский и С,А.Шибаев (53) 681.3 (088.8) (56) Авторское свидетельство СССР

1Ф 1526454. кл, G 06 F 11/20, Н 05 К 10/00, 1988.

Авторское свидетельство СССР

М 1579443, кл. Н 05 К 10/10, G Об F. 11/20, 1988.. (54) УСТРОЙСТВО ДЛЯ УПРАВЛЕНИЯ РЕ КОНФИГУРАЦИЕЙ РЕЗЕРВИРОВАННОЙ

ВЫЧИСЛИТЕЛЬНОЙ СИСТЕМЫ (57) Изобретений относится к вычислительной технике и может быть использовано при

Изобретение относится к вычислительной технике и может быть использовано при построении отказоустойчивых многопроцессорных вычислительных систем (ВС), Цель изобретения — повышение оперативности диагностирования.

На фиг. 1. представлена схема резервиpoaaHHoA BC; Ha фиг. 2 — ycTpoAcTso. для управления реконфигурацией резервированной ВС; на фиг, 3 и 4 — временные диаграммы работы устройства управления.

Резервированная ВС (фиг. 1) содержит

1g,.1z,... 1л1, 1m+1 резервируемые процессоры, коммутаторы 21,..., 2m вывода информации, модули 3>,.... Зщ памяти, устройство 4 управления, группу входов 51 5m. ба+1 контроля устройства управления, коммутатоРы 61,..., 6m.ввоДа инфоРмаЦии, гРУппУ

„„. Ж „„1718398 А1 (я)5 Н 05 К 10/00, G Об F 11/20 построении параллельных вычислительных систем повышенной надежности. Цель изобретения — повышение оперативности диагностирования вычислительных систем с малым резервом времени за счет сокращения времени выявления отказавшего процессора. Устройство для управления реконфигурацией содержит шесть элементов И, два элемента задержки, три группы элементов И, группу элементов ИЛИ, генератор.тактовых импульсов, регистр готовности процессоров, первый и второй регистры сдвига, шифратор согласования, элемент

ИЛИ, элемент НЕ и триггер блокировки. Устройство позволяет сократить время выявления отказавшего процессора с m +" 1 до трех тактов контроля. 4 ил., 2 табл. выходов 7>,..., 7П, 7П+1 управления процессорами и группу выходов 81 " 8m управле- 4 ния коммутацией устройства, коммутатор 9 а сравнения, выход 10 управления сравнени- Q) ем устройства, блок 11 сравнения и вход 12 ( сравнения устройства.

Устройство управления (фиг. 2) содер- 0 жит первый элемент И 13, первый элемент

t4 задержки, первую группу элементов ИЛИ

151,. „15m, 15m+>, регистр 17 готовности,Ф процессоров, вторую группу элементов И

181,..., 18m, 18m+1, третью группу элементов

И 191,..., 19 . 19m+1, второй элемент И 20, генератор 21 тактовых импульсов, третий 22 и четвертый 23 элементы И, первый регистр

24 сдвига, второй регистр 25 сдвига, шифратор 26 согласования, выход 27 генератора

21 тактовых импульсов, выходы 28 "Пуск", 1718398

20

30

40

29 "Блокировка записи", 30i "Останов" из группы выходов 71,... 7, 7m+i управления процессорами устройства, пятый 31 и uiecтой 32 элементы И, второй элемент 33 задержки, элемент ИЛИ 34, элемент НЕ 35 и триггер 36 блокировки.

Регистр 17 готовности процессоров содержит информацию о состоянии процессоров (исправен или неисправен), что определяется состоянием соответствующих разрядов регистра 17, 1-й разряд в нулевом состоянии, то i-й процессор исправен, если в единичном — неисправен. Генератор 21 предназначен для общей синхронизации работы системы и разделения вычислительного процесса на такты путем выработки сигналов пуска процессоров и сигналов управления коммутаторами.

Первый регистр 24 сдвига предназначен для определения пары проверяемых процессоров (если i-й разряд регистра в единичном состоянии, то это значит, что в текущем такте проверяются процессоры i-й и (i+ 1)-й (i 1. m), если в единичном состоянии (т+ 1)-й разряд, то проверяются(а+ 1)-й и первый процессоры для управления коммутатором 9 сравнения. Для получения выдачей сигнала "Блокировка записи" на тот процессор иэ пары проверяемых, который контролировался в первом такте из двух смежных тактов контроля, содержит информацию о номере процессора, контролирова вше гося в двух тактах подряд (соответствующий разряд регистра в единичном состоянии).

Второй регистр 25 сдвига предназначен для управления коммутаторами 2 вывода и

6i ввода информации (i = 1, m) на основе состояния соответствующих разрядов. Если

1-й разряд второго регистра 25 в нулевом состоянии, то коммутаторы 2i и 6i подключают (i + 1)-й процессор к,1-му модулю памяти, единичное состояние i-го разряда обеспечивает подключение (i+ 1)-го процессора к (i + 1)-му модулю памяти (i = 1, m=7), единичное состояние m-ro разряда — подключейие(а + 1)-ro процессора к первому модулю памяти. Второй регистр 25 сдвига может быть выполнен на основе реверсивного регистра сдвига, при этом коммутацию информационных и управляющих входов данного регистра необходимо осуществлять таким образом, чтобы при сдвиге вниз в старший разряд регистра (00) записывалась "1", а при сдвиге вверх в младший разряд (D3) записывался "0".

Вифратор 26 согласования предназначен для формирования кода установки второго регистра 26 сдвига в случае поступления на один иэ входов 51„... 5m, 5m+ контроля устройства сигнала от средств контроля соответствующего процессора, т.е, сигнала, свидетельствующего об отказе процессоров. Необходимость использования шифратора 26 согласования вызвана требуемым распределением, с целью сохранения производительности системы, оставшихся m исправных процессоров на работу с m модулями памяти, так как отказавший процессор, выявленный средствами внутреннего контроля. исключается из конфигурации для восстановления, и модуль памяти, если в текущем такте его информация не обрабатывалась параллельно двумя процессорами, остается без процессора обработки. На временных диаграммах (фиг, 3 и 4) сигналам присвоены позиции одноименных выходов, Принцип функционирования ВС состоит в следующем.

Каждый резервируемый процессор через соответствующие коммутаторы ввода и вывода в каждом такте подключается к одному из модулей памяти. В исходном состоянии все процессоры исправны, при этом в каждом такте назначается пара проверяемых процессоров, которые подключаются к одному модулю памяти и выполняют одни и те же инструкции над одинаковыми исходными данными. Результаты работы пары процессоров сравниваются.

В следующем такте назначается новая пара проверяемых процессоров. Если в текущем такте. контроля произошло несравнение результатов работы пары проверяемых процессоров, то в устройстве управления информация об этом сохраняется на один такт, а на следующий такт контроля назначается новая пара проверяемых процессоров. В случае несравнения результатов работы и в новой паре проверяемых процессоров принимается решение об отказе процессора, который контролировался в обеих парах, иначе система переводится в предыдущую конфигурацию.

Если по окончании очередного такта работы результаты в паре контролируемых процессоров совпали — это значит, что имевшее место несравнение результатов работы в этой паре было вызвано однократным сбоем, Если же по окончании очередного такта работы йроизошло несравнение результатов, то принимается решение об отказе процессора, контролировавшегося в двух последних тактах.

В дальнейшем до момента восстановления отказавшего процессора и включения его в конфигурацию контроль. работоспособности системы осуществляется только встроенными средствами контроля процессоров.

После восстановления отказавшего процес1718398 сора система вновь функционирует в режиме резервирования.

Резервированная BC работает следующим образом.

В исходном состоянии, когда все процессоры 11.... 1 . 1+1 исправны. во всех разрядах регистра 17 готовности процессоров записаны нули. Сигналы высокого уровня с инверсных выходов регистра 17 выходы 71,..., 7, 7 +> управления процессорами устройства управления сигналов пуска соответствующих процессоров от генератора 21..

Управление коммутацией процессоров к определенным модулям памяти технически осуществляется с помощью второго регистра 25 сдвига, состояния разрядов

15 которого определяют уровни сигналов на 20 соответствующих выходах 8i,... Bm управления коммутацией устройства управления.

В исходном состоянии во второй регистр 25 записан код 000...00, Порядок подключения процессоров к модулям памяти при данном коде указан s табл. 1.

Таким образом, в первом такте будут контролироваться процессоры 11 и 1г, обрабатывающие информацию первого модуля 3 памяти. Об этом свидетельствует содержимое первого регистра 24 сдвига, в котором

30 в исходном состоянии записан код

1000...00. Соответствие кодов первого регистра 24 парам проверяемых процессоров показано в табл. 2. 35

После выполнения счета результаты с информационных выходов всех процессоров поступают на информационные входы коммутаторов 9 сравнения. С выхода 10.управления сравнением устройства на управ- 40 щий вход коммутатора 9 поступает код, ЙЬт:уу3решает коммутацию информационных"3Ъхддов" парц„.проверяемых процессоров на входы блока 11 сравнения. В первом такте это выходы процессорен.,11 и 45

1г.

Выходная информация пары проверяемых процессоров сравнивается в блоке 11 сравнения, на выходе которого при положительном результате сравнения вырабатыва- 50 ется сигнал низкого уровня., который, поступая на вход 12 сравнения устройства управления, запрещает работу элемента И

13. После этого результаты счета с информа55 ционных выходов непроверяемых и одйого из пары проверяемых процессоров через коммутаторы 2 вывода информации поступают на входы модулей 3 памяти и зэпиеываются в них. В модуль памяти будет записываться выходная информация того разрешают прохождение через соответст- 10 вующие элементы И 191,..., 19, 19 +j на процессора из пары проверяемых, который контролировался в данном и предыдущих тактах (табл, 2).Это достигается путем блокировки записи выходной информации другого проверяемого процессора, т.е. процессора, который контролирован в первом такте из двух смежных тактов контроля. Для этого из разрядов 1,2,..., m, m + 1 первого регистра

24 передается на входы 18г. 18з„., 18m+> третьей группы элементов И и при разрешающем уровне на вторых входах элементов

19 высокий уровень на выходе одного определенного элемента 19 передается в состветствующую выходную шину 7 управления процессорами устройства. В первом такте это выход 29г "Блокировка записи", По следующему тактовому импульсу осуществляется сдвиг содержимого первого регистра 24 и регистра 25, при этом в них будут записаны коды 016...00 и 110...00 соответственно и во втором такте будут контролироваться процессоры 1г и 1з. В (m + 1)-м такте содержимое первого регистра 24 будет следующее: 000...01, а второго регистра

25 соответственно 111...1.1. После этого по следующему тактовому импульсу, первый регистр 24 сдвига и второй регистр 25 сдвига устанавливаются в исходное состояние:

100...00 и 000...00 соответственно, Отказ процессора фиксируется внешним контролем, а также средствами встроенного контроля, если они позволяют обнаружить этот отказ.

Пусть идет i-й такт работы системы (фиг. 3).

В этом такте парой проверяемых процессоров назначаются процессоры 1i и 1;+ . Предположим, что результаты их работы не совпали и на выходе блока 11 выработался сигнал несравнения высокого уровня. Этот сигнал поступит на вход 12 сравнения устройства и далее на входы первого элемента

И 13 первого элемента 14 задержки, элемента НЕ 35 и шестого элемента И 32. Элемент

11 (О-триггер) задерживает поступающий на его вход сигнал на один такт. Поэтому низкий уровень сигнала с выхода элемента 14 задержки запрещает прохождение сигнала несравнения через элемент И 13. Так как на выход второго элемента 33 задержки также низкий уровень сигнала, то прохождение сигнала несравнения через шестой элемент

И 32 также запрещено. Устройство управления не изменяет свою работу.

В.следующем i+1 такте (фиг. 3) параллельно работают процессоры 1;+i и 1i+g.

Пусть и в этом такте произошло несравнение результатов работы пары проверяемых процессоров. Сигнал несравнения с выхода блока 11 поступает на вход 12 сравнения

1718398

50 устройства управления и проходит через первый И 13 элемент, который будет открыт сигналом высокого уровня с выхода элемента 14 задержки (результат несравнения в предыдущем такте), и элемент ИЛИ 34 на один из входов элементов И 15 первой группы. Появление сигнала высокого уровня на выходе элемента ИЛИ 34 означает отказ процессора. Номер отказавшего процессора определяется содержанием первого регистра 24, на выходе i + 1-ro разряда которого в текущем i + 1-м такте формируется высокий уровень, который разрешает прохождение сигнала отказа через элемент

И 15н-1 на элементе ИЛИ 16н- и через него на вход регистра 17. При этом в единичное состояние устанавливается соответствующий разряд регистра 17 готовности процессоров, на прямом выходе которого вырабатывается сигнал останова отказавшего процессора 1н-1, поступающий в выходную шину 7 управления процессорами, на инверсном выходе — сигнале низкого уровня, который, закрывая элемент 19-+1 запрещает прохождение сигналов 27 запуска от генератора 21 в выходную шину 7 управления процессорами. Низкий уровень с инверсного выхода i + 1-го разряда регистра ,17, поступающий на вход второго элемента

И 20, формирует на выходе этого элемента низкий уровень, который поступает на вход элементов И 181, .„18m, 18m+1 и запрещает прохождение сигналов блокировки записи в выходные шины 71,... 7m. 7m+> управления процессорами. Кроме того, низкий уровень с выхода элемента И 20 поступает на вход четвертого элемента И 23, запрещая изменение содержимого первого 24 и второго 25 регистров импульсами 27 от генератора 21.

Таким образом происходит подготовка системы к работе с m исправными процессорами, Начиная со следующего такта система будет продолжать функционировать с

m исправными процессорами без проведения внешнего контроля, функции остановленного процессора 1 +> будет выполнять соседний процессор 1н, Контроль работоспособности процессоров будет осуществляться только внутренним контролем.

Если же в i+ 1-м такте с блока 11 сравнения на вход 12 сравнения устройства управления не поступил сигнал высокого уровня (фиг. 4), т.е, результаты работы пары проверяемых процессоров совпали, то сигнал высокого уровня с первого элемента t4 задержки (результат нвсравнения в предыдущем такте) пройдет через пятый элемент И и поступит на вход установки триггера 36 блокировки, на сдвиговые вверх входы регистров 24 и 25, а также на вход aroporo

35 элемента 33 задержки, По этому сигналу содержимое регистров 24 и 25 сдвигается на один разряд вверх, а триггер 36 блокировки устанавливается в единичное состояние, блокируя тем самым сдвиг содержимого первого 24 и второго 25 регистров вниз по следующему тактовому импульсу с выхода генератора 21. Таким образом, в следующем l + 2-м такте (фиг. 4) будут проверяться процессоры 1. и 1н-ь Если по окончании их работы с выхода блока 11 сравнения на вход

12 сравнения устройства управления не поступает сигнал о несравнении результатов, то сигнал высокого уровня с выхода второго элемента 33 задержки не пройдет через шестой элемент И 32, по этим сигналам триггер

36 блокировки обнуляется и появляющийся на инверсном выходе триггера 36 единичный сигнал разрешает в следующем такте прохождение через четвертый элемент И 23 тактовых импульсов с выхода 27 генератора

21. Устройство управления не изменяет свою работу, так как в этом слу <ае, поступивший в i-M такте с блока 11 сравнения сигнал высокого уровня был инициирован однотактным сбоем в работе пары проверяемыхх процессоров.

Если же в! +.2-м такте (фиг. 4) с блока 11 сравнения поступает сигнал высокого уровня, свидетельствующий о несовпадении результатов в паре проверяемых процессоров

1 и 1н1, то принимается решение об отказе процессора 1ь Поступивший на вход 12 сравнения сигнал высокого уровня разрешает прохождение сигнала с выхода второго элемента 33 задержки через шестой элемент И 32, Устройство управления настраивается на работу с m исправными про- цессорами. В этом случае функции отказавшего процессора 1 будет выполнять соседний процессор 1+ .

Таким образом, предлагаемое устройство позволяет сократить время выявления отказавшего процессора с m + 1 до трех тактов контроля и поэтому может быть применено для BC с малым резервом времени, Формула изобретения

Устройство для управления реконфигурацией резервированной вычислительной системы, содержащее первый-четвертый элементы И, группу элементов ИЛИ, первую — третью группы элементов И, первый элемент задержки, регистр готовности процессоров, генератор тактовых импульсов, первый и второй регистры сдвига, шифратор согласования, входы которого и первые входы элементов ИЛИ группы подключены к соответствующим входам группы входов контроля устройства, выходы шифратора согласования — к информационным входам

1718398

Таблица I

Номера модулей памяти, подклвчаемик. к процессооам

t 2 3 ... е-1 m m+1

1 2 3 ... в-1 т<

1 0 0 0 ... 0 0 I 1 2 ... яг-2 m-1 m

2 1 0 0 ... 0 0 1 2 2 ... m-2 m-1 в

3 1 t 0 ... 0 . 0 1 2 3 .. m-2 <а-I.m

m 1 .m+1 I » 1

m+2 0 . 0

1 0 1 2 3 ... < m-1 в ! 1 . 1 2 3 ... в-1 а 1

0 - 0 . 1 2 ... в-2 <я-1, <а

1

0 ...

Т а б п и ц а 2

Содеряимое разрядов регистра сдвмга

Процессор, с которого сцитивается иибормация

Пара проверяемых процессоров

Номер такта

1 1 0 0 .... 0 0 0

2 0 0- ... а. 0 0

Э . 0 0 1 ... 0 0 0

1< !2

2 3

m 0 0 О, 0 1 0 1<и !»< ° < я<+1 0 0 0 ... 0 0 1.,-1<

m<2 1 0 0 ... 0 0 0 1< - 1я!

1< второго регистра сдвига, вход сброса которого подключен к выходу первого разряда первого регистра сдвига, входы синхронизации и сдвига второго регистра сдвига соединены с выходами третьего и четвертого 5 элементов И соответственно, выходы второго регистра сдвига — с группой выходов уп"равления коммутацией устройства, выходы: . первого регистра сдвига подключены- к"вы- ходу управления сравнением устройства и., 10 первым входом соответствующих элементов И первой группы. выходы которых.подключены к вторым входам соответствуюЩих элементов ИЛИ группы, вход сравнения устройства — к первому входу первого злейшей- 15 та И и через первый элемент задержки::к.. второму входу первого элемента И, выходы элементов ИЛИ группы подключены к @нформационным входам регистра готовносньпроцессоров, прямые выходы регистра:ro; 20 тоаности процессоров. второй и третьей групп элементов И соединены с соответст- вующими выходами группы выходов управления процессорами устройства, инверсные выходы регистра готовности 25 процессоров соединены с первыми входами соответствующих элементов И третьей группы и с входами второго элемента И, прямой и инверсный выходы которого соединены с первыми входами четвертого и ЗО

Номер Содеряииое раарядоа регистра .сдвига такта с евпомимаиием третьего элементов И соответственно, к вторым входам которых и.к вторым входам элементов И третьей группы подключен выход генератора TBKT08blx. импульсов, первые входы элементов И второй группы подключены к соответствующим выходам первого регистра сдвига, а вторые входы — к прямому выходу второго элемента И. выход четвертого элемента И вЂ” к входу сдвига первого регистра сдвига, о т л и ч а ю щ е е с я тем, что. с целью повышения оперативности диагностирования. в устройство управления.введены пятый и шестой элементы И. второй элемент задержки. элемент ИЛИ, элемент

HE и триггер блокировки, выход которого подключен к третьему входу четвертого элемента И, выходы первого и шестого элементов И вЂ” к первому и второму входам элемента

ИЛИ, выход которого соединен с вторыми входами элементов -И. первой круппы. вход сравнения устройства подключен к первому входу шестого элемента И и через элемент НЕ с первым входом пятого элемента И, второй вход которого соединен с выходом первого элемента задержки. а выход подключен к входам стробирования первого и второго сдвиговых регистров, к входу установкй триггера блокировки и через второй элемент задержки к второму входу шестого элемента И и входу сброса триггера блокировки.

1718398

1718398

1718398!

35 д

Cu >

Юнг. 4 составитель H. Парамонов

Гехред M.Mîðråíòàë Корректэр А. Осауленко

Редактор H. Яцола

Производственно-изд; тельский комбинат "Патент", г. Ужгодгд л.Гагарина. 101

Подпис ое

ВНИИПИ Госуда ствен ого комитета по изобретениям и отк1 ыти м при ГК Т С С

113G35, Москва. Ж-35, Раушская наб., 4/Е

Устройство для управления реконфигурацией резервированной вычислительной систем Устройство для управления реконфигурацией резервированной вычислительной систем Устройство для управления реконфигурацией резервированной вычислительной систем Устройство для управления реконфигурацией резервированной вычислительной систем Устройство для управления реконфигурацией резервированной вычислительной систем Устройство для управления реконфигурацией резервированной вычислительной систем Устройство для управления реконфигурацией резервированной вычислительной систем Устройство для управления реконфигурацией резервированной вычислительной систем 

 

Похожие патенты:

Изобретение относится к автоматике и вычислительной технике и может быть использовано при построений отказоустойчивых цифровых систем

Изобретение относится к вычислительной технике и может быть применено для синхронизации резервированных делителей частоты

Изобретение относится к импульсной технике

Изобретение относится к автоматике и вычислительной технике, в частности к устройствам для КОНТРОЛЯ и оеэервировани! информационно-измерительных систем и Может быть использовано при построении отказоустойчивых цифровых систем

Изобретение относится к вычислительной технике и может быть использовано при построении высоконадежных и стабильных систем синхронизации

Изобретение относится к вычислительной технике и связи и может быть использовано в системах автоматического управления для передачи информации

Изобретение относится к автоматике и вычислительной технике и может быть использовано в мажоритарно-резервированных устройствах для деления частоты импульсов

Изобретение относится к вычислительной технике и может быть использовано при построении параллельных микропроцессорных систем повышенной надежности, в частности для цифровой обработки радиолокационной информации

Изобретение относится к вычислительной технике и может быть применено при разработке резервированных систем контроля и управления повышенной надежности , а также адаптивных резервированных систем

Изобретение относится к вычислительной и импульсной технике и может быть использовано для генерации сетки опорных частот

Изобретение относится к автоматике и вычислительной технике и может быть использовано при построений отказоустойчивых цифровых систем

Изобретение относится к вычислительной технике и может быть использовано в цифровых устройствах для параллельного суммирования двоичных чисел в фибоначчиевой системе счисления

Изобретение относится к вычислительной технике и может быть использовано при построении параллельных микропроцессорных систем повышенной надежности, в частности для цифровой обработки радиолокационной информации

Изобретение относится к импульсной технике, в частности к устройствам резервирования средств синхронизации комплексов связи

Изобретение относится к автоматике и вычислительной технике, в частности к устройствам для контроля и резервирования информационно - измерительных систем, и может быть использовано при построении отказоустойчивых цифровых систем

Изобретение относится к вычислительной технике и может быть использовано в системах автоматического управления

Изобретение относится к электротехнике и может быть использовано для автоматического подключения резервной нагрузки постоянного тока при отказе основной нагрузки

Изобретение относится к вычислительной технике и может быть использовано для построения контроллеров повышенной надежности

Изобретение относится к автоматике и вычислительной технике и может быть использовано для автоматического включения в работу элементов резервированной системы

Изобретение относится к импульсной и вычислительной технике и может быть использовано при построении высоконадежных устройств

Изобретение относится к области операционной системы мультипроцессорных отказоустойчивых вычислительных систем
Наверх