Способ перераспределения данных при расширении массива дисков



Способ перераспределения данных при расширении массива дисков
Способ перераспределения данных при расширении массива дисков
Способ перераспределения данных при расширении массива дисков
Способ перераспределения данных при расширении массива дисков
Способ перераспределения данных при расширении массива дисков
Способ перераспределения данных при расширении массива дисков
Способ перераспределения данных при расширении массива дисков
G06F3/0647 - Вводные устройства для передачи данных, подлежащих преобразованию в форму, пригодную для обработки в вычислительной машине; выводные устройства для передачи данных из устройств обработки в устройства вывода, например интерфейсы (пишущие машинки B41J; преобразование физических переменных величин F15B 5/00,G01; получение изображений G06T 1/00,G06T 9/00; кодирование, декодирование или преобразование кодов вообще H03M; передача цифровой информации H04L)

Владельцы патента RU 2747213:

Общество с ограниченной ответственностью "Рэйдикс" (RU)

Изобретение относится к вычислительной технике. Технический результат заключается в ускорении процедуры перераспределения данных при возможности осуществления запросов пользователей в процессе перераспределения. В способе перераспределения данных добавляют хотя бы один физический диск в дисковый массив, содержащий, по меньшей мере, два диска с первоначальным распределением данных по дискам массива, разбивают все страйпы первоначального дискового массива данных на группы, включающие k страйпов, при этом число k страйпов из первоначальной конфигурации массива выбирают таким, чтобы при переносе данных из первоначальной конфигурации дискового массива в новую конфигурацию дискового массива переносимые данные, включая вычисленные контрольные суммы для нового массива данных, заняли целое число m страйпов, далее последовательно переносят данные каждой группы страйпов первоначального дискового массива в заранее зарезервированную область записи данных, а затем записывают данные этой группы страйпов в страйпы новой конфигурации дискового массива, при достижении условия, когда размер свободной области между перемещенными и неперемещенными данными новой конфигурации дискового массива становится больше, чем размер переносимой группы страйпов, переносят и записывают данные каждой группы страйпов первоначального дискового массива непосредственно в страйпы новой конфигурации дискового массива, и при переносе данных последней группы страйпов первоначального дискового массива в страйпы новой конфигурации дискового массива прекращают перераспределение данных, причем при переносе данных разрешают обращаться к массиву данных по запросам пользователей. 7 з.п. ф-лы, 8 ил.

 

ОБЛАСТЬ ТЕХНИКИ

Изобретение относится к системам хранения данных на дисках и способам перераспределения данных при увеличении числа дисков и изменении уровня RAID (рейда).

ПРЕДШЕСТВУЮЩИЙ УРОВЕНЬ ТЕХНИКИ

Процесс перераспределения данных (рестрайпинг, англ. restriping) - это процесс перемещения данных из одной конфигурации дискового пространства в системе хранения данных с контрольными суммами (RAID) в другую конфигурацию дискового пространства для увеличения физического пространства RAID и тем самым производительности системы хранения данных, и/или изменения уровня RAID с целью повышения отказоустойчивости системы.

Известна система и способ перераспределения данных по множеству томов по патенту ЕР1880324, публикация 23.01.2008, МПК G06F-003/06. Способ предполагает распределение данных по дискам в виде страйпов с одинаковыми номерами и перераспределение данных при добавлении дисков. Перераспределение данных предполагает определение того, находятся ли страйпы на правильном объеме дисков, и если это не так, перемещает страйпы на правильный объем.

Известен патент CN102880424, публикация 28.10.2015, МПК G06F-003/06, в котором описана система и способ перераспределения данных в системе RAID. Способ может выполняться периодически, непрерывно, после каждого изменения RAID-устройства, после добавления дисководов и/или перед удалением дисководов. Система включает в себя подсистему RAID и диспетчер дисков, сконфигурированный для автоматического вычисления оценки для каждого RAID-устройства.

Наиболее близким является техническое решение, описанное в патенте ЕР2021904, публикация 2009-02-11, МПК G06F-003/06. Решение относится к системам и способам перераспределения данных в RAID. Способ предусматривает перемещение данных с исходного устройства RAID на альтернативное устройство RAID и удаление исходного устройства RAID.

При этом остается актуальной задача повышения быстродействия процедуры перераспределения данных при осуществлении рестрайпинга.

СУЩНОСТЬ ИЗОБРЕТЕНИЯ

Техническим результатом изобретения является ускорение процедуры перераспределения данных при возможности осуществления запросов пользователей в процессе перераспределения.

Способ перераспределения данных при расширении массива дисков во время работы компьютерной системы включает следующие операции.

Добавляют хотя бы один физический диск в дисковый массив, содержащий, по меньшей мере, два диска с первоначальным распределением данных по дискам массива.

Разбивают все страйпы первоначального дискового массива данных на группы, включающие к страйпов, при этом число к страйпов из первоначальной конфигурации массива выбирают таким, чтобы при переносе данных из первоначальной конфигурации дискового массива в новую конфигурацию дискового массива, переносимые данные, включая вычисленные контрольные суммы для нового массива данных, заняли целое число m страйпов.

Далее последовательно переносят данные каждой группы страйпов первоначального дискового массива в заранее зарезервированную область записи данных, а затем записывают данные этой группы страйпов в страйпы новой конфигурации дискового массива.

При достижении условия, когда размер свободной области между перемещенными и не перемещенными данными новой конфигурации дискового массива становится больше чем размер переносимой группы страйпов, переносят и записывают данные каждой группы страйпов первоначального дискового массива непосредственно в страйпы новой конфигурации дискового массива.

И при переносе данных последней группы страйпов первоначального дискового массива в страйпы новой конфигурации дискового массива прекращают перераспределение данных.

В частном случае выполнения при достижении условия, когда размер свободной области между перемещенными и не перемещенными данными новой конфигурации дискового массива становится больше чем размер переносимых, по меньшей мере, одной группы страйпов, переносят и записывают данные, по меньшей мере, двух страйпов одной группы одновременно.

Кроме того, при достижении условия, когда размер свободной области между перемещенными и не перемещенными данными новой конфигурации дискового массива становится больше чем размер переносимых, по меньшей мере, двух групп страйпов переносят и записывают данные, по меньшей мере, двух групп страйпов.

В частности, при переносе данных разрешают обращаться к массиву данных по запросам пользователей.

При этом, устанавливают приоритет процессу переноса данных от нуля до ста процентов приоритета, зависящий от обращений по запросам пользователей. Регулировку приоритета осуществляют путем выделения периода времени между переносом одной группы страйпов до времени начала переноса последующей группы страйпов.

В одном варианте выполнения, при потере или искажении данных в процессе перераспределения данных, прерывают перераспределение данных, восстанавливают данные, а далее продолжают перенос данных групп страйпов.

В другом варианте выполнения, при потере или искажении данных в процессе перераспределения данных, выполняют перераспределение данных до конца, а далее восстанавливают данные, который были утрачены или искажены.

В еще одном варианте, при потере или искажении данных в процессе перераспределения данных, восстановление данных производят одновременно с переносом данных, для тех областей дискового массива, которые не попадают в текущую группу страйпов переноса.

В данной заявке используются следующие термины:

Блок - в RAID массивах диски логически разбиваются на блоки одинакового размера.

Страйп - последовательность блоков с одинаковыми номерами, расположенных на разных дисках RAID массива.

Группа страйпов - два и более страйпов разных дисков RAID массива.

КРАТКОЕ ОПИСАНИЕ ЧЕРТЕЖЕЙ

На Фиг. 1 показано состояние RAID-массива перед началом процесса переноса данных из начальной конфигурации массива в новую конфигурацию массива.

На Фиг. 2 приведена схема первой итерации переноса данных из начальной конфигурации массива в новую конфигурацию массива.

На Фиг. 3 приведена схема второй итерации переноса данных из начальной конфигурации массива в новую конфигурацию массива.

На Фиг. 4 приведена схема третьей итерации переноса данных из начальной конфигурации массива в новую конфигурацию массива.

На Фиг. 5 приведена блок схема процесса перераспределения данных.

На Фиг. 6 приведена блок схема процесса последовательного переноса страйпов одной группы.

На Фиг. 7 приведена блок схема процесса параллельного переноса страйпов одной группы.

На Фиг. 8 приведена блок схема регулировки скорости процесса переноса данных при разном приоритете.

ВАРИАНТЫ ОСУЩЕСТВЛЕНИЯ ИЗОБРЕТЕНИЯ

Способ перераспределения данных при расширении массива дисков во время работы компьютерной системы относится к системе хранения данных при переходе из одной конфигурации массива дисков в другую, при добавлении дисков для увеличения физического пространства RAID. При этом возможно также изменение уровня RAID с целью повышения отказоустойчивости системы. Пример расширения массива дисков показан на Фиг.1. К четырем имеющимся дискам первоначальной конфигурации массива добавляются два диска, и новая конфигурация дискового массива включает шесть дисков.

Первоначальный массив дисков содержит страйпы А, В, С, D, Е, F которые содержат на каждом диске блоки А1, А2, A3 с данными и контрольными суммами Р начального уровня RAID в страйпе А, и других страйпахА, В, С, D, Е, F дисков 1-4.

При этом, расширение может происходить как путем добавления новых физических дисков, так и путем расширения дискового массива другим способом, например, за счет добавления другого рейд массива или системы хранения в качестве устройства рейда.

Первоначально разбивают все страйпы А, В, С, D, Е, F… первоначального дискового массива данных на группы, включающие к страйпов. В данном способе перераспределение данных производится одновременно для нескольких страйпов - группы страйпов. Тем самым достигается ускорение процедуры перераспределения данных, так как в известных способах перенос осуществляется по одному страйпу или по одному блоку.

При этом, количество страйпов к в группе страйпов из первоначальной конфигурации массива выбирают таким, чтобы при переносе данных из первоначальной конфигурации дискового массива в новую конфигурацию дискового массива, переносимые данные, включая вычисленные контрольные суммы для нового массива данных, заняли целое число m страйпов.

Далее последовательно переносят данные каждой группы страйпов первоначального дискового массива в заранее зарезервированную, свободную область записи данных (backup сору). Размер свободной области записи данных рассчитывается таким образом, чтобы всегда поместились данные переносимой группы страйпов максимального размера.

Затем записывают данные этих групп страйпов в страйпы новой конфигурации дискового массива.

Процесс перераспределения данных, когда перенос данных группы страйпов сначала производится в заранее зарезервированную область записи данных, а затем в страйпы новой конфигурации дискового массива показан на Фиг.2 - Фиг. 4. В процессе перераспределения данных запись в заранее зарезервированную, свободную область производится чтобы избежать порчи данных в случае отказов во время этого процесса. В процессе переноса, если это необходимо, рассчитываются новые контрольные суммы данных вместо старых Pi, где Pi - это контрольная сумма в страйпе i старой конфигурации рейда. В примере реализации рассматривается вариант с расширением уровня RAID, значит с расчетом новых контрольных сумм Si,j, где Si,j - контрольная сумма номер j в страйпе i новой конфигурации рейда

На Фиг. 2 приведена схема первой итерации переноса данных из начальной конфигурации массива в новую конфигурацию массива. При этом этап записи в заранее зарезервированную область, для простоты понимания на рисунках опущен. При первой итерации перемещаются данные первой группы страйпов из старой конфигурации в новую. Данные перемещаемой группы страйпов в данном примере охватывают страйпы старой конфигурации с номерами 0-3, включающие данные, находящиеся в блоках 1-11 и контрольные суммы Р03. В новой конфигурации дискового массива данные и новые контрольные суммы S0,0- S2,0 и S0,1-S2,1 будут размещены в страйпах с номерами 0-2. В один момент времени переносится только одна группа страйпов. Обращение к данным страйпов, находящихся в процессе переноса, по запросам пользователей блокируются до окончания перемещения группы страйпов. Вопросы приоритета процесса перераспределения данных или процесса выполнения запросов пользователей при переносе, рассматриваются ниже.

После окончания первой итерации в новой конфигурации массива между перенесенными данными (страйпы с номерами 0-2) и еще не перенесенными данными (страйп номер 4 и последующие страйпы) образуется свободный, не занятый данными страйп номер 3.

Во время второй итерации переноса данных из начальной конфигурации массива в новую конфигурацию массива (Фиг. 3), происходит перенос данных группы страйпов под номерами 4-7, блоки 12-23 и соответствующие контрольные суммы. Они записываются в новой конфигурации массива в страйпы с номерами 3-5. При этом рассчитываются соответствующие новые контрольные суммы. По окончании этой итерации образуется свободная зона, не занятая данными, состоящая уже из двух страйпов, с номерами 6-7.

На третьей итерации происходят такие же процессы переноса данных, сначала запись данных группы страйпов в свободную, заранее зарезервированную область, а затем в новую конфигурацию массива в страйпы под номерами 6-8, блоки 24-35 и соответствующие контрольные суммы. По окончании этой итерации образуется свободная зона, не занятая данными, состоящая уже из трех страйпов, с номерами 9-11.

Таким образом каждая итерация переноса данных группы страйпов в новую конфигурацию массива будет расширять свободную зону между перенесенными данными и еще не перенесенными данными. На какой-то итерации, в данном примере после третьей итерации, достигается условие, когда размер свободной области между перемещенными и не перемещенными данными новой конфигурации дискового массива становится больше чем размер переносимой группы страйпов.

При достижении этого условия переносят и записывают данные каждой группы страйпов первоначального дискового массива непосредственно в страйпы новой конфигурации дискового массива, минуя этап промежуточной записи в заранее зарезервированную область. Такой переход в данном способе перераспределения данных при расширении массива дисков во время работы компьютерной системы не затрагивает хранимые данные и позволяет еще более ускорить перенос данных.

Так же при достижении этого условия перенос страйпов одной группы может выполняться не последовательно по одному страйпу, а параллельно для всех страйпов группы. Таким образом чтение данных необходимых для расчета контрольных сумм согласно уровню рейда и количеству дисков новой конфигурации, расчет контрольных сумм и запись данных выполняется одновременно для всех страйпов группы. Такой подход существенно повышает скорость переноса данных.

Более того, когда размер области между перемещенными и не перемещенными данными новой конфигурации дискового массива становится больше чем размер нескольких переносимых групп страйпов, перенос данных может выполняться параллельно не только для страйпов одной группы, но и сразу для нескольких групп страйпов.

Таким образом, перемещение данных в свободную, заранее зарезервированную область производится не всегда, а только в начале процесса перераспределения данных при расширении массива дисков.

Процесс перераспределения данных при расширении массива дисков иллюстрируется блок схемой на Фиг. 5. Первоначально производится инициализация начальных условий перераспределения данных к которым относится номер текущей группы переноса, размер группы переноса, количество групп в рейде, размер свободной области между перемещенными и не перемещенными данными старой и новой конфигурациями дискового массива, время ожидания между переносом групп согласно приоритету. Далее, после проверки не проведено ли полное перераспределение данных, проверяется условие, необходимо ли проводить перераспределение данных через зарезервированную область записи данных или может быть произведено перераспределение данных непосредственно из данных каждой группы страйпов первоначальной конфигурации дискового массива непосредственно в страйпы новой конфигурации дискового массива. После осуществления следующей итерации переноса данных производится обновление значения счетчика перенесенных групп страйпов и цикл повторяется.

Необходимо отметить, что благодаря наличию счетчика перенесенных групп и внутренней хэш таблицы, в которой для каждой группы при процессе рестрайпинга хранится текущее количество запросов от пользователя и запросов на перенос данных, перераспределение данных может происходить без остановки пользовательской нагрузки на основное хранилище.

Из блок схемы на Фиг. 5, перенос данных группы страйпов может осуществляться синхронно, по одному страйпу (блок а) или асинхронно, параллельно по всем страйпам (блок b). Таким образом в группе страйпы могут переноситься один за другим, то есть последовательно (синхронно), или асинхронно, то есть переносится сразу несколько страйпов группы.

На Фиг. 6 приведена блок схема синхронного, по одному страйпу, последовательного перераспределения данных. При последовательном переносе страйпов группы, для каждого страйпа по очереди сперва производится чтение данных необходимых для расчета контрольных сумм согласно уровню рейда и количеству дисков новой конфигурации. Затем прочитанные блоки и контрольные суммы записываются в новое местоположение, согласно новой конфигурации рейда. Только после окончания записи страйпа происходит переход к обработке следующего страйпа.

На Фиг. 7 приведена блок схема асинхронной, параллельной по всем страйпам, последовательности перераспределения данных При параллельном переносе всех страйпов группы, сперва выполняется чтение всех блоков данных старой конфигурации, необходимых для записи и расчета контрольных сумм новой конфигурации. Когда для какого-то страйпа X новой конфигурации прочитаны все блоки данных, то для него выполняется расчет контрольных сумм согласно уровню рейда и количеству дисков новой конфигурации. Это событие может происходить одновременно для нескольких страйпов. После расчета контрольных сумм страйпа X выполняется запись его блоков данных и контрольных сумм согласно новой конфигурации. Выполняется ожидание того, что для всех страйпов группы будет выполнена запись согласно новой конфигурации. Далее происходит переход к следующей группе страйпов, если не все группы были перенесены.

В процессе переноса данных может произойти отказа дисков дисковой корзины в RAID, повреждение части диска или другой отказ в системе хранения данных, при котором отказавшие данные могут быть восстановлены за счет наличия в RAID контрольных сумм.

В процессе восстановления данных при перераспределении возможны три варианта.

В первом варианте при потере или искажении данных в процессе перераспределения данных, прерывают перераспределение данных, восстанавливают данные, а далее продолжают перенос данных групп страйпов.

Во втором варианте при потере или искажении данных в процессе перераспределения данных, выполняют перераспределение данных до конца, а далее восстанавливают данные, который были утрачены или искажены.

В третьем варианте при потере или искажении данных в процессе перераспределения данных, восстановление данных производят одновременно с переносом данных, для тех областей дискового массива, которые не попадают в текущую группу страйпов переноса.

Важной отличительной особенностью способа является возможность управления приоритетом перераспределения данных или приоритетом выполнения запросов пользователей.

Приоритет задает администратор системы хранения данных как число от 0 до 100%. Приоритет регулирует время, которое процесс перераспределения данных будет ждать между переносом одной группы рестрайпинга и началом переноса следующей группы перераспределения данных, например, 5 миллисекунд, тем самым снижая влияние на пользовательскую нагрузку.

Если приоритет выставлен 100%, то даже при наличии пользовательской нагрузки на массив данных, не будет происходить ожидание между переносом одной группы и другой, таким образом перераспределения данных будет работать с максимальной скоростью.

Если приоритет перераспределения данных выставлен 0%, то при наличии пользовательской нагрузки, перераспределение данных будет ожидать пока нагрузка прекратится, а потом перераспределение данных продолжится.

Если приоритет перераспределения данных между 0% и 100%, то время ожидания пропорционально приоритету. Таким образом можно регулировать скорость перераспределения данных в зависимости от приоритета и нагрузки пользователя.

Процедура управления приоритетом поясняется блок схемой на Фиг. 8. Управление приоритетом осуществляется за счет подсчета количества запросов в течение определенного времени и проверки пользовательской нагрузки на массив данных также за определенное время.

ПРОМЫШЛЕННАЯ ПРИМЕНИМОСТЬ

Заявленный способ может быть применен для увеличения производительности RAID-массива и его размера за счет добавления дискового пространства при сохранении или увеличении надежности сохранения информации. Во время перераспределения данных может быть произведена смена уровня RAID-массива. При этом пользовательская нагрузка на систему хранения может осуществляться, при этом может меняться приоритет между перераспределением данных и пользовательской нагрузкой.

Процесс перераспределения данных - рестрайпинга происходит быстрее и он является более ориентированным на запросы пользователей систем хранения данных, так как запросы пользователей могут не прерываться.

1. Способ перераспределения данных при расширении массива дисков во время работы компьютерной системы, характеризующийся тем, что

- добавляют хотя бы один физический диск в дисковый массив, содержащий, по меньшей мере, два диска с первоначальным распределением данных по дискам массива;

- разбивают все страйпы первоначального дискового массива данных на группы, включающие k страйпов, при этом число k страйпов из первоначальной конфигурации массива выбирают таким, чтобы при переносе данных из первоначальной конфигурации дискового массива в новую конфигурацию дискового массива переносимые данные, включая вычисленные контрольные суммы для нового массива данных, заняли целое число m страйпов;

- далее последовательно переносят данные каждой группы страйпов первоначального дискового массива в заранее зарезервированную область записи данных, а затем записывают данные этой группы страйпов в страйпы новой конфигурации дискового массива;

- при достижении условия, когда размер свободной области между перемещенными и неперемещенными данными новой конфигурации дискового массива становится больше, чем размер переносимой группы страйпов, переносят и записывают данные каждой группы страйпов первоначального дискового массива непосредственно в страйпы новой конфигурации дискового массива;

- при переносе данных последней группы страйпов первоначального дискового массива в страйпы новой конфигурации дискового массива прекращают перераспределение данных, при этом при переносе данных разрешают обращаться к массиву данных по запросам пользователей.

2. Способ по п. 1, характеризующийся тем, что при достижении условия, когда размер свободной области между перемещенными и неперемещенными данными новой конфигурации дискового массива становится больше, чем размер переносимых, по меньшей мере, одной группы страйпов, переносят и записывают данные, по меньшей мере, двух страйпов одной группы одновременно.

3. Способ по п. 1, характеризующийся тем, что при достижении условия, когда размер свободной области между перемещенными и неперемещенными данными новой конфигурации дискового массива становится больше, чем размер переносимых, по меньшей мере, двух групп страйпов, переносят и записывают данные, по меньшей мере, двух групп страйпов.

4. Способ по п. 1, характеризующийся тем, что устанавливают приоритет процессу переноса данных от нуля до ста процентов приоритета, зависящий от обращений по запросам пользователей.

5. Способ по п. 4, характеризующийся тем, что регулировку приоритета осуществляют путем выделения периода времени между переносом одной группы страйпов до времени начала переноса последующей группы страйпов.

6. Способ по п. 1, характеризующийся тем, что при потере или искажении данных в процессе перераспределения данных прерывают перераспределение данных, восстанавливают данные, а далее продолжают перенос данных групп страйпов.

7. Способ по п. 1, характеризующийся тем, что при потере или искажении данных в процессе перераспределения данных выполняют перераспределение данных до конца, а далее восстанавливают данные, который были утрачены или искажены.

8. Способ по п. 1, характеризующийся тем, что при потере или искажении данных в процессе перераспределения данных восстановление данных производят одновременно с переносом данных для тех областей дискового массива, которые не попадают в текущую группу страйпов переноса.



 

Похожие патенты:

Заявленная группа изобретений относится к способам и устройствам, осуществляющим радиолокационное считывание усилия. Эти способы и устройства могут предоставлять возможность измерения значительного охвата усилий.

Группа изобретений относится к способу и системе объединения множественных записей в системе электронных карт контрольной проверки, считываемому процессором носителю для длительного хранения данных.

Изобретение относится к средствам вывода интерактивного интерфейса услуги на основе дополненной реальности. Техническим результатом является расширение арсенала технических средств вывода интерактивного интерфейса услуги на основе дополненной реальности.

Изобретение относится к области информационных технологий. Технический результат заключается в улучшении доступности приложений, услуг и содержимого или доступность функций, которые могут выполнять с устройствами.

Изобретение относится к области устройств для мультимедийного управления вычислительными устройствами для слепых или слабовидящих. Техническим результатом является обеспечение возможности для слепых и слабовидящих людей взаимодействовать с графическими элементами на вычислительных устройствах.

Настоящее изобретение относится к области вычислительной техники для переноса файла между мобильными терминалами. Технический результат заключается в повышении эффективности переноса файла между мобильными терминалами.

Изобретение относится к системам сегментации объекта на изображении. Технический результат заключается в обеспечения возможности получения точной сегментации объекта на изображении.

Изобретение относится к системам обработки данных. Технический результат заключается в автоматизированном учете производственных операций работников.

Изобретение относится к средствам управления печатающим устройством. Технический результат заключается в обеспечении возможности определения, не противоречит ли принятое значение настройки печати хранимой информации о настройках.

Группа изобретений раскрывает способ и устройство для обработки сигнала касания. Технический результат - прием процессом приложения полной последовательности операций касания, которая согласуется с логикой обработки, тем самым эффективно не допуская одновременного ответа процесса обработки жеста и процесса обработки приложения, так, что гарантируется стабильное и плавное переключение интерфейса, когда пользователь оперирует в области ввода жеста.

Изобретение относится к способу копирования или перемещения иерархически структурированных данных с устройства-носителя информации на устройство-потребитель информации.
Наверх