Что такое raid массивы и зачем они нужны?

Диски, используемые для RAID 0

Как я написал в введении, наш RAID будет состоять из четырёх дисков. Первый диск — Seagate Barracuda 80 Гб с интерфейсом IDE — самый слабенький:

Тем не менее, состояние его вполне нормальное. Сбойных секторов или прочих ошибок нет. На скриншоте ниже SMART и быстродействие этого диска в программе CrystalDiskMark:

Seagate Barracuda 80 Gb IDE

Поскольку на моей системной плате нет разъёмов IDE, то подключить этот диск напрямую я не мог. Для этого пришлось использовать плату-контроллер. Так она выглядит:

Не подумайте, что контроллер я купил специально, дабы подключить старый диск. Делать мне нечего. Случайно я вспомнил, что он у меня валяется без дела и решил задействовать. Контроллер этот двусторонний. То есть, с его помощью можно подключить старый IDE диск к современной системной плате, но также можно подключить новый SATA диск к старой плате, у которой нет SATA контроллера. На фотографии ниже показываю, как диск подключается к плате. В разъём IDE вставляется плата-контроллер, а уже к ней подключается SATA шлейф и питание самого контроллера. Питание диска подключается как обычно:

Конечно же первый вопрос, который возникает, при работе с подобными контроллерами: “Насколько он ухудшает скорость работы диска?” Мне тоже хотелось это проверить и я подключил диск к старой плате, имеющей разъём IDE. Ниже скриншот быстродействия, но диск уже подключен напрямую IDE to IDE:

Сравнение производительности (подключение напрямую — слева и через контроллер — справа)

Как видно на сравнительном скриншоте, разницы в производительности почти нет. Она настолько незначительная, что можно сказать в пределах погрешности измерений. Так что хорошая новость, подобный контроллер практически никак не ограничивает быстродействие жёсткого диска. С этим разобрались, переходим к следующему диску.

Следующий диск тоже Seagate Barracuda 80 Гб, но уже с интерфейсом SATA, более современный:

Диск этот хоть и SATA, но тоже далеко не первой свежести. И тем не менее со SMART всё в порядке. Его вы видите на скриншоте ниже вместе с тестом производительности:

Seagate Barracuda 80 Gb SATA

Третий диск, используемый мною для создания массива — Maxtor 80 Gb SATA:

SMART и тест быстродействия этого диска:

Maxtor 80 Gb SATA

Четвёртого диска на 80 Гб у меня не было. Но для создания RAID массива совершенно не обязательно использовать диски одинакового объёма. Посему четвёртым диском был выбран Seagate Barracuda 160 Gb SATA:

SMART этого диска показывает 1 сбойный сектор. Появился он уже давно и новых не добавляется, так что всё в порядке. Хотя наработка внушительная — 47 тысяч 300 часов:

Seagate Barracuda 160 Gb SATA

В завершение вступительной части покажу, как все эти 4 диска разместились в корпусе компьютера. Прямо перед ними расположен 120 мм вентилятор, продувающий всю “корзину” (между дисками есть расстояние). С охлаждением проблем нет:

Все четыре диска подключены к компьютеру, переходим к созданию RAID:

Скриншот окна “Управление дисками”

Практическая реализация

Для
практической реализации RAID-массивов необходимы две составляющие: собственно
массив жестких дисков и RAID-контроллер. Контроллер выполняет функции связи
с сервером (рабочей станцией), генерации избыточной информации при записи и
проверки при чтении, распределения информации по дискам в соответствии с алгоритмом
функционирования.

Конструктивно контроллеры бывают как внешние, так и внутренние. Имеются также
интегрированные на материнской плате RAID-контроллеры. Кроме того, контроллеры
различаются поддерживаемым интерфейсом дисков. Так, SCSI RAID-контроллеры предназначены
для использования в серверах, а IDE RAID-контроллеры подходят как для серверов
начального уровня, так и для рабочих станций.

Отличительной характеристикой RAID-контроллеров является количество поддерживаемых
каналов для подключения жестких дисков. Несмотря на то что к одному каналу контроллера
можно подключить несколько SCSI-дисков, общая пропускная способность RAID-массива
будет ограничена пропускной способностью одного канала, которая соответствует
пропускной способности SCSI-интерфейса. Таким образом, использование нескольких
каналов может существенно повысить производительность дисковой подсистемы.

При использовании IDE RAID-контроллеров проблема многоканальности встает еще
острее, поскольку два жестких диска, подключенных к одному каналу (большее количество
дисков не поддерживается самим интерфейсом), не могут обеспечить параллельную
работу — IDE-интерфейс позволяет обращаться в определенный момент времени только
к одному диску. Поэтому IDE RAID-контроллеры должны быть как минимум двухканальными.
Бывают также четырех- и даже восьмиканальные контроллеры.

Другим различием между IDE RAID- и SCSI RAID-контроллерами является количество
поддерживаемых ими уровней. SCSI RAID-контроллеры поддерживают все основные
уровни и, как правило, еще несколько комбинированных и фирменных уровней. Набор
уровней, поддерживаемых IDE RAID-контроллерами, значительно скромнее. Обычно
это нулевой и первый уровни. Кроме того, встречаются контроллеры, поддерживающие
пятый уровень и комбинацию первого и нулевого: 0+1. Такой подход вполне закономерен,
поскольку IDE RAID-контроллеры предназначены в первую очередь для рабочих станций,
поэтому основной упор делается на повышение сохранности данных (уровень 1) или
производительности при параллельном вводе-выводе (уровень 0). Схема независимых
дисков в данном случае не нужна, так как в рабочих станциях поток запросов на
запись/чтение значительно ниже, чем, скажем, в серверах.

Основной функцией RAID-массива является не увеличение емкости дисковой подсистемы
(как видно из его устройства, такую же емкость можно получить и за меньшие деньги),
а обеспечение надежности сохранности данных и повышение производительности.
Для серверов, кроме того, выдвигается требование бесперебойности в работе, даже
в случае отказа одного из накопителей. Бесперебойность в работе обеспечивается
при помощи горячей замены, то есть извлечения неисправного SCSI-диска и установки
нового без выключения питания. Поскольку при одном неисправном накопителе дисковая
подсистема продолжает работать (кроме уровня 0), горячая замена обеспечивает
восстановление, прозрачное для пользователей. Однако скорость передачи и скорость
доступа при одном неработающем диске заметно снижается из-за того, что контроллер
должен восстанавливать данные из избыточной информации. Правда, из этого правила
есть исключение — RAID-системы уровней 2, 3, 4 при выходе из строя накопителя
с избыточной информацией начинают работать быстрее! Это закономерно, поскольку
в таком случае уровень «на лету» меняется на нулевой, который обладает великолепными
скоростными характеристиками.

До сих пор речь в этой статье шла об аппаратных решениях. Но существует и программное,
предложенное, например, фирмой Microsoft для Windows 2000 Server. Однако в этом
случае некоторая начальная экономия полностью нейтрализуется добавочной нагрузкой
на центральный процессор, который помимо основной своей работы вынужден распределять
данные по дискам и производить расчет контрольных сумм. Такое решение может
считаться приемлемым только в случае значительного избытка вычислительной мощности
и малой загрузки сервера.

Сергей Пахомов

КомпьютерПресс 3’2002

Отзывы о статье RAID-массивы — надежность и производительность

22.07.2007

|

Что такое RAID и зачем оно нужно?

RAID — это дисковый массив (т.е. комплекс или, если хотите, связка) из нескольких устройств, — жестких дисков. Как я и говорил выше, этот массив служит для повышения надёжности хранения данных и/или для повышения скорости чтения/записи информации (или и то и другое).

Собственно, то чем именно занимается оная связка из дисков, т.е  ускорением работы или повышением безопасности данных, — зависит от Вас, а точнее, от выбора текущей конфигурации рейда(ов). Разные типы этих конфигураций как раз и отмечаются разными номерами: 1, 2, 3, 4 и, соответственно, выполняют разные функции.

Рейды ощутимо удобнее и эффективнее использования одного диска в системе. Я бы даже рекомендовал их всем поголовно, не смотря на то, что приходится использовать два (а то и все четыре) устройства вместо одного. Подробнее я писал в статье: «Бутылочное горлышко» в производительности Вашего компьютера

Просто, например, в случае построения 0-вой версии (описание вариаций 0, 1, 2, 3 и пр., — читайте ниже) Вы получите ощутимый прирост производительности. Да и вообще жесткий диск нынче как раз таки узкий канал в быстродействии системы.

Что такое Write Through и Write Back?

Это способ записи данных, полученных RAID контроллером, на дисковый массив. По другому эти способы еще называются так: прямая запись (Write Through) и отложенная запись (Write Back). Какой из этих способов будет использоваться определяется в BIOS-е контроллера (либо при создании массива, либо позднее).

  • Write Through — данные записываются непосредственно на дисковый массив. Т.е. как только данные получены, они сразу же записываются на диски и после этого контроллер подает сигнал управляющей ОС о завершении операции.
  • Write Back — данные записываются сначала в кэш, и только потом (либо по мере заполнения кэш-а, либо в моменты минимальной загрузки дисковой системы) из кэш-а на диски. При этом, сигнал о завершении операции записи передается управляющей ОС сразу же по получении данных кэш-ем контроллера.

Write Back работает быстрее, но при этом надо помнить, что в случае сбоя питания все данные, которые находились в этот момент вкэш-е, будут потеряны. Причем, управляющая ОС (а следовательно и приложение, записывавшее эти данные) ничего об этом «не узнают», так как они уже получили сообщение от контроллера об успешном завершении записи. Например, если в кэше находились данные транзакции сервера СУБД, то СУБД будет уверенна, что с данными все хорошо, хотя на самом деле это не так.

Избежать описанной проблемы можно или с помощью установки на RAID контроллер BBU (см. ниже), или посредством подключения всего сервера через источник бесперебойного питания (UPS) с функцией программируемого выключения.

Кстати, некоторые RAID контроллеры не позволяют включить функцию Write Back без установленного BBU.

Теория: Уровни RAID и принципы восстановления данных

Чаще всего сейчас используются массивы уровней 0, 1, 10, 5, 50. В последнее время наблюдается возрастающий интерес к шестому уровню.

Ниже приведена краткая информация о принципах работы массивов. Более подробно, об этом можно прочитать в соответствующей статье.

RAID 0 – использование чередующейся записи (страйп). Строится из двух и более накопителей. Информация записывается на все диски массива блоками определенного (8кб,16кб,32кб,64 кб, 128кб…) размера. Файлы, размер которых один блок, равномерно распределяются по двум или более дискам.

Из-за отсутствия избыточности или дублирования данных, при выходе из строя одного из дисков, восстановить информацию в полном объеме невозможно без использования данных с неисправного накопителя. Исключением будут лишь файлы, размер которых меньше размера блока. Для полноценного восстановления информации в таких случаях необходимо сначала снять данные с неисправного диска, после чего восстанавливать RAID.

В случаях, когда все диски исправны, а массив отказывается корректно работать, восстановление производится программными методами, которые описаны

RAID 1 – использование технологии зеркалирования (зеркало). Строится из двух дисков. Информация одновременно пишется на оба накопителя, каждый диск является полной копией своего собрата. В случае выхода из строя одного из дисков массив остается работоспособным.

Если происходит сбой в работе контроллера и массив перестает определяться, то восстановление данных можно выполнить, воспользовавшись советами из статьи «Простое восстановление данных». Для этого один из дисков следует подключить к компьютеру на прямую, минуя RAID контроллер. Если повезёт, после подключения Ваши данные могут оказаться доступными и без использования программ, описанных в вышеуказанной статье.

RAID 10 – это объединение уровня 0 с уровнем 1, т.е. два страйпа объединяются в зеркало. В массиве используются минимум 4 диска. Он может остаться работоспособным при выходе из строя одного из составляющих его RAID 0.

При возникновении проблемы, в первую очередь необходимо определить, с чем именно возникли неполадки – с контроллером или с дисками

Когда проблема на уровне контроллера, Вам следует определить, какие винчестеры являются парами, составляющими страйпы

Здесь важно не перепутать диски, т.к. это приведет к потерянному времени и отсутствию результата

После того, как это станет известно, берётся одна такая пара, и с неё снимается информация таким же образом, как и с самостоятельного RAID 0.

Во время эксплуатации RAID 10, случается и такое, что выходят из строя два диска. Здесь возможны следующие варианты:

1) Оба диска принадлежат к одному страйпу, контроллер корректно обрабатывает исключительную ситуацию, и массив продолжает функционировать нормально.

2) Оба диска принадлежат к одному страйпу, но массив разваливается. В этом случае просто берём исправный страйп, и программно собираем его (об этом ниже).

3) Диски принадлежат к разным страйпам, но в одном из них уцелел первый, а в другом второй накопитель. Попробуйте программно собрать из них RAID 0.

4) Вышли из строя одноимённые диски разных страйпов. Увы  Один из сломанных дисков придётся отремонтировать, или каким-либо ещё образом снять с него данные. Затем программная сборка.

RAID 5 – массивы с контролем четности. Основным его достоинством является распределение блоков информации и контрольных блоков четности по всем дискам массива. Для создания такого массива требуется минимум три диска. Объём массива равен сумме объёмов составляющих его накопителей, минус один диск. Блоки контроля чётности используются для вычисления недостающей информации при выходе из строя одного из накопителей, составляющих массив. Таким образом, при утрате одного из дисков данные не теряются, и массив может продолжать работу.

Но, случается и такое, что после выхода из строя одного накопителя, контроллер неверно обрабатывает исключительную ситуацию и массив перестает корректно работать, либо полностью «падает». Подобный сбой может возникнуть также во время выполняемого после замены диска перестроения массива. Иногда в течение короткого времени после смерти первого диска, выходит из строя ещё один.

Если массив не работает, и количество неисправных дисков не более одного, то его можно собрать При выходе из строя двух накопителей, сначала потребуется восстановить работоспособность, или снять информацию на исправный диск с одного из них, и лишь затем можно заняться сборкой массива.

Типы RAID массивов для Windows 7, и (HDD — SSD)

Массив RAID 1 из 2 жестких дисков

Массив RAID 1 — один из самых распространенных и бюджетных вариантов, который использует 2 жестких диска. Это минимальное количество дисков HDD или SSD, которое можно использовать. Массив RAID 1 призван обеспечить максимальную защиту данных пользователя, потому что все файлы будут одновременно копироваться сразу на 2 жестких диска. Для того, чтобы его создать, берем два одинаковых по объему харда, например по 500 Гб и делаем соответствующие настройки в BIOS для создания массива. После этого в вашей системе будет виден один жесткий диск размеров не 1 Тб, а 500 Гб, хотя физически работают два жестких диска — формула расчета приведена чуть ниже. И все файлы одновременно будут писаться на два диска, то есть второй будет полной резервной копией первого. Как вы понимаете, при выходе из строя одного из дисков вы не потеряете ни частички своей информации, так как у вас будет вторая копия этого диска.

Также поломки и не заметит операционная система, которая продолжит работу со вторым диском — о неполадке вас известит лишь специальная программа, которая контролирует функционирование массива. Вам нужно лишь удалить неисправный диск и подключить такой же, только рабочий — система автоматически скопирует на него все данные с оставшегося исправного диска и продолжит работу.

Объем диска, который будет видеть система, рассчитывается здесь по формуле:

V = 1 x Vmin, где V — это общий объем, а Vmin — объем памяти самого маленького жесткого диска.

Что такое массив RAID 0 на Windows 10

Еще одна популярная схема, которая призвана повысить не надежность хранения, а наоборот, скорость работы. Также состоит из двух HDD, однако в этом случае ОС видим уже полный суммарный объем двух дисков, т.е. если объединить в Raid 0 диски по 500 Гб, то система увидит один диск размером 1 Тб. Скорость чтения и записи повышается за счет того, что блоки файлов пишутся поочередно на два диска — но при этом отказоустойчивость данной системы минимальная — при выходе из строя одного из дисков почти все файлы будут повреждены и вы потеряете часть данных — ту, которая была записана на сломавшийся диск. Восстанавливать информацию после этого придется уже в сервисном центре.

Формула расчета общего объема диска, видимого Windows, выглядит так:

V = V1 + V2

Если вы до прочтения данной статьи по большому счету не беспокоились об отказоустойчивости вашей системы, но хотели бы повысить скорость работы, то можете купить дополнительный винчестер и смело использовать этот тип

По большому счету, в домашних условиях подавляющее количество пользователей не хранит какой-то супер-важной информации, а скопировать какие-то важные файлы можно на отдельный внешний жесткий диск

Массив Raid 10 (0+1) из 4 или 6 жестких дисков

Как следует уже из самого названия, этот тип массива объединяет в себе свойства двух предыдущих — это как бы два массива Raid 0, объединенных в Raid 1. Используются четыре жестких диска, на два из них информация записывается блоками поочередно, как это было в Raid 0, а на два других — создаются полные копии двух первых. Система очень надежная и при этом достаточно скоростная, однако весьма дорогая в организации. Для создания нужно 4 HDD или SSD, при этом система будет видеть общий объем по формуле:

V = 2 x Vmin

То есть, если возьмем 4 диска по 500 Гб, то система увидит 1 диск размером 1 Тб.

Данный тип, также как и следующий, чаще всего используется в организациях, на серверных компьютерах, где нужно обеспечить как высокую скорость работы, так и максимальную безопасность от потери информации в случае непредвиденных обстоятельств.

Ваше мнение — WiFi вреден?%%Показать результатыПроголосовало: 7536

Какое количество дисков в массиве RAID 5?

Массив жестких дисков Raid 5 — оптимальное сочетание цены, скорости и надежности. В данном массиве минимально могут быть задействованы 3 HDD/SSD, объем рассчитывается из более сложной формулы:

V = N x Vmin — 1 x Vmin, где N — количество жестких дисков.

Итак, допустим у нас 3 диска по 500 Гб. Объем, видимый ОС, будет равен 1 Тб.

Схема работы массива выглядит следующим образом: на первые два диска (или три, в зависимости от их количества) записываются блоки разделенных файлов, а на третий (или четвертый) — контрольная сумма первых двух (или трех). Таким образом, при отказе одного из дисков, его содержимое легко восстановить за счет имеющейся на последнем диске контрольной суммы. Производительность такого массива ниже, чем у Raid 0, но такая же надежная, как Raid 1 или Raid 10 и при этом дешевле последнего, т.к. можно сэкономить на четвертом харде.

На схеме ниже представлена схема Raid 5 из четырех HDD.

RAID 2, 3, 4, 5, 6 — что такое и с чем едят их?

Описание этих массивов тут по стольку по скольку, т.е. чисто для справки, да и то в сжатом (по сути описан только второй) виде. Почему так? Как минимум в силу низкой популярности этих массивов среди рядового (да и в общем-то любого другого) пользователя и, как следствие, малого опыта использования оных мною.

RAID 2 зарезервирован для массивов, которые применяют некий код Хемминга (не интересовался что это, посему рассказывать не буду). Принцип работы примерно такой: данные записываются на соответствующие устройства так же, как и в RAID 0, т.е они разбиваются на небольшие блоки по всем дискам, которые участвуют в хранении информации.

Оставшиеся же  (специально выделенные под оное) диски хранят коды коррекции ошибок, по которым в случае выхода какого-либо винчестера из строя возможно восстановление информации. Тобишь в массивах такого типа диски делятся на две группы — для данных и для кодов коррекции ошибок

Например, у Вас два диска являют собой место под систему и файлы, а еще два будут полностью отведены под данные коррекции на случай выхода из строя первых двух дисков. По сути это что-то вроде нулевого рейда, только с возможностью хоть как-то спасти информацию в случае сбоев одного из винчестеров. Редкостно затратно, — четыре диска вместо двух с весьма спорным приростом безопасности.

RAID 3, 4, 5, 6.. Про них, как бы странно это не звучало на страницах этого сайта, попробуйте почитать на Википедии. Дело в том, что я в жизни сталкивался с этими массивами крайне редко (разве что пятый попадался под руку чаще остальных) и описать доступными словами принципы их работы не могу, а перепечатывать статью, с выше предложенного ресурса решительно не желаю, как минимум, в силу наличия в оных зубодробительных формулировок, которые даже мне понятны со скрипом.

Заключение

Подавляющее большинство современных операций и востребованных процессов пользователей требуют наличия и обязательного использования персональных компьютерных устройств, которые позволяют получать, обрабатывать, оперировать и хранить огромный объем доступных цифровых материалов, количество которых постоянно увеличивается, требуя, в свою очередь, соответствующего доступного свободного дискового инструментария.

Конструктивный формат современных компьютеров не ограничивается возможностью использовать только один дисковый накопитель и позволяет дополнительно комплектовать устройства пользователей добавочными информационными хранилищами, значительно увеличивая пригодное для использования свободное пространство.

Однако не всегда подобный подход удобен, и часто, чтобы организовать защищенное хранилище, обладающее высокими параметрами безопасности, производительности, эффективности, отказоустойчивости и надежности, рекомендуется задействовать, доступную на сегодняшний день, технологию виртуализации данных «RAID», позволяющую объединить нескольких физических дисковых устройств в общий логический модуль.

Подобный вариант может первоначально показаться несколько сложным, однако при более близком взаимодействии процедура организации дискового пространства в формате «RAID» становиться понятной и простой, а также способствует облегчению многих, связанных с хранением данных, процессов. После соответствующей настройки «RAID», пользовательские данные будут автоматически сохранены на нескольких жестких дисках, что значительно повышает их защищенность от всевозможных нежелательных последствий и непредвиденных утрат.

Итоги

Прежде чем подводить итоги, я хочу дать вам послушать запуск четырёх старых дисков одновременно. Это прикольно звучит. Посмотрите небольшое видео, в нём вы также сможете услышать, как стрекочут все четыре диска при случайном чтении/записи:

Я не хочу перечислять минусы подобного RAID массива из старых дисков, они слишком очевидны. А вот немного о плюсах можно сказать. Во-первых, ощутимо повышается производительность, если конечно не забивать массив под завязку. Скорости старых жёстких объёмом 80 Гб крайне низкие по современным меркам. Создание RAID 0 позволяет дотянуть производительность до уровня современных жёстких дисков. Во-вторых, если использовать диски одинакового размера, то их ёмкости суммируются, это тоже плюс. Иметь в операционной системе четыре отдельных логических диска маленького размера неудобно. Объединив 4 диска на 80 Гб в RAID 0, получаем почти 300 ГБ сплошного дискового пространства. В-третьих, подобная манипуляция позволяет дать старым, забытым “жестянкам” новую жизнь.

Заметна ли разница в производительности невооружённым взглядом, без тестов? Да, заметна

Первое, на что я обратил внимание, что файлы быстрее копируются как в массив, так и из него. Также была замечена существенно возросшая производительности при работе в виртуальной машине

Разместив виртуальный жёсткий диск на RAID 0, я ощутил, как виртуалка “задышала”. Загрузка гостевой операционной системы стала быстрее да и вообще отзывчивость виртуальной машины в целом улучшилась.

Предвосхищая будущие комментарии, не могу не сказать об опасности хранения важных данных на подобных массивах. Но ведь это же очевидно, не так ли? Вероятность того, что в любой момент что-нибудь пойдёт не так, слишком высока. RAID 0 сам по себе мягко говоря не блещет отказоустойчивостью. А если создавать его из старых дисков с огромной наработкой, то высоки шансы, что весь массив внезапно накроется медным тазом. Я использовал этот массив для того, чтобы рендерить на него видео. Даже если массив отвалится, то ничего страшного не произойдёт. Всё, что я потеряю, это отрендеренный файл, который можно рендерить снова. Но ничего подобного не произошло. Не скажу, что я долго пользовался этим массивом, но за всё время его работы не было замечено ни единого сбоя. Всё работало как часы.

Заключение

Использование RAID-массивов позволяет реализовать повышенние потенциала нескольких дисковых накопителей за счет их объединения. В частности, растет производительность и надежность хранения информации. Однако эффективность работы массива будет сильно зависеть от того, каким способом он создан. Оптимальным является аппаратный метод на базе отдельного RAID-контроллера, но его организация потребует больших финансовых вложений.

Помимо способа реализации для работы RAID важна конфигурация массивов, которая делится на несколько базовых уровней. Оптимальным уровнем считается RAID-10, поскольку он обеспечивает не только высокую скорость обработки данных, но и их сохранность.

Оцените материал:

Рейтинг
( Пока оценок нет )
Понравилась статья? Поделиться с друзьями:
Техноарена
Добавить комментарий

;-) :| :x :twisted: :smile: :shock: :sad: :roll: :razz: :oops: :o :mrgreen: :lol: :idea: :grin: :evil: :cry: :cool: :arrow: :???: :?: :!: