Избыточный массив недорогих дисков (RAID — redundant array of independent disks) — это система хранения данных, в которой для размещения информации используют несколько жестких дисков. Поддержка различных уровней избыточности, производительности и способов восстановления после сбоя осуществляется посредством целого ряда разнообразных методик хранения.
Дисковый массив RAID — это консолидированная серверная система для хранения данных большого объема. В массивах RAID значительное число дисков относительно малой емкости используется для хранения крупных объемов данных, а также для обеспечения более высокой надежности и избыточности. Подобный массив воспринимается компьютером как единое логическое устройство.
Дисковый массив RAID может быть образован несколькими способами. Некоторые типы массивов RAID предназначены в первую очередь для повышения производительности, гарантии высокого уровня надежности, обеспечения отказоустойчивости и коррекции ошибок.
Общей для массивов RAID (что можно назвать их основным преимуществом) является функция «горячей замены». Иными словами, пользователь имеет возможность удалить выбранный дисковод, установив на его место другой. Для большинства типов дисковых массивов RAID данные на замененном диске могут быть восстановлены автоматически, без отключения сервера.
Конечно, RAID — далеко не единственный способ защитить данные большого объема. Однако традиционно применяемое в таких случаях программное обеспечение резервного копирования или зеркалирования действует намного медленнее и зачастую предусматривает отключение системы в случае возникновения ошибки на дисководе.
Произошла ли замена дисковода из-за сбоя системы или вызвана какой-либо другой причиной, серверы для замены дисковода отключать не нужно. Вместо этого RAID восстанавливает данные с остальных дисководов, используя зеркальные копии или информацию о четности, и не требует отключения компьютера.
Чаще всего применяются реализации дисковых массивов, называемые системами RAID уровня 0, 3 и 5.
Система RAID уровня 0 (расщепление данных) представляет собой простейший вариант организации дискового массива. На обычном жестком диске данные хранятся в последовательных секторах одного и того же диска. Система RAID 0 использует как минимум два диска и разделяет данные на блоки, которые имеют размер от 512 байт до нескольких мегабайт и поочередно записываются на разные диски. Сегмент 1 записывается на диск 1, сегмент 2 — на диск 2 и т. д. Когда система доходит до последнего диска в массиве, то следующий сегмент она записывает на диск 1 и т. д.
Благодаря сегментации данных нагрузка ввода/вывода распределяется между всеми дисководами. А поскольку чтение и запись на диски может осуществляться одновременно, производительность возрастает весьма существенно. Но такой подход не обеспечивает защиты данных. Если на диске возникает ошибка, то данные безвозвратно теряются. Системы RAID уровня 0 не предназначены для критически важных приложений, но хорошо подходят для таких задач, как создание и редактирование видео и изображений.
Система RAID уровня 0 (расщепление данных) представляет собой простейший вариант организации дискового массива. На обычном жестком диске данные хранятся в последовательных секторах одного и того же диска. Система RAID 0 использует как минимум два диска и разделяет данные на блоки, которые имеют размер от 512 байт до нескольких мегабайт и поочередно записываются на разные диски. Сегмент 1 записывается на диск 1, сегмент 2 — на диск 2 и т. д. Когда система доходит до последнего диска в массиве, то следующий сегмент она записывает на диск 1 и т. д.
Благодаря сегментации данных нагрузка ввода/вывода распределяется между всеми дисководами. А поскольку чтение и запись на диски может осуществляться одновременно, производительность возрастает весьма существенно. Но такой подход не обеспечивает защиты данных. Если на диске возникает ошибка, то данные безвозвратно теряются. Системы RAID уровня 0 не предназначены для критически важных приложений, но хорошо подходят для таких задач, как создание и редактирование видео и изображений.
Системы RAID уровня 3 предусматривают расщепление данных, но кроме того, они выбирают один из дисков для хранения контрольной суммы по разделам. Такой подход позволяет обеспечить определенную отказоустойчивость и особенно полезен в средах, предполагающих интенсивное использование данных, либо в однопользовательских средах для доступа к длинным последовательным записям. Системы RAID уровня 3 не поддерживают перекрытия ввода/вывода и требуют применения синхронизованных дисководов, дабы предотвратить снижение производительности при работе с короткими записями.
Системы RAID уровня 5 аналогичны системам уровня 0, но вместо разбиения данных на блоки они распределяют биты каждого байта между различными дисками. Такой подход побитного расщепления данных между дисками увеличивает нагрузку, но в случае возникновения сбоя на диске последний может быть заменен, и данные могут быть восстановлены с кодов четности и кодов коррекции ошибок. В системах RAID уровня 5 перекрываются все операции ввода/вывода. Для организации подобных систем требуется от трех до пяти дисков. Они лучше подходят для многопользовательских комплексов, для которых производительность не имеет критически важного значения или которые выполняют небольшое количество операций записи.
Менее используемые виды массивов RAID
Системы RAID уровня 1 поддерживают зеркалирование дисков, то есть на диск 1 всегда записывается то же самое, что и на диск 2, и чтение информации выполняется с любого диска. Такой подход делает возможным постоянное проведение резервного копирования, но требует большего числа дисков и не способствует увеличению производительности. RAID 1, обладающая повышенной производительностью и отказоустойчивостью в многопользовательской системе, остается, однако, самой простой в реализации и больше всего подходит для работы бухгалтерских и финансовых систем, а также для обработки данных высокой готовности.
Системы RAID уровня 2 были разработаны для мэйнфреймов и суперкомпьютеров. Они оперативно корректируют данные и, как правило, имеют высокую скорость проверки и исправления ошибок.
Системы RAID уровня 4 преимущественно используются при расщеплении больших блоков, что записи оказываются на одном диске целиком. Они применяются редко, поскольку не поддерживают одновременно большое число операций записи.
Системы RAID уровня 6 редко реализуются на коммерческом уровне. Они представляют собой развитие систем RAID уровня 5 за счет использования расширенной схемы контрольных сумм, распределенной между различными дисководами. Эти системы способны одновременно обрабатывать несколько дисковых ошибок, но производительность, особенно для операций записи, довольно низка, кроме того, система требует применения довольно сложного контроллера.
Системы RAID уровня 7, выпускаемые только компанией Storage Computer, включают в себя в качестве контроллера встроенную операционную систему реального времени и высокоскоростную системную шину для поддержки кэширования. Такие системы обеспечивают высокопроизводительный ввод/вывод, но крайне дороги.
Системы RAID уровня 10 содержат массив разделов, каждый из которых представляет собой массив дисков RAID уровня 1. Они обеспечивают такую же надежность, как и системы уровня 1, и предназначены для серверов баз данных. Для таких серверов необходима высокая производительность и гарантия избыточности, не предъявляющая больших требований к емкости.
Системы RAID уровня 53 (предложенные не так давно) реализованы как массив сегментированных дисков уровня 0, в котором каждый сегмент представляет собой массив уровня 3. Такие системы имеют ту же избыточность и отказоустойчивость, что и системы уровня 3, и могут оказаться полезными для информационных систем, требующих конфигурации RAID 3 с высокой скоростью передачи данных, но стоят дорого и довольно неэффективны.
Как работает RAID
Система RAID уровня 0: массив «расщепленных» данных без поддержки отказоустойчивости
Система RAID уровня 3: параллельный обмен с разбиением
Система RAID уровня 5: независимые диски с данными с распределенными блоками
Автор: Кэтлин Олсон
Взято с Computerworld