Что такое RAID массивы. Немного истории и описания технологий


Развитие многих электронных компонентов персонального компьютера (например, процессоров) значительно опережает совершенствование дисковых накопителей. Что, по сути, заставляет рядовых пользователей, имеющих ценную информацию, столкнуться с неприятными последствиями выхода из строя электронно-механических винчестеров. Зачастую, проблема на локальном уровне решается подключением нескольких жестких дисков и грамотная реализация программно-аппаратных технологий распределения многочисленных потоков информации. К коллективным сложным системам хранения большого объема данных (например, сервера популярного видеохостинга youtube.com) требуется постоянная доступность, отказоустойчивость и производительность. Потери от ошибок в мировом масштабе могут исчисляться сотнями миллиардов долларов! Поэтому еще в XX веке были разработаны основные уровни массивов, избыточных массивов независимых дисков (RAID).


Что такое RAID массивы. Немного истории и описания технологий

Еще в 1987 году Гарт Гибсон, Рэнди Катц и Дэвид Паттерсон в научной статье изложили основные идеи организации массивов RAID, используемых сегодня для совершенствования уже разработанных методов организации хранения данных. Главная задача развития в этой отрасли – разрешить конфликт трех основных величин: надежность, цена и производительность. Поэтому стали разрабатывать многочисленные архитектуры (в том числе и многоуровневые) построения RAID-массивов на основе пяти уже существующих уровней, которые незамысловато обозначаются цифрами от 0 до 6. Все 6 типов архитектуры были закреплены как стандарт в 1992 году на организованном консорциуме. Сегодня существует уже 8 базовых стандартных одноуровневых массивов. Главное задача в веке XXI остается такой же: стремление к меньшим потерям производительности, реализация стройной структуры доступа к хранящейся информация и, конечно же, своевременное устранение ошибок чтения и записи увеличивающихся потоков информации.


Каждая архитектура имеет свои особенности. Рассмотрим их подробнее.


Первый «RAID 0» как таковой избыточности не имеет. На этом уровне осуществляется быстрый и в то же время простой способ увеличения производительности всей системы. Причем скорость работы такого массива будет прямо пропорциональна количеству задействованных дисков. Стоит заметить, что в этом случае ровно во столько же раз возрастает вероятность сбоя и ошибок всей системы. Восстановить информацию после возникновения нештатных ситуаций не представляется возможным! В упрощенной форме по этому принципу организуются простые массивы пользователей ПК, ошибки которых решаются в основном приобретением более дорогостоящего оборудования (жестких дисков). Идея зеркалирования реализована в архитектуре «RAID 1». Здесь главное преимущество – надежность. В результате повреждения информации на одном диске, потоки данных станут транслироваться с другого. Естественно, что ни о каком выигрыше в скорости не может быть и речи.


«RAID 2» использует код Хемминга. Принцип работы заключается в том, что вся входящая информация делится на «слова» определенной длины, зависящей от количества задействованных дисков. Дальше для каждого созданного «отрезка» вычисляется код коррекции, который успешно сохраняется на диске, в выделенное специально для этих целей место. Такой способ организации успешно решает проблемы двойных и одиночных ошибок. Однако в масштабах предприятия этот уровень не получил должного признания по причине низкого КПД при работе с большим количеством запросов. «RAID 3,4 и 5» - это массивы, на которых реализуется принцип четности в случае одиночных неисправностей. Если, например, ставится задача организовать постоянный доступ к большим файлам с низкой частотой запросов, то архитектура «RAID 3» станет наиболее приемлемым вариантом. Однако для реализации этого уровня необходимо как минимум три жестких диска. Вся информации в этой конкретной ситуации делится на два винчестера, а на третий записываются контрольные суммы. В случае сбоя одного из дисков, целостность всего массива не нарушается. «RAID 4» практически не используется, так как организовать работу ассиметричной системы ввода-вывода довольно сложно и тем более сложно восстановить хранящиеся на винчестерах блоки информации. «RAID 5» нашел компромисс между надежностью «RAID 1» и скоростью «RAID 0». Однако в этом случае RAID-контроллер плохо справляется с потоками входящей информации, так как загружается, в основном расчетами корректирующих кодов. «RAID 6» практически похож на «RAID 5». Главное особенность шестого является реализация двух независимых схем контроля четности независимо друг от друга.


RAID-системы по способу реализации делятся на аппаратные и программные. В первом случае, требуется приобретение дорогостоящих контроллеров. Специальное ПО, конечно же, дешевле. Однако оно создает дополнительную нагрузку на вычислительные мощности ЭВМ. В последнее время стоимость RAID-контроллеров снизилась. Реализация аппаратного, более качественного способа хранения информации, стала возможной не только в пределах дорогих «мэйнфреймов», но и на рабочих станциях и на серверах начального уровня. При выборе архитектуры хранения данных, необходимо руководствоваться, в первую очередь, задачами, которые вы ставите перед своей информационной системой. И, конечно же, помнить, что стоимость системы защиты никогда не должна превышать собственную стоимость защищаемой информации.


  • Дата: 23-12-2017, 20:00

Предыдущие статьи сайта:

Понравилась статья? Ставь лайки, рассказывай друзьям!



Отзывы о статье: Что такое RAID массивы. Немного истории и описания технологий

Технологии, секреты и фишки Apple: Iphone, iPad, iPod