Автор: Пользователь скрыл имя, 05 Мая 2012 в 23:32, реферат
В современном мире, где информация и способы ее обработки имеют решающее значение важно обеспечить отказоустойчивость систем хранения информации.
Вместе с серверным комплексом система хранения данных является главной составной частью любого вычислительного центра, а потому следует подумать и об её отказоустойчивости. Систему хранения следует рассматривать не только как дисковые массивы для хранения данных, но и более широко – как комплекс, включающий еще и транспорт ввода/вывода (I/O), методы размещения данных, программное обеспечение для оптимизации транспорта, обеспечения гарантированной доставки, размещения и хранения данных и т.д.
Введение 3
1 Повышение отказоустойчивости массивов 4
2 Отказоустойчивость средствами ОС 10
Заключение 13
Список использованных источников 14
Реферат
на тему
«Отказоустойчивость
файловых и дисковых
систем»
Выполнил:
Фаааааааааа И.О.
В современном мире, где информация и способы ее обработки имеют решающее значение важно обеспечить отказоустойчивость систем хранения информации.
Вместе с серверным комплексом система хранения данных является главной составной частью любого вычислительного центра, а потому следует подумать и об её отказоустойчивости. Систему хранения следует рассматривать не только как дисковые массивы для хранения данных, но и более широко – как комплекс, включающий еще и транспорт ввода/вывода (I/O), методы размещения данных, программное обеспечение для оптимизации транспорта, обеспечения гарантированной доставки, размещения и хранения данных и т.д.
Спектр
методов повышения
Как
правило, сбои технического характера
происходят из-за нарушения функционирования
какого-либо компонента центра обработки
данных. Несмотря на самое тщательное
тестирование оборудования всегда есть
вероятность выхода его из строя.
Сбои логического характера случаются
по причинам нарушения целостности информации
вследствие ошибок системного программного
обеспечения или из-за неправильных действий
персонала.
Повышение отказоустойчивости дисковых массивов может быть достигнуто полным или частичным дублированием компонентов оборудования. За последнее время никаких революционных новаций в этой области не появилось, а само по себе дублирование компонентов применяется практически во всех типах оборудования ИТ. Естественно, подобные решения предлагают все производители дисковых массивов, однако полное дублирование (системы, где дублируются все компоненты) реализовано лишь в некоторых продуктах, поэтому к их выбору нужно подходить очень внимательно.
Системы хранения данных отчасти являются аналогами вычислительных систем, т.е массивы большой емкости имеют не только «полки» с дисками, но и ряд других компонентов:
Очевидно, что чем больше из вышеперечисленных компонентов продублировано, тем выше отказоустойчивость самого массива, как аппаратной составляющей системы хранения. Влияние дублирования разных компонентов на стоимость массива различно. Например, дублирование блоков питания не приведет к ее резкому увеличению, однако дублирование контроллеров RAID или, скажем, внутренних коммутационных компонентов заметно повлияет на цену. Поэтому задачи повышения отказоустойчивости зачастую проще и дешевле решаются установкой нескольких независимых массивов либо средствами операционной системы, специализированного программного обеспечения или приложений.
В массивах старшего или среднего класса все перечисленные компоненты дублируются, поэтому их функционирование не зависит друг от друга с точки зрения отказоустойчивости (т.е. в случае отказа, например, процессора или блока памяти, пакеты данных направляются на другой процессор или блок памяти внутри массива). В массивах среднего и младшего класса эти компоненты объединены аппаратно в один модуль (и ввод/вывод, и контроллер RAID). В случае отказа любой его части - модуля памяти или порта ввода/вывода – блок целиком будет выведен из эксплуатации, и отказоустойчивость дискового массива сразу резко понизится, так как все его компоненты окажутся непродублированными.
Следует также отметить, что дублирование любых компонентов не влияет на производительность систем хранения.
Кроме повышения отказоустойчивости путем организации дисковых групп (RAID-5, RAID-10 и др.), т.е. за счет избыточности, у некоторых систем хранения имеются так называемые «внутренние» возможности. У разных производителей они называются по-разному, но их можно свести к нижеследующей классификации.
Мгновенная копия (Cloning). Принцип работы схож с тиражированием, т.е. в некий момент времени имеются две синхронизированные области данных, затем после изменения оригинальной области внутри массива, создается журнал транзакций, в соответствии с которым вносятся изменения во вспомогательную область, чем достигается идентичность хранимой информации. Связь между двумя областями можно разорвать когда угодно и получить независимую копию, правда, в этом случае уже нельзя гарантировать согласованности данных. Например, в базе данных Oracle не все данные сразу размещаются на диске, но взамен можно работать с журналами (redolog) или перевести базу данных в состояние, когда данные принудительно записываются на диски. Мы получаем копию данных, которую можно поместить на ленточные устройства или сохранить в другом массиве. Её же можно использовать и в случае ошибки технического характера. Но это уже, скорее, относится к вопросу доступности и сохранности данных.
Мгновенный снимок (SnapShot). Идея практически идентична мгновенной копии, только вспомогательная область, куда производится дублирование информации, отсутствует, а вместо этого записываются изменения, произошедшие с какого-то момента. С одной стороны, мы получаем существенную экономию места, а с другой - возможность «отката» до состояния на тот момент, когда производились снимки. Это позволяет скорректировать логические ошибки, если таковые возникли в период псле выполнения одного из снимков. Метод более всего подходит для защиты от сбоя логического характера, так как при аппаратной неисправности информация, естественно, будет потеряна.
Удаленная синхронизация данных (Remote Mirror). Средствами массива без вмешательства персонала и независимо от серверов данные постоянно пересылаются на рядом стоящий или удаленный массив, например через FICON или Fibre Channel. В результате можно всегда иметь актуальную копию данных в другом месте, а в случае полного отказа одного массива появляется возможность быстро перевести серверы на работу с теми же данными, но находящимися на другом (других) массиве. Решение работает по тому же принципу, что и кластер высокой готовности в серверной технологии. Вопрос о согласованности данных частично решается регламентами и процедурами с учетом конкретного приложения и способа организации самой файловой системы.
Следует заметить, что организация дисковых групп RAID5, RAID10 и т.д. потребует дополнительных затрат. При этом, например, применение RAID5 приведет к существенному снижению производительности системы до недопустимого для поддерживаемых приложений уровня в связи с дополнительными вычислениями (например, в системах биллинга с большим числом абонентов).
В любых типах систем хранения данных существует набор компонентов, который обеспечивает передачу данных между дисками массивов и серверным аппаратным обеспечением. К траснпорту ввода/вывода обычно относят кабели (SCSI, Fibre Channel и др.), оптические коммутаторы и другое оборудование, необходимое для передачи данных в рамках существующей системы ввода/вывода. Различия транспорта в зависимости от типа системы хранения будут рассмотрены ниже.
Direct Attach Storage (DAS). В напрямую подключаемых к серверам системах хранения транспорт реализуется по схеме: адаптер шины (Host Bus Adapter, HBA) -> соединительный кабель -> ввод/вывод устройства хранения. В этом случае возможно дублирование всего I/O, т.е. установка второго адаптера и использование одного массива хранения данных с дублированным модулем ввода/вывода или двух массивов, между которыми необходимо синхронизировать данные, например с помощью специализированного ПО.
Network Attach Storage (NAS). В специализированных файловых серверах IP можно задействовать средства сетей IP для повышения отказоустойчивости транспорта и средства массива для избыточного хранения данных. Преимущество решения в простоте управления и применении уже имеющейся структуры сетей IP, что не требует дополнительных затрат. Однако недостатками являются низкая отказоустойчивость самого транспорта и низкая же скорость - по сравнению с SAN.
Storage
Area Network (SAN). Отказоустойчивость транспорта
можно повысить несколькими
Fibre
Channel. Вышесказанное справедливо
и при использовании Fibre Channel в
качестве транспортного
iSCSI.
Этот относительно новый
FCIP (Fibre Channel поверх IP). В случае FCIP происходит инкапсуляция протокола Fibre Channel в IP. Соответственно, отказоустойчивость должна обеспечиваться как на участке Fibre Channel, так и далее на FCIP, но уже средствами сетей IP. Этот транспорт также позволяет избежать ограничения на удаленность узлов. Как и в решениях для iSCSI, существуют специализированные устройства – маршрутизаторы /коммутаторы для трансляции Fibre Channel в FCIP и обратно.
Таким образом, повышение отказоустойчивости транспорта влечет за собой заметный рост стоимости оборудования и обслуживания, а также дополнительные затраты на системы мониторинга и управления транспортом и, кроме того, потребность в высококвалифицированном персонале. Вместе с тем, меры по обеспечению отказоустойчивости практически не сказываются на общей производительности системы, а в случае использования коммутаторов директорского класса возможно даже ее улучшение.
Некоторые
проблемы из-за сбоя оборудования могут
быть решены на уровне операционной системы
или специализированного
Файловая система обычно является частью операционной системы и тесно интегрирована со средствами повышения отказоустойчивости. Которые в свою очередь обеспечивают безотказность транспорта на всем пути от сервера до диска (начиная от адаптеров, коммутационных кабелей, коммутационного оборудования, ввода/вывода массива хранения данных, контроллера RAID и заканчивая внутренней разводкой от контроллера RAID до самих дисков) только при наличии работоспособной аналогичной цепочки. Большинство из них умеет организовывать виртуальные массивы RAID с избыточностью записи, части которого физически находятся на разных массивах.
Существует большое количество различных файловых систем, которые делятся на ряд различных групп по их применению. Рассмотрим некоторые из них.
Дисковые файловые системы обычно являются поток-ориентироваными. Файлы в поток-ориентированых файловых системах представляются последовательностью битов, часто предоставляющие такие функции, как чтение, запись, изменение данных и произвольный доступ. Среди дисковых файловых систем можно выделить ряд отказоустойчивых систем, таких как журналируемые файловые системы, это класс файловых систем, характерная черта которых — ведение журнала, хранящего список изменений, в той или иной степени помогающего сохранить целостность файловой системы. Представителями журналируемых файловых систем являются: ReiserFS - файловая система разработанная специально для Linux, JFS - журналируемая файловая система первоначально разработанная IBM и др.
Информация о работе Отказоустойчивость файловых и дисковых систем