Разделы

Цифровизация Инфраструктура

Как построить виртуальную СХД?

Тема виртуализации различных программных и аппаратных ресурсов в последнее время поднимается все чаще. Виртуальные системы хранения данных (СХД) не исключение. При создании такого хранилища часто возникают вопросы: какая среда предпочтительна, каким ПО пользоваться, как выбрать аппаратное обеспечение?

В ИТ-контексте обычно под термином "виртуальный" понимают отделение логической организации ресурса от физической. Например, простыми примерами виртуализации являются обычная файловая система (пользователи работают с логическими представлениями физической организации данных на носителе – файлами) и RAID-массивы (данные, размещенные на нескольких дисках с использованием различных уровней отказоустойчивости, причем пользователь в итоге может видеть их представленными на одном логическом томе).

Таким образом, виртуализация делает более понятным и прозрачным управление ресурсами, скрывая их сложную внутреннюю организацию.

Динамическое распределение загрузки
устройств хранения

Увеличить изображение

Что касается СХД, то основные задачи, которые решаются с помощью виртуализации это централизация и прозрачность управления, оптимизация загрузки имеющихся устройств хранения данных и серверов обработки, повышение производительности серверов обработки данных, повышение пропускной способности сети, повышение надежности хранения, достижение высокой отказоустойчивости, а также возможность создания надежной и производительной системы хранения данных

Построение виртуальных СХД основано на нескольких основных технологиях хранения данных.

В зависимости от поставленных задач и объемов данных можно варьировать использование той или иной среды хранения.

Где хранить?

DAS – Direct Attached Storage. Устройства хранения подключены непосредственно к серверам.

DAS представляет наиболее простую систему хранения данных. Устройства хранения присоединяются напрямую к серверу . Виртуализация здесь, как правило, ограничивается возможностями RAID-массива (ПО-контроллера). Есть возможность создания логических томов на нескольких физических дисках. Но невозможно создать тома, покрывающие несколько устройств хранения (массивов) и, таким образом, невозможно динамически перераспределять нагрузку между разными устройствами хранения и управлять всеми устройствами хранения (например, подключенными к разным серверам) с единой консоли. Наращивание пространства для хранения весьма проблематично и зачастую требует полной замены устройства хранения на более емкое, что требует дополнительных затрат на перенос данных.

Разделение потоков управляющей информации и непосредственно данных

Увеличить изображение

При быстро растущих объемах информации и требованиях к ее надежному хранению, репликации, а так же к возможностям гибкого управления СХД как единым целым, стоит задуматься о более интеллектуальных и производительных решениях - сетевых СХД.

На их базе можно построить сложнейшие многоуровневые системы хранения данных, с репликацией, приемлемым уровнем производительности и отказоустойчивости. Виртуализация в таких системах позволяет скрыть сложный механизм взаимосвязи различных устройств и процессов СХД, а администратору предоставить удобную среду для конфигурирования и управления СХД.

Пользователи в свою очередь получают доступ к данным в режиме 24x7.

NAS – Network Attached Storage. СХД, подключаемые непосредственно в сеть.

Дмитрий Балдин, «РусГидро»: Вынужденный переход на open source приводит к увеличению поверхности кибератак
безопасность

Данная технология позволяет обойти ограничения DAS на размещение томов на разных устройствах хранения (например разных RAID- контроллерах), а также на динамическое распределение загрузки устройств хранения.

NAS подключаются непосредственно в локальную сеть, снимая тем самым с серверов нагрузку по обработке ввода/вывода данных, оснащаются собственными ОС, которые снабжены функциями оптимизации операций чтения/записи.

Такие системы обеспечивают доступ к данным большого числа одновременно работающих пользователей (более тысячи), обрабатывают запросы с большого количества серверов на разных платформах. Они весьма гибки и просты в настройках и имеют относительно небольшую стоимость.

Различие некоторых сетевых систем состоит в виртуализации обработки данных – файловой и блоковой. В отличие от файловой системы блоковая позволяет идентифицировать, найти и обработать конкретный блок данных, а не файл целиком, что позволяет достичь более высокой производительности. Причем этот процесс естественно скрыт от конечного пользователя – он получает все те же данные не вдаваясь в сложности обработки.

СХД, объединяющая несколько модулей

Увеличить изображение

Наиболее продвинутые NAS-системы выполняют многие функции, которые развиты в более сложных по архитектуре SAN-системах. Они имеют Ethernet и FC порты для подключения серверов, интеллектуальных маршрутизаторов, пулов дисковых массивов и ленточных накопителей, ПО, совместимое с Windows, Linux, Unix и со специализиро- ванным ПО различных разработчиков, развитые средства резервного копирования, репликации и удобную консоль управления. Многие модули применяются как в NAS системах, так и при построении SAN. Например, маршрутизаторы от ведущих производителей (Cisco, Brocade), накопители с FC интерфейсом, сетевые контроллеры (NSC), некоторые виды ПО.

SAN – представляют собой высокопроизводительную сеть хранения данных. С повышением передачи данных в среде Fiber Chanel до 4 Гб/ сек, решения на базе СХД такой архитектуры стали еще более производительными и привлекательными.

Как с помощью ad-hoc инструмента снизить расходы на внедрение аналитики
Импортонезависимость

Возможность построения каскадируемых систем (подключение машрутизатор-маршрутизатор через FC) практически без потери производительности делает возможным создание надежных многоуровневых систем хранения. Благодаря технологиям виртуализации, реализованным в ПО для SAN от основных игроков этого рынка (EMC, HDS, IBM), сеть хранения и подключенные к ней устройства имеют единую консоль управления. Кроме того, устройства хранения имеют возможность обмениваться между собой управляющей информацией и данными, что позволяет разгружать целые сегменты сети, не занятые, например, в репликации или резервном копировании, а так же сервера приложений.

Но для СМБ выбор таких систем не всегда оптимален. Основным сектором потребителей SAN-решений все-таки остаются крупные клиенты. Cотни терабайт информации может накопить и хранить очень серьезная корпорация с многолетней историей и не одним десятком филиалов, да и ценность этих данных должна быть адекватна стоимости вкладываемых в их хранение средств (стоимость СХД для ЦОД и крупных корпораций может составлять от десятков тысяч долларов до нескольких миллионов). Но в последнее время стали появляться системы начального уровня, которые по цене могут быть рассмотрены в качестве альтернативы и для СМБ.