www.gcs.ru
+7(495) 729-51-70 (ГКС)
Инновации хранения данных IBM
Как инновации в хранении информации помогают расти?
Статья

Виртуализация хранения: секрет оптимальных инвестиций

Систематика-IBM
, Текст: Александра Кирьянова

По мере совершенствования технологий для бизнеса виртуализация определяет эффективность, производительность, безопасность и доступность данных в системе хранения предприятия при одновременном снижении цены. Система хранения с технологией виртуализации позволяет распоряжаться данными как ресурсом, распределяя их так, что приложениям не нужно определять физическое расположение накопителей. Статья посвящена преимуществам виртуализации систем хранения с использования IBM FlashSystem.

Виртуализация СХД оказывает положительный эффект на функционирование ряда жизненно важных для предприятия функций, включая объединение, многоуровневое хранение, защиту и оптимизацию объема данных:

  • Объединение ресурсов позволяет обеспечит необходимый объем хранения для каждого приложения с активированной функцией распределения этих ресурсов.
  • Многоуровневое хранение гарантирует достаточную производительность системы хранения для каждого приложения.
  • Технологии защиты данных обеспечивают несколько способов ограждения корпоративной информации от потери или повреждения.
  • Оптимизация емкости обычно использует технику «тонкого резервирования томов» (Thin Provisioning) в сочетании с различными технологиями снижения объема данных, с целью уменьшения циклов простоя или избыточность данных, экономя таким образом расходы несколькими способами.

Массивы IBM FlashSystem обеспечивают виртуализацию систем хранения с глубокой интеграцией сверхбыстрых флеш-технологий. При этом десятки терабайт данных, размещенных в небольшом корпусе, управляются скоростной интеллектуальной полупроводниковой логикой. Приобретение одной из моделей флеш-массива IBM FlashSystem автоматически подразумевает наличие технологии, необходимой для виртуализации всех или любой части системы хранения данных в составе СХД предприятия. После развертывания массива и идентификации его портов сервером имен, простой и интуитивно понятный графический пользовательский интерфейс управления IBM FlashSystem позволит виртуализировать всю систему хранения с единой панелью управления. Благодаря этой возможности, далее можно распространить возможности мощного пакета функций для управления хранением данных IBM на все остальные системы хранения СХД.

Виртуализация системы хранения с помощью IBM FlashSystem превращает СХД предприятия из группы разрозненных систем хранения в единый ресурс ИТ-инфраструктуры, который затем можно выделять, перераспределять, масштабировать, обновлять и так далее без какого-либо влияния на работу приложений.

Объединение ресурсов и многоуровневое хранение

Виртуализация систем хранения в общем случае обозначает автоматическое согласование рабочих нагрузок приложений и необходимых для этого ресурсов хранения. В эпоху до виртуализации систем хранения, набор данных для конкретного приложения хранился на конкретных физических разделах конкретных жестких дисков. Для перемещения этого набора данных на другой ресурс хранения приходилось выключать приложение; после завершения процесса перемещения информации приложение обновлялось с новыми адресами физического расположения данных, и только после этого можно было возобновлять работу. Те же процедуры требовались при необходимости расширения емкости системы хранения, что выливалось в потерю рабочего времени, денег и снижение производительности

СХД может включать в свой состав несколько типов устройств хранения, это естественно для подобных элементов ИТ-инфраструктуры. Допустим, предприятие в свое время начало использовать СХД на базе единственного дискового массива, и затем, по мере развития и диверсификации бизнеса, к нему добавились следующие массивы. Наконец, соображения цены и производительности привели к необходимости добавить к этой разнородной СХД флеш-массив. В таком случае, если остановить выбор на одной из подходящих моделей семейства IBM FlashSystem, весь комплекс разнородных отдельных систем хранения удалось бы объединить в единый многоуровневый ресурс, включающий медленные, но недорогие дисковые хранилища, ленточные архиваторы и флеш-массив, значительно менее дорогой в такой конфигурации при расчете производительности на единицу хранения. Именно так можно логически обосновать выгоду от многоуровневого хранения: за счет размещения определенных данных на соответствующих носителях, удается снизить цену и увеличить производительность и эффективность всей системы хранения данных в целом.

Виртуализация дисковых хранилищ обеспечила возможность появления режима автоматической миграции данных, но в связи со слишком медленной выборкой данных с дисковых накопителей и слишком медленной их записью на новые диски (по сравнению со скоростью работы других компонентов ИТ-инфраструктуры) можно сказать, что такая виртуализация всего лишь позволила обеспечить перенос данных без непосредственного воздействия на приложения: технология работает, но слишком медленно.

Ситуация резко изменилась после объединения флеш-технологий и виртуализации. Системы хранения на базе флеш-памяти преобразовали понятие миграции данных в мобильность данных. Современные технологии виртуализации систем хранения на базе флеш-технологий, интегрированные, например, в IBM FlashSystem, способны перемещать не только наборы данных, но также их фрагменты таких наборов, отдельные папки и подпапки с одного ресурса хранения на другой с чрезвычайно высокой скоростью.

Так, например, некоторые наборы данных становятся активными только в определенное время, вроде бухгалтерских приложений в конце каждого месяца, или даже отдельные их фрагменты. В системах хранения на базе флеш-памяти с виртуализацией, механизм виртуализации постоянно мониторит активность данных, и в конце месяца, когда эти данные становятся активными, перемещает их быстро, автоматически и прозрачно с носителя длительного хранения – вроде емкого диска или ленточного накопителя, на оптимизированный для скоростной работы флеш-накопитель.

Помимо автоматического распределения производительности для соответствующих задач и приложений, виртуализированная система хранения также постоянно стремится увеличить использование различных ресурсов хранения, какими бы они ни были, какие бы приоритеты по политикам использования на них ни были установлены.

Защита данных

Одной из важнейших функций СХД является всесторонняя защита данных. На практике это означает обеспечение бесперебойного доступа приложений к данным, и если один из компонентов или процессов ИТ-инфраструктуры предприятия по каким-то причинам вышел из строя, ни бита данных не должно быть потеряно безвозвратно ни при каких условиях.

Надежная защита данных зачастую обходится достаточно дорого, и, как правило, обеспечивается двумя способами — за счет предотвращения сбоев оборудования, или, по крайней мере, за счет создания резервных копий для сохранения целостности данных, с возможностью последующего использования этих копий в случае потери или повреждения оригинала.

В первом случае на большинстве предприятий для предотвращения сбоев используют простое правило — ни единой точки отказа, что означает гарантированную сохранность информации даже в случае выхода из строя любого компонента на пути прохождения данных. Поскольку ничто в этом мире не идеально, единственным способом добиться такой гарантии будет избыточное резервирование всей цепочки, но даже удвоение числа дисков резко взвинчивает расходы.

Использование IBM FlashSystem снижает расходы на защиту данных благодаря тому, что флеш-массивы изначально разработаны без единой внутренней точки отказа. Фактически, между системой и коммутатором СХД создаются множественные соединения с избыточным резервированием, и данные перемещаются по продублированным трассам от интерфейсов к отдельным резервируемым модулям флеш-памяти. Даже с таким высоким уровнем встроенной надежности, на некоторых предприятиях продолжают конфигурировать архитектуры систем хранения полным резервированием. Такой тип конфигураций часто называют «зеркалированием» (mirroring), или «горячим резервом» (hot spare), который используется при сбое активной системы. Однако заведомо безотказные массивы IBM FlashSystem позволяют обойтись без зеркалирования или резервирования, что значительно снижает затраты на оборудование.

Внутренняя аппаратная избыточность — не единственный способ, которым IBM FlashSystem защищает данные, для этих целей также используется технология RAID с режимами защиты данных. Принцип работы этой технологии основан на разбивке блока данных на несколько частей, каждая из которых записывается в отдельный чип флеш-памяти во флеш-модулях массива. Затем ключ, известный как «бит четности», рассчитывается контроллером и добавляется к блоку данных. Впоследствии бит четности позволяет реконструировать весь блок данных в случае сбоя чипа флеш-памяти и частичной потери данных.

В каждом отдельном флеш-модуле массива IBM FlashSystem используется уникальное решение под названием Variable Stripe RAID для изменения размера страйпа в RAID. Эта технология инициирует работу RAID-алгоритма в случае сбоя чипа таким образом, что остальные флеш-ресурсы в RAID-группе перераспределяют между собой данные из сбойного чипа. В дальнейшем неисправная микросхема обходится, а весь массив сохраняет высокую эффективность и производительность с минимумом затрат.

В массивах IBM FlashSystem также усовершенствован еще один уровень защиты данных, он также использует RAID, но уже на системном уровне между всеми флеш-модулями, а не только внутри каждого отдельного модуля. Такая защита гарантирует полную сохранность данных даже в случае неисправности целого флеш-модуля.

Оба компонента защиты данных — Variable Stripe RAID на уровне модулей и аппаратный RAID на системном уровне, работают независимо друг от друга. Но вместе они обеспечивают синергическую отказоустойчивость системы, справляясь даже с многочисленными сбоями флеш-памяти.

Отсутствие точек отказа, избыточность компонентов и путей прохождения данных, два варианта RAID — и это далеко не все способы защиты данных в IBM FlashSystem. Дело в том, что отдельные ячейки флеш-памяти далеко не идеальны, некоторые хорошо держат заряд и могут быть точно считаны, а некоторые нет. С самого начала использования флеш-памяти в критически важных средах, разработчики флеш-технологий компенсировали недостатки ячеек с помощью так называемых кодов коррекции ошибок (Error Correction Codes, ECC). Алгоритмы ECC активируются флеш-контроллером во время считывания данных на предмет проверки на наличие ошибок и их исправления «на лету». В системах IBM используется алгоритм «жесткого решения» собственной разработки, обеспечивающий высокую степень коррекции с сохранением производительности, пропускной способности и надежности при снижении сложности системы и уменьшении накладных расходов.

Несмотря на множество уровней защиты IBM FlashSystem, индустрия располагает различными способами защиты критичных данных без привязки к конкретному аппаратному обеспечению или операционной системе, надежность которых проверена годами. Наиболее распространенным из таких способов является создание копии и ее хранение в другом месте.

Среди способов создания резервных копий наиболее популярны «моментальные снимки» (snapshots) и «клонирование» (клоны, clones). Моментальные снимки по сути представляют собой копии наборов данных, сделанные в определенные моменты времени. В случае повреждения данных, система может быть «перемещена во времени» на момент последнего моментального снимка, и запущена заново с этой точки с корректным набором данных. Чем чаще делаются мгновенные снимки, тем более свежей будет резервная копия, однако хранение большого количества мгновенных снимков требует ресурсов, вычитаемых из объема доступных для приложений основной рабочей нагрузки.

Мгновенные снимки обеспечивают две возможности, отлично сочетающиеся с виртуализацией систем хранения. Во-первых, процесс создания снимков может повлиять на производительность системы, поскольку при этом задействовано программное обеспечение и процессы обработки на пути прохождения данных. В этой ситуации виртуализация хранилища может динамически переместить действия по созданию снимка с «линии огня», используя для этого доступные ресурсы хранения и снизив таким образом задержки.

Виртуализация флеш-памяти работает еще лучше, обеспечивая дополнительную производительность и меньшую латентность, так что снимки на флеш-ресурсах могут быть сделаны с минимальным влиянием на общую производительность.

Во-вторых, большинство СХД имеют различные типы устройств хранения, включая флеш-память, дисковые и ленточные системы, которые чаще всего никак не «общаются» друг с другом. Когерентный снимок во всех этих разрозненных системах в ручном режиме просто немыслим. В случае виртуализированной системы хранения проблемы не будет, поскольку весь комплекс управляется как один ресурс, а не как разрозненные активы. Инструменты виртуализации, такие как IBM FlashCopy Manager, способны синхронизировать снимки и управлять ими в разрозненных массивах с быстрыми и медленными компонентами, а ресурсы IBM FlashSystem практически исключают влияние этих процессов на общую производительность.

Клонирование (клоны) — это еще одна стратегия защиты данных с виртуализированными системами хранения. Клоны представляют собой полные копии всего набора данных — в отличие мгновенных снимков, которые экономичнее в плане расхода емкости хранения, но при этом могут захватывать только изменения данных. Клоны используются для восстановления работоспособности системы после катастроф или крупных системных сбоев, а также в процессе разработки, тестирования и подготовки рабочей среды новых приложений, тщательно отделенных от реального рабочего окружения, но при этом использующих наиболее свежие версии набора данных. Виртуализация систем хранения позволяет перемещать по мере необходимости клоны наборов данных на отдельные ресурсы хранения для разработки и тестирования ПО без какого-либо влияния на рабочее окружение. Соответствующие ресурсы хранения для таких случаев могут быть оперативно выделены и сконфигурированы исходя из необходимых и/или доступных ресурсов.

Оптимизация емкости

Исторически емкость системы хранения представляла собой статичный ресурс, изменить который можно было только после полной остановки системы, физической переустановки новых дисков и повторного запуска. Для того, чтобы избежать риска неожиданного исчерпания доступной емкости по мере развития предприятия, приходилось выделять или изначально закладывать в проект заведомо избыточную емкость. Такая практика, получившая название «чрезмерного резервирования», требовала дорогостоящих расходов на ресурсы, которые порой так и оставались незадействованными.

Современная практика «тонкого резервирования» (Thin provisioning) означает выделение только тех ресурсов хранения, которые необходимы прямо сейчас. Это более эффективно и дешево, но для традиционных систем хранения такой подход порой может оказаться рискованным. В случае внедрения виртуализации системы хранения, тонкое резервирование работает превосходно, поскольку наращивание емкости можно производить просто и быстро, не прерывая рабочий процесс.

Виртуализированные флеш-массивы IBM FlashSystem, изначально поставляемые с технологией тонкого резервирования, обеспечивают доступ к максимальной емкости системы сразу же после разворачивания и настройки всего хранилища в качестве единого ресурса. Функциональные возможности тонкого резервирования тщательно отслеживают фактическое использование системы хранения и автоматически распределяют ресурсы между различными адресами дискового пространства (LUN) по мере необходимости.

Другим методом для экономии расхода емкости хранилища является технология под названием «сжатие данных» (data compression). Под сжатием (или компрессией) подразумевают уменьшение занимаемого данными объема для экономии пространства или уменьшения скорости передачи данных по сети. В процессе записи данных такие инструменты как IBM Real‐time Compression увеличивают свободный объем системы хранения с помощью программных и аппаратных алгоритмов, удаляющих все избыточные символы, вставляя единый символ на место строки повторяющихся символов и/или небольших битовых последовательностей часто повторяющихся символов, и используя другие методики сжатия.

Гибкие алгоритмы сжатия данных, реализованные в IBM FlashSystem, являются подмножеством большой группы инноваций IBM, именуемых IBM FlashCore. Эти многочисленные инновации позволяют массивам IBM FlashSystem обеспечивать операционную и ценовую эффективность в широком диапазоне. Технологии IBM FlashCore — это сердце систем хранения FlashSystem. Основой этих технологий является концепция аппаратного ускорения потока данных для обеспечения высокой производительности с оптимизацией доступного пространства, которые так необходимы современным системам хранения корпоративного класса.

Технология IBM Real‐time Compression для сжатия данных в реальном времени позволяет уменьшить объем файлов для некоторых типов данных в соотношении до 5:1. Поскольку флеш-память все еще несколько дороже чем дисковые накопители, сжатие данных является весьма эффективной стратегией для флеш-массивов. В случае программного сжатия данных с помощью обычных процессоров, это может отрицательно отразиться на латентности системы хранения. Вот почему технология IBM Real‐time Compression в массивах IBM FlashSystem реализована в основном на аппаратном уровне, что позволяет свести к минимуму влияние на латентность даже при максимальных коэффициентах компрессии. Кроме того, некоторые типы данных сжимаются очень слабо даже с самыми современными алгоритмами компрессии.

В процессе развертывания или в любой момент в процессе эксплуатации, механизм виртуализации IBM FlashSystem обеспечивает возможность выборочного применения алгоритмов IBM Real‐time Compression только к заранее определенным администратором томам данных.

Владимир Бахур