www.gcs.ru
+7(495) 729-51-70 (ГКС)
Инновации хранения данных IBM
Как инновации в хранении информации помогают расти?
Статья

Как выбрать массив хранения на флеш?

Систематика-IBM
, Текст: Александра Кирьянова

Перед выбором подходящей флеш-технологии есть смысл проанализировать необходимые для предприятия масштабы системы хранения, оценить производительность флеш-контроллеров, преимущества SSD и PCIe-накопителей и выгоду от перехода на флеш-массивы класса IBM FlashSystem.

Процесс принятия решения о приобретении и внедрении системы хранения на флеш-технологиях можно разбить на два этапа. Первым делом необходимо оценить реальные потребности предприятия и выбрать наиболее подходящее для этих целей решение на рынке. Ниже рассматривается ряд аналитических инструментов и ресурсов для наиболее точной оценки потребностей в хранении данных. Второй этап заключается в оценке возможностей всех доступных вариантов систем хранения на флеш-технологиях, включая SSD, PCIe-накопители и флеш-массивы, и выяснения причин, по которым флеш-массивы являются наиболее подходящим вариантом для хранения данных предприятия.

Анализ систем хранения

Сразу же после принятия решения о дальнейшем расширении вычислительных возможностей предприятия для более быстрого принятия решений, более быстрого обслуживания заказчиков или с целью более эффективного расходования бюджета ЦОДа, следующим шагом непременно должен стать анализ ИТ-инфраструктуры для точного определения причин и блоков, ограничивающих производительность. Ключевым моментом для снижения рисков и увеличения эффективности использования флеш-систем хранения является детальное понимание характеристик производительности системы и приложений.

Большинство операционных систем обладают встроенными утилитами для мониторинга и диагностики. Двумя наиболее популярными из них на протяжении многих лет считаются Performance Monitor (perfmon) для Windows и Iostat для семейства Unix.

Утилита Iostat представляет собой инструмент мониторинга вычислительной системы под ОС Unix/Linux, предназначенный для сбора и изучения статистики по операциям ввода-вывода системы хранения. Зачастую Iostat используется для выявления ограничений производительности устройств хранения данных – как для локальных дисков, так и для удаленных накопителей, подключенных по сети.

Ряд приложений со специфическими свойствами – таких, как, например, базы данных, также зачастую обладает встроенными инструментами для оценки взаимодействия компонентов вычислительной системы, особенно устройств хранения, на предмет поиска «бутылочных горлышек» производительности аппаратных и программных модулей. Среди таких инструментов наиболее известна утилита для мониторинга и диагностики Statspack под базы данных Oracle, в последних версиях получившая название Automatic Workload Repository (AWR). Отчеты, генерируемые Oracle AWR, предоставляют администратору детальную информацию относительно времени выполнения снимков базы данных. Снимки предоставляют всю статистическую информацию о периодах ожидания, объеме операций ввода и вывода, таймингах, загрузке памяти и различной деятельности, связанной с программной обработкой запросов SQL.

Статистика об активности памяти, операциях ввода-вывода (I/O) и характеристиках производительности SQL, предоставляемая Oracle AWR, Iostat, perfmon и другими подобными инструментами, предоставляет собой бесценную информацию для оценки оптимального режима работы системы в целом, а также базы данных и других важных приложений. Выбор подходящей флеш-системы хранения для соответствующей ИТ-инфраструктуры, принятый на основании анализа такой информации, будет более взвешенным и продуманным.

Даже если ИТ-персонал предприятия достаточно квалифицирован для всестороннего анализа собранной информации с целью выбора подходящего варианта флеш-системы хранения, помощь специалистов из компаний – потенциальных поставщиков таких систем хранения, никогда не помешает. На сегодняшний день все официальные поставщики систем хранения на флеш-технологиях имеют в своем штате специальных технических экспертов, чаще всего называемых «инженерами по продажам» (Sales Engineer, SE), чья работа заключается в предоставлении помощи заказчикам по сбору необходимой информации, ее анализу, проектным решениям, тестированию и внедрению. Крупные вендоры делают значительные инвестиции в подобные ресурсы. К примеру, только за несколько последних лет IBM инвестировала в глобальную сеть лабораторий под названием «Центры компетенции флеш-технологий» (Flash Centers of Competency, CoC), в которых потенциальные заказчики могут получить развернутые консультации для устранения рисков при внедрении флеш-систем хранения.

Специалисты IBM Flash CoC предоставляют потенциальным заказчикам комплексные услуги, включающие подробные сведения для анализа рабочих нагрузок системы и приложений – так называемые «оценочные шаблоны» (Data Pattern Assessments). Эксперты IBM применяют инструменты анализа для полного сканирования массивов, хост-систем, баз данных и файлов ЦОДа клиента. Шаблоноы IBM Data Pattern Assessments требуют минимальных затрат времени и ресурсов со стороны заказчика, но взамен обеспечивают неоценимой информацией для определения ключевых точек ИТ-инфраструктуры, таких как приложения, серверы и системы хранения, для которых внедрение флеш-систем хранения данных с высокой производительностью и минимальными задержками была бы наиболее эффективна.

Флеш-контроллеры

Для создания эффективной твердотельной системы хранения в масштабах предприятия, обязательно необходимо учитывать специфику управления устройствами на базе флеш-памяти. Для этой цели в каждое устройство хранения на флеш-памяти встраивается специальный управляющий процессор — флеш-контроллер.

Флеш-контроллеры обеспечивают запись и чтение данных с носителя, а также управляют различными служебными процессами для быстрой, надежной и долговечной работы флеш-памяти. Наиболее известны два таких процесса: нивелирование износа флеш-носителя и уборка мусора.

Нивелирование износа флеш-накопителей корпоративного класса по сути представляет собой технологию равномерного распределения данных по ячейкам флеш-памяти для увеличения продолжительности жизни устройства. В последнее десятилетие было разработано большое количество блестящих инженерных решений для флеш-контроллеров для оптимизации использования флеш-памяти и увеличения срока службы флеш-чипов.

В отличие от небольшой и нерегулярной нагрузки на флеш-чипы для бытовой электроники, такой как смартфоны и цифровые камеры, флеш-накопители корпоративного класса испытывают огромные нагрузки по циклам записи и стирания (write/erase, P/E). Флеш-память было бы очень сложно применять в системах хранения для предприятий, если бы одна и та же ячейка регулярно подвергалась многочисленным циклам стирания-записи и в результате достаточно быстро вышла бы из строя. Для этих целей во все флеш-контроллеры накопителей корпоративного класса встраиваются специальные решения для выравнивания износа, с целью распространения активности циклов P/E между сотнями и тысячами флеш-ячеек каждого накопителя. Технология нивелирования износа к настоящему времени доведена до такого уровня эффективности, что корпоративные флеш-накопители сегодня изнашиваются гораздо реже, нежели традиционные жесткие диски с механическими компонентами.

Недавние исследования аналитической компании ESG, проведенные с системами IBM FlashSystem, показали, что износ жестких дисков составляет примерно 5% ежегодно на протяжении трехлетнего периода, в то время как флеш-модули в эквивалентном массиве IBM FlashSystem продемонстрировали износ лишь на 0,1%.

Уборка мусора необходима для поддержания высокой производительности, снижение которого может произойти по причине необходимости предварительной очистки флеш-ячеек перед записью. Для сокращения времени записи ячеек и соответствующего повышения скорости накопителя, флеш-контроллер запоминает расположение недействительных данных – таких как, например, удаленные или перезаписанные в другом месте. Затем флеш-контроллер в фоновом режиме производит операцию стирания, подготавливая таким образом ячейки для последующей записи.

    Твердотельные диски (SSD) традиционно рассматриваются в качестве наиболее удобного и доступного по цене варианта внедрения флеш-технологий, однако не стоит забывать об их ограничениях и недостатках.

    К примеру, выбор доступных форм-факторов SSD очень ограничен. Например, провести выравнивание износа для 10 ТБ массива гораздо проще, чем для 1 ТБ массива хотя бы по той причине, что в первом случае имеется гораздо больше флеш-ячеек, между которыми можно распределить новые записи. Преимуществом готовых решений «флеш из коробки» класса флеш-массива является то, что для достижения поставленных задач нужно всего лишь выбрать более емкое готовое устройство. С устройствами, чей форм-фактор рассчитан под размеры серверного отсека, такое принципиально невозможно.

    Поскольку SSD разработаны для использования в окружении для жестких дисков – практически, им на замену, они вынуждены использовать унаследованные интерфейсные протоколы – по сути своей, сетевые языки, как винчестеры, хотя эти протоколы далеко не всегда разрабатывались с учетом скоростных характеристик флеш-памяти. В общем случае, все технологии, разработанные для использования с жесткими дисками, обладают задержками миллисекундного диапазона, от единиц до сотен. Флеш, в свою очередь, оперирует задержками в микросекунды, то есть, быстрее на один – три порядка.

    Для некоторых программных и аппаратных компонентов, изначально разработанных для работы на скоростях жестких дисков, переход на скорости работы флеш-памяти просто невозможен, так что применение SSD в подобной среде порой сводит на нет ряд потенциальных преимуществ устройств на флеш-памяти.

    Твердотельные диски не являются готовыми отдельными решениями, по своей сути они предназначены для подключения и работы в качестве компонента интегрированного решения, вне зависимости от того, сервер это или массив хранения данных. Далеко не всегда такое интегрированное решение оптимизировано для работы с флеш-технологиями, и в этом случае приличные деньги будут заплачены за посредственную производительность.

    Ключевым преимуществом SSD всегда была цена его покупки. Это и сегодня является преимуществом, но на рынке корпоративных систем к цене приобретения нужно добавить операционные расходы на обслуживание систем хранения, в которые входит оплата электричества, охлаждения, цена устройств и программ управления SSD, и даже площадь размещения в ЦОДе. И это еще не полный список. Приобретение быстрых SSD и механическая замена ими старых жестких дисков в сервере выглядит заманчиво, но при этом стоит задуматься, как долго они износятся без элементарной функции выравнивания износа, которая попросту не предусмотрена в таком варианте? Таким образом, низкая цена SSD сама по себе не является преимуществом, поскольку твердотельные диски – это всего лишь компоненты в состав более сложных систем хранения с дополнительными расходами на эксплуатацию.

    Твердотельные диски показывают высокую эффективность только в подходящей для этого среде. Тем, кто намерен добиться максимальной производительности на каждый потраченный рубль, не стоит останавливать свой выбор на SSD.

      Процессы выравнивания износа и уборки мусора, как и множество других служебных задач по обслуживанию, выполняются флеш-контроллерами различных вендоров по различным алгоритмам, в связи с чем в каждом случае речь о разной скорости, задержках, последовательности, предсказуемости, надежности и эффективности каждой конкретной серии устройств хранения. При выборе накопителей для работы с критически важными для предприятия данными, параметры работы флеш-контроллера должны быть под особо пристальным вниманием.

      После точной оценки требований к проектируемой системе хранения — его емкости, скорости работы, потенциальных узких мест во всей инфраструктуре ЦОДа и множества других важных факторов, можно переходить к этапу оценки вариантов выбора подходящих флеш-накопителей.

      Плюсы и минусы флеш-накопителей с интерфейсом PCIe

      По аналогии с SSD, PCIe-накопители на флеш-памяти являются в некотором смысле заложниками сервер-ориентированной модели ускорения приложений – концепции, зародившейся еще во времена до технологий виртуализации, когда под одно приложение разворачивался отдельный сервер, и для увеличения производительности приложения требовалось соответствующее увеличение производительности системы хранения.

      Серверные кластеры, используемые сегодня повсеместно для работы сразу с несколькими приложениями, стали первым поприщем для широкого внедрения PCIe-накопителей. В то же время, сейчас все большую популярность приобрела архитектура виртуализации – когда сервер представлен как множество самостоятельных компьютеров – виртуальных машин, каждый из которых работает под управлением собственной операционной системы и работает со своими приложениями. PCIe-накопители с успехом могут использоваться в таком виртуализационном окружении до тех пор, если не предполагается кластеризация серверов.

      Разумеется, инженеры быстро нашли различные способы совместного использования кэшированных данных для PCIe-накопителей в отдельных виртуальных машинах. К сожалению, во всех подобных решения задействованы сети, в результате чего так или иначе получается… ещё один вариант сетевой системы хранения – именно то, от чего стремились избавиться при разработке изначальной концепции. Помимо этого, управление процессом распределения данных между PCIe-накопителями в различных физических системах требует использования специфического программного обеспечения, которое работает на уровне структуры данных и начисто разрушает изначальную цель по достижению сверхнизких задержек на уровне скоростей взаимодействия с процессором.

      Ко всем этим сложностям также стоит добавить необходимость открывать каждый корпус сервера каждый раз, когда понадобится установка или замена каждого PCIe-накопителя.

      Любые современные технологии, связанные с ИТ, растут с постоянным ускорением. Каждый день возрастает востребованность в еще большем объеме данных, более высоких скоростях работы с данными, появляются новые разновидности приложений и новые типы рабочих задач, такие как мобильные и социальные системы взаимодействия.

      По мере совершенствования программного обеспечения, возрастает необходимость в виртуализации всех компонентов ИТ-инфраструктуры. По своей сути, это и есть определение облачных вычислений — процессоры, сети и системы хранения становятся ресурсом, управляемым, потребляемым, распределяемым, обновляемым и масштабируемым и даже предоставляемым по подписке отдельно от других компонентов.

      Преимущества использования флеш-массивов

      В тех случаях, когда использование SSD или PCIe-накопителей по каким-то причинам невыгодно или неэффективно, отличных успехов можно добиться с использованием массивы хранения данных.

      Массив хранения данных – это, пожалуй, самый оптимальный способ преобразования системы хранения в виртуализационный ресурс с минимумом головной боли, сложностей и затрат. Впрочем, выбор в пользу флеш-массива хранения данных вместо SSD или PCIe-накопителей имеет ряд других веских причин:

      Флеш-массивы IBM FlashSystem

      Многие присутствующие сегодня на рынке флеш-массивы изначально разрабатывались в качестве программных инженерных проектов, призванных решить ряд типичных проблем систем хранения. Такие программные решения загружались на стандартные аппаратные решения, купленные в магазине, и затем, если все работало как было запланировало, на свет появлялся новый конкурентоспособный флеш-массив с относительно низкой ценой разработки и быстрым временем вывода на рынок. Всегда ли и для всех ли хороши такие решения? Отнюдь.


      Массив IBM FlashSystem V9000 со всем необходимым для работы
      Цена: SSD имеют минимальную цену при покупке, флеш-массивы обеспечивают минимальную финальную цену, сложенную из стоимости покупки и стоимости операционных расходов на обслуживание. Флеш-массивы также обеспечивают минимальную цену в расчете на единицу хранимой информации, особенно когда требуется упаковать максимум данных в минимальном объеме.

      Нет ведущих, нет ведомых: В случае внедрения сетевой системы хранения есть смысл остановить выбор на менее дорогом и сложном решении. Флеш-массивы очень легко оптимизируются для распределения емкости и других функциональных возможностей между любыми подключенными к ним устройствами.

      Задержки: Когда требуется ускорение работы приложений на физическом сервере, PCIe-накопители оказываются выгоднее по цене, нежели флеш-массивы, и более производительными, нежели SSD. Однако при наличии распределенной инфраструктуры хранения или при планировании ее разворачивания у флеш-массивов нет конкурентов.

      После установки дисков в шасси IBM FlashSystem, настройки и оптимизации системы, можно добавлять, изменять и совершенствовать такое хранилище данных с учетом требований приложений и других бизнес-нужд без ущерба для любых других компонентов ИТ-инфраструктуры предприятия. Системы хранения IBM FlashSystem, полностью выполненные на флеш-технологиях, разработаны с учетом дальнейшего развития информационных технологий и бизнес-систем. Аппаратная платформа этих систем совершенствовалась десятилетиями со времен возникновения первых флеш-массивов такого уровня, равно как и программная платформа.

      Программная платформа IBM FlashSystem представляет собой комплекс, успешно внедренный и используемый в тысячах ИТ-инфраструктур. Например, в одной только функции IBM для сжатия данных в реальном времени (Real‐time Compression) используется более 70 патентов компании.

      Для внедрения системы хранения с совместным использованием флеш-накопителей и жестких дисков, достаточно приобрести лучшие из них и интегрировать с легкодоступным многоуровневым программным обеспечением для системы хранения.

      Для разворачивания массива IBM FlashSystem достаточно приобрести и установить необходимое количество доступных накопителей. Это решение обеспечивает минимальную цену за терабайт информации, достаточно высокую производительность, а также отличное ПО для виртуализации и управления системой хранения, включая динамическое многоуровневое распределение для автоматического перемещения данных между накопителями на основе установленных администратором политик.

      При необходимости развернуть флеш-систему хранения данных с минимальной ценой хранения за терабайт, есть смысл обратить внимание на характеристики IBM FlashSystem. Если необходима высокая отдача производительности на вложенные инвестиции, IBM FlashSystem также будет отличным решением.

      Минимальные задержки, масштабируемость проекта по мере роста, минимальные издержки при внедрении – все это обеспечивает IBM FlashSystem. Главное же преимущество заключается в том, что переход на IBM FlashSystem означает для предприятия финальный, экономически эффективный отказ от жестких дисков.

      С системами IBM FlashSystem можно в полной мере оценить потенциал облачных вычислений и работы с большими данными, реализовать виртуальные рабочие места без необходимости внесения изменений в инфраструктуру системы хранения. Самое большое преимущество от внедрения систем IBM FlashSystem – это производительность, надежность и эффективное превращение системы хранения данных из тормозящего фактора в локомотив инноваций предприятия.

      Владимир Бахур