Интеллектуальные СХД могут восстанавливать данные в 12 раз быстрее
24.09.2021
В период пандемии эта проблема стала особенно яркой и проявилась в том числе в дата-центрах, владельцы которых стремительно сокращали пространство, которое традиционно занимало серверное оборудование, отдавая его под системы хранения данных. Сотни и тысячи экспертов спорят о том, какие технологии и подходы станут основой цифрового будущего, но все они сходятся на том, что ни один из этих подходов не будет актуальным без действительно высокоскоростных СХД.
СХД, обогнавшая конкурентов по уровню производительности в 2 раза
Авторитетный консорциум Storage Performance Council (SPC), занимающийся в том числе независимыми оценками систем хранения, в декабре 2020 г. обновило свой рейтинг СХД по уровню производительности. Мир получил нового лидера, который улучшил показатели своего предшественника более чем в 2 раза (21 млн операций ввода-вывода в секунду против 10 млн на тот момент, а сейчас на второй позиции — другое решение с показателем 11 млн IOPS). Так самой производительной СХД в мире официально стало OceanStor Dorado 18000 v6 от компании Huawei.
Этот успех удивителен отнюдь не тем, что рейтинг покорило решение Huawei (в топ-10 СХД китайской компании оккупировали 5 позиций!), а тем, каким оказалось соотношение производительности СХД и той суммы, которую бизнесу придется за эту производительность выложить.
Как отмечают в SPC, на рынке есть компании, которые могут предложить бизнесу отдаленно похожие цифры IOPS, но стоить это будет настолько дороже, чем разработка Huawei, что ни одна серьезная компания такое предложение рассматривать не станет. Не будет лишним отметить, что проведенный авторский тест SPC-1 воссоздает в боевых условиях не какие-то теоретические ситуации, которые могут быть очень далеки от реальных, а действительно максимально нагружает систему хранения. Так, как это делают настоящие бизнес-критичные приложения предприятия, когда доходит до работы с системами ввода-вывода.
21 млн операций ввода-вывода в секунду — такой уровень производительности показала система хранения данных OceanStor Dorado 18000 v6 от компании Huawei. По данным консорциума Storage Performance Council, предыдущее наивысшее достижение было побито более чем в два раза.
Как достигли 21 млн IOPS
В самой компании Huawei высокую производительность относят к числу ключевых особенностей новой OceanStor Dorado 18000 v6. Помимо 21 млн IOPS китайские разработчики смогли добиться сверхнизкой задержки на уровне 0,5 мс. Ключом к успеху в Huawei считают уникальную архитектуру системы хранения, благодаря которой стал возможным интеллектуальный ускоренный поиск способов передачи данных, непосредственно вычислений и, конечно, хранения и управления.
За интеллектуальность отвечает модуль ИИ-ускорителя с обвесом из машинного обучения. Такая конфигурация позволяет системе самостоятельно изучать влияние различных нагрузок и конкретных приложений на операции ввода-вывода и на основе ИИ-алгоритмов оптимизировать работу с памятью. Эффективность кэш-памяти при чтении информации повышается за счет этого сразу на 50%, а задержка пакетной обработки проседает с 300 мкс до 150 мкс.
Искусственный интеллект используется и для передачи данных — за это отвечает модуль многопротокольных интерфейсов, который анализирует в том числе Fiber Channel 32/16/8 Гбит/с и Ethernet 100/40/25/10 Гбит/с. Задержка сети при чтении сокращается также в 2 раза — со 160 мкс до 80 мкс.
Все это имело бы куда меньшее значение, если бы в OceanStor Dorado 18000 v6 не было высокопроизводительной вычислительной платформы на базе процессора ARM, благодаря которой и достигается двукратное повышение показателя IOPS.
Также в решении присутствует оборудование для интеллектуального управления, которое повышает число локализованных отказов сразу на 30% (до 93% — практически невиданный для рынка результат) и сокращает время восстановления с 2 часов до 10 минут.
Последний важный кирпичик — умные SSD, сокращающие задержки чтения в 2 раза (с 40 мкс до 20 мкс при низких нагрузках) из-за принципиально переработанного компонента — уровня трансляции флеш-памяти.
В Huawei провели собственные тесты All-Flash Array систем хранения конкурентов и OceanStor Dorado 18000 v6. В тестах конкурентов снижение производительности достигало 40%, а в случае решения Huawei — всего 10%.
Как обеспечивается надежность
Вторым краеугольным камнем успеха своей новой системы китайский гигант называет высокую надежность. Лучшая ее иллюстрация — способность продолжать работу даже после отказа 7 конроллеров из 8, что и так является полумифической ситуацией, с которой на практике бизнес сталкивается только совсем уж в экстренных ситуациях.
На это влияют несколько факторов. Среди них стоит выделить надежность самой компонентной базы, основой которой стали твердотельные накопители Huawei. Их средняя наработка на отказ составляет 3 млн часов. Кроме того, на срок службы SSD-дисков влияют дополнительные применяемые технологии: коррекция ошибок с помощью кода с малой плотностью проверок на четность (Low-Density Parity-Check Code; LDPC), выравнивание износа Global Wear Leveling и Anti-Wear Leveling и технология регулирования питания на чипах SamrtFSP.
Сами подходы, ставшие фундаментом для разработки, сделали возможной столь высокую отказоустойчивость. В частности, взаимосвязанная архитектура «active-active», которая получила название SmartMatrix. Помимо спокойного «полета» на одном контроллере, она сделала возможным полный отказ одной из двух контроллерных стоек. Технология RAID-TP, ставшая логическим продолжением RAID 5-го и 6-го уровней, дает еще и устойчивость к одновременному (!) выходу из строя 3 дисков. Для бизнеса это будет привлекательным еще и потому, что используемая в OceanStor Dorado 18000 v6 интеллектуальная технология DAE сокращает время, необходимое для восстановления 1 ТБ данных, с 10 часов до 15 минут.
В Huawei провели собственные тесты All-Flash Array систем хранения конкурентов и OceanStor Dorado 18000 v6. В тестах конкурентов снижение производительности достигало 40%, а в случае решения Huawei — всего 10%.
Среди других важных элементов стоит выделить бесшлюзовое решение HyperMetro (также с архитектурой «active-active»), которое осуществляет аварийное переключение малозаметно для приложений, и режим FlashEver, позволяющий отказаться от необходимости переноса данных в рамках систем, созданных в последнее десятилетие. Правда, может потребоваться замена самих контроллеров.
Последний элемент в рецепте успеха — бесшлюзовое резервное копирование в облако, помноженные на собственные механизмы защиты в многооблачных средах. Процессы, связанные с аварийным восстановлением, таким образом, приводятся к единому знаменателю, как и резервное копирование, и само повторное использование данных.
Характеристики СХД
Важно также отметить основные спецификации системы хранения OceanStor Dorado 18000 v6, которые выгодно выделяют ее не только на фоне конкурентов, но даже и на фоне OceanStor Dorado 8000 V6, которая сама являлась одним из лучших решений на рынке в своем ценовом сегменте. Данные характеристики приведены в таблице ниже.
Характеристики аппаратной платформы OceanStor Dorado 18000 V6
Максимальное количество контроллеров | 32 |
Максимальная емкость кэша (сдвоенные контроллеры, расширение путем добавления контроллеров) | 512 ГБ — 32 ТБ |
Протоколы хранения | FC, iSCSI, NFS, CIFS |
Типы внешних портов | 8/16/32 Гбит/с FC/FC-NVMe и 10/25/40/100 Гбит/с Ethernet, 25 Gb NVMe поверх RoCE |
Типы внутренних портов | 100G RDMA/SAS 3.0 |
Максимальное количество модулей ввода/вывода, поддерживающих «горячую» замену, на блок контроллеров | 28 |
Максимальное количество внешних портов на блок контроллеров | 96 |
Максимальное количество дисков SSD | 6400 |
SSD-диски | NVMe SSD размером с ладонь 1,92 ТБ/3,84 ТБ/7,68 ТБ/15,36 ТБ SAS SSD 960 ГБ/1,92 ТБ/3,84 ТБ/7,68 ТБ/15,36 ТБ/30,72 ТБ |
Максимальное количество LUNов | 65 536 |
Поддержка SCM | 800 ГБ SCM |