www.gcs.ru
+7(495) 729-51-70 (ГКС)
Инновации хранения данных IBM
Как инновации в хранении информации помогают расти?
Статья

Почему важна скорость СХД

Систематика-IBM
, Текст: Александра Кирьянова

Замена морально и физически устаревших систем хранения данных на традиционных жестких дисках новыми скоростными системами на базе флеш-технологий коренным образом меняет работу частных, государственных и научных предприятий, связанных с обработкой данных посредством интернета и локальных сетей. Но даже в организациях, использующих обработку информации в «локальных» базах данных, применение скоростных современных флеш-массивов сулит огромную экономию расходов на обслуживание ИТ-инфраструктуры.

Все современные организации – от городских мэрий и киностудий до медицинских компаний и производителей автомобилей – уже успели оценить на практике критическое влияние информационных технологий (ИТ) на успешное ведение дел. По мере более глубокого проникновения ИТ во все сферы человеческой деятельности, каждый руководитель и менеджер получает максимально четкое представление о той важной роли, которую играют системы хранения данных, как они помогают в достижении намеченных целей и принятии правильных решений с минимальными затратами.

Сегодня можно с уверенностью утверждать, что эволюционный процесс развития твердотельных накопителей (SSD – SolidStateDisk) на чипах флеш-памяти NAND-типа наконец достиг такой стадии соотношения цены, производительности и надежности, при котором многие организации всерьез рассматривают возможность ее использования на замену недопустимо медленным и значительно менее эффективным накопителям с механическими вращающимся частями. Эффективность перевода систем хранения на SSD стала настолько очевидной, что рано или поздно каждый руководитель предприятия неминуемо озадачивается поиском ответа на естественно рождающиеся вопросы: Когда уместно использование флеш-памяти? Какое решение на базе флеш-памяти лучше всего подходит для каждого конкретного случая? И как я могу сделать его успешной, экономически эффективной частью моего центра обработки данных?

Информационные технологии не являются панацеей сами по себе и всего лишь призваны решать некоторые проблемы бизнеса и расширять его возможности. Аналогично и системы хранения данных, даже самые быстрые и современные, будут не более чем бесполезным украшением ЦОДа до тех пор, пока не начнут приносить определенную выгоду предприятию. Таким образом, первым шагом при развития бизнеса можно определить получение дополнительной информации о преимуществах использования флеш-массивов в качестве инструмента для решения насущных бизнес-задач по хранению данных.

Для онлайна всегда важна скорость

Предположим, деятельность компании хотя бы частично связана с интернетом. На практике в эту группу попадает подавляющее число предприятий — от ритейлеров с онлайн-магазинами до банков и других финансовых учреждений с онлайновыми сервисами и научных организаций, распространяющих информацию о своих достижениях посредством Сети. Тем не менее, на базовом, самом примитивном уровне представления интернет – это всего лишь сеть компьютеров, обменивающихся наборами цифровых пакетов – нулей и единиц в виде импульсов напряжения.

За десятилетия своего развития компьютерные сети превратились в сложные и мощные системы, способные управлять передачей невероятных объемов цифровой информации по различным типам соединений, таким как металлические провода, оптические волокна и даже вовсе без проводов посредством электромагнитных волн. С каждым годом, по мере увеличения потоков передаваемой информации, требования к мощности компьютерных сетей стремительно растут.

Сегодня ежедневно человечество генерирует около 2,5 квинтильонов байт (байт – единица цифровой информации, в большинстве случаев состоящая из восьми битов) новых данных. Согласно прогнозам специалистов IBM, к 2017 г. суммарный объем данных увеличится на очередные 800%.

Для успешного управления постоянно растущими потоками данных и их своевременной передачи, компьютерные сети должны стать еще быстрее. Данные постоянно записываются и считываются на каждом подключенном к информационной сети компьютерном «узле», а это значит, что скорость работы систем хранения напрямую влияет на общую производительность при выполнении любых работ, завязанных на компьютерные сети.

Перенос данных с одного компьютера на другой – лишь простейший пример необходимости использования информационных сетей. Чаще всего компьютеры взаимодействуют друг с другом через интернет и другие типы коммуникационных сетей, таких как локальные сети (LocalAreaNetworks, LAN) внутри или под контролем отдельной организации, или географически более масштабные глобальные сети (WideAreaNetworks, WAN). Благодаря сетевым приложениям можно обмениваться фотографиями, переводить деньги между счетами и даже проводить бизнес-встречи с коллегами по всему миру. Но все это возможно только с быстрыми системами хранения и извлечения данных.

По сути, весь бизнес, правительство и наука в современном мире используют компьютерные приложения в качестве основополагающих инструментов жизнедеятельности. По мере роста объемов данных, количество приложений, от которых мы зависим, растет ещё быстрее. Для выполнения заданий в максимально короткие сроки, приложения должны записывать данные на накопители и извлекать эти данные в максимально короткое время.

Количество времени, необходимое для совершения полного цикла хранения данных – по сути время отклика хранения, обычно называют задержкой системы хранения или латентностью.

Наиболее важным ограничением, или «бутылочным горлышком» способности приложения вовремя выполнить задание, является латентность системы хранения компьютера, на котором запущено это приложение.

Еще одним важным видом латентности в цифровых системах являются задержки в информационных сетях. Если функционирование приложения частично или полностью зависит от передачи данных по сетям, такой вид латентности суммируется с задержками вычислительной системы и системы хранения.

Задержки локального хранилища – это уже плохо, но в сочетании с задержками сети проблемы умножаются. Жизненно важные для работы предприятия приложения демонстрируют производительность, ограниченную дополнительными задержками устройств хранения, а также особенностями дизайна и архитектуры вычислительной системы. Решение проблем латентности вычислительных систем и сетей является предметом успешной деятельности ряда процветающих отраслей мировой индустрии информационных технологий.

Ряд совершенно новых отраслей промышленности и секторов экономической деятельности возник после изобретения сетевых вычислений и выхода человечества в Интернет, ряд традиционных отраслей был преобразован в нечто новое. И почти в каждом таком случае быстрые системы хранения данных стали основным критерием успеха.

Электронная коммерция

Онлайновая розница – или, как ее еще называют, – e-Commerce, за считанные годы стала одной из движущих сил развития мировой экономики. Электронная коммерция представляет собой отличный пример прямой зависимости успешности предприятия от производительности систем хранения. По оценкам аналитиков IBM, мировые доходы бизнеса розничных интернет-продаж перевалили за отметку в $1 трлн несколько лет назад, и совсем скоро они составят более 5% всей мировой экономической деятельности.

Помимо создания совершенно новых бизнес-моделей, электронная коммерция также успешно конкурирует с традиционными несетевыми магазинами. Например, в США на сегодняшний день порядка 70% потребителей впервые взаимодействуют с брендами именно посредством онлайн-покупок. Совсем скоро ожидается, что порядка 50% всех долларов, потраченных в США на розничные покупки, будут приходиться на цифровые онлайновые транзакции.

Онлайновые покупатели отнюдь не настроены ожидать длительной загрузки информации в процессе принятия решения о совершении покупки, их интересует максимально быстрая реакция. Сложные и насыщенные динамичным контентом интернет-страницы загружаются гораздо дольше, особенно на мобильных устройствах, что определяет одну из фундаментальных проблем для провайдеров электронной коммерции.

Влияние электронной коммерции на рынок торговли в целом очень велико и увеличивается в последнее время в среднем на 20% ежегодно. Использование информационных технологий в е-коммерции становится одним из важнейших рыночных инструментов на пути к успеху. Успешные интернет-магазины розничной торговли взаимодействуют с потребителями и обеспечивают быстрый доступ к информации о продуктах с максимальной скоростью, обеспечивая таким образом рост рыночной доли и прибыльность компании.

Большие данные и аналитика

Каждое современное предприятие в настоящее время накапливает огромные объемы данных, которые порождаются широким кругом источников, зачастую на экстремальных скоростях. Именно такие массивы данных сегодня принято называть большими данными. Выявление значимых паттернов и взаимное влияние в этих обширных массивах данных принято называть аналитикой больших данных.

Для предприятий любого масштаба собственные данные являются одним из самых ценных активов, а собственно аналитика больших данных может стать одним из мощнейших инструментов для получения конкурентного преимущества, увеличения продаж и защиты бизнеса от мошенничества. В то же время для проведения аналитики в реальном времени – в режиме, соответствующем скорости накопления больших данных, платформа для анализа больших данных требует использования системы хранения с минимально возможными задержками, равно как и с экстраординарной производительностью для обработки постоянно увеличивающегося объема данных. Таким образом, производительность системы хранения действительно очень важна для любого предприятия, планирующего использовать преимущества анализа больших данных.

Производительность также важна для науки

Некоммерческие предприятия также используют большие данные в своей работе. Отличным примером такого предприятия является Большой адронный коллайдер в пригороде Церна, Швейцария, где в процессе научных экспериментов примерно 150 млн сенсоров генерируют данные со скоростью до 40 млн раз в секунду. Суммарный поток генерируемых за год данных превышает 150 ПБ, или примерно 500 квинтильонов (5 на 10 в 20-й степени) байт в день — почти в 200 раз больше, чем все данные, генерируемые остальными источниками в мире. Только благодаря анализу таких невероятных объемов данных ученым удалось, например, подтвердить существование бозона Хиггса, также называемого «Божьей частицей».

Финансовые сервисы

Индустрия финансовых сервисов является еще одним хорошим примером значимости производительности систем хранения. Среди индустриальных направлений, особенно заметно ускорившихся с пришествием Интернета в финансовый сектор, можно отметить торговлю акциями. Основные банковские системы становятся все быстрее и быстрее по мере того, как из обычных систем для хранения счетов клиентов, они превращаются в удобные инструменты с онлайновым и мобильным доступом.

На примере финансового сектора особенно четко видны жесткие условия конкуренции, распределения рыночной доли, увеличении доходов и передела рынка между компаниями, совершенствующими свои ИТ-инфраструктуры, и теми, кто упускает эту возможность. Задержки и масштабируемость систем являются критически важными параметрами для успешной работы приложений финансовых организаций.

Помимо оперативной обработки транзакций, оценки рисков и рыночной ситуации, предприятия финансового сектора также способствовали принятию общеотраслевого онлайнового инструментария оперативной аналитической обработки данных (OLAP), еще более усилив потребность в очень быстрых вычислительных системах и высокопроизводительных системах хранения.

Облака, смартфоны и социальное взаимодействие

Онлайновый бизнес – это новый диковинный мир, где Интернет трансформирует не только традиционные предприятия, но также способствует возникновению совершенно новых отраслей и полностью новых индустриальных направлений. Все это сопровождается не только возникновением новых сервисов и способов их доставки, но также возникновением новых моделей воровства и мошенничества с данными. Этот стремительно растущий мир коммерции и взаимодействия, законного и не очень, порождает непрерывную гонку новых технологий хранения данных, основанных на постоянно ускоряющейся потребности в скорости.

Мобильные гаджеты и онлайновая социальная активность являются двумя совершенно новыми коммерческими направлениями, порожденными интернетом, которые на наших глазах меняют правила ведения бизнеса и взаимодействие общества в глобальном масштабе. Профильные мобильные технологии и распространение социальных сетей расширяет возможности доступа человечества к накопленным знаниям.

В 2016 г. около 57% компаний планируют израсходовать более четверти собственного ИТ-бюджета на системы мобильного и социального взаимодействия, что в два раза больше, нежели было затрачено в 2013 г.

В то время как многие сферы индустрии и профессии видоизменяются под воздействием Интернета, ИТ-инфраструктуры предприятий на глобальном уровне трансформируются под растущим воздействием облачных вычислений. При любой модели доставки облачных сервисов, для ИТ-инфраструктуры критическим звеном является система хранения данных. Более того: поскольку работа приложений и других функциональных сервисов по облачной модели завязана для конечного потребителя на использование локальных сетей, интернета или того и другого, системные задержки являются наиболее критичным параметром.

Суммарное время отклика системы включает сетевые задержки и задержки вычислительной системы. По мере увеличения пропускной способности сетей, значительная часть внимания переносится на снижение задержек в самом центре обработки данных, которая, в свою очередь, напрямую зависит от используемой системы хранения данных. Вот почему внедрение флеш-массивов хранения в облачных и других сетевых средах происходит такими стремительными темпами: только высокопроизводительные системы хранения в состоянии справиться с постоянно растущими нагрузками.

Согласно прогнозам IBM, уже в 2016 г. более четверти приложений во всем мире будет располагаться в «облаках». При этом примерно 85% нового программного обеспечения будет изначально встраиваться в облачные структуры. Рынок ИТ в качестве онлайновой услуги, генерирующий новые бизнес-модели, уже успел достичь в 2015 г. объема в $250 млрд.

Производительность генерирует прибыль

Пока что далеко не вся активность корпоративных, правительственных и научных учреждений связана с Интернетом: в настоящее время речь примерно о 5% мировой экономики, в то время как остальные 95% не связаны с Интернетом или связаны с ним очень слабо. На практике это означает, что множество данных обрабатываются локально, в физических стенах предприятий, и никак не подключены к сетям.

Нужны ли для таких «локальных» вычислительных систем быстрые системы хранения? Заинтересованы ли организации, зависящие от компьютерных вычислений, в совершенствовании собственной ИТ-инфраструктуры? В обоих случаях ответ положительный.

База данных представляет собой организованную подборку данных для использования этой структурированной информации в различных прикладных системах, например, при выборе подходящего номера в отелях определенного города на определенное число и количество постояльцев. СУБД представляют собой программы, обеспечивающие взаимодействие между базами данных, пользователями и другими приложениями для выборки и анализа хранящихся данных. СУБД общего назначения разрабатываются для определения, создания и обработки запросов из баз данных с возможностью их обновления и администрирования.

Базы данных представляют собой пример наиболее широко распространенного приложения из категории «локальных» вычислений. Базы данных и системы управления базами данных (СУБД) фактически являются ровесниками информационной эпохи.

Базы данных используются повсеместно – от бухгалтерии и отдела кадров до учета комплектующих на складе и ведения клиентского сервиса с отслеживанием доставки. Поскольку использование различных баз данных связано с большинством приложений и с обработкой данных в подавляющем числе случаев экономической активности на планете. Таким образом, не будет преувеличением сказать, что производительность баз данных влияет на деятельность предприятий, правительственных и научных учреждений в значительно большей степени, чем любые другие информационные технологии.

Имеют ли базы данных с хранилищами на флеш-технологиях преимущества перед базами данных на традиционных жестких дисках? Недавние исследования, проведенные аналитиками компании Wikibon, свидетельствуют, что общие затраты на ИТ могут быть значительно сокращены путем замены традиционных систем хранения на современные флеш-массивы:

  • на 54% сокращается суммарная стоимость ИТ-инфраструктуры предприятия,
  • на 94% снижаются расходы на администрирование и операционныее расходы,
  • на 76% сокращаются экологические затраты (за счет экономии энергии и занимаемой площади),
  • на 52% сокращаются расходы на программное обеспечение.


Каким образом возникает такой существенный выигрыш от использования более быстрых систем хранения для работы с базами данных, особенно в масштабах расходов на весь центр обработки данных? Оказывается, производительность системы хранения действительно может значительным образом повлиять на расходы по обработке информации, при этом, для этого есть несколько способов.

При выполнении увеличенного объема работ с прежним уровнем затрат, расходы на единицу выполненной работы снижаются. Быстрые системы хранения с меньшей латентностью позволяют базам данных более оперативно реагировать на каждый запрос пользователя или приложений.

На протяжении десятилетий производительность большинства компонентов ИТ-инфраструктур постепенно увеличивалась, но возможности традиционных жестких дисков с вращающимися пластинами росли значительно медленнее. В результате между производительностью центральных процессоров и накопителей со временем образовался огромный разрыв, оцениваемый в 10 тыс. раз (ГГц/мс). По этой причине, обрабатываемые процессором приложения вынуждены простаивать множество вычислительных циклов процессора в ожидании пересылки данных от процессора в базу данных и обратно. В некоторых случаях, медленная система хранения данных на традиционных накопителях может снизить общую производительность ЦОД до 10% от потенциально возможного уровня, при этом все остальное время системы будут простаивать в ожидании данных. Применение современных быстрых систем хранения резко повышает коэффициент полезной загрузки процессора, который может быть ещё более увеличен за счет дополнительной оптимизации задержек в других системных компонента. Повышение коэффициента полезного использования процессора напрямую влияет на эффективность всей ИТ-инфраструктуры, при этом, для выполнения обычного объема работ может понадобиться гораздо меньшее число серверов, со значительно меньшим числом программного обеспечения.

Все современные системы хранения на базе флеш-технологий не только быстрее, но также экономичнее традиционных дисковых накопителей. Флеш-чипы памяти не имеют движущихся механических частей, в них движутся только электроны, обеспечивая значительную экономию на счетах за электричество. Попутно это также означает пропорционально уменьшенное выделение тепла и конвертируется в меньшие затраты на вентиляционные системы для охлаждения центра обработки данных.

Любые механические компоненты, к числу которых принадлежат традиционные жесткие диски, как правило, изнашиваются и ломаются значительно быстрее, нежели электронные микросхемы. Таким образом, предприятие значительным образом экономит на затратах по ремонту и обслуживанию баз данных, расходах на системных администраторов. Широкий список предприятий — от онлайновой розницы до банков и фондовых бирж, могут позволить себе использование скоростных систем хранения на фоне сокращения расходов на обслуживающий персонал.

Владимир Бахур