Что на самом деле означают 2 самых главных параметра в DRaaS: RTO и RPO
Значимость услуги послеаварийного восстановления для инфраструктуры предприятия неоспорима. Для любой организации важно обладать высоким уровнем стрессоустойчивости. Понимая необходимость различных инструментов резервирования и восстановления, далеко не каждый знает, на что ориентироваться, подбирая поставщика подобных услуг. В настоящее время для всех провайдеров, предоставляющих своим заказчикам инструментарий наподобие DRaaS, наиболее показательными являются два параметра — RTO и RPO. Ориентируясь только на них, можно делать оценку качества заказываемого сервиса.
Что такое RTO и RPO в аварийном восстановлении
Хотя эти два понятия отчасти влияют друг на друга, знакомиться с ними необходимо по-отдельности. RPO — это аббревиатура, обозначающая целевую точку восстановления. Другими словами, именно этот параметр задает частоту репликации данных. К примеру, если указанное значение описываемого параметра равняется 1 час, то дублирование будет происходить каждые 60 мин. При этом максимальный объем утраченных данных будет соответствовать изменениям, которые были внесены в систему на протяжении этого периода.
Естественно, частота дублирования имеет непосредственное влияние на производительность системы. Наиболее защищенный вариант — синхронная репликация, имеет RPO, равный 0, но нагрузка, оказываемая на канал при ее реализации, делает его крайне невыгодным.
Второй показатель, описанный в этой статье, имеет не меньшую роль для предприятия. RTO отображает максимальное затрачиваемое время на перезапуск системы на резервных мощностях в случае аварии.
Данный показатель имеет отношение к общей производительности организации и практически не отображает степень защищенности данных. RTO или целевое время восстановления показывает, как долго проекту придется обходиться без информационной инфраструктуры в случае сбоев в ее работе. Если учесть, что многие просто не способны работать без доступа к базам данных, то становится очевидным важность этого параметра.
В чем разница между RTO или RPO
Несмотря на простоту озвученного вопроса, для многих понимание различия между понятием RTO и RPO становится сложной задачей. Если обобщить, то первый показатель указывает на то, как долго придется обходиться предприятию без баз данных, а второй параметр обозначает, насколько весомыми будут потери информации.
Фактически, RTO и RPO — это характеристики, объединяемые только тем, что они отображают целевые рамки, в которые поставщик услуги резервного копирования обязуется уложиться. В остальном же они мало в чем взаимосвязаны и характеризуют разные величины.
Узнать RTO и RPO у 15 провайдеров DRaaS
Типичные значения RTO или RPO
Рассматриваемые показатели влияют на стоимость тарифного пакета услуг репликации инфраструктуры. По этой причине и ввиду высокой нагрузки провайдеры не могут обеспечить своим клиентам идеальные нулевые значения данных характеристик. Подобное решение было бы просто финансово неоправданным.
Большинство поставщиков услуги аварийного восстановления предусматривают возможность подстройки пакета под индивидуальные требования заказчика. Именно такой подход стоит считать правильным, ведь для некоторых организаций час простоя и актуализация информации часовой давности не принесет значимых убытков. Для других же и несколько потерянных минут станут ощутимой проблемой. В целом, на сегодняшнем рынке самые передовые провайдеры DRaaS обеспечивают RTO и RPO от 1 мин. Это считается эталоном. В то же время и предложения с RTO и RPO в 15 мин считаются нормой.
От чего зависит RTO и RPO, как добиться снижения
Оба описанных параметра — это, в первую очередь, не характеристика провайдера, а отражение требований проекта заказчика. Поэтому перед определением, какого провайдера DRaaS выбрать, стоит произвести оценку работоспособности собственной организации.
Большинство поставщиков DRaaS или схожих решений демонстрируют эти два понятия в виде линейного графика. На координатной сетке отображают параболу убытка. Левая часть диаграммы демонстрирует RPO, а правая RTO.
Добавив на получившийся график две кривые, отражающие стоимость тарифного пакета услуг репликации сервиса, можно прояснить очевидность показателей RTO и RPO, соответствующих потребностям бизнеса. Нужное значение будет находиться на пересечении функций.
Если обобщить, то показатели целевого времени и точки репликации должны подбираться так, чтобы обеспечить максимальную безубыточность. Поэтому необходимо учитывать и стоимость времени простоя, и цену самого решения.
Не стоит воспринимать RTO и RPO как константу, предлагаемую поставщиками. Наоборот, рынок DRaaS и подобных строится так, что провайдеры ориентируются на реальные запросы клиентов. В перспективе могут появиться решения с синхронной репликацией и возможностью перезапуска инфраструктуры менее чем за минуту, однако для этого необходимо, чтобы появились заказчики, для которых такая услуга будет оправдана с финансовой стороны.
Обзор DRaaS 2021: на что еще обратить внимание кроме RTO и RPO
Как вычислить свой RPO
Определить, какой RPO сможет удовлетворить потребности организации, достаточно просто. Если проект способен без ущерба для себя потерять из своей базы данные за 1 час работы, то RPO для такой фирмы будет равный 60 мин.
В этом вопросе все напрямую зависит от того, какой тип бизнеса реализует конкретный заказчик. К примеру, если требуется репликация данных загруженного офиса, занимающегося графическим дизайном, то и дублирование каждые 15 минут покажется недостаточным. В то время как для проекта с низкой частотой изменения целевая точка восстановления может равняться нескольким суткам.
Подсчет данного показателя подразумевает определение временного отрезка, который организация сможет функционировать, не используя основные информационные структуры без ощутимых потерь прибыли. Необходимо учитывать самые различные сценарии. Кибератаки, пожары, стихийные бедствия, технические сбои — все это будет иметь разное влияние на работоспособность проекта. В то же время все неприятности можно квалифицировать и на базе полученных категорий оценить максимально возможный ущерб, и время реального функционирования инфраструктуры в случае его возникновения.