Скажи-ка, дядя, ведь не RAR’ом… Почему архивирование данных не менее важно, чем бэкап
О том, почему данные играют сегодня определяющую роль для любого бизнеса, много рассказывать не приходится. Они стали основным активом для большинства компаний, а потерять накопленную информацию сегодня — все равно что разрушить бизнес до основания. Поэтому так много внимания уделяется защите данных. Однако зачастую в тени остается вопрос о том, как именно и какие данные необходимо защищать.
Архивирование и резервное копирование
Для обывателей эти два термина часто становятся синонимами. На самом деле они обозначают два разных процесса.
Бэкап, или резервное копирование, — создание страховой копии оперативных файлов, с которыми работают пользователи и корпоративные системы. Кроме того, при бэкапе часто создаются и образы операционных систем и приложений. Так делают потому, что основное назначение резервных копий — быстрое восстановление работоспособности систем в случае происшествий. Поломка оборудования, ошибочные действия пользователей, природные катастрофы — все это может привести к потере данных, которые необходимо не просто сохранить, но и обеспечить к ним постоянный доступ. В последнее время к числу рисков прибавились атаки вирусов-шифровальщиков, которые грозят бизнесу не только утратой данных, но и огромными затратами на «вознаграждение» вымогателей. Не будем забывать и про репутационные потери: кейс компании Garmin хорошо известен всем.
Но бизнес имеет дело не только с оперативными данными, которые необходимы «здесь и сейчас». Значительный объем многочисленных баз данных и файловых архивов содержат не оперативную, а ретроспективную информацию. Сплошь и рядом на ее долю приходится наибольший объем, тогда как оперативные данные занимают на дисках незначительное пространство.
Ретроспективные (неактивные) данные, хотя и представляют для организации не меньшую ценность, чем оперативные, необходимы лишь время от времени. Между обращениями к ним могут проходить недели и даже месяцы. И для того, чтобы сохранить ретроданные и одновременно высвободить вычислительные мощности, применяют архивирование.
В этом и состоит принципиальное отличие бэкапа от архивирования: в назначении копий данных, которые создаются во время этих операций. И применение резервного копирования не заменяет архивирования.
Но означает ли это, что речь идет о принципиально разных действиях? Отнюдь. И бэкап, и архивирование формируют копии массивов данных организации. Кроме того, оба этих процесса преследуют единую цель: защитить корпоративную информацию, обеспечить ее сохранность и доступность.
Почему для архивирования нужны специальные решения
Решений для резервного копирования очень много. Их популярность резко возросла после активизации хакеров-вымогателей, которые организовали в 2018 году целую серию атак вирусов-шифровальщиков, в ходе которых вымогали у своих жертв огромные деньги. Они во многом способствовали росту популярности резервного копирования как средства защиты данных от подобных нападений.
Средства архивирования корпоративных данных распространены не так широко. Приведем в качестве примера разработку компании Veritas. Она отлично иллюстрирует тезис о том, что бэкап и архивирование — разные задачи и требуют для своего решения разных инструментов.
Компания Veritas — один из ветеранов индустрии высоких технологий. Она основана еще в 1983 году (первоначальное название — Tolerant) а ее акции входили некоторое время в список NASDAQ 100. Десять лет Veritas была составной частью Symantec, а после того, как акционеры гиганта приняли решение разделить бизнес, снова обрела независимость.
Основная специализация Veritas — защита данных. В ее продуктовом портфеле есть специальные (и весьма востребованные рынком) решения, основное из которых — Veritas NetBackup. Его название говорит само за себя: разработка предназначена для резервного копирования данных в гетерогенных средах.
Но, вместе с этим решением Veritas выпускает и другое, предназначенное для архивирования данных — Veritas Enterprise Vault. Зачем компании, сделавшей себе имя популярнейшим продуктом, разрабатывать специализированное решение для похожих задач? Все дело в функциональности, которой должны обладать решения для архивации.
Почтовый ящик как модель хранилища данных
Разницу между резервным копированием и архивированием данных проще всего описать на примере почтового ящика. Большинство пользователей используют для работы только те письма, что получены в последние несколько недель, но крайне неохотно удаляют старую переписку: она служит источником информации, с помощью которой можно «поднять» старые обсуждения, получить справочную информацию, восстановить полученные файлы. Иными словами — почта служит ценным источником ретроспективной информации.
Всем знакома типичная проблема корпоративных почтовых ящиков, — их ограниченный объем. И необходимость «чистить» их становится настоящей головной болью, потому что иногда просто невозможно удалить старые письма, которые занимают в хранилище лишнее место. И единственным решением для их сохранения становится архивация.
То же самое можно сказать и обо всем корпоративном массиве информации. Его хранение требует выделения значительных ресурсов, в то время как емкость систем хранения данных ограничена, и скоростные СХД приходится использовать только для тех данных, которые часто нужны в работе. Освободить в буквальном смысле бесценное пространство скоростных СХД и призвана архивация. С ее помощью формируются долгосрочные копии ретроспективных данных, которые можно поместить в «медленные» хранилища, будь то DAS, выделенный сервер с HDD вместо твердотельных носителей или даже недорогое облако с медленной скоростью работы.
Что должны уметь решения для архивации
Но высвобождение вычислительных мощностей, необходимых для хранения оперативных данных и их резервных копий — отнюдь не единственная задача архивирования. Ведь архив нужно не только хранить, с ним необходимо работать: вести поиск необходимых документов и записей в базах данных, проверять актуальность информации и поддерживать архив в актуальном состоянии, то есть добавлять в него новые данные, перешедшие в разряд архивных и периодически удалять те элементы, срок хранения которых истек. Сделать это при помощи «подручных» средств, конечно же, невозможно.
Отсюда и функциональность решений для архивации.
Прежде всего, они разделяют информационные ресурсы компании на оперативные и ретроспективные. Соотношение между ними задает администратор системы, как правило на оперативные данные приходится 20% — с ними работают сотрудники и информационные сервисы, они же подлежат резервному копированию. Остальные 80% — архивные данные, и для них нужно обеспечить дальнейшее хранение.
Учитывая скорость обновления информации, вести ее мониторинг приходится постоянно. Современные средства архивирования делают это в режиме реального времени, архивируя данные, перешедшие в разряд ретроспективных и перемещая их в архив с одновременным присваиванием необходимых индексов.
Решение для архивирования постоянно мониторит и содержимое самого архива. Это необходимо для того, чтобы индексировать его элементы, выявлять данные, которые можно удалить и избегать дублирования файлов, которые не только занимают лишнее пространство в хранилище, но и затрудняют поиск информации.
Еще одна возможность, которую предоставляют решения для архивации — ведение поиска по содержимому архива. Без него невозможно использование данных.
Первоначальный пример, решение Veritas Enterprise Vault, прекрасно иллюстрирует возможности такого решения. Оно сканирует данные компании, разделяет их на категории (почтовые ящики и файлы) и присваивает всем данным основные категории. При этом могут использоваться как данные, находящиеся в собственном хранилище предприятия, так и дополнительные, — сегодня множество компаний используют как собственные, так и внешние источники. Оперативная часть массива остается на месте (с ней ведется постоянная работа, она же подлежит резервированию), а ретроспективная отправляется в архив.
При этом Enterprise Vault для работы с архивными данными обладает продвинутым поиском, , имеет развитую систему индексирования (ее можно настраивать в зависимости от потребностей и особенностей компании) и даже систему распознавания текста на изображениях, которая облегчает индексирование и работу с документами, хранящимися в формате картинок или PDF.
Почему так важен архив
Прозрачность данных, их достоверность и репрезентативность — важнейшее качество, которым должен обладать архив. Во-первых, этого требуют законодательство и регуляторы. В большинстве стран мира действует специальное законодательство, определяющее требования к хранению информации. В России это — Закон «Об архивном деле в Российской Федерации» 125-ФЗ, который обязывает все организации обеспечить хранение, доступность и актуальность как бумажных документов, так и электронной информации. Эти требования детализируются во множестве инструкций и положений, которые составляются многочисленными регуляторами и местными органами власти.
Кроме того, все большее распространение получает комплаенс. И для того, чтобы соответствовать его нормам, деятельность компании (которая, в свою очередь, отражается в ее архиве) должна быть прозрачной.
Например, не так давно одна из небольших консалтинговых финансовых компаний, работающих в Нью-Йорке, привлекла внимание инвесторов. Владельцы были заинтересованы в том, чтобы продать свой бизнес, но сделка оказалась под угрозой срыва: потенциальных покупателей не устроил низкий уровень прозрачности. Компания не обладала масштабными массивами информации и, казалось бы, ей не требовались специальные решения для того, чтобы выделять и решать отдельную задачу по организации и ведению архива данных. Но, ради достижения своей цели, привлечения авторитетного инвестора, владельцы инвестировали в Veritas Enterprise Vault и буквально за два месяца превратили свой, ранее неструктурированный и непрозрачный, массив данных в полноценный архив, открытый для поиска и анализа, содержащий информацию, репрезентативность которой была подтверждена.
Технологии Veritas для архивирования доступны и российским заказчикам. Партнер Veritas в нашей стране, компания OCS Distribution, проводит семинары и тренинги по продуктам (их участниками ежегодно становятся сотни человек), адресованы они не только техническим специалистам, но и лицам, принимающим бизнес-решения.
Решения Veritas можно и протестировать. Для этого в OCS развернута демонстрационная лаборатория, в которой можно, кроме того, поучаствовать в совместных пилотах «дилер-дистрибьютор-вендор». Получить помощь, связанную с техническими вопросами и приобретением продуктов Veritas, в том числе и Veritas Enterprise Vault, можно у сотрудников многофункциональной команды дистрибьютора. Она доступна всем дилерам OCS в России, независимо от масштаба проектов, которые они реализуют.