Разделы

ПО Софт Безопасность Бизнес

Скажи-ка, дядя, ведь не RAR’ом… Почему архивирование данных не менее важно, чем бэкап

О том, почему данные играют сегодня определяющую роль для любого бизнеса, много рассказывать не приходится. Они стали основным активом для большинства компаний, а потерять накопленную информацию сегодня — все равно что разрушить бизнес до основания. Поэтому так много внимания уделяется защите данных. Однако зачастую в тени остается вопрос о том, как именно и какие данные необходимо защищать. 

Архивирование и резервное копирование

Для обывателей эти два термина часто становятся синонимами. На самом деле они обозначают два разных процесса.

Бэкап, или резервное копирование, — создание страховой копии оперативных файлов, с которыми работают пользователи и корпоративные системы. Кроме того, при бэкапе часто создаются и образы операционных систем и приложений. Так делают потому, что основное назначение резервных копий — быстрое восстановление работоспособности систем в случае происшествий. Поломка оборудования, ошибочные действия пользователей, природные катастрофы — все это может привести к потере данных, которые необходимо не просто сохранить, но и обеспечить к ним постоянный доступ. В последнее время к числу рисков прибавились атаки вирусов-шифровальщиков, которые грозят бизнесу не только утратой данных, но и огромными затратами на «вознаграждение» вымогателей. Не будем забывать и про репутационные потери: кейс компании Garmin хорошо известен всем.

Но бизнес имеет дело не только с оперативными данными, которые необходимы «здесь и сейчас». Значительный объем многочисленных баз данных и файловых архивов содержат не оперативную, а ретроспективную информацию. Сплошь и рядом на ее долю приходится наибольший объем, тогда как оперативные данные занимают на дисках незначительное пространство.

Ретроспективные (неактивные) данные, хотя и представляют для организации не меньшую ценность, чем оперативные, необходимы лишь время от времени. Между обращениями к ним могут проходить недели и даже месяцы. И для того, чтобы сохранить ретроданные и одновременно высвободить вычислительные мощности, применяют архивирование.

В этом и состоит принципиальное отличие бэкапа от архивирования: в назначении копий данных, которые создаются во время этих операций. И применение резервного копирования не заменяет архивирования.

Но означает ли это, что речь идет о принципиально разных действиях? Отнюдь. И бэкап, и архивирование формируют копии массивов данных организации. Кроме того, оба этих процесса преследуют единую цель: защитить корпоративную информацию, обеспечить ее сохранность и доступность.

Почему для архивирования нужны специальные решения

Решений для резервного копирования очень много. Их популярность резко возросла после активизации хакеров-вымогателей, которые организовали в 2018 году целую серию атак вирусов-шифровальщиков, в ходе которых вымогали у своих жертв огромные деньги. Они во многом способствовали росту популярности резервного копирования как средства защиты данных от подобных нападений.

Средства архивирования корпоративных данных распространены не так широко. Приведем в качестве примера разработку компании Veritas. Она отлично иллюстрирует тезис о том, что бэкап и архивирование — разные задачи и требуют для своего решения разных инструментов.

Компания Veritas — один из ветеранов индустрии высоких технологий. Она основана еще в 1983 году (первоначальное название — Tolerant) а ее акции входили некоторое время в список NASDAQ 100. Десять лет Veritas была составной частью Symantec, а после того, как акционеры гиганта приняли решение разделить бизнес, снова обрела независимость.

Основная специализация Veritas — защита данных. В ее продуктовом портфеле есть специальные (и весьма востребованные рынком) решения, основное из которых — Veritas NetBackup. Его название говорит само за себя: разработка предназначена для резервного копирования данных в гетерогенных средах.

Но, вместе с этим решением Veritas выпускает и другое, предназначенное для архивирования данных — Veritas Enterprise Vault. Зачем компании, сделавшей себе имя популярнейшим продуктом, разрабатывать специализированное решение для похожих задач? Все дело в функциональности, которой должны обладать решения для архивации.

Почтовый ящик как модель хранилища данных

Разницу между резервным копированием и архивированием данных проще всего описать на примере почтового ящика. Большинство пользователей используют для работы только те письма, что получены в последние несколько недель, но крайне неохотно удаляют старую переписку: она служит источником информации, с помощью которой можно «поднять» старые обсуждения, получить справочную информацию, восстановить полученные файлы. Иными словами — почта служит ценным источником ретроспективной информации.

Большинство пользователей используют для работы только те письма, что получены в последние несколько недель

Всем знакома типичная проблема корпоративных почтовых ящиков, — их ограниченный объем. И необходимость «чистить» их становится настоящей головной болью, потому что иногда просто невозможно удалить старые письма, которые занимают в хранилище лишнее место. И единственным решением для их сохранения становится архивация.

То же самое можно сказать и обо всем корпоративном массиве информации. Его хранение требует выделения значительных ресурсов, в то время как емкость систем хранения данных ограничена, и скоростные СХД приходится использовать только для тех данных, которые часто нужны в работе. Освободить в буквальном смысле бесценное пространство скоростных СХД и призвана архивация. С ее помощью формируются долгосрочные копии ретроспективных данных, которые можно поместить в «медленные» хранилища, будь то DAS, выделенный сервер с HDD вместо твердотельных носителей или даже недорогое облако с медленной скоростью работы.

Что должны уметь решения для архивации

Но высвобождение вычислительных мощностей, необходимых для хранения оперативных данных и их резервных копий — отнюдь не единственная задача архивирования. Ведь архив нужно не только хранить, с ним необходимо работать: вести поиск необходимых документов и записей в базах данных, проверять актуальность информации и поддерживать архив в актуальном состоянии, то есть добавлять в него новые данные, перешедшие в разряд архивных и периодически удалять те элементы, срок хранения которых истек. Сделать это при помощи «подручных» средств, конечно же, невозможно.

Отсюда и функциональность решений для архивации.

Архив нужно не только хранить, с ним необходимо работать

Прежде всего, они разделяют информационные ресурсы компании на оперативные и ретроспективные. Соотношение между ними задает администратор системы, как правило на оперативные данные приходится 20% — с ними работают сотрудники и информационные сервисы, они же подлежат резервному копированию. Остальные 80% — архивные данные, и для них нужно обеспечить дальнейшее хранение.

Учитывая скорость обновления информации, вести ее мониторинг приходится постоянно. Современные средства архивирования делают это в режиме реального времени, архивируя данные, перешедшие в разряд ретроспективных и перемещая их в архив с одновременным присваиванием необходимых индексов.

Решение для архивирования постоянно мониторит и содержимое самого архива. Это необходимо для того, чтобы индексировать его элементы, выявлять данные, которые можно удалить и избегать дублирования файлов, которые не только занимают лишнее пространство в хранилище, но и затрудняют поиск информации.

Еще одна возможность, которую предоставляют решения для архивации — ведение поиска по содержимому архива. Без него невозможно использование данных.

Еще одна возможность, которую предоставляют решения для архивации — ведение поиска по содержимому архива

Первоначальный пример, решение Veritas Enterprise Vault, прекрасно иллюстрирует возможности такого решения. Оно сканирует данные компании, разделяет их на категории (почтовые ящики и файлы) и присваивает всем данным основные категории. При этом могут использоваться как данные, находящиеся в собственном хранилище предприятия, так и дополнительные, — сегодня множество компаний используют как собственные, так и внешние источники. Оперативная часть массива остается на месте (с ней ведется постоянная работа, она же подлежит резервированию), а ретроспективная отправляется в архив.

При этом Enterprise Vault для работы с архивными данными обладает продвинутым поиском, , имеет развитую систему индексирования (ее можно настраивать в зависимости от потребностей и особенностей компании) и даже систему распознавания текста на изображениях, которая облегчает индексирование и работу с документами, хранящимися в формате картинок или PDF.

Почему так важен архив

Прозрачность данных, их достоверность и репрезентативность — важнейшее качество, которым должен обладать архив. Во-первых, этого требуют законодательство и регуляторы. В большинстве стран мира действует специальное законодательство, определяющее требования к хранению информации. В России это — Закон «Об архивном деле в Российской Федерации» 125-ФЗ, который обязывает все организации обеспечить хранение, доступность и актуальность как бумажных документов, так и электронной информации. Эти требования детализируются во множестве инструкций и положений, которые составляются многочисленными регуляторами и местными органами власти.

Кроме того, все большее распространение получает комплаенс. И для того, чтобы соответствовать его нормам, деятельность компании (которая, в свою очередь, отражается в ее архиве) должна быть прозрачной.

Прозрачность данных, их достоверность и репрезентативность — важнейшее качество, которым должен обладать архив

Например, не так давно одна из небольших консалтинговых финансовых компаний, работающих в Нью-Йорке, привлекла внимание инвесторов. Владельцы были заинтересованы в том, чтобы продать свой бизнес, но сделка оказалась под угрозой срыва: потенциальных покупателей не устроил низкий уровень прозрачности. Компания не обладала масштабными массивами информации и, казалось бы, ей не требовались специальные решения для того, чтобы выделять и решать отдельную задачу по организации и ведению архива данных. Но, ради достижения своей цели, привлечения авторитетного инвестора, владельцы инвестировали в Veritas Enterprise Vault и буквально за два месяца превратили свой, ранее неструктурированный и непрозрачный, массив данных в полноценный архив, открытый для поиска и анализа, содержащий информацию, репрезентативность которой была подтверждена.

Технологии Veritas для архивирования доступны и российским заказчикам. Партнер Veritas в нашей стране, компания OCS Distribution, проводит семинары и тренинги по продуктам (их участниками ежегодно становятся сотни человек), адресованы они не только техническим специалистам, но и лицам, принимающим бизнес-решения.

Решения Veritas можно и протестировать. Для этого в OCS развернута демонстрационная лаборатория, в которой можно, кроме того, поучаствовать в совместных пилотах «дилер-дистрибьютор-вендор». Получить помощь, связанную с техническими вопросами и приобретением продуктов Veritas, в том числе и Veritas Enterprise Vault, можно у сотрудников многофункциональной команды дистрибьютора. Она доступна всем дилерам OCS в России, независимо от масштаба проектов, которые они реализуют.