Как описывалось ранее, роль хранимой информации в бизнесе постоянно возрастает: базы данных, корпоративная почта, результаты выполненных исследований/работ и т.д. Безусловно, потеря некоторых данных (например, общая сетевая папка с фотографиями корпоративных мероприятий) может быть не критична, однако практически в каждой более или менее крупной компании всегда есть та информация, без которой дальнейшая работа не возможна. Представьте себе что будет, если за пару дней до окончания закрытия налогового периода будет повреждена база 1с с тысячами клиентских операций… Причина повреждения может быть разной: от физической (выход из строя дисков в массиве RAID, отказ СХД и т.д.) до программной (неконсистентность БД, криптошифровальщики и т.д.).

Понимая возможные риски, системные администраторы ВСЕГДА должны хранить резервные копии чувствительных данных. Главный залог успеха в сохранности информации – правильная организация процесса резервного копирования. В теории его основные вопросы:

  • Организация резервирования с точки зрения «железа» (на чем хранить, как хранить, как доставлять и т.д.)
  • Организация резервирования с точки зрения ПО (как часто делать бекапы, какие бэкапы, доступное окно бэкапа и т.д.)
  • Регулярные проверки работоспособности копий и планов восстановления.

В данной заметке мы затронем только первый пункт, касающийся методов хранения. Острота данного вопроса заключается в том, что всегда существует конфликт между требованиями к RPO/RTO и готовностью к затратам на ту область, которая с первого взгляда не приносит прибыль. Несложно согласиться с тем, что все хотят работать исключительно с надежным и неломающимся оборудованием. Организуя резервные копии, мы подстраховываемся от возможных проблем, связанных с потерей данных. Данные траты, в теории, могут никогда и не оправдаться.

Когда заходит речь о резервном копировании, то речь всегда идет о таких понятиях как RPO/RTO. RPO (Recovery Point Objective) определяет за какой промежуток времени можно потерять данные, а RTO (Recovery Time Objective) – как быстро необходимо восстановить работоспособность того или иного сервиса. Например, банковские системы обладают очень маленькими промежутками RPO/RTO, в то время как у небольшого провинциального интернет-магазина требования существенно мягче. Чем меньше промежутки RPO/RTO, тем более дорогими становятся решения.

Как отмечалось ранее, резервные копии с точки зрения экономики, не приносят прибыли. Поэтому при планировании стратегии резервного копирования всегда необходимо взвешенно подходить к выбору RPO/RTO, а иначе возможны ситуации, когда для хранения копий приходится использовать ALLFLASH-массивы.

Понимая, что резервные копии являются обязательным условием любого более или менее серьезного IT, производители оборудования и администраторы обычно рассматривают несколько подходов в вопросе того, где и как хранить резервные копии:

  1. Локальное хранение на самом сервере/выделенном сервере.
  2. Хранение резервных копий на общей дисковой СХД.
  3. Хранение резервных копий на выделенной дисковой СХД или программно-определяемой СХД (SDS).
  4. Хранение резервных копий на специализированной дисковой СХД.
  5. Хранение резервных копий на ленточных библиотеках.

Варианты 1-3 интуитивно понятны. Практически сразу можно понять все плюсы и минусы таких решений. Вариант 5 – очень специфичен и напрямую редко применим (см статью ссылка). Наибольший интерес представляет вариант №4, когда для хранения используются специально спроектированные решения, в основе которых мощный комплекс программного и аппаратного обеспечения.

Главное отличие от обычных недорогих выделенных СХД – ориентация на хранение резервных копий. Для этого приоритетными являются идеи компрессии и дедупликации: благодаря этим механизмам повышается эффективность хранения. Для нужд соответствия RPO/RTO появляется возможность использовать, например, SSD-диски. Обычное хранение резервных копий на SSD – очень дорогая задача, однако, использование эффективных методов оптимизации хранения данных позволяют существенно уменьшить требования к объему дисков и, следовательно, к стоимости.

Современные алгоритмы дедупликации при определенных типах данных способны показывать эффективность на уровне 20:1, 30:1 или даже больше. На практике это означает, что для хранения 20ТБ резервных копий может понадобиться только 1ТБ дискового пространства.

С аппаратной точки зрения большинство решений очень похожи и строятся на базе обычных стоечных серверов архитектуры х86, на которые установлено специальное ПО, которое и является их главной изюминкой.

В зависимости от используемого управляющего ПО, условий работы и аппаратных характеристик (установленные процессоры, объем оперативной памяти, тип и кол-во используемых дисков и т.д.) появляется возможность экономно хранить резервные копии в полном соответствии с требуемыми уровнями RPO/RTO.

© 2012-2019 Технологическое партнерство.

Click Me