Резервное копирование, архивирование и репликация

Резервное копирование, архивирование и репликация

 

Сравнение репликации, резервного копирования и архивирования

Основные отличия
Репликация данных Быстрое восстановление производственных данных из реплики. Не защищает от сбоев на программном уровне (повреждённые данные копируются в реплику).
Резервное копирование данных Требуется определённое время на восстановление данных из резервной копии. Защищает от сбоев на аппаратном и программном уровнях.
Архивирование данных Не применяется для восстановления производственных данных.

Непрерывность бизнес-процессов

Единая точка отказа

Единая точка отказа — это компонент системы, выход из строя которого может привести к недоступности всей системы.

Пример

Сбой любого единственного компонента в последовательной цепочке приведёт к недоступности данных для клиента:
Клиент — IP сеть — сетевая карта (NIC) — Сервер — Гипервизор — Виртуальная машина — Хост-адаптер шины (HBA) — SAN-сеть — FC-коммутатор — Порт массива хранения данных — Массив дисков хранения данных — Данные.

Для решения проблемы единой точки отказа системы проектируются с избыточным количеством компонентов.

Ключевые показатели безотказности

  • MTBF - Mean Time Between Failures – среднее время безотказной работы (наработка на отказ).
  • MTTR - Mean Time to Restoration - среднее время восстановления системы после отказа (при наличии всех необходимых ресурсов).

Решения по обеспечению непрерывности бизнес-процессов

  • резервное копирование
  • репликация
    • локальная
    • удалённая.



Резервное копирование

Ключевые параметры для выбора стратегии резервного копирования

  • RPO – Recovery Point Objective – точка отката (определяет отрезок времени от настоящего до момента в прошлом, данными за который можно пожертвовать ради снижения стоимости восстановления данных).
  • RTO — Recovery Time Objective — время восстановления системы после сбоя (время допустимого простоя бизнес-процесса).
  • Объём данных резервного копирования, количество файлов и степень сжатия.
  • Местонахождение хранилища резервных копий.
  • Срок хранения резервных копий.


Значения параметров RPO и RTO зависят от стоимости потери данных и простоя бизнеса.
RPO определяет периодичность создания резервных копий.
RTO влияет на выбор типа носителей.

Методы резервного копирования

  • горячее резервное копирование (без ограничения доступа к данным во время копирования)
  • холодное резервное копирование (на время копирования данные становятся недоступны).


Виды резервного копирования по объёму копируемых данных и скорости копирования / восстановления
Резервное копирование Объём копируемых данных Скорость копирования данных Скорость восстановления данных
Полное (full) Все данные Медленная Быстрая
Накопительное (differential) Данные, которые изменились с момента последнего полного резервного копирования Средняя Средняя
Инкрементное (incremental) Данные, которые изменились с момента последнего инкрементного резервного копирования Быстрая Медленная

Резервное копирование конфигурации сервера

При потере данных из-за отказа сервера перед восстановлением данных необходимо восстановить базовую систему сервера: разбить дисковое пространство на разделы, установить и настроить операционную систему и приложения.

SCB – Server Configuration Backup - резервное копирование конфигурации сервера.
SCB позволяет восстановить данные даже на сервер с другой аппаратной конфигурацией.

Дедупликация данных при резервном копировании

Для экономии трафика резервного копирования и сокращения объёма резервного хранилища выполняется дедупликация данных на уровне файлов или на уровне субфайлов.

При дедупликации на уровне файлов в резервную копию не попадают одинаковые экземпляры одного файла.

Пример

У каждого из 10 сотрудников на ПК есть один и тот же файл с телефонным справочником. После дедупликации в резервной копии сохранится только одна копия этого файла и 9 указателей на этот файл.

При дедупликации на уровне субфайлов в резервную копию не попадают одинаковые данные из разных файлов.

Пример

У каждого из 10 сотрудников на ПК есть файл с одинаковой презентацией, в которой изменён только первый слайд с контактной информацией. После дедупликации в резервной копии сохранится только одна копия общего блока данных со всеми слайдами кроме первого и 10 копий первого слайда с указателями на общий блок данных.

Сравнение методов дедупликации данных
Метод дедупликации данных Преимущества Недостатки
На стороне источника данных уменьшает трафик и окно резервного копирования снижает производительность клиентской машины
На стороне приёмника данных перед сохранением данных увеличивает окно резервного копирования
На стороне приёмника данных после сохранения данных увеличивает пространство хранения (для хранения образов резервных копий до удаления дубликатов данных)

Резервное копирование в виртуализованной среде

Сравнение методов резервного копирования в виртуальной среде
Место установки агента резервного копирования Особенности
На виртуальной машине Агент не копирует конфигурацию ВМ
На гипервизоре Агент копирует данные вместе с конфигурациями ВМ
На прокси-сервере Агент создаёт образы ВМ (без остановки работы ВМ) на прокси-сервере, откуда они потом копируются на устройство резервного копирования



Архивирование данных

В конце своего жизненного цикла информация (фиксированный контент) удаляется или попадает в архив на длительное хранение.

Компоненты среды архивирования данных
Компонент Функция
Сервер архивирования Управляет процессом архивирования в соответствии с политикой архивирования
Агент архивирования на сервере приложений Агент выбирает данные для архивирования и передаёт их на сервер архивирования
Устройство хранения архивных данных Хранит фиксированный контент

Репликация данных

Репликация Локация Применение
локальная в пределах одного дата-центра оперативное восстановление данных (high availability)
удалённая в другом дата-центре восстановление данных после стихийных бедствий и катастроф (disaster recovery)

Локальная репликация

Цели создания локальных реплик

  • быстрое восстановление данных
  • разгрузка производственного устройства от вспомогательных операций обработки данных (анализа данных, генерации отчётов, тестирования новых приложений, резервного копирования, миграции данных на новые хранилища и т. п.).

Согласованность реплик файловой системы и базы данных

Перед записью на диск данные помещаются в кэш-память хоста.
Согласованность реплики файловой системы означает, что и данные кэш-памяти вошли в реплику.

Если база данных реплицируется в подключенном состоянии, то согласованность реплики базы данных означает, что все изменения базы данных вошли в реплику.

Удалённая репликация

Удалённая репликация защищает информационные активы предприятия от региональных рисков, связанных с чрезвычайными ситуациями (катастрофами). Реплика создаётся на географически удалённой производственной площадке.

В зависимости от ширины полосы пропускания сети (удалённости) выбирается режим удалённой репликации: синхронный или асинхронный.

Сравнение режимов удалённой репликации
Режим удалённой репликации Ширина полосы пропускания сети RPO
Синхронный больше максимальной нагрузки при записи нулевой
Асинхронный больше средней нагрузки ненулевой

Трёхсторонняя репликация

При трёхсторонней репликация создаются две удалённых реплики: одна — с синхронным режимом (в ближайшем промежуточном бункере), вторая — с асинхронным режимом (на дальней производственной площадке). В каскадном режиме на транзитных участках может быть несколько промежуточных реплик между источником и приёмником данных.

Технологии локальных и удалённых репликаций

  • репликация на уровне хоста (используются ресурсы хоста)
  • репликация на уровне хранилища данных (используются ресурсы хранилища данных)
  • репликация на уровне сети (используются ресурсы внешнего CDP-устройства – Continuous Data Protection).