Смартсорсинг.ру

Сообщество руководителей ИТ-компаний, ИТ-подразделений и сервисных центров

Статьи в блогах Вопросы и ответы Темы в лентах Пользователи Компании Лента заказов Курс по ITSM

4 ключевых вопроса к плану восстановления после сбоев

4 ключевых вопроса к плану восстановления после сбоев

У каждой компании должен быть план восстановления после сбоев —  это не вызывает сомнения. Сбои в ИТ-системах случаются у всех и ИТ-службы должны быть готовы к ним. Бекап критических данных делают многие. А вот полноценный план восстановления после сбоев есть далеко не у всех.

В вашей команде есть люди персонально ответственные за резервное копирование данных?

Технологические решения для резервного копирования — будут существенно зависеть от размера компании. Кому-то достаточно массива жестких дисков, кто-то будет использовать SAN, в больших компаниях все еще популярны библиотеки на ленточных носителях. Однако, несмотря на наличие автоматизированных систем и возможность запуска  бекапа по расписанию — все равно требуется контроль за состоянием резервных копий со стороны сотрудников ИТ.

Вы планируете производительность систем и пропускную способность сетей?

Создание резервных копий — ресурсоемкое занятие: производительность серверов в такие моменты может критически падать, да и нагрузки на сеть существенно возрастают. Необходимо планировать время резервного копирования так, чтобы оно само по себе не становилось причиной инцидентов.

Насколько быстро вы можете восстановить данные?

Создать резервные копии — это меньшая часть резервного копирования. Задача восстановления данных — намного более сложная. Между тем, бизнес-пользователей мало волнует наличие у вас резервных копий. Им хочется знать, какое время вам потребуется на то, чтобы обеспечить восстановление данных. А также, данные, за какой максимальный промежуток времени вы не сможете восстановить. Теоретически эти параметры должны быть прописаны в SLA, на практике критичность подобных требований для пользователей выясняется после инцидентов, когда платить за дополнительные возможности резервного копирования уже поздно.

А вы в этом уверены?

Теоретически восстановить данные не намного сложнее, чем их сохранить. На практике, иногда оказывается, что не все так гладко. То у SQL-таблиц что-то не так с кодировкой, то права доступа на восстановленные файлы «не те», то еще что-то пошло не так. Иногда оказывается, что решение, которое великолепно создавало бекапы, вовсе не работает в обратном направлении. А вы пробовали восстанавливать данные из своих резервных копий? У Вас есть ясное представление о том, где искать данные для различных систем, и какая последовательность действий нужна для их восстановления. На чем основано ваши показатели для времени восстановления систем? На ощущениях или на опыте.

По мотивам набора вопросов предложенного компанией Sepaton

Дополнительные материалы

Комментарии (1)

  • Аватар

    Яковлев Андрей Михайлович [swtws], 03 марта 2011, 14:00

    0
    Валерий,

    Есть резервное копирование - это если ситема жива, но утрачены данные,
    Есть аварийное восстановление - это если все померло.

    То есть Disaster Recovery Plan (План аварийного восстановления) подразумевает комплекс мер по восстановлению самой системы и как только все оживет, накатывание бэкапа.
    Живой пример из практики Владимира Чижикова:

    http://skif-swarogich.livejournal.com/21298.html