Бесперебойная работа системы по резервному копированию. Бесперебойная работа оборудования

Для разработки плана существует три основных способа:

Собственными силами.

С помощью коммерческого программного обеспечения, предназначенного для составления планов обеспечения бесперебойной деятельности (демонстрационные версии таких программ можно посмотреть или скачать с веб-сайта независимого американского журнала по вопросам восстановления после бедствия Disaster Recovery Journal.

Привлечение внешнего консультанта для оказания помощи или непосредственной разработки плана.

Способы отличаются по стоимости, но во всех случаях требуется выделение персонала для проведения исследований и реализации плана.

Разработка собственными силами требует наличия квалификации в области составления плана обеспечения бесперебойной деятельности. Эту квалификацию можно приобрести только путем всестороннего обучения и накопления опыта. Большинство организаций не имеют этой возможности.

Разработку плана обеспечения бесперебойной деятельности предприятия необходимо организовать в виде проекта, чтобы управлять задачами, сроками и конечными результатами. Основными этапами типичного проекта являются:

Организация выполнения проекта;

Оценка риска, уменьшение нежелательных последствий от наступления событий, связанных с риском, анализ последствий для бизнеса;

Разработка стратегии восстановления деятельности;

Документирование плана;

Обучение;

Имитация бедствия.

Организация выполнения проекта

Организация выполнения проекта включает в себя административное управление проектом, определение допущений, проведение совещаний и разработку политики .

Оценка риска. При оценке риска выявляются типы бедствий, которые могут произойти в каждом конкретном месте. Обследуется физическая инфраструктура здания и его окружения. Для каждого типа бедствия делается оценка возможной продолжительности и присваивается относительная величина, соответствующая вероятности их появления. Используется шкала, например, от 0 до 3; где 0 означает невероятное событие, а 3 -- весьма вероятное. В результате этого выявляются области, в которых следует провести дальнейшие исследования, чтобы уменьшить последствия событий, приводящих к риску.

Анализ последствий для деятельности организации. После оценки риска проводится анализ последствий бедствия для деятельности организации, в ходе которого определяются потери из-за невозможности продолжать нормальную деятельность. Они могут быть очевидными или носить более абстрактный характер, при котором руководству придется сделать предположительную оценку потерь. В любом случае цель заключается не в том, чтобы получить точный ответ, а в том, чтобы выявить факторы, которые являются критически важными для продолжения деятельности компании. На этом этапе определяется масштаб плана обеспечения бесперебойной деятельности. Чрезмерные меры предосторожности потребуют лишних средств, а недостаточные -- не обеспечат должной безопасности.

Разработка стратегии обеспечения бесперебойной деятельности. После определения требований можно принимать решение о том, как обеспечивать восстановление деятельности. Существует множество вариантов технических решений, в том числе:

Использование "горячего" резервного помещения. Поставщик предоставляет компании подготовленное рабочее помещение с оборудованием, средствами телекоммуникации, персоналом, осуществляющим техническую поддержку, и т.д., обычно по годовому контракту. Заказчики получают доступ к оборудованию по принципу "первый пришел -- первым обслуживается".

Использование "холодного" резервного помещения. Компания организует работу в пустующем или арендуемом помещении, которое подготовлено к использованию. Сразу после бедствия в помещении развертывается оборудование (возможно, закупаемое у поставщиков), программное обеспечение и службы обеспечения.

Использование внутренних резервов. Для предоставления услуг в чрезвычайных обстоятельствах используется оборудование компании, которое расположено в ином месте.

Заключение соглашения о взаимной поддержке. Заключается соглашение с другой компанией о коллективном использовании ресурсов после бедствия. При этом предполагается, что резервное оборудование всегда имеет нужную производительность и вас устраивает степень защиты информации при коллективной работе.

В некоторых случаях можно использовать комбинацию этих вариантов. Крупные многонациональные компании чаще всего используют для локальных вычислительных сетей метод внутреннего резервирования. Поскольку количество имеющихся резервных помещений ограничено, может оказаться, что в случае чрезвычайных обстоятельств не окажется рабочего помещения, которое можно было бы использовать. Бедствие в масштабе региона может привести к тому, что все резервные помещения будут заняты и компании негде будет возобновить работу.

Хорошо подготовленный план обеспечивает компанию пошаговыми инструкциями, соответствующими типу и тяжести бедствия. В нем указываются функциональные группы специалистов компании, подготовленные для реализации плана. Наличие хорошо проработанного плана гарантирует, что в стрессовой ситуации после возникновения чрезвычайных обстоятельств, критически важные факторы не будут упущены.

Документация. План может документироваться различными способами. Большинство компаний все еще применяют традиционные текстовые редакторы, другие используют коммерческое программное обеспечение. Какой бы метод ни был использован, важно обеспечить строгое выполнение процедур управления внесением изменений, чтобы поддерживать план в состоянии, соответствующем реальной текущей ситуации.

Обучение. Обучение "Группы восстановления" направлено на то, чтобы каждый сотрудник знал свои функции и обязанности в случае возникновения нештатных ситуаций.

Имитация бедствия. Большинство компаний проводят испытания плана минимум один раз в полгода. Имитируя бедствия можно проверить план, найти его слабые места и отработать взаимодействие участников. Обнаружение недостатков обычно влечет за собой корректировку плана. План должен регулярно проходить испытания и корректироваться. Лишь немногие планы обеспечения бесперебойной деятельности выполняются так, как это предусматривалось первоначально. Поскольку внесение поправок в план необходимо делать регулярно, должна быть максимально упрощена процедура корректировки плана .

При разработке плана обеспечения бесперебойной деятельности необходимо предусмотреть следующее:

Если в настоящий момент план отсутствует, необходимо уведомить высшее руководство о потенциальных опасностях, которые связаны с отсутствием подготовленного и испытанного плана;

При наличии плана надо обеспечить его регулярное испытание -- провести циклическую замену специалистов, участвующих в испытаниях. Желательно, чтобы в этом процессе приняло участие максимальное количество сотрудников;

Надо добиться того, чтобы руководство сделало планирование обеспечения бесперебойной деятельности одной из своих целей;

При выборе альтернативных рабочих помещений необходимо позаботиться, чтобы ими можно было воспользоваться при первой необходимости;

Не принимайте существующие системы и процедуры резервирования на веру: проведите полную экспертизу резервирования и внесите необходимые изменения. Проведите испытания процедур восстановления;

При определении приоритетов приложений опросите руководителей, чтобы они изложили свою точку зрения;

Учтите в плане все мелочи, которые могли бы помешать процессу восстановления деятельности;

После составления плана разработайте механизм, обеспечивающий его регулярное обновление.

Также план должен содержать процедуры выполнения следующих функций:

Ввод в действие процедур для чрезвычайных ситуаций.

Уведомление сотрудников, поставщиков и заказчиков.

Формирование группы (групп) восстановления.

Оценка последствий бедствия.

Принятие решения о реализации плана восстановления деятельности.

Ввод в действие процедур восстановления деятельности.

Переезд в альтернативное рабочее помещение (помещения).

Восстановление функционирования критически важных приложений.

Восстановление основного рабочего помещения.

Кроме того, план должен содержать документы, которые могут быть использованы персоналом, не знакомым с конкретно восстанавливаемыми функциями. Эти документы должны включать следующие данные:

Схемы коммутации телефонов;

Процедуры для аварийного отключения питания;

Организационная структура Центра восстановления;

Требования к оборудованию и снабжению Центра восстановления;

Конфигурация Центра восстановления;

Список критически важных приложений;

Список восстанавливаемого оборудования;

Сводные данные по оценке рисков.

Проводе комплексный анализ представим описание плана по обеспечению непрерывной деятельности в организации. План включает следующие основные разделы:

а) Основные положения плана.

б) Оценка чрезвычайных ситуаций:

Выявление уязвимых мест компании;

Классификация возможных опасных событий и оценка вероятности их возникновения;

Сценарии чрезвычайных ситуаций;

Потенциальные источники отрицательных последствий каждой чрезвычайной ситуации и оценка величины ущерба;

Набор критериев, на основании которых объявляется чрезвычайная ситуация.

в) Деятельность компании в чрезвычайной ситуации:

Первоначальное реагирование на чрезвычайную ситуацию (оценка опасного события, объявление чрезвычайной ситуации, оповещение необходимого круга лиц, ввод в действие чрезвычайного плана);

Мероприятия, обеспечивающие бесперебойность деятельности компании в чрезвычайной ситуации и восстановление ее нормального функционирования.

г) Поддержание готовности к возникновению чрезвычайной ситуации:

Контроль правильности и корректировка содержания плана;

Составление списка адресов и процедуры рассылки плана;

Разработка программы повышения квалификации и ознакомления персонала с действиями, необходимыми для восстановления деятельности компании после бедствия;

Подготовка к опасным событиям, обеспечение безопасности и предотвращение бедствий;

Регулярное проведение частичных и комплексных проверок (типа пожарных учений) готовности компании к действиям в чрезвычайной ситуации и способности восстановить нормальную деятельность;

Регулярное создание резервных копий данных, документации, бланков входных и выходных документов и основного программного обеспечения, их хранение в безопасном месте.

д) Информационное обеспечение:

Приоритетные функции, выполняемые компанией;

Списки внутренних и внешних ресурсов -- технических средств, программного обеспечения, средств связи, документов, офисного оборудования и персонала;

Учетная информация о техническом, программном и другом обеспечении, необходимом для восстановления деятельности организации в случае чрезвычайной ситуации;

Список лиц, которых необходимо оповестить о чрезвычайной ситуации с указанием адресов и телефонов;

Вспомогательная информация -- планы и схемы, маршруты перевозок, адреса и т.п.;

Описание детальных пошаговых процедур, обеспечивающих четкое выполнение всех предусмотренных мер;

Функции и обязанности сотрудников в случае возникновения непредвиденных обстоятельств;

Сроки восстановления деятельности в зависимости от типа возникшей чрезвычайной ситуации;

Смета расходов, источники финансирования.

е) Техническое обеспечение:

Создание и поддержание базы технических средств, обеспечивающей бесперебойную деятельность компании в чрезвычайной ситуации;

Создание и поддержание в надлежащем состоянии резервного производственного помещения.

ж) Организационное обеспечение, состав и функции следующих групп, обеспечивающих бесперебойную деятельность в случае бедствия:

Группы оценки чрезвычайной ситуации;

Группы управления в кризисной ситуации;

Группы для работ в чрезвычайной ситуации;

Группы восстановления;

Группы обеспечения работы в резервном производственном помещении;

Группы административной поддержки.

Таким образом план обеспечения непрерывной деятельности организации представляет собой детальный перечень мероприятий, которые должны быть выполнены до, во время и после бедствия. Этот план документируется и испытывается, чтобы удостовериться в его работоспособности в изменяющихся условиях.

План служит руководством к действию во время кризиса и гарантирует, что ни один важный аспект не будет упущен. Профессионально составленный план направляет действия даже неопытных сотрудников.

Наличие детального, регулярно испытываемого плана поможет оградить любую организацию от судебных исков по поводу халатности. Само существование плана служит доказательством того, что руководство компании не пренебрегло подготовкой к возможным бедствиям.

Основные выгоды от составления детального плана обеспечения бесперебойной деятельности состоят в следующем:

Минимизация потенциальных финансовых потерь;

Уменьшение юридической ответственности;

Сокращение времени нарушения нормальной работы;

Обеспечение стабильности деятельности организации;

Организованное восстановление деятельности;

Сведение к минимуму суммы страховых взносов;

Уменьшение нагрузки на ведущих сотрудников;

Лучшая сохранность имущества;

Обеспечение безопасности персонала и заказчиков;

Соблюдение требований законов и инструкций.

Для любой компании крайне важна бесперебойная работа ее IT-инфраструктуры, особенно серверов и установленного на них программного обеспечения. Прекращение доступа к Интернет, электронной почте, базам данных и другим приложениям неминуемо приведет к серьезным сбоям в бизнес-процессах компании.

Для обеспечения стабильной работы приложений серверное оборудование должно отвечать высоким требованиям по надежности. Одним из основных методов повышения надежности сервера является резервирование его подсистем путем дублирования компонентов: процессора, оперативной памяти, сетевых подключений, дисковых и твердотельных накопителей, устройств охлаждения, блоков питания. Отказ дублированного компонента не приводит к отказу сервера в целом, но может снизить его производительность. Устранение неисправности обычно выполняется без остановки работы сервера путем "горячей" замены отказавшего компонента.

Однако полное резервирование в рамках традиционной серверной архитектуры невозможно. Такие компоненты сервера как системная плата и контроллер дисков обычно не дублируются. Поэтому их выход из строя будет означать отказ сервера в целом и, как следствие, аварийную остановку всех приложений. Какова вероятность такой ситуации?

Надежность сервера определяется параметром MTBF — средним временем наработки на отказ. MTBF сервера можно вычислить теоретически — на основании известных значений MTBF серверных компонентов. С помощью данного метода мы рассчитали MTBF типового сервера и получили значение, равное 10 годам (детали расчета). Для такого сервера вероятность выхода из строя в течение одного года будет равна 10%.

Согласно статистике нашего сервисного центра серверы Team имеют среднее время наработки на отказ 25 лет, коэффициент готовности 99,99% и вероятность выхода из строя в течение одного года около 4%. При этом в отличие от "теоретического" расчета наша статистика учитывает любые отказы, в том числе и отказы дублированных компонентов, которые не приводят к отказу сервера в целом.

Очевидно, что столь высокие показатели надежности вполне достаточны для обеспечения устойчивой работы серверных приложений и соответствуют потребностям большинства компаний малого и среднего бизнеса.

Однако для некоторых компаний внеплановая остановка бизнес-приложений (пусть даже очень маловероятная) неприемлема. Например, одним из клиентов нашей компании является предприятие непрерывного цикла с численностью работников 150 человек. Производственный процесс на предприятии управляется при помощи специализированного серверного приложения. Остановка этой программы означает остановку производства. Восстановление работоспособности приложения после аппаратного или программного сбоя может занять несколько часов и на протяжении этого времени производство будет простаивать. Поэтому требуется обеспечить гарантированную непрерывность работы этого приложения как необходимое условие непрерывности всего бизнес-процесса.

Переход на виртуальную платформу VMware позволяет решить эту задачу.

Предлагаемое решение основано на использовании кластера двух (или более) серверов с общей системой хранения. В таком кластере все компоненты (в том числе компоненты системы хранения) продублированы. Восстановление работы приложений в случае отказа одного из серверов обеспечивается средствами виртуализации.

В штатном режиме на каждом сервере работает свой набор приложений, каждое приложение — в отдельной виртуальной машине. Все приложения изолированы друг от друга и не влияют на работу других приложений. Виртуальные машины и данные, с которыми они работают, хранятся на общем дисковом массиве, доступ к которому имеют оба сервера. Распределение виртуальных машин по серверам изначально задается администратором. Им же для каждой виртуальной машины выделяется часть аппаратных ресурсов сервера, при этом коэффициент загрузки каждого сервера может достигать 70-80%.

Непрерывность работы приложений обеспечивается средствами виртуальной платформы, которые осуществляют постоянный мониторинг виртуальных машин. В случае остановки виртуальной машины из-за отказа сервера она автоматически перезапустится на другом сервере. После устранения причины отказа и включения сервера виртуальные машины автоматически вернутся на "свой" сервер без прерывания работы.

Данное решение позволяет выполнять плановые работы по техническому обслуживанию серверов без остановки приложений. Перед выключением сервера его приложения "переезжают" на другой сервер, а после завершения работ возвращаются обратно.

Важным достоинством данного решения является его универсальность, поскольку оно подходит для любых приложений и не накладывает практически никаких ограничений на тип гостевых операционных систем виртуальных машин. Этим оно выгодно отличается от службы кластеров Microsoft Windows Server. Другими преимуществами решения являются более эффективное использование аппаратных ресурсов серверов, а также простота внедрения и администрирования.

Состав решения

Решение по обеспечению непрерывной работы серверных приложений на виртуальной платформе VMware включает следующие компоненты:

  1. Два (или более) сервера Team . Все серверы Team совместимы с платформой VMware.
  2. Дисковый RAID-массив с полным резервированием подсистем.
  3. VMware Essentials Plus Kit в качестве платформы виртуализации.
  4. Лицензии на операционные системы в соответствии с количеством виртуальных машин.
  5. Необходимые пользователю серверные приложения.

В рамках внедрения данного решения наша компания готова выполнить следующие работы:

  1. Подбор конфигурации серверов с требуемым уровнем производительности.
  2. Подбор системы хранения.
  3. Поставку серверов, системы хранения и другого необходимого оборудования.
  4. Поставку программного обеспечения.
  5. Монтаж и подключение оборудования.
  6. Установку и настройку платформы виртуализации.
  7. Установку и настройку виртуальных машин, операционных систем и приложений.
  8. Тестирование системы и ввод в эксплуатацию.
  9. Сопровождение в рамках гарантийного обслуживания и, по желанию, по договору аутсорсинга.

В составе решения мы бесплатно предоставим восемь часов работы сертифицированного специалиста VMware и Microsoft для консультаций, обучения и работ по внедрению решения.

На сегодняшний день обеспечением резервного копирования занимаются сервера, будь то большое или малое предприятие. Поэтому говорить о бесперебойной работе нужно непосредственно сервера. Что требуется для бесперебойной работы сервера

Чтобы сервер работал бесперебойно нужно не только иметь мощную аппаратуру, но и дополнительное оборудование, квалифицированный персонал. Они и должны обеспечивать оптимальные условия для работы сервера.

1. К дополнительному оборудованию можно отнести:

кондиционирование серверных, то есть, систему охлаждения, вентиляции и т.д., которые не допускают перегрева оборудования;

различные датчики, предназначенные для контроля температурного режима в системе;

автоматические генераторы, которые включаются при отключении электропитания;

независимые магистрали, предназначенные для обеспечения оборудования питанием;

сторожевой таймер, который предупреждает о зависании сервера.

2. Квалифицированные специалисты осуществляют резервирование, замену, подключение основных элементов без отключения оборудования. Также бесперебойную работу обеспечивает наличие объемной памяти.

Как обеспечивается кондиционирование серверов

Сервер со вспомогательным оборудованием устанавливают в отдельном помещении, где должна обеспечиваться хорошая циркуляция воздуха. В помещении должны быть установлены кондиционеры, способные поддерживать оптимальную температуру и влажность. Также отдельно устанавливают систему вентиляции и охлаждения на серверные шкафы. Желательно, чтобы они могли определять, какой участок нуждается в большем охлаждении.



Как видно, для обеспечения бесперебойной и надежной работы сервера нужно приложить немало усилий и средств

Восстановление информации

В данном разделе будут детально расписаны процедуры восстановления информации:

Восстановление структуры файловой системы

В случае форматирования логического диска или раздела, структура и атрибуты данных не нарушаются, но изменяется либо инвентаризируется (приводится в начальное состояние) информация о расположении данных на данном накопителе.

При быстром форматировании обновляется малая часть файловой таблицы, часть служебных записей остается, необходимо лишь интерпретировать ее и прочитать данные в нужном порядке.

Полное форматирование может обновить всю файловую таблицу, поэтому восстановление структуры файлов и папок не всегда возможно. Для восстановления данных без информации о структуре можно использовать восстановление файлов по сигнатурам.

Если произошло повреждение файловой системы в результате программного сбоя или неисправности носителя, программы для восстановления данных могут восстановить часть информации, зависящую от объема повреждений.

Восстановление удаленных данных файловой системы

При удалении данных, на самом деле, данные физически остаются на накопителе, однако в файловой системе более не отображаются, а место на носителе, где они располагаются, помечается как свободное и готовое к записи новой информации. В данном случае атрибуты файлов изменяются. В случае записи в данный раздел или логический диск может произойти частичное или полное замещение данных, помеченных, как удаленные.

Подобные файлы можно легко прочитать и восстановить со всеми атрибутами и информацией о расположении, прочитав служебные записи файловой системы. Существуют как программы только для восстановления удаленных данных, так и комплексные решения, где восстановление удаленных данных - лишь одна из функций.

Восстановление по сигнатурам

В случае, когда реконструкция файловой системы невозможна в силу каких-либо причин, некоторые файлы все еще можно восстановить, используя восстановление по сигнатурам. При данном типе восстановления происходит посекторное сканирование накопителя на предмет наличия известных сигнатур файлов

Основной принцип работы алгоритмов сигнатурного поиска такой же, как у самых первых антивирусов. Как антивирус сканирует файл в поисках участков данных, совпадающих с известными фрагментами кода вирусов, так и алгоритмы сигнатурного поиска, использующиеся в программах для восстановления данных, считывают информацию с поверхности диска в надежде встретить знакомые участки данных. Заголовки многих типов файлов содержат характерные последовательности символов. К примеру, файлы в формате JPEG содержат последовательность символов “JFIF”, архивы ZIP начинаются с символов “PK”, а документы PDF начинаются с символов “%PDF-“.

Некоторые файлы (к примеру, текстовые и HTML файлы) не обладают характерными сигнатурами, но могут быть определены по косвенным признакам, т.к. содержат только символы из таблицы ASCII.

По результатам сканирования выдается, чаще всего, список файлов, отсортированных по типу. Информация о расположении файлов не восстанавливается.

Данный тип восстановления хорошо применять для восстановления фотографий с карт памяти, так как данные на карте однотипные и записываются, в общем случае, строго последовательно, без фрагментации.

Смешанное восстановление

Большинство программ позволяют применить одновременно несколько способов восстановления за одно сканирование. В результате выдается максимально возможный результат при использовании данной программы.

Восстановление из резервных копий

Самый надежный, простой и дешевый способ восстановления информации - восстановление информации из ранее сделанных резервных копий. Для создания резервных копий используется специализированное ПО, которое в том числе может выполнять восстановление данных.

Рассмотрим основные типы носителей и их неисправности.

Накопитель на гибком магнитном диске (НГМД)

Основной неисправностью является так называемое «размагничивание».

Встречается чаще всего при прохождении магнитных детекторов в магазинах, метро, аэропортах. Восстановить данные удаётся только с не размагниченных областей накопителя. Так же встречаются неисправности, связанные с физическим повреждением носителя, такими как царапины, сильное загрязнение. Каждый случай необходимо рассматривать индивидуально и только после этого прогнозировать результат восстановления информации.

Программно-аппаратный способ

Как говорилось выше, в этом способе следует уделить большое внимание именно типу накопителя информации. Варианты и способы восстановления начнем с яркого примера носителя информации.

Накопители CD/DVD/BR

Оптические накопители могут иметь разные причины невозможности чтения данных:

Механические

повреждение прозрачного слоя

повреждение отражающего слоя

Химические

разложение прозрачного слоя

разложение регистрируемого слоя (у записываемых дисков)

коррозия отражающего слоя

Нарушение организации данных

вследствие аппаратно-программных ошибок при записи данных

вследствие неправильных данных

Самыми частыми причинами нечитаемости дисков являются повреждение отражающего и прозрачного слоя, а также разложение регистрируемого слоя у записываемых дисков. В случае образования царапин на поверхности диска, возможно применить полирование рабочей поверхности, что приведёт к удалению нежелательных повреждений и улучшит чтение данных, однако при образовании трещин, использовать данный метод опасно, так как при последующем чтении диск может разрушиться в дисководе под действием центробежной силы. Повреждение фольгированного покрытия диска (старение металла, царапины) больше всего осложняет восстановление данных.

К данному типу накопителей можно отнести USB Flash, SSD-диски, карты памяти SD, miniSD, microSD, xD, MS, M2, Compact Flash.

Самые распространенные технические неисправности]

Логические неисправности

Возникают данные неисправности в самых различных случаях. Одна из самых распространенных причин - неправильное извлечение устройства из компьютера.

В случае логических неисправностей восстановить данные возможно с помощью программ для восстановления данных.

Механические повреждения

Диск прекратил корректную работу в результате какого-либо физического воздействия (падения, попадания влаги, изгиба, сжатия и т. д.). Причина неисправности, чаще всего, в поломке платы или разрушении контактов и компонентов.

Восстановить данные можно, если исправить поломку: заменить неисправный компонент или восстановить нарушенный контакт. Также можно считать данные напрямую с чипа памяти, используя специальное оборудование.

Восстановление данных производится как и в предыдущем случае: заменой компонентов либо чтением с чипов памяти напрямую.

Планирование восстановление работоспособности сети при аварийной ситуации

Один из наиболее полных и логичных образцов подобного документа был разработан Национальным институтом стандартов США (NIST) в 2001 году.

План восстановления функционирования системы устанавливает перечень и последовательность процедур, необходимых для восстановления нормального функционирования системы после наступлении чрезвычайных обстоятельств, повлекших отказ в доступности ресурсов системы. В результате выхода из строя отдельных элементов системы, физического разрушения помещений, пожара, наводнения, террористических атак и др.

Основная цель реализации Плана заключается в обеспечении быстрого и полного восстановления устойчивого функционирования информационной системы.

Поставленная цель достигается решением следующих задач:

определение порядка действий, процедур и ресурсов, необходимых для восстановления функционирования системы или обеспечения ее устойчивого функционирования в резервном варианте размещения технических средств и персонала;

определение штатного состава и основных обязанностей персонала оперативного штаба и аварийных групп из числа сотрудников банка по реализации мероприятий Плана восстановления, а также порядка организации эффективного взаимодействия между аварийными группами и управления ими в течение всего времени активности Плана восстановления;

определение порядка взаимодействия и координации действий оперативного штаба по реализации Плана с другими организациями и структурами (пожарные, медперсонал, милиция, спасатели и др.), которые, возможно, будут привлекаться к ликвидации последствий чрезвычайных событий, вызвавших нарушение нормального функционирования системы.

К примеру, специалисты NIST все мероприятия по выполнению Плана распределяют по трем этапам:

этап уведомления/активации Плана. Основные задачи, решаемые на данном этапе, – своевременная идентификация наступления чрезвычайных условий, обнаружение нанесенных системе повреждений, оценка ущерба, прогноз возможности восстановления функционирования системы и принятие решения о необходимости активации Плана восстановления системы;

этап восстановления. Основные задачи – восстановление функционирования системы по временной схеме (с использованием резервных средств и помещений), проведение комплекса работ по полному восстановлению работоспособности системы в объеме обычных условий;

этап воссоздания системы/деактивации Плана. Основные задачи – полное восстановление нормальной работы системы и деактивация Плана восстановления, возврат к нормальному функционированию.

Согласно исследованию компании McKinseyQuarterly, за последний год в США значительно возросло число компьютерных атак на корпоративные IT-системы. В исследовании McKinseyQuarterly сообщается, что число компьютерных атак (действия хакеров, вирусов, червей, недобросовестных работников и др.) возросло на 150% по сравнению с 2000 годом, составив в общей сложности 53000 случаев взлома систем информационной безопасности компаний.

Такой рост произошел в первую очередь из-за отношения к IT-безопасности как к области сугубо технологической. Это означает, что многими организационными и стратегическими решениями в компаниях попросту пренебрегали.

Реализуемость Плана основана на двух предположениях:

нормальное функционирование системы нарушено в результате наступления некоторого чрезвычайного события или цепи подобных событий. В результате система не способна реализовывать свои функции в объеме, требуемом для качественного обслуживания абонентов;

существует подготовленное помещение, которое выполняет функции резервного центра размещения технических средств системы. Персонал системы формирует необходимую информационно-вычислительную среду на основе технических средств резервного центра для восстановления функционирования системы по резервному варианту размещения в период действия Плана восстановления. Кроме того, резервный вариант размещения используется в течение всего времени, необходимого для восстановления функционирования системы по прежнему (либо новому) месту размещения.

Разработка плана по обеспечению непрерывности и восстановлению деятельности предприятия

3.2 План обеспечения бесперебойной деятельности организации в случае нештатных ситуаций

Для разработки плана существует три основных способа:

Собственными силами.

С помощью коммерческого программного обеспечения, предназначенного для составления планов обеспечения бесперебойной деятельности (демонстрационные версии таких программ можно посмотреть или скачать с веб-сайта независимого американского журнала по вопросам восстановления после бедствия Disaster Recovery Journal.

Привлечение внешнего консультанта для оказания помощи или непосредственной разработки плана.

Способы отличаются по стоимости, но во всех случаях требуется выделение персонала для проведения исследований и реализации плана.

Разработка собственными силами требует наличия квалификации в области составления плана обеспечения бесперебойной деятельности. Эту квалификацию можно приобрести только путем всестороннего обучения и накопления опыта. Большинство организаций не имеют этой возможности.

Разработку плана обеспечения бесперебойной деятельности предприятия необходимо организовать в виде проекта, чтобы управлять задачами, сроками и конечными результатами. Основными этапами типичного проекта являются:

Организация выполнения проекта;

Оценка риска, уменьшение нежелательных последствий от наступления событий, связанных с риском, анализ последствий для бизнеса;

Разработка стратегии восстановления деятельности;

Документирование плана;

Обучение;

Имитация бедствия.

Организация выполнения проекта

Организация выполнения проекта включает в себя административное управление проектом, определение допущений, проведение совещаний и разработку политики .

Оценка риска. При оценке риска выявляются типы бедствий, которые могут произойти в каждом конкретном месте. Обследуется физическая инфраструктура здания и его окружения. Для каждого типа бедствия делается оценка возможной продолжительности и присваивается относительная величина, соответствующая вероятности их появления. Используется шкала, например, от 0 до 3; где 0 означает невероятное событие, а 3 -- весьма вероятное. В результате этого выявляются области, в которых следует провести дальнейшие исследования, чтобы уменьшить последствия событий, приводящих к риску.

Анализ последствий для деятельности организации. После оценки риска проводится анализ последствий бедствия для деятельности организации, в ходе которого определяются потери из-за невозможности продолжать нормальную деятельность. Они могут быть очевидными или носить более абстрактный характер, при котором руководству придется сделать предположительную оценку потерь. В любом случае цель заключается не в том, чтобы получить точный ответ, а в том, чтобы выявить факторы, которые являются критически важными для продолжения деятельности компании. На этом этапе определяется масштаб плана обеспечения бесперебойной деятельности. Чрезмерные меры предосторожности потребуют лишних средств, а недостаточные -- не обеспечат должной безопасности.

Разработка стратегии обеспечения бесперебойной деятельности. После определения требований можно принимать решение о том, как обеспечивать восстановление деятельности. Существует множество вариантов технических решений, в том числе:

Использование "горячего" резервного помещения. Поставщик предоставляет компании подготовленное рабочее помещение с оборудованием, средствами телекоммуникации, персоналом, осуществляющим техническую поддержку, и т.д., обычно по годовому контракту. Заказчики получают доступ к оборудованию по принципу "первый пришел -- первым обслуживается".

Использование "холодного" резервного помещения. Компания организует работу в пустующем или арендуемом помещении, которое подготовлено к использованию. Сразу после бедствия в помещении развертывается оборудование (возможно, закупаемое у поставщиков), программное обеспечение и службы обеспечения.

Использование внутренних резервов. Для предоставления услуг в чрезвычайных обстоятельствах используется оборудование компании, которое расположено в ином месте.

Заключение соглашения о взаимной поддержке. Заключается соглашение с другой компанией о коллективном использовании ресурсов после бедствия. При этом предполагается, что резервное оборудование всегда имеет нужную производительность и вас устраивает степень защиты информации при коллективной работе.

В некоторых случаях можно использовать комбинацию этих вариантов. Крупные многонациональные компании чаще всего используют для локальных вычислительных сетей метод внутреннего резервирования. Поскольку количество имеющихся резервных помещений ограничено, может оказаться, что в случае чрезвычайных обстоятельств не окажется рабочего помещения, которое можно было бы использовать. Бедствие в масштабе региона может привести к тому, что все резервные помещения будут заняты и компании негде будет возобновить работу.

Хорошо подготовленный план обеспечивает компанию пошаговыми инструкциями, соответствующими типу и тяжести бедствия. В нем указываются функциональные группы специалистов компании, подготовленные для реализации плана. Наличие хорошо проработанного плана гарантирует, что в стрессовой ситуации после возникновения чрезвычайных обстоятельств, критически важные факторы не будут упущены.

Документация. План может документироваться различными способами. Большинство компаний все еще применяют традиционные текстовые редакторы, другие используют коммерческое программное обеспечение. Какой бы метод ни был использован, важно обеспечить строгое выполнение процедур управления внесением изменений, чтобы поддерживать план в состоянии, соответствующем реальной текущей ситуации.

Обучение. Обучение "Группы восстановления" направлено на то, чтобы каждый сотрудник знал свои функции и обязанности в случае возникновения нештатных ситуаций.

Имитация бедствия. Большинство компаний проводят испытания плана минимум один раз в полгода. Имитируя бедствия можно проверить план, найти его слабые места и отработать взаимодействие участников. Обнаружение недостатков обычно влечет за собой корректировку плана. План должен регулярно проходить испытания и корректироваться. Лишь немногие планы обеспечения бесперебойной деятельности выполняются так, как это предусматривалось первоначально. Поскольку внесение поправок в план необходимо делать регулярно, должна быть максимально упрощена процедура корректировки плана .

При разработке плана обеспечения бесперебойной деятельности необходимо предусмотреть следующее:

Если в настоящий момент план отсутствует, необходимо уведомить высшее руководство о потенциальных опасностях, которые связаны с отсутствием подготовленного и испытанного плана;

При наличии плана надо обеспечить его регулярное испытание -- провести циклическую замену специалистов, участвующих в испытаниях. Желательно, чтобы в этом процессе приняло участие максимальное количество сотрудников;

Надо добиться того, чтобы руководство сделало планирование обеспечения бесперебойной деятельности одной из своих целей;

При выборе альтернативных рабочих помещений необходимо позаботиться, чтобы ими можно было воспользоваться при первой необходимости;

Не принимайте существующие системы и процедуры резервирования на веру: проведите полную экспертизу резервирования и внесите необходимые изменения. Проведите испытания процедур восстановления;

При определении приоритетов приложений опросите руководителей, чтобы они изложили свою точку зрения;

Учтите в плане все мелочи, которые могли бы помешать процессу восстановления деятельности;

После составления плана разработайте механизм, обеспечивающий его регулярное обновление.

Также план должен содержать процедуры выполнения следующих функций:

Ввод в действие процедур для чрезвычайных ситуаций.

Уведомление сотрудников, поставщиков и заказчиков.

Формирование группы (групп) восстановления.

Оценка последствий бедствия.

Принятие решения о реализации плана восстановления деятельности.

Ввод в действие процедур восстановления деятельности.

Переезд в альтернативное рабочее помещение (помещения).

Восстановление функционирования критически важных приложений.

Восстановление основного рабочего помещения.

Кроме того, план должен содержать документы, которые могут быть использованы персоналом, не знакомым с конкретно восстанавливаемыми функциями. Эти документы должны включать следующие данные:

Схемы коммутации телефонов;

Процедуры для аварийного отключения питания;

Организационная структура Центра восстановления;

Требования к оборудованию и снабжению Центра восстановления;

Конфигурация Центра восстановления;

Список критически важных приложений;

Список восстанавливаемого оборудования;

Сводные данные по оценке рисков.

Проводе комплексный анализ представим описание плана по обеспечению непрерывной деятельности в организации. План включает следующие основные разделы:

а) Основные положения плана.

б) Оценка чрезвычайных ситуаций:

Выявление уязвимых мест компании;

Классификация возможных опасных событий и оценка вероятности их возникновения;

Сценарии чрезвычайных ситуаций;

Потенциальные источники отрицательных последствий каждой чрезвычайной ситуации и оценка величины ущерба;

Набор критериев, на основании которых объявляется чрезвычайная ситуация.

в) Деятельность компании в чрезвычайной ситуации:

Первоначальное реагирование на чрезвычайную ситуацию (оценка опасного события, объявление чрезвычайной ситуации, оповещение необходимого круга лиц, ввод в действие чрезвычайного плана);

Мероприятия, обеспечивающие бесперебойность деятельности компании в чрезвычайной ситуации и восстановление ее нормального функционирования.

г) Поддержание готовности к возникновению чрезвычайной ситуации:

Контроль правильности и корректировка содержания плана;

Составление списка адресов и процедуры рассылки плана;

Разработка программы повышения квалификации и ознакомления персонала с действиями, необходимыми для восстановления деятельности компании после бедствия;

Подготовка к опасным событиям, обеспечение безопасности и предотвращение бедствий;

Регулярное проведение частичных и комплексных проверок (типа пожарных учений) готовности компании к действиям в чрезвычайной ситуации и способности восстановить нормальную деятельность;

Регулярное создание резервных копий данных, документации, бланков входных и выходных документов и основного программного обеспечения, их хранение в безопасном месте.

д) Информационное обеспечение:

Приоритетные функции, выполняемые компанией;

Списки внутренних и внешних ресурсов -- технических средств, программного обеспечения, средств связи, документов, офисного оборудования и персонала;

Учетная информация о техническом, программном и другом обеспечении, необходимом для восстановления деятельности организации в случае чрезвычайной ситуации;

Список лиц, которых необходимо оповестить о чрезвычайной ситуации с указанием адресов и телефонов;

Вспомогательная информация -- планы и схемы, маршруты перевозок, адреса и т.п.;

Описание детальных пошаговых процедур, обеспечивающих четкое выполнение всех предусмотренных мер;

Функции и обязанности сотрудников в случае возникновения непредвиденных обстоятельств;

Сроки восстановления деятельности в зависимости от типа возникшей чрезвычайной ситуации;

Смета расходов, источники финансирования.

е) Техническое обеспечение:

Создание и поддержание базы технических средств, обеспечивающей бесперебойную деятельность компании в чрезвычайной ситуации;

Создание и поддержание в надлежащем состоянии резервного производственного помещения.

ж) Организационное обеспечение, состав и функции следующих групп, обеспечивающих бесперебойную деятельность в случае бедствия:

Группы оценки чрезвычайной ситуации;

Группы управления в кризисной ситуации;

Группы для работ в чрезвычайной ситуации;

Группы восстановления;

Группы обеспечения работы в резервном производственном помещении;

Группы административной поддержки.

Таким образом план обеспечения непрерывной деятельности организации представляет собой детальный перечень мероприятий, которые должны быть выполнены до, во время и после бедствия. Этот план документируется и испытывается, чтобы удостовериться в его работоспособности в изменяющихся условиях.

План служит руководством к действию во время кризиса и гарантирует, что ни один важный аспект не будет упущен. Профессионально составленный план направляет действия даже неопытных сотрудников.

Наличие детального, регулярно испытываемого плана поможет оградить любую организацию от судебных исков по поводу халатности. Само существование плана служит доказательством того, что руководство компании не пренебрегло подготовкой к возможным бедствиям.

Основные выгоды от составления детального плана обеспечения бесперебойной деятельности состоят в следующем:

Минимизация потенциальных финансовых потерь;

Уменьшение юридической ответственности;

Сокращение времени нарушения нормальной работы;

Обеспечение стабильности деятельности организации;

Организованное восстановление деятельности;

Сведение к минимуму суммы страховых взносов;

Уменьшение нагрузки на ведущих сотрудников;

Лучшая сохранность имущества;

Обеспечение безопасности персонала и заказчиков;

Соблюдение требований законов и инструкций.

Анализ деятельности предприятия "Бипэк-Авто"

В случае возникновения загорания или пожара, или же случае признаков загорания или пожара,работник обязан: сообщить немедленно по телефону 101 следующее: точный адрес (улица, номер здания или сторения, этаж) что горит (электроустановка...

Информационно-документационное обеспечение принятия стратегических решений в организации (на примере ОАО "Родина")

Организация документационного обеспечения принятия стратегических решений предприятия - это комплекс мероприятий, направленных на создание и поддержание условий...

Очень важна роль общественно-экономической формации в формировании социально-психологического климата производственного коллектива. В соответствии с этими наиболее значимыми факторами...

Планирование производственно-хозяйственной деятельности

В условиях функционирования рыночных отношений предприятия изучают конъюнктуру рынка, возможности потенциальных партнеров, движение цен и на их основе организуют материально-техническое обеспечение собственного производства...

Применение аутплейсмента при высвобождении персонала

Разработка антикризисной стратегии на предприятии (на материалах ОАО "ГМС Насосы")

ОАО «ГМС - Насосы» является крупным предприятием, существующим более 60 лет. Предприятие известно на рынке как успешное, эффективно работающее, выпускающее высокого качества насосов...

Разработка бизнес-плана реализации стратегии деятельности коммерческой организации

Каждая фирма, начиная свою деятельность, обязана четко представить потребность на перспективу в финансовых, материальных, трудовых и интеллектуальных ресурсах, источники их получения...

Разработка плана по обеспечению непрерывности и восстановлению деятельности предприятия

В настоящее время почти все компании в значительной степени зависят от компьютерных технологий или автоматизированных систем...

Разработка методов предупреждения конфликтов в организации. Глава 1. Теоретические аспекты управления конфликтами в организации 1.1 Анализ понятия конфликт Среди современных авторов...

Социально-психологические методы предотвращения конфликтов в коллективе учреждения СКС

Способы управления конфликтными ситуациями

В туристическом бизнесе конфликты встречаются довольно часто и проявляются наиболее четко и ярко...