Аварийное восстановление и аудит непрерывности бизнеса - Disaster recovery and business continuity auditing
Учитывая растущую зависимость организаций от информационных технологий для ведения своей деятельности, Планирование непрерывности бизнеса охватывает всю организацию, и Аварийное восстановление фокусируется на ЭТО.
Аудиторская проверка документов, охватывающих организацию Непрерывность бизнеса и аварийное восстановление планы обеспечивают стороннюю проверку заинтересованные стороны что документация полная и не содержит материал искажения.
Недостаточная полнота может привести к игнорированию вторичных эффектов, например, когда значительно увеличившаяся работа на дому приводит к перегрузке входящей телекоммуникационной способности участка восстановления, а двухнедельная заработная плата, которая не была критичной в течение первых 48 часов, теперь вызывает предполагаемые проблемы с восстановлением , осложненного реакцией правительства и, возможно, профсоюзов.[1]
Обзор
Термины «Непрерывность бизнеса» и «Восстановление после сбоя», которые часто используются вместе, очень разные. Непрерывность бизнеса означает способность бизнеса продолжать выполнение критически важных функций и бизнес-процессов после возникновения аварии, тогда как аварийное восстановление относится конкретно к информационным технологиям (ИТ) и функциям бизнеса, ориентированным на данные, и является подмножеством бизнеса. Непрерывность.[2]
Метрики
Основная цель - защитить организацию в случае, если все или часть ее операций и / или компьютерных услуг будут частично или полностью непригодны для использования.
Минимизация времени простоя и потери данных во время аварийного восстановления измеряется двумя концепциями:
- Целевое время восстановления (RTO), время, пока система полностью не заработает.
- Цель точки восстановления (RPO), мера возможности восстановления файлов путем указания восстановления резервной копии на определенный момент времени.
Роль аудитора
Аудитор исследует и оценивает
- что процедуры, изложенные в плане BCP и DR, действительно соответствуют реальной практике
- что конкретное лицо в организации, которое может называться сотрудником по аварийному восстановлению, координатором аварийного восстановления, координатором аварийного восстановления или каким-либо другим подобным званием, имеет технические навыки, подготовку, опыт и способности для анализа возможностей члены команды для выполнения поставленных задач
- что более одного человека обучены и способны выполнять определенную функцию. Тесты и опросы персонала могут помочь в достижении этой цели.
Документация
Чтобы максимизировать свою эффективность, планы аварийного восстановления наиболее эффективны при частом обновлении и должны:
- быть неотъемлемой частью всех бизнес-анализ процессы,
- пересматриваться при каждом крупном корпоративном приобретении, при каждом запуске нового продукта и на каждом этапе разработки новой системы.
Организация должна вести соответствующие записи. Аудитор проверяет записи, счета и контракты, чтобы убедиться, что записи ведутся. Одна из таких записей - это текущий список поставщиков оборудования и программного обеспечения организации. Такой список составляется и периодически обновляется с учетом меняющейся деловой практики. Его копии хранятся на сайте и за его пределами и доступны для тех, кто в них нуждается. Аудитор тестирует процедуры, используемые для достижения этой цели, и определяет их эффективность.
План по ликвидации последствий катастрофы
А План по ликвидации последствий катастрофы (DRP) представляет собой документированный процесс или набор процедур для выполнения аварийное восстановление процессы и восстановление и защита бизнеса ЭТО инфраструктура в случае катастрофа.[3] Это «всеобъемлющее изложение последовательных действий, которые необходимо предпринять до, во время и после бедствия».[4] Катастрофа могла быть естественный, относящийся к окружающей среде или же рукотворный. Техногенные катастрофы могут быть преднамеренными (например, террористический акт) или непреднамеренными (то есть случайными, например, прорыв искусственной плотины).
Типы планов
Хотя универсального плана не существует,[5] есть три основных стратегии:[3][5]
- профилактика, включая надлежащее резервное копирование, наличие устройств защиты от перенапряжения и генераторов
- обнаружение, побочный продукт регулярных проверок, которые могут выявить новые (потенциальные) угрозы
- исправление[6]
Последнее может включать в себя обеспечение надлежащего страховые полисы, и проведение мозгового штурма «извлеченные уроки».[3][7]
Связь с планом обеспечения непрерывности бизнеса
В План продолжения работы компании (BCP) - это комплексный организационный план, который включает план аварийного восстановления и состоит из пяти планов компонентов:[8]
- План возобновления бизнеса
- План действий в чрезвычайной ситуации
- План непрерывности операций
- План управления инцидентами
- План по ликвидации последствий катастрофы
Первые три (планы возобновления бизнеса, чрезвычайной ситуации с занятостью и непрерывности операций) не имеют отношения к ИТ-инфраструктуре. План управления инцидентами (IMP) действительно имеет дело с ИТ-инфраструктурой, но, поскольку он устанавливает структуру и процедуры для противодействия кибератакам на ИТ-системы организации, он обычно не является агентом для активации плана аварийного восстановления, выходящего из плана аварийного восстановления. как единственный компонент BCP, представляющий интерес для ИТ.[8]
Преимущества
Как и любой план страхования, есть преимущества, которые можно получить при правильном планировании, в том числе:[4]
- Минимизация риска задержек
- Гарантия надежности резервных систем
- Обеспечение стандарта для тестирования плана
- Минимизация принятия решений во время бедствия
- Снижение потенциальных юридических обязательств
- Снижение излишне стрессовой рабочей среды
Методология планирования и тестирования
По словам Джеффри Х. Уолда из журнала Disaster Recovery Journal, весь процесс разработки плана аварийного восстановления состоит из 10 шагов:[4]
- Выполнение оценки риска: Комитет по планированию готовит анализ риска и анализ влияния на бизнес (BIA), который включает в себя ряд возможных бедствий. Каждая функциональная область организации анализируется для определения возможных последствий. Традиционно наибольшую опасность представляет пожар. Тщательный план предусматривает «наихудшие» ситуации, например, разрушение главного здания.
- Установление приоритетов обработки и операций: Критические потребности каждого отдела оцениваются и устанавливаются приоритеты. Написано соглашения для выбранных альтернатив подготовлены детали с указанием продолжительности, условий прекращения, системное тестирование, Стоимость, любые специальные процедуры безопасности, процедура уведомления об изменениях в системе, часы работы, конкретное оборудование и другое оборудование, необходимое для обработки, требования к персоналу, определение обстоятельств, составляющих чрезвычайная ситуация, процесс переговоров о продлении срока службы, гарантия совместимость, доступность, требования к ресурсам, не относящимся к мэйнфреймам, приоритеты и другие договорные вопросы.
- Сбор данных: Сюда входят различные списки (список резервных должностей сотрудников, список важных телефонных номеров, главный список вызовов, главный список поставщиков, контрольный список уведомлений), инвентаризация (коммуникационное оборудование, документация, офисное оборудование, формы, страховые полисы, компьютерное оборудование рабочих групп и центров обработки данных, микрокомпьютер железо и софт, канцелярские, внешнее оборудование для хранения, телефоны и т. д.), регистр распространения, графики резервного копирования / хранения программного обеспечения и файлов данных, спецификации временного расположения, любые другие подобные списки, материалы, инвентарные запасы и документация. Предварительно отформатированные формы часто используются для облегчения процесса сбора данных.
- Составление и документирование письменного плана
- Разработка критериев и процедур тестирования: причины для тестирования включают
- Определение возможности и совместимости средств и процедур резервного копирования.
- Выявление областей в плане, которые необходимо изменить.
- Обучение руководителей и членов команды.
- Демонстрация способности организации восстанавливаться.
- Обеспечение мотивации для поддержания и обновления плана аварийного восстановления.
- Тестирование плана: Начальная буква "прогон, репетиция "плана выполняется путем проведения структурированного пошагового теста. Необходимо выполнить фактический тестовый прогон. Проблемы устранены.
Чтобы свести к минимуму перерывы в работе, можно запланировать начальное тестирование по частям и в нерабочее время. Последующие тесты проводятся в обычные рабочие часы.
Типы тестов включают в себя: тесты контрольного списка, тесты моделирования, параллельные тесты и тесты полного прерывания.
Предостережения / противоречия
Из-за высокой стоимости различные планы не обходятся без критики. Dell выявил пять «типичных ошибок», которые организации часто допускают при планировании BCP / DR:[9]
- Отсутствие бай-ина: Когда высшее руководство рассматривает планирование аварийного восстановления как «еще одну фальшивую тренировку по устранению землетрясений» или руководители не могут сделать планирование аварийного восстановления и подготовку к нему приоритетом.
- Неполные RTO и RPO: Неспособность включить каждый важный бизнес-процесс или блок данных. Рябь может усилить воздействие стихийного бедствия. Заработная плата может быть изначально не критичной, но оставленная в покое на несколько дней, она может стать более важной, чем любая из ваших первоначальных проблем.
- Системная миопия: Третья точка отказа заключается в сосредоточении внимания только на аварийном восстановлении без учета более крупных потребностей в непрерывности бизнеса. Потеря офисных помещений в результате стихийного бедствия может привести к мгновенному скоплению удаленных сотрудников, что, в свою очередь, может перегрузить компанию. VPN в мгновение ока перегружают персонал ИТ-поддержки и вызывают серьезные узкие места и монополию в системе АТС с телефонным подключением.
- Слабая безопасность: Когда происходит катастрофа, данные и бизнес-процессы организации становятся уязвимыми. Таким образом, безопасность может быть важнее чистой скорости, необходимой для RTO плана аварийного восстановления. Тогда наиболее важным соображением становится обеспечение безопасности новых конвейеров данных: от новых виртуальных частных сетей до подключения внешних служб резервного копирования.
- При стихийных бедствиях, планирование патологоанатомической экспертизы
- Блокировка или удаленная очистка потерянных портативных устройств
Решения и стратегии
- Обозначение сайта: горячий участок vs. холодный участок. Горячий участок полностью оборудован для возобновления работы, тогда как холодный объект не имеет такой возможности. На теплом сайте есть возможность возобновить некоторые, но не все операции.
- А анализ выгоды и затрат необходим.
- Периодические тесты и испытания подтверждают жизнеспособность и эффективность плана. Аудитор изучает вероятность того, что деятельность организации может поддерживаться на уровне, который предполагается в плане, и способность организации фактически наладить операции на месте.
- Аудитор может проверить это с помощью бумажной и безбумажной документации и фактического физического наблюдения. В безопасность места хранения также подтверждается.
- Резервное копирование данных: Аудит процессов резервного копирования определяет, (а) они эффективны, и (б) действительно ли они реализуются вовлеченным персоналом.[10][11]
- План аварийного восстановления также включает информацию о том, как лучше всего восстановить данные, которые не были скопированы. Чтобы гарантировать, что данные не будут повреждены, изменены или уничтожены во время этого процесса, введены средства контроля и защиты.
- Сверла: Тренировки проводятся периодически, чтобы определить, насколько эффективен план и какие изменения могут потребоваться. Основная задача аудитора здесь - убедиться, что эти учения проводятся должным образом и что проблемы, обнаруженные в ходе этих учений, решаются.
- Резервное копирование ключевого персонала - в том числе периодические обучение персонала и перекрестное обучение.
Прочие соображения
Страхование
Аудитор определяет адекватность компании страхование покрытие (особенно свойство и страхование от несчастных случаев ) через обзор компании страховые полисы и другие исследования. Аудитору необходимо проверить следующие аспекты: объем политики (включая любые заявленные исключения), достаточность охвата для покрытия потребностей организации, а также актуальность политики. Аудитор также устанавливает посредством анализа рейтингов, присвоенных независимыми рейтинговыми агентствами, что страховая компания или компании, обеспечивающие покрытие, имеют финансовая жизнеспособность для покрытия убытков в случае бедствия.
Эффективные планы аварийного восстановления учитывают степень ответственности компании перед другими организациями и ее способность выполнять эти обязательства, несмотря на крупную катастрофу. Хороший аудит аварийного восстановления будет включать анализ существующих MOA и контракты для обеспечения юридической ответственности организации за неэффективность в случае катастрофа или любые другие необычные обстоятельства сведены к минимуму. Также описаны соглашения, касающиеся оказания поддержки и помощи в восстановлении компании. Методы, используемые для оценки этой области, включают проверку разумности плана, определение того, учитывает ли план все факторы, а также проверку разумности контрактов и соглашений с помощью документации и сторонних исследований.
Проблемы со связью
Аудитор должен убедиться, что планирование гарантирует, что оба управление и команда восстановления имеют эффективные коммуникация оборудование, контактная информация как для внутреннего общения, так и для внешних вопросов, таких как деловые партнеры и ключевые клиенты.
Методы аудита включают
- тестирование процедур, интервьюирование сотрудников, сравнение с планами другой компании и отраслевыми стандартами,
- изучение руководств компании и других письменных процедур.
- прямое наблюдение за тем, чтобы номера телефонов экстренных служб были перечислены и были легко доступны в случае бедствия.
Действия в чрезвычайных ситуациях
Процедуры поддержки персонала во время круглосуточного аварийного восстановления включены в любой хороший план аварийного восстановления. Порядок хранения продуктов питания и воды, возможности ведения CPR /первая помощь и действия в чрезвычайных ситуациях в семье четко прописаны и проверены. Обычно это может быть достигнуто компанией посредством хорошего обучение персонала программы и четкое определение должностных обязанностей. Проверка способности плана к готовности часто включает такие задачи, как опросы персонала, непосредственное физическое наблюдение, а также изучение записей о тренировках и любых сертификатов.
Экологические проблемы
Аудитор должен проанализировать процедуры, которые учитывают возможность сбоев питания или других ситуаций, не связанных с ИТ.
- Фонари и свечи может понадобиться.
- Безопасность процедуры в случае утечки газа, пожары или другие подобные явления
Смотрите также
- Схема ротации резервных копий
- Аудит информационных технологий
- Сравнение программного обеспечения для резервного копирования
- Сравнение онлайн-сервисов резервного копирования
- Уязвимость (вычисления)
Рекомендации
- ^ «Обеспокоены ли внешние аудиторы раскрытием информации о киберрисках» (PDF).
- ^ Сьюзан Снедейкер (2013). Планирование непрерывности бизнеса и аварийного восстановления для ИТ-специалистов (2-е изд.). Берлингтон: Elsevier Science. ISBN 9780124114517.
- ^ а б c Билл Абрам (14 июня 2012 г.). «5 советов по созданию эффективного плана аварийного восстановления». Вычислительная техника для малого бизнеса. Получено 9 августа 2012.
- ^ а б c Уолд, Джеффри Х. (1997). «Процесс планирования аварийного восстановления». Журнал аварийного восстановления. Взято из Тома 5 №1. Мир аварийного восстановления. Архивировано из оригинал 15 августа 2012 г.. Получено 8 августа 2012.
- ^ а б «Планирование аварийного восстановления - пошаговое руководство». Университет штата Мичиган. Архивировано из оригинал 8 марта 2014 г.. Получено 9 мая 2014.
- ^ «Резервное аварийное восстановление». Архивирование электронной почты и удаленное резервное копирование. 2010. Архивировано с оригинал 22 января 2013 г.. Получено 9 мая 2014.
- ^ «Планы аварийного восстановления и обеспечения непрерывности бизнеса». Решения для каменных переходов. 2012. Архивировано с оригинал 23 августа 2012 г.. Получено 9 августа 2012.
- ^ а б Чад Бахан. (Июнь 2003 г.). «План аварийного восстановления». Получено 24 августа 2012.
- ^ Кормак Фостер; Корпорация Dell (25 октября 2010 г.). «Пять ошибок, которые могут убить план аварийного восстановления». Архивировано из оригинал на 2013-01-16. Получено 8 августа 2012.
- ^ Констанс Густке (7 октября 2015 г.). «Ураган Хоакин подчеркивает важность продолжения работы». Нью-Йорк Таймс.
- ^ Берман, Алан. : Построение успешного плана обеспечения непрерывности бизнеса. Журнал о страховании бизнеса, 9 марта 2015 г. http://www.businessinsurance.com/article/20150309/ISSUE0401/303159991/constructing-a-successful-business-continuity-plan
- Мессье-младший, В. Ф. (2011). Услуги по аудиту и подтверждению достоверности информации: систематический подход (8-е изд.). Нью-Йорк: МакГроу-Хилл / Ирвин. ISBN 9780077520151.
- Gallegos, F .; Senft, S .; Дэвис, А. Л. (2012). Контроль и аудит информационных технологий (4-е изд.). Бока-Ратон, Флорида: Публикации Ауэрбаха. ISBN 9781439893203.