テクノロジー データ管理 非公開: ディザスタリカバリ用語の理解 – RTO、RPO、フェイルオーバー、BCP など

ディザスタリカバリ用語の理解 – RTO、RPO、フェイルオーバー、BCP など

災害復旧計画は、組織が異常事態に見舞われる前に策定しておく必要がある最優先の対策です。

IT 業界では、災害とその影響に対する計画、行動、手順を含む正式な文書を作成することから始まります。

災害は事前の予告なく突然起こる出来事であり、その種類はさまざまです。そして、それが実現すると、個人や組織は財務上の問題やユーザー エクスペリエンスを含むさまざまな困難に直面することになります。

攻撃が発生した場合は、その影響を最小限に抑え、より迅速に業務を復旧できるように準備しておく必要があります。この場合、実用的な災害復旧計画を作成することが、災害を阻止または防止するのに役立ちます。また、ユーザー エクスペリエンス、コスト、ダウンタイムの観点から、その後の影響を軽減することもできます。

さらに、すべてを再開できるように、計画、人材、戦略、機器、システムを準備しておく必要があります。ただし、そのためには、災害復旧について深く理解する必要があります。

この記事では、このような悪条件でも勇敢に反撃し、より強くなれるように、主要な災害復旧用語とともにこれについて詳しく説明します。

さぁ、始めよう!

災害とは何ですか?

災害は、IT 業界を含むどこでも起こり得る予期せぬ出来事です。これは自然に発生するか人為的に発生し、企業の運営を妨害したり、インフラストラクチャの構造を混乱させたりする可能性があります。

その結果、組織とその顧客、ベンダー、従業員、パートナーが影響を受けます。これは、財務、業界の評判、顧客の信頼、セキュリティ境界の点で組織にプレッシャーを与えます。

したがって、このようなシナリオを克服するために事前に準備をしておく必要があります。このためには、すべての操作とデータを即座に回復する必要があります。簡単に言うと、顧客のために可能な限り最短の間隔ですべてを回復できるように組織を準備する必要があります。

災害には、サイバー攻撃、妨害行為、テロ攻撃、ランサムウェアや物理的脅威、ハリケーン、地震、火災、洪水、労働事故、停電など、さまざまな種類があります。

災害復旧とは何を意味しますか?

災害復旧は、災害が発生した後に通常の業務を回復するプロセスです。これには、ハードウェア、ソフトウェア、機器、接続、ネットワーキング、電力、データへのアクセスの再開が含まれます。災害が発生する前に組織を準備するには、文書化されたプロセスでルールと手順を設定する必要があります。

ただし、組織の施設が破壊された場合は、通信、輸送、調達、作業場所などに取り組んで、活動の一部を拡張する必要があります。

災害復旧計画はなぜ重要ですか?

自然災害または人災による災害から復旧するための完璧な計画を立てることは、あらゆる IT 業界にとって不可欠です。計画をスムーズに実行するために、適切な従業員とツールを適切な場所に配置してください。

災害復旧がなぜ重要なのかをさらに詳しく見てみましょう。

ダメージを制限する

災害は予測できません。それがいつやって来て、いつ去っていくのかは誰にもわかりません。ただし、インフラストラクチャに生じる損害を制御するために、事前に準備をする必要があります。

たとえば、洪水が発生しやすい地域では、重要な書類や各種機器を最上階に置いて被害を避けることができます。

同様に、サイバー攻撃によってデータが侵害されたり盗まれたりする前に、重要なデータをバックアップしてください。

サービスの復元

災害からの復旧計画をしっかりと準備しておけば、すべてのサービスを迅速かつ簡単に通常の状態に復元できます。つまり、ほとんどすべての主要な資産とサービスを短期間で回復できるということです。

中断を最小限に抑える

明日、あるいは手術の次の段階で何が起こるかはわかりません。ただし、完璧な回復計画があれば、結果についてあまり心配する必要はありません。インフラストラクチャは、最小限の中断で運用を継続できます。

トレーニングと準備

IT インフラストラクチャは、屋根の下で働く多くの従業員で構成されています。緊急事態が発生した場合に必要かつ予想されるとおりに直ちに行動できるよう、全員が回復について知っておく必要があります。

適切な準備を行うことで、組織に関わる全員のストレス レベルも低下します。さらに、予期せぬ出来事が発生した場合に必要な行動を取れるように従業員を訓練することもできます。

災害復旧の用語

災害復旧をより詳しく理解するために、用語から始めましょう。

ディザスタリカバリ用語の理解 - RTO、RPO、フェイルオーバー、BCP など
ディザスタリカバリ用語の理解 – RTO、RPO、フェイルオーバー、BCP など

RTO

目標復旧時間 (RTO) は、財務成長に影響を与えることなく災害に耐えるために組織がビジネスの性質に応じて設定する時間です。

RTO を設定する際、企業は組織にさまざまな影響を与える可能性のあるダウンタイムを確認する必要があります。これは、災害後も事業運営を継続するための実行可能な戦略を検討するために使用されます。顧客は、アプリケーションで障害が発生した場合、アプリケーションが動作を再開するまでにどのくらい時間がかかるかを尋ねます。答えは、あらゆる組織の RTO です。

例: あなたが PayPal や Pioneer のようなオンライン取引会社で、予測不可能な出来事に直面していると仮定します。この場合、RTO は操作を回復するのに十分な速さになります。

言い換えれば、企業は財務やデータの形での影響を避けるために、RTO を 1 ~ 2 時間に設定します。

ディザスタリカバリ用語の理解 - RTO、RPO、フェイルオーバー、BCP など
ディザスタリカバリ用語の理解 – RTO、RPO、フェイルオーバー、BCP など

RPO

目標復旧時点 (RPO) は、IT インフラストラクチャが時間と情報量の観点から処理できるデータ損失です。

紛らわしいですか?

送金、スケジュール設定、支払いなどを含む銀行の取引を記録するデータベースの例を考えてみましょう。災害が発生した場合、データベースはリアルタイムで復旧されます。この場合、災害時のデータベースと災害後のデータベース復旧の差はゼロになります。

一部の企業では、バックアップからすべての情報を回復するのに約 24 時間かかることは許容されますが、場合によっては壊滅的な事態になる可能性があります。 RPO 要件に従ってインフラストラクチャを設定することが重要です。これには、バックアップの頻度の向上、アーキテクチャへのスタンバイ データベースの追加などが含まれます。

ディザスタリカバリ用語の理解 - RTO、RPO、フェイルオーバー、BCP など
ディザスタリカバリ用語の理解 – RTO、RPO、フェイルオーバー、BCP など

フェイルオーバー

長距離を旅行する状況を考えてみましょう。突然、予期せぬ理由でタイヤがパンクしてしまいました。あなたの車に用意されているスペアタイヤと、欠陥のあるタイヤを交換するための工具に感謝します。

フェイルオーバーも同様に機能します。

これは、災害時にバックアップ接続が必要であることを意味します。一言で言えば、フェイルオーバーとは、災害時に情報を復旧システムに切り替えるために使用できるネットワークとシステムを用意することを意味します。

フェイルオーバーにより、インフラストラクチャまたはハードウェアに障害が発生した場合でも、すべてのサービスがスムーズに実行されます。これにより、組織のデータと収益の損失を防ぎ、エンドユーザーへのサービスの中断を回避できます。

これを手動で設定することも、データをスタンバイ サーバーに移動するために自動的に機能するようにすることもできます。

ディザスタリカバリ用語の理解 - RTO、RPO、フェイルオーバー、BCP など
ディザスタリカバリ用語の理解 – RTO、RPO、フェイルオーバー、BCP など

フェイルバック

IT フェイルバックは、災害に対処した後に元の本番環境を元の場所 (システム) に戻す単純な操作です。攻撃中、企業はフェイルオーバー操作に従い、すべてのワークロードが VM レプリカまたはバックアップ システムに転送されます。

ただし、次の返品ステップをスキップすることはできません。すべてを回復して動作を再開したら、すべてのワークロードを元の VM またはシステムに転送する必要があります。ワークロードを元の職場またはシステムに戻すこの全体的なプロセスは、フェイルバックとして知られています。それは、攻撃から「戻ってくる」ことを意味します。

フェールバックは、企業の定期メンテナンスにも使用されます。確かに、フェイルオーバー後には必ずフェイ​​ルバックが発生します。つまり、重要なデータを回復するための最初のステップがフェイルオーバーであり、2 番目のステップがフェイルバックです。クラウドからクラウド、オンプレミスからオンプレミス、オンプレミスからクラウド、またはこれらの任意の組み合わせの間でセットアップできます。

DR

災害復旧 (DR) は、期間内に資産を復旧するための事前に構築された計画を立てるプロセスです。

DR により、組織は迅速に対応し、予期せぬイベントからすべてのサービスを回復できるようになります。また、予期せぬ事態が発生した場合に直ちに行動を起こすための指示を記載した正式な文書も提供します。

BCP

事業継続計画 (BCP) は、サーバー、モバイル デバイス、パーソナル コンピューター、およびネットワークに対する IT の中断に対処するための戦略を IT インフラストラクチャが立てることを可能にする、最も受け入れられる災害復旧計画の 1 つです。

BCP は、組織が主要なビジネス ニーズを満たすためにエンタープライズ ソフトウェアと生産性を再確立する計画を立てるのに役立つため、災害復旧とは少し異なります。

ここでは、企業はサイバー攻撃や自然災害などの潜在的な脅威を克服するための復旧システムを構築します。これは、資産を保護し、ストライキ後にすべてのサービスがすぐに再開できるように設計されています。

BCM

事業継続管理 (BCM) は、ビジネス プロセスに対する脅威に対する防御として機能するように特別に設計されたリスク管理プロセスです。 BCM は BCP の次のステップであり、復旧計画を検証して、社内全員が計画に即座に対応し、すべての重要なものが復旧していることを確認します。

BCM は、外部および/または内部の脅威に直面したときにインフラストラクチャのリスクを特定する管理フレームワークとして機能します。また、定期的なテストの助けを借りてフレームワークが効率的に機能することを保証し、予測可能性を高め、リスクを軽減し、将来の攻撃の計画を調整します。

バイアス

ビジネス インパクト分析 (BIA) は、重要なシステム、運用、プロセスを特定することによってビジネスの生存率を分析するプロセスです。これは、業務の中断による組織への災害の影響について説明します。

BIA は、強力な回復戦略の作成に役立つ重要な情報を収集するために、攻撃が実際に発生する前に結果を予測します。また、機器の交換コスト、キャッシュ フロー、利益、給与などの損失など、障害によって発生したコストも特定します。

BIA レポートを作成するときは、ビジネスに関係する重要なプロセス、さまざまな領域への中断の影響、許容可能な期間、許容可能な領域、財務コストなどを考慮する必要があります。

コールツリー

コール ツリーは、緊急時に呼び出すスタッフのリストを作成するプロセスです。ツリー状の構造に従った手順です。

たとえば、災害時、1 人が少人数のメンバーに緊急のメッセージを連絡し、そのスタッフが各グループに個別に電話します。こうすることで、すべてのスタッフが脅威の最中に情報を受け取り、割り当てられた仕事を開始して、すべての機能とプロセスを時間内に回復することができます。リストの作成は簡単ですが、それをリアルタイムで実装すると混乱が生じます。

すべての緊急スタッフが常に警戒できるよう、定期的に通報活動を行う必要があります。定期的なテストは、パフォーマンスに重大な影響を与える可能性のある、変更された番号や欠落している番号を特定するのにも役立ちます。

コール ツリーには、緊急時に指示を伝達するために使用される情報が含まれています。手動で行うこともできますが、今日のデジタル世界では自動化を使用してプロセスを加速し、メンバーに通知します。

コマンドセンター/コントロールセンター

これは、危機時の復旧計画に対する指揮や制御を提供するために特別に準備された仮想または物理的な施設です。災害発生時にチームと通信してシステムと機能を管理します。

従来、インフラストラクチャは、適切なアプローチなしに危機に対処する司令センターに依存していました。現在、組織はコントロール センターを完璧に設計しており、即時の対応がコア コンピテンシーに向けられています。

災害を感知すると、指令センターは迅速に復旧フェーズに向けて動きます。さらに、サービス、プレス、配達などの場合のレポート ポイントとしても機能します。また、そのようなシナリオでは、複数の分野の人々が集まります。

インシデント対応

インシデント対応は、攻撃に対処するために与えられる対応の一種です。これは、適切な手順と担当者の助けを借りて行われ、ネットワークとデータのセキュリティを適切なタイミングで効果的に維持します。

組織が予期せぬイベントが発生する前にインシデント計画を立てていれば、リアルタイムで脅威からデータを保護できます。インシデント対応スペシャリストは常に問題に注意を払い、インシデント発生中は自然に行動します。セキュリティ侵害を回避するために特定の措置を講じ、災害復旧中に一歩も省略しないようにします。

最初に、重要なデータを特定し、安全性を確保するためにクラウドまたはリモートの場所に保存する必要があります。インシデント対応計画を定期的に更新することで、現在のインフラストラクチャのニーズと進化するサイバー脅威に対処します。

バックアップ

バックアップ ソリューションは、IT インフラストラクチャがデータのコピーを維持し、適切なタイミングで安全に保存するのに役立ちます。データベースの破損、すべてのデータの誤った削除、またはその他の問題に直面した場合、データを即座に復元してサービスを継続できるように、バックアップを準備しておく必要があります。

データバックアップ
データバックアップ

これには、異常なイベントが発生した後にすべてのデータに簡単にアクセスできるように、ファイルを複製して安全な場所に保存することが含まれます。データを複数の場所にバックアップしておくと、サイトに障害が発生した場合でも確実に復元できるようになります。

回復力

コミュニティ、国家、組織、個人がサービスやシステムを損なうことなく災害に抵抗または耐える能力は、災害回復力として知られています。

組織は、危険による多大なストレスを回避する準備をしておく必要があります。誰かが助けに来てくれるのを待つのではなく、より適切な計画を立てて損失を最小限に抑えることができるようにしてください。これにより、災害に対応し、IT インフラストラクチャを効率的に復旧できます。

ここでの主な目標は、必要なときに必要な機能と構造を保存し、復元することです。災害に強い組織になるには、事前に準備し、リスクを予測し、変化に適応し、共有して学習し、さまざまな部門を統合し、リスク レベルを管理する能力を備えている必要があります。

SLA

サービス レベル アグリーメント (SLA) は、緊急時にサービスを復元するためにかかる時間をエンドユーザーに通知する災害計画です。

SLA は、顧客のデータが安全であり、侵害されたり第三者と共有されたりしないことを保証します。これは、エンドユーザーの問題に対する単一の窓口です。

すべての IT インフラストラクチャは、顧客に SLA に関する保証を提供します。したがって、必ず事前にエンドユーザーと連絡を取ってください。

スポフ

単一障害点 (SPOF) は、他の多くのシステムやアプリケーションが接続されている機器、個人、リソース、またはアプリケーションです。

このような機器やリソースがダウンすると、システムに接続されているすべての重要な部品も一緒にダウンします。したがって、プロセス全体と業務運営が影響を受けます。

したがって、組織を運営し続けるためには、このような問題に対処する戦略を立てる必要があります。まず最初にできることは、より大きな影響を与える可能性のある単一の機器またはシステムを特定することです。次に、ビジネスへの影響分析を実行し、リスク評価スコアを取得して、これから起こるシーンを認識します。イベント前に調べて見つけてください。

すべての SPOF をリストしたら、回復プロセスに従って分類します。それぞれの SPOF を 3 つの異なるカテゴリに分類します。

  • 少ない時間と予算で簡単かつ直接的に回復します。
  • 回復は難しいでしょうが、信頼できる回復プロセスが開発される可能性があります。
  • 一度落ちてしまうと回復することはできません。

カテゴリに基づいて適切に行動できます。

システムの回復

ハードウェア障害が発生した場合は、回復プロセスを実行して、特定のシステムまたはサーバーを元の形式に戻す必要があります。また、システム全体を回復するには、回復要件、バックアップ、ファームウェアの互換性、およびハードウェアの互換性を準備しておく必要があります。

システムリカバリは、マシンを以前の設定または新品時と同じ状態にリセットするプロセスです。これを行うと、システムにインストールされているソフトウェアまたはアプリケーションによるウイルス感染がすべて消去されます。

このプロセスには、人為的または自然な中断に対してデータの可用性を確保するための特定の手順を設定し、それに従う IT インフラストラクチャの復旧計画が含まれます。

システムの復元

システムの復元は、特定のファイルと情報を適切なタイミングで以前の状態に復元できる回復ツールです。

システムの復元を使用すると、レジストリ キー、インストールされているプログラム、ドライバー、システム ファイルなどを以前のバージョンに復元できます。これは多くの災害時に命の恩人として機能します。

テスト計画

これは、テスト戦略、見積もり、リソース、期限、目的、スケジュールに関する情報を保存する文書を指します。これは、ハードウェアとソフトウェアの安全性を確保するためのテストを実行する青写真として機能します。

これには、災害後の影響を管理するために計画された手順や手順に従ったさまざまなテストが含まれます。あなた自身とあなたの組織が行動の過程で 1 つのステップも省略しないように準備するために、定期的なテストを実行してください。このようにして、IT インフラストラクチャは欠点を理解し、戦う準備を整えることができます。

結論

災害はいつ起こるか誰にもわかりません。したがって、適切な安全性とセキュリティ対策はあらゆるビジネスにとって不可欠です。

災害復旧の用語は、攻撃や災害への対応方法を理解するのに役立ちます。また、予期せぬ事態が発生したときにインフラストラクチャを保護できるように、事前に準備するのにも役立ちます。効果的なリアルタイムの災害復旧戦略を作成して、数百万ドルを節約し、顧客の信頼を失わせることができます。

「ディザスタリカバリ用語の理解 – RTO、RPO、フェイルオーバー、BCP など」についてわかりやすく解説!絶対に観るべきベスト2動画

EBPM-エビデンスに基づく政策形成の導入と実践 #5 パネルディスカッション【RIETI EBPMシンポジウム】
洋書を読みたい? なら日本語が原作の洋書が良いですよ

災害復旧計画は、組織が異常事態に見舞われる前に策定しておく必要がある最優先の対策です。

IT 業界では、災害とその影響に対する計画、行動、手順を含む正式な文書を作成することから始まります。

災害は事前の予告なく突然起こる出来事であり、その種類はさまざまです。そして、それが実現すると、個人や組織は財務上の問題やユーザー エクスペリエンスを含むさまざまな困難に直面することになります。

攻撃が発生した場合は、その影響を最小限に抑え、より迅速に業務を復旧できるように準備しておく必要があります。この場合、実用的な災害復旧計画を作成することが、災害を阻止または防止するのに役立ちます。また、ユーザー エクスペリエンス、コスト、ダウンタイムの観点から、その後の影響を軽減することもできます。

さらに、すべてを再開できるように、計画、人材、戦略、機器、システムを準備しておく必要があります。ただし、そのためには、災害復旧について深く理解する必要があります。

この記事では、このような悪条件でも勇敢に反撃し、より強くなれるように、主要な災害復旧用語とともにこれについて詳しく説明します。

さぁ、始めよう!

災害とは何ですか?

災害は、IT 業界を含むどこでも起こり得る予期せぬ出来事です。これは自然に発生するか人為的に発生し、企業の運営を妨害したり、インフラストラクチャの構造を混乱させたりする可能性があります。

その結果、組織とその顧客、ベンダー、従業員、パートナーが影響を受けます。これは、財務、業界の評判、顧客の信頼、セキュリティ境界の点で組織にプレッシャーを与えます。

したがって、このようなシナリオを克服するために事前に準備をしておく必要があります。このためには、すべての操作とデータを即座に回復する必要があります。簡単に言うと、顧客のために可能な限り最短の間隔ですべてを回復できるように組織を準備する必要があります。

災害には、サイバー攻撃、妨害行為、テロ攻撃、ランサムウェアや物理的脅威、ハリケーン、地震、火災、洪水、労働事故、停電など、さまざまな種類があります。

災害復旧とは何を意味しますか?

災害復旧は、災害が発生した後に通常の業務を回復するプロセスです。これには、ハードウェア、ソフトウェア、機器、接続、ネットワーキング、電力、データへのアクセスの再開が含まれます。災害が発生する前に組織を準備するには、文書化されたプロセスでルールと手順を設定する必要があります。

ただし、組織の施設が破壊された場合は、通信、輸送、調達、作業場所などに取り組んで、活動の一部を拡張する必要があります。

災害復旧計画はなぜ重要ですか?

自然災害または人災による災害から復旧するための完璧な計画を立てることは、あらゆる IT 業界にとって不可欠です。計画をスムーズに実行するために、適切な従業員とツールを適切な場所に配置してください。

災害復旧がなぜ重要なのかをさらに詳しく見てみましょう。

ダメージを制限する

災害は予測できません。それがいつやって来て、いつ去っていくのかは誰にもわかりません。ただし、インフラストラクチャに生じる損害を制御するために、事前に準備をする必要があります。

たとえば、洪水が発生しやすい地域では、重要な書類や各種機器を最上階に置いて被害を避けることができます。

同様に、サイバー攻撃によってデータが侵害されたり盗まれたりする前に、重要なデータをバックアップしてください。

サービスの復元

災害からの復旧計画をしっかりと準備しておけば、すべてのサービスを迅速かつ簡単に通常の状態に復元できます。つまり、ほとんどすべての主要な資産とサービスを短期間で回復できるということです。

中断を最小限に抑える

明日、あるいは手術の次の段階で何が起こるかはわかりません。ただし、完璧な回復計画があれば、結果についてあまり心配する必要はありません。インフラストラクチャは、最小限の中断で運用を継続できます。

トレーニングと準備

IT インフラストラクチャは、屋根の下で働く多くの従業員で構成されています。緊急事態が発生した場合に必要かつ予想されるとおりに直ちに行動できるよう、全員が回復について知っておく必要があります。

適切な準備を行うことで、組織に関わる全員のストレス レベルも低下します。さらに、予期せぬ出来事が発生した場合に必要な行動を取れるように従業員を訓練することもできます。

災害復旧の用語

災害復旧をより詳しく理解するために、用語から始めましょう。

ディザスタリカバリ用語の理解 - RTO、RPO、フェイルオーバー、BCP など
ディザスタリカバリ用語の理解 – RTO、RPO、フェイルオーバー、BCP など

RTO

目標復旧時間 (RTO) は、財務成長に影響を与えることなく災害に耐えるために組織がビジネスの性質に応じて設定する時間です。

RTO を設定する際、企業は組織にさまざまな影響を与える可能性のあるダウンタイムを確認する必要があります。これは、災害後も事業運営を継続するための実行可能な戦略を検討するために使用されます。顧客は、アプリケーションで障害が発生した場合、アプリケーションが動作を再開するまでにどのくらい時間がかかるかを尋ねます。答えは、あらゆる組織の RTO です。

例: あなたが PayPal や Pioneer のようなオンライン取引会社で、予測不可能な出来事に直面していると仮定します。この場合、RTO は操作を回復するのに十分な速さになります。

言い換えれば、企業は財務やデータの形での影響を避けるために、RTO を 1 ~ 2 時間に設定します。

ディザスタリカバリ用語の理解 - RTO、RPO、フェイルオーバー、BCP など
ディザスタリカバリ用語の理解 – RTO、RPO、フェイルオーバー、BCP など

RPO

目標復旧時点 (RPO) は、IT インフラストラクチャが時間と情報量の観点から処理できるデータ損失です。

紛らわしいですか?

送金、スケジュール設定、支払いなどを含む銀行の取引を記録するデータベースの例を考えてみましょう。災害が発生した場合、データベースはリアルタイムで復旧されます。この場合、災害時のデータベースと災害後のデータベース復旧の差はゼロになります。

一部の企業では、バックアップからすべての情報を回復するのに約 24 時間かかることは許容されますが、場合によっては壊滅的な事態になる可能性があります。 RPO 要件に従ってインフラストラクチャを設定することが重要です。これには、バックアップの頻度の向上、アーキテクチャへのスタンバイ データベースの追加などが含まれます。

ディザスタリカバリ用語の理解 - RTO、RPO、フェイルオーバー、BCP など
ディザスタリカバリ用語の理解 – RTO、RPO、フェイルオーバー、BCP など

フェイルオーバー

長距離を旅行する状況を考えてみましょう。突然、予期せぬ理由でタイヤがパンクしてしまいました。あなたの車に用意されているスペアタイヤと、欠陥のあるタイヤを交換するための工具に感謝します。

フェイルオーバーも同様に機能します。

これは、災害時にバックアップ接続が必要であることを意味します。一言で言えば、フェイルオーバーとは、災害時に情報を復旧システムに切り替えるために使用できるネットワークとシステムを用意することを意味します。

フェイルオーバーにより、インフラストラクチャまたはハードウェアに障害が発生した場合でも、すべてのサービスがスムーズに実行されます。これにより、組織のデータと収益の損失を防ぎ、エンドユーザーへのサービスの中断を回避できます。

これを手動で設定することも、データをスタンバイ サーバーに移動するために自動的に機能するようにすることもできます。

ディザスタリカバリ用語の理解 - RTO、RPO、フェイルオーバー、BCP など
ディザスタリカバリ用語の理解 – RTO、RPO、フェイルオーバー、BCP など

フェイルバック

IT フェイルバックは、災害に対処した後に元の本番環境を元の場所 (システム) に戻す単純な操作です。攻撃中、企業はフェイルオーバー操作に従い、すべてのワークロードが VM レプリカまたはバックアップ システムに転送されます。

ただし、次の返品ステップをスキップすることはできません。すべてを回復して動作を再開したら、すべてのワークロードを元の VM またはシステムに転送する必要があります。ワークロードを元の職場またはシステムに戻すこの全体的なプロセスは、フェイルバックとして知られています。それは、攻撃から「戻ってくる」ことを意味します。

フェールバックは、企業の定期メンテナンスにも使用されます。確かに、フェイルオーバー後には必ずフェイ​​ルバックが発生します。つまり、重要なデータを回復するための最初のステップがフェイルオーバーであり、2 番目のステップがフェイルバックです。クラウドからクラウド、オンプレミスからオンプレミス、オンプレミスからクラウド、またはこれらの任意の組み合わせの間でセットアップできます。

DR

災害復旧 (DR) は、期間内に資産を復旧するための事前に構築された計画を立てるプロセスです。

DR により、組織は迅速に対応し、予期せぬイベントからすべてのサービスを回復できるようになります。また、予期せぬ事態が発生した場合に直ちに行動を起こすための指示を記載した正式な文書も提供します。

BCP

事業継続計画 (BCP) は、サーバー、モバイル デバイス、パーソナル コンピューター、およびネットワークに対する IT の中断に対処するための戦略を IT インフラストラクチャが立てることを可能にする、最も受け入れられる災害復旧計画の 1 つです。

BCP は、組織が主要なビジネス ニーズを満たすためにエンタープライズ ソフトウェアと生産性を再確立する計画を立てるのに役立つため、災害復旧とは少し異なります。

ここでは、企業はサイバー攻撃や自然災害などの潜在的な脅威を克服するための復旧システムを構築します。これは、資産を保護し、ストライキ後にすべてのサービスがすぐに再開できるように設計されています。

BCM

事業継続管理 (BCM) は、ビジネス プロセスに対する脅威に対する防御として機能するように特別に設計されたリスク管理プロセスです。 BCM は BCP の次のステップであり、復旧計画を検証して、社内全員が計画に即座に対応し、すべての重要なものが復旧していることを確認します。

BCM は、外部および/または内部の脅威に直面したときにインフラストラクチャのリスクを特定する管理フレームワークとして機能します。また、定期的なテストの助けを借りてフレームワークが効率的に機能することを保証し、予測可能性を高め、リスクを軽減し、将来の攻撃の計画を調整します。

バイアス

ビジネス インパクト分析 (BIA) は、重要なシステム、運用、プロセスを特定することによってビジネスの生存率を分析するプロセスです。これは、業務の中断による組織への災害の影響について説明します。

BIA は、強力な回復戦略の作成に役立つ重要な情報を収集するために、攻撃が実際に発生する前に結果を予測します。また、機器の交換コスト、キャッシュ フロー、利益、給与などの損失など、障害によって発生したコストも特定します。

BIA レポートを作成するときは、ビジネスに関係する重要なプロセス、さまざまな領域への中断の影響、許容可能な期間、許容可能な領域、財務コストなどを考慮する必要があります。

コールツリー

コール ツリーは、緊急時に呼び出すスタッフのリストを作成するプロセスです。ツリー状の構造に従った手順です。

たとえば、災害時、1 人が少人数のメンバーに緊急のメッセージを連絡し、そのスタッフが各グループに個別に電話します。こうすることで、すべてのスタッフが脅威の最中に情報を受け取り、割り当てられた仕事を開始して、すべての機能とプロセスを時間内に回復することができます。リストの作成は簡単ですが、それをリアルタイムで実装すると混乱が生じます。

すべての緊急スタッフが常に警戒できるよう、定期的に通報活動を行う必要があります。定期的なテストは、パフォーマンスに重大な影響を与える可能性のある、変更された番号や欠落している番号を特定するのにも役立ちます。

コール ツリーには、緊急時に指示を伝達するために使用される情報が含まれています。手動で行うこともできますが、今日のデジタル世界では自動化を使用してプロセスを加速し、メンバーに通知します。

コマンドセンター/コントロールセンター

これは、危機時の復旧計画に対する指揮や制御を提供するために特別に準備された仮想または物理的な施設です。災害発生時にチームと通信してシステムと機能を管理します。

従来、インフラストラクチャは、適切なアプローチなしに危機に対処する司令センターに依存していました。現在、組織はコントロール センターを完璧に設計しており、即時の対応がコア コンピテンシーに向けられています。

災害を感知すると、指令センターは迅速に復旧フェーズに向けて動きます。さらに、サービス、プレス、配達などの場合のレポート ポイントとしても機能します。また、そのようなシナリオでは、複数の分野の人々が集まります。

インシデント対応

インシデント対応は、攻撃に対処するために与えられる対応の一種です。これは、適切な手順と担当者の助けを借りて行われ、ネットワークとデータのセキュリティを適切なタイミングで効果的に維持します。

組織が予期せぬイベントが発生する前にインシデント計画を立てていれば、リアルタイムで脅威からデータを保護できます。インシデント対応スペシャリストは常に問題に注意を払い、インシデント発生中は自然に行動します。セキュリティ侵害を回避するために特定の措置を講じ、災害復旧中に一歩も省略しないようにします。

最初に、重要なデータを特定し、安全性を確保するためにクラウドまたはリモートの場所に保存する必要があります。インシデント対応計画を定期的に更新することで、現在のインフラストラクチャのニーズと進化するサイバー脅威に対処します。

バックアップ

バックアップ ソリューションは、IT インフラストラクチャがデータのコピーを維持し、適切なタイミングで安全に保存するのに役立ちます。データベースの破損、すべてのデータの誤った削除、またはその他の問題に直面した場合、データを即座に復元してサービスを継続できるように、バックアップを準備しておく必要があります。

データバックアップ
データバックアップ

これには、異常なイベントが発生した後にすべてのデータに簡単にアクセスできるように、ファイルを複製して安全な場所に保存することが含まれます。データを複数の場所にバックアップしておくと、サイトに障害が発生した場合でも確実に復元できるようになります。

回復力

コミュニティ、国家、組織、個人がサービスやシステムを損なうことなく災害に抵抗または耐える能力は、災害回復力として知られています。

組織は、危険による多大なストレスを回避する準備をしておく必要があります。誰かが助けに来てくれるのを待つのではなく、より適切な計画を立てて損失を最小限に抑えることができるようにしてください。これにより、災害に対応し、IT インフラストラクチャを効率的に復旧できます。

ここでの主な目標は、必要なときに必要な機能と構造を保存し、復元することです。災害に強い組織になるには、事前に準備し、リスクを予測し、変化に適応し、共有して学習し、さまざまな部門を統合し、リスク レベルを管理する能力を備えている必要があります。

SLA

サービス レベル アグリーメント (SLA) は、緊急時にサービスを復元するためにかかる時間をエンドユーザーに通知する災害計画です。

SLA は、顧客のデータが安全であり、侵害されたり第三者と共有されたりしないことを保証します。これは、エンドユーザーの問題に対する単一の窓口です。

すべての IT インフラストラクチャは、顧客に SLA に関する保証を提供します。したがって、必ず事前にエンドユーザーと連絡を取ってください。

スポフ

単一障害点 (SPOF) は、他の多くのシステムやアプリケーションが接続されている機器、個人、リソース、またはアプリケーションです。

このような機器やリソースがダウンすると、システムに接続されているすべての重要な部品も一緒にダウンします。したがって、プロセス全体と業務運営が影響を受けます。

したがって、組織を運営し続けるためには、このような問題に対処する戦略を立てる必要があります。まず最初にできることは、より大きな影響を与える可能性のある単一の機器またはシステムを特定することです。次に、ビジネスへの影響分析を実行し、リスク評価スコアを取得して、これから起こるシーンを認識します。イベント前に調べて見つけてください。

すべての SPOF をリストしたら、回復プロセスに従って分類します。それぞれの SPOF を 3 つの異なるカテゴリに分類します。

  • 少ない時間と予算で簡単かつ直接的に回復します。
  • 回復は難しいでしょうが、信頼できる回復プロセスが開発される可能性があります。
  • 一度落ちてしまうと回復することはできません。

カテゴリに基づいて適切に行動できます。

システムの回復

ハードウェア障害が発生した場合は、回復プロセスを実行して、特定のシステムまたはサーバーを元の形式に戻す必要があります。また、システム全体を回復するには、回復要件、バックアップ、ファームウェアの互換性、およびハードウェアの互換性を準備しておく必要があります。

システムリカバリは、マシンを以前の設定または新品時と同じ状態にリセットするプロセスです。これを行うと、システムにインストールされているソフトウェアまたはアプリケーションによるウイルス感染がすべて消去されます。

このプロセスには、人為的または自然な中断に対してデータの可用性を確保するための特定の手順を設定し、それに従う IT インフラストラクチャの復旧計画が含まれます。

システムの復元

システムの復元は、特定のファイルと情報を適切なタイミングで以前の状態に復元できる回復ツールです。

システムの復元を使用すると、レジストリ キー、インストールされているプログラム、ドライバー、システム ファイルなどを以前のバージョンに復元できます。これは多くの災害時に命の恩人として機能します。

テスト計画

これは、テスト戦略、見積もり、リソース、期限、目的、スケジュールに関する情報を保存する文書を指します。これは、ハードウェアとソフトウェアの安全性を確保するためのテストを実行する青写真として機能します。

これには、災害後の影響を管理するために計画された手順や手順に従ったさまざまなテストが含まれます。あなた自身とあなたの組織が行動の過程で 1 つのステップも省略しないように準備するために、定期的なテストを実行してください。このようにして、IT インフラストラクチャは欠点を理解し、戦う準備を整えることができます。

結論

災害はいつ起こるか誰にもわかりません。したがって、適切な安全性とセキュリティ対策はあらゆるビジネスにとって不可欠です。

災害復旧の用語は、攻撃や災害への対応方法を理解するのに役立ちます。また、予期せぬ事態が発生したときにインフラストラクチャを保護できるように、事前に準備するのにも役立ちます。効果的なリアルタイムの災害復旧戦略を作成して、数百万ドルを節約し、顧客の信頼を失わせることができます。

「ディザスタリカバリ用語の理解 – RTO、RPO、フェイルオーバー、BCP など」についてわかりやすく解説!絶対に観るべきベスト2動画

EBPM-エビデンスに基づく政策形成の導入と実践 #5 パネルディスカッション【RIETI EBPMシンポジウム】
洋書を読みたい? なら日本語が原作の洋書が良いですよ