可用性チェーンの強化| ITProPortal
公開: 2022-01-10最も重要なアプリと詳細の優れた可用性(HA)を確認することを検討するとき、最初は何を信じますか? あなたまたはあなたの消費者がこれらのアプリケーションに99.99pcの時間でアクセスできる必要がある場合、コンピューティングおよびストレージソースへのアクセスを保証することについて最初に想定するのは純粋に自然なことです。 クラウドでSQLServerを使用している場合は、たとえば、ホームウィンドウのフェールオーバークラスターインスタンス(FCI)を構成して、コンピューティングとストレージの負荷を代替ノードに即座に送信することで、コンピューティングソースまたはストレージソースの障害に対応できます。フェールオーバークラスターのHAトラブルは解決しました!
しかし、それが失敗したことを意味するコンピューティングまたはストレージでない場合はどうなるでしょうか。 可用性チェーンには、あなたとあなたの購入者を個々のコンピューティングおよびストレージリソースに接続する多くのバックリンクがあります。 達成しようとしているHAの作業体験を確実にするために、これらすべてのリンクについて考える必要があります。
ネットワークの可用性
重要なアプリケーションをクラウドで機能させている場合、クラウドサポート会社は、クラウドインフラストラクチャの要素を接続するイントラネットの可用性を確認します。 AWS、Azure、Google Cloud Systemはすべて、多数のパスを備えた優れた速度の堅牢な内部ネットワークを提供するため、コアクラウドネットワークは99.99pcHAターゲットを完全にサポートできます。
買い物客がクラウドベースのほとんどのプログラムにリンクする方法を管理することはできませんが、買い物客に参加する方法を指示することはできます。 VPNゲートウェイ、またはAzure ExpressRoute、AWS Direct Connect、GoogleDirectInterconnectなどの専用接続サービスを採用している可能性があります。 これらのソリューションはすべて、クラウドへの高速で非常に低遅延の接続を提供できますが、すべて異なるSLAを提供し、それらの多くは可用性チェーンの弱いバックリンクを公開します。 Azure ExpressRouteの標準構成では、99.95 pcの可用性しか提供されないため、AWS ImmediateJoinの基本的な構成はさらに低くなります。99.9pcのみプロバイダーが予期せず失敗した場合、重要なアプリへのアクセスが予想よりもかなり長く制限される可能性があります。 実際、AzureまたはAWSクラウドでHA用に構成されたVMは、中断することなく動作し続ける可能性がありますが、ExpressRouteまたはImmediate Joinがダウンしているためにアクセスできない場合は、非常に簡単で快適です。
AzureExpressRouteまたはAWSImmediateConnect for HAを構成して、整理することができます。 99.99%のSLAを取得するには、少なくとも2つのExpressRoute回線と4つの即時結合回線を設定する必要があります。 GCPで類似のプロバイダーを利用している場合は、重要ではないアプリケーション向けのGoogle即時相互接続サービスよりも作成段階アプリケーション向けのGoogle即時相互接続アシスタンスを使用して、99.99PCSLAを取得することをお勧めします。
インフラストラクチャの可用性
ただし、ネットワーク内の弱い一方向リンクを強化したとしても、ロードバランサー、DNSサーバー、IDおよび認証サーバー、Webサイトサーバーファームなど、クラウドインフラストラクチャ自体の内部に弱いバックリンクが存在する可能性があります。 2021年10月のFacebookでの本当に一般的な停止を忘れないでください。 Facebookの主要なビジネス系統をサポートする生産方法ではなく、Facebookの内部DNSサーバーへのエントリに影響を与える停止は、ビジネス全体を数時間停止させるために信頼できました。 HA用に完全に構成されていることを確認するには、一般的なインフラストラクチャのこれらのコンポーネントを効果的に確認する必要があります。
GoogleのDNSサーバーソリューションのSLAは100pcであり、これは有望ですが、クラウドID企業のSLAはわずか99.9%です。 同様に、AWSのRoute 53非公開DNSサポートは100%のSLAを提供するよう努めていますが、そのDirectory Solutionsの提供は99.9%で最高になっています。 Azure Energetic Directoryの基本および高品質の製品とサービスは100個のSLAを提供しますが、Azure Active Listing Domain ExpertサービスのSLAは99.9%で最高になります。
コミュニティ接続と同様に、重要なクラウドベースのアプリをサポートする内部インフラストラクチャの信頼性を高めるためにできる問題があります。 たとえば、多くのエリアコントローラーを使用してAWS自然環境を構成できます。これにより、探している99.99%のアクセシビリティ度に近い機能を備えたAWSリスティング製品とサービスの信頼性を強化できます。
マルチクラウドの代替
ただし、2021年12月7日の7時間のAWS停止のように、最も準備の整った企業でさえ予期しないダウンタイムが発生する可能性がある場所があります。 AWSが停止した状況では、問題は見込み客が使用していたデバイスではなく、AWSが指摘しているように、「モニタリング、内部DNS、認証製品やサービスなどの基本的なサービスをホストするために行われた内部コミュニティで発生した問題に起因していました。実際、いくつかの条件では、顧客のアプリが管理していたVMは動作を維持し、HA SLAに完全に準拠していますが、ゲートウェイや内部DNS製品の問題により、クライアントはアプリにアクセスできませんでした。およびサービス、ロードバランサー、および適切に動作する機能が内部コミュニティで発生したミスの連鎖的な結果によって損なわれたその他のパーツ。
可用性チェーンの弱いバックリンクがクラウド自体であることが判明した場合、どのようにしてアプリケーションを運用し、アクセスし続けることができますか? この記事での最大の可能性は、マルチクラウドの大災害回復(DR)の回答に依存することです。 基本的に、完全に個別のクラウドで最も重要なプログラムをサポートするミラーインフラストラクチャを開発します。 重要なSQLServerインフラストラクチャがAWSで動作している場合、たとえば、AzureまたはGCPでSQL Serverの同様の機会を生成します。これは、AWSクラウドがオフラインになった場合に手動で起動できる場合です。 AWS環境とAzure/GCP環境の両方で実行され、AWSのSQLServerインスタンスからAzure/GCPクラウド環境のインフラストラクチャに接続されたストレージへの情報のレプリケーションをすばやく調整できるDR管理の回答を選択する必要があります。 2つの環境で同様のDR管理オプションを実際に展開しない場合、クラウドに関連する知識を適切に複製できない可能性があります。
また、プリンシパルインフラストラクチャとDRインフラストラクチャの間に実質的な速度のデジタルプライベートコミュニティ(VPN)関係を構成する必要があります。 AWS、Azure、およびGCPはすべて、安全なクラウド間リンクを可能にするVPN製品とサービスを提供します(3番目の代替手段もあります)。これは、DR管理の回答がクラウドインフラストラクチャ間の重要な情報。 もちろん、12月にAWS VPN Remedyを使用していた場合は、停止の過程で長い間オフラインになっている可能性がありますが、このシナリオでは問題ありません。 AWSで管理するDR管理解決は、コミュニティが可能にするのと同じくらい迅速に、DRインフラストラクチャ内の対応するストレージにすべての近隣書き込み操作を複製します。したがって、AWSプロバイダーがオフラインになるまでに、DRソフトウェアはすべてを複製します(またはほぼすべて)DRインフラストラクチャへの重要なAWSデータ。 キークラウドがオフラインで存在しないことが明らかになるとすぐに、DRクラウドのインフラストラクチャを起動し、ごくわずかな中断で消費者の獲得を本質的な目的に提供することから始めることができます。 HAレメディを期待している5分未満の時間枠では稼働していない可能性がありますが、AWSが取得するために7日間数時間持ちこたえた場合よりも、大幅に迅速に運用できます。その操作はオンラインに戻ります。
ソフトウェアの可用性
長期的には、HAの構成とは、アプリケーションの実質的な可用性を確保するための構成です。 問題なくVMとストレージのHAを保証するFCIを生成できます。 すべてのクラウドアシスタンスベンダーは、そのレベルであなたに対応することに慣れています。 ただし、正しい結論から結論へのHAを得るには、可用性チェーン内の他のすべてのバックリンクに追加の認識を払う必要があります。 あなたがそれらを強化するために過剰な方法を取ることを除いて、あなたが認識するよりも弱いものもあります。
デイブバーミンガム、シニアテクニカルエバンジェリスト、 SIOS技術革新