Consolidarea lanțului de disponibilitate | ITProPortal

Publicat: 2022-01-10

Ce credeți inițial când vă gândiți să vă asigurați disponibilitatea superioară (HA) a celor mai importante aplicații și detalii? Dacă dvs. sau consumatorii dvs. trebuie să puteți accesa aceste aplicații 99,99 pc din timp, este pur natural să presupuneți mai întâi despre garantarea accesibilității la sursele de calcul și stocare. Dacă lucrați cu SQL Server în cloud, pentru un caz concret, puteți configura o instanță de cluster de failover (FCI) Windows Home pentru a răspunde la eșecul surselor de calcul sau de stocare, mergând instantaneu încărcările de calcul și stocare la un nod alternativ. a clusterului de failover. HA probleme rezolvate!

Dar dacă nu mijloacele de calcul sau de stocare nu au succes? Există multe backlink-uri în lanțul de disponibilitate care vă conectează pe dvs. și cumpărătorii dvs. la resursele de calcul și stocare individuale. Trebuie să vă gândiți la toate aceste legături pentru a vă asigura experiența de lucru HA pe care vă străduiți să o obțineți.

Disponibilitatea rețelei

Dacă vă funcționați aplicațiile semnificative în cloud, compania dvs. de asistență în cloud va fi sigură de disponibilitatea intranetului care conectează factorii infrastructurii dvs. de cloud. AWS, Azure și Google Cloud System oferă o viteză superioară, rețele interioare robuste, cu un număr de căi, astfel încât rețelele cloud de bază sunt absolut capabile să vă susțină ținta HA de 99,99 pc.

Pur și simplu nu puteți gestiona modul în care cumpărătorii dvs. se conectează la programele dvs. bazate pe cloud, dar puteți comanda cum vă alăturați acestora. Este posibil să utilizați un gateway VPN sau servicii de conectivitate dedicate, cum ar fi Azure ExpressRoute, AWS Direct Connect sau Google Direct Interconnect. Toate aceste soluții vă pot oferi o conexiune cu viteză semnificativă și latență foarte scăzută la cloud, dar toate oferă SLA-uri diferite și multe dintre ele expun backlink-uri slabe în lanțul de disponibilitate. Configurația standard a Azure ExpressRoute oferă doar o disponibilitate de 99,95 computere, asigurați-vă că configurația esențială a AWS Immediate Join este chiar mai mică – doar 99,9 computer. Într-adevăr, mașinile virtuale configurate pentru HA în norii Azure sau AWS pot continua să funcționeze fără întreruperi, dar asta este ușurință și confort dacă nu le poți accesa din cauza faptului că ExpressRoute sau Immediate Join sunt inactiv.

Puteți configura Azure ExpressRoute sau AWS Immediate Connect pentru HA, poate fi nevoie doar de organizare. Va trebui să configurați cel puțin două circuite ExpressRoute și 4 circuite Immediate Join pentru a obține un SLA de 99,99 %. Dacă utilizați furnizori analogi de pe GCP, veți dori să utilizați Google Immediate Interconnect Assistance pentru aplicații în faza de creație în comparație cu serviciile Google Immediate Interconnect pentru aplicații necritice pentru a obține SLA de 99,99 pc.

Disponibilitatea infrastructurii

Chiar dacă întăriți legăturile slabe unidirecționale din rețea, totuși, există în continuare legături potențiale slabe în interiorul infrastructurii cloud în sine - printre echilibratorii de încărcare, serverele DNS, serverele de identitate și autentificare, fermele de servere de site-uri web și altele asemenea. Nu uitați de întreruperea cu adevărat publică la Facebook în octombrie 2021? Întreruperile care influențează intrarea în serverele DNS ale Facebook - nu metodele de producție care sprijină principalele tulpini de afaceri ale Facebook - au fost de încredere pentru a reduce întreaga afacere timp de ore. Trebuie să vedeți aceste componente ale infrastructurii dvs. generale la fel de eficient pentru a vă asigura că sunteți absolut configurat pentru HA.

SLA-ul Google pentru soluțiile de server DNS este de 100 de computere, ceea ce este încurajator, dar SLA pentru companiile Cloud Id este de doar 99,9%. De asemenea, suportul DNS non-public Route 53 de la AWS se străduiește să furnizeze un SLA de 100%, dar oferta sa de soluții de director depășește cu 99,9%. Produsele și serviciile Azure Energetic Directory fundamentale și de calitate oferă un SLA de 100 de bucăți, dar SLA pentru serviciile Azure Active Listing Domain Expert depășește cu 99,9%.

Ca și în cazul conectivității comunității, există probleme pe care le puteți face pentru a crește fiabilitatea infrastructurii interioare care sprijină aplicațiile vitale bazate pe cloud. Pentru un caz concret, vă puteți configura mediul dvs. natural AWS cu multe controlere de zonă, ceea ce poate consolida fiabilitatea produselor și serviciilor AWS Listing prezentând mai aproape de grade de accesibilitate de 99,99% pe care le căutați.

Alternativa multi-cloud

Există, totuși, perioade, cum ar fi întreruperea AWS de 7 ore din 7 decembrie 2021, unde chiar și cele mai bine pregătite corporații s-ar putea întâlni cu perioade neprevăzute. În circumstanța întreruperii AWS, problemele au provenit nu din dispozitivele pe care potențialele le foloseau, ci, după cum notează AWS, din problemele apărute într-o comunitate din interior creată „pentru a găzdui servicii fundamentale, cum ar fi monitorizarea, DNS-ul intern, produse și servicii de autorizare, și elemente ale planului de comandă EC2.”* De fapt, în mai multe condiții, VM-urile pe care se gestionau aplicațiile clienților au rămas operaționale și complet conforme cu SLA-urile HA – totuși clienții nu și-au putut accesa aplicațiile din cauza problemelor cu gateway-urile, produsele DNS interne. și servicii, echilibrare de încărcare și alte părți a căror capacitate de a funcționa corect a fost compromisă de consecințele în cascadă ale greșelilor care au apărut asupra comunității interioare.

Cum pot aplicațiile dvs. să rămână operaționale și accesibile atunci când backlinkul slab din lanțul de disponibilitate se dovedește a fi cloud-ul însuși? Cea mai mare posibilitate a ta din acest articol este să depinzi de un răspuns de recuperare în caz de catastrofe multi-cloud (DR). Practic, ați dezvolta o infrastructură în oglindă pentru a vă susține cele mai importante programe într-un nor complet individual. Dacă infrastructura dumneavoastră crucială SQL Server funcționează pe AWS, de exemplu, ați produce o ocazie similară de SQL Server pe Azure sau GCP, ocazie în care ați putea porni manual dacă cloud-ul AWS ar fi deconectat. Veți dori să alegeți un răspuns de administrare DR care rulează atât în mediile AWS, cât și în mediile Azure/GCP și care poate orchestra rapid replicarea informațiilor de la instanța SQL Server din AWS la stocarea conectată la infrastructura din mediul cloud Azure/GCP. Dacă într-adevăr nu implementați opțiunea de administrare DR similară în cele două medii, este posibil să nu vă replicați cunoștințele în mod corespunzător implicând norii.

De asemenea, veți dori să configurați o relație cu o comunitate privată digitală (VPN) de viteză substanțială între infrastructura principală și DR. AWS, Azure și GCP prezintă toate produse și servicii VPN care pot permite o legătură sigură de la cloud la nor (și există și alternative de a treia întâlnire), iar aceasta va deveni canalul prin care răspunsul dvs. de gestionare a DR vă reproduce. informații semnificative între infrastructurile cloud. Desigur, dacă ați folosit un remediu VPN AWS în decembrie, este posibil să fi fost offline de mult în timpul întreruperii - dar în acest scenariu este în regulă. Rezoluția de administrare DR care gestionează pe AWS replică toate operațiunile de scriere de vecinătate către omologul său de stocare din infrastructura DR la fel de prompt pe care comunitatea o va face posibil, astfel încât, până când furnizorii AWS au fost offline, software-ul DR ar fi replicat toate (sau aproape toate) din datele vitale AWS pentru infrastructura DR. Pe cât de repede a fost evident că cloud-ul cheie a lipsit offline, ați învățat infrastructura în cloud-ul DR și ar putea începe să ofere consumatorului obținerea în scopurile dumneavoastră esențiale cu o întrerupere neglijabilă. S-ar putea să nu fii treaz și să te descurci în intervalul de timp sub 5 minute pe care te bazezi pentru un remediu HA, dar ai fi operațional mult mai rapid decât ai fi dacă ai fi avut experiență să reziste timp de 7 câteva ore pentru ca AWS să obțină operațiunile sale din nou la linie.

Disponibilitatea software-ului

Pe termen lung, configurarea pentru HA este totul despre configurarea pentru a fi sigur de disponibilitatea substanțială a aplicației dvs. Puteți genera FCIs care vor garanta HA a mașinilor virtuale și stocarea fără probleme. Toți furnizorii de asistență cloud sunt obișnuiți să vă găzduiască la acel nivel. Totuși, pentru HA corectă de la încheiere la încheiere, trebuie să acordați atenție suplimentară tuturor celorlalte legături din lanțul de disponibilitate. Unii vor fi mai slabi decât recunoașteți, cu excepția faptului că luați măsuri în exces pentru a le întări.

Dave Bermingham, evanghelist tehnic senior, SIOS Inovație tehnologică