Memperkuat rantai ketersediaan | ITProPortal
Diterbitkan: 2022-01-10Apa yang Anda pikirkan pada awalnya ketika mempertimbangkan untuk memastikan ketersediaan superior (HA) dari aplikasi dan detail terpenting Anda? Jika Anda atau pelanggan Anda harus dapat mengakses aplikasi ini 99,99 pc setiap saat, adalah wajar untuk menganggap pertama tentang menjamin aksesibilitas ke sumber komputasi dan penyimpanan. Jika Anda menggunakan SQL Server di cloud, misalnya, Anda dapat mengonfigurasi Instance Failover Cluster (FCI) windows Home untuk merespons kegagalan sumber komputasi atau penyimpanan dengan langsung mengalihkan beban komputasi dan penyimpanan ke node alternatif dari cluster failover. Masalah HA terpecahkan!
Tapi bagaimana jika bukan berarti komputasi atau penyimpanan yang tidak berhasil? Ada banyak tautan balik dalam rantai ketersediaan yang menghubungkan Anda dan pembeli ke sumber daya komputasi dan penyimpanan individu. Anda perlu memikirkan semua tautan itu untuk memastikan pengalaman kerja HA yang ingin Anda capai.
Ketersediaan jaringan
Jika Anda menjalankan aplikasi penting Anda di cloud, perusahaan dukungan cloud Anda akan memastikan ketersediaan intranet yang menghubungkan faktor-faktor infrastruktur cloud Anda. AWS, Azure, dan Google Cloud System semuanya memberikan kecepatan superior, jaringan interior kokoh dengan sejumlah jalur, sehingga jaringan cloud inti benar-benar mampu mendukung target HA 99,99 pc Anda.
Anda tidak dapat mengatur bagaimana pembeli Anda menautkan ke sebagian besar program berbasis cloud Anda, tetapi Anda dapat memerintahkan bagaimana Anda bergabung dengan mereka. Anda mungkin menggunakan VPN Gateway atau layanan konektivitas khusus seperti Azure ExpressRoute, AWS Direct Connect, atau Google Direct Interconnect. Semua solusi ini dapat memberi Anda kecepatan yang signifikan, koneksi latensi yang sangat rendah ke cloud, tetapi semuanya menyediakan SLA yang berbeda—dan banyak di antaranya mengekspos backlink yang lemah dalam rantai ketersediaan. Konfigurasi standar Azure ExpressRoute hanya memberikan ketersediaan 99,95 pc memastikan konfigurasi penting dari AWS Immediate Join bahkan lebih rendah – hanya 99,9 pc Jika kemungkinan penyedia gagal tiba-tiba, aksesibilitas ke aplikasi penting Anda dapat dibatasi untuk waktu yang jauh lebih lama daripada yang Anda antisipasi. Sebenarnya, VM yang dikonfigurasi untuk HA di awan Azure atau AWS dapat terus beroperasi tanpa gangguan—tetapi itu adalah kemudahan dan kenyamanan yang dingin jika Anda tidak dapat mengaksesnya karena ExpressRoute atau Gabung Segera sedang tidak aktif.
Anda dapat mengonfigurasi Azure ExpressRoute atau AWS Immediate Connect untuk HA yang memerlukan pengaturan. Anda perlu mengonfigurasi setidaknya dua sirkuit ExpressRoute dan 4 sirkuit Gabung Segera untuk memperoleh SLA sebesar 99,99%. Jika Anda menggunakan penyedia analog di GCP, Anda sebaiknya menggunakan Bantuan Interkoneksi Langsung Google untuk Aplikasi Tahap Pembuatan dibandingkan Layanan Interkoneksi Langsung Google untuk Aplikasi yang tidak penting untuk mendapatkan SLA 99,99 pc.
Ketersediaan infrastruktur
Meskipun Anda mendukung tautan satu arah yang lemah di jaringan, tetap ada tautan balik yang lemah di dalam infrastruktur cloud itu sendiri—di antara penyeimbang beban, server DNS, server identitas dan otentikasi, kumpulan server situs web, dan sejenisnya. Jangan lupa benar-benar pemadaman publik di Facebook pada Oktober 2021? Pemadaman yang memengaruhi akses ke server DNS internal Facebook—bukan metode produksi yang mendukung jenis bisnis utama Facebook—dapat diandalkan untuk menghentikan bisnis penuh selama berjam-jam. Anda perlu melihat komponen infrastruktur umum Anda ini secara efektif untuk memastikan bahwa Anda benar-benar dikonfigurasi untuk HA.
SLA Google untuk solusi server DNS adalah 100 pc, yang menggembirakan, tetapi SLA untuk perusahaan Cloud Id hanya 99,9 persen. Demikian pula, dukungan DNS non-publik Route 53 AWS berusaha untuk menyediakan SLA 100 persen, tetapi penawaran Directory Solutions-nya mencapai 99,9 persen. Produk dan Layanan Azure Energetic Directory Fundamental and Quality memberikan 100 pc SLA, tetapi SLA untuk layanan Azure Active Listing Domain Expert mencapai 99,9 persen.
Seperti halnya konektivitas komunitas, ada beberapa masalah yang dapat dilakukan untuk meningkatkan kepercayaan infrastruktur dalam yang mendukung aplikasi penting berbasis cloud Anda. Misalnya, Anda dapat mengonfigurasi lingkungan alami AWS Anda dengan banyak pengontrol area, yang dapat memperkuat ketergantungan Produk dan layanan AWS Listing yang menampilkan lebih dekat ke tingkat aksesibilitas 99,99 persen yang Anda cari.
Alternatif multi-cloud
Namun, ada periode, seperti pada pemadaman AWS 7 jam pada tanggal 7 Desember 2021, di mana bahkan perusahaan yang paling siap sekalipun mungkin mengalami waktu henti yang tidak terduga. Dalam keadaan pemadaman AWS, masalah tidak berasal dari perangkat yang digunakan prospek, tetapi, seperti yang dicatat AWS, dari masalah yang terjadi pada komunitas internal yang dibuat “untuk menghosting layanan dasar, seperti pemantauan, DNS dalam, produk dan layanan otorisasi, dan elemen bidang perintah EC2.”* Bahkan, dalam beberapa kondisi, VM tempat aplikasi pelanggan telah mengelola tetap beroperasi dan sepenuhnya sesuai dengan HA SLA—namun klien tidak dapat mengakses aplikasi mereka karena masalah dengan gateway, produk DNS internal dan layanan, penyeimbang beban, dan bagian lain yang kemampuannya untuk beroperasi dengan benar terganggu oleh konsekuensi berjenjang dari kesalahan yang terjadi pada komunitas interior.
Bagaimana aplikasi Anda dapat terus beroperasi dan dapat diakses ketika backlink yang lemah dalam rantai ketersediaan ternyata adalah cloud itu sendiri? Kemungkinan terbesar Anda dalam artikel ini adalah bergantung pada jawaban multi-cloud catastrophe recovery (DR). Pada dasarnya, Anda akan mengembangkan infrastruktur cermin untuk mendukung program terpenting Anda di cloud yang sepenuhnya individual. Jika infrastruktur SQL Server penting Anda beroperasi di AWS, misalnya, Anda akan menghasilkan kejadian serupa dari SQL Server di Azure atau GCP, kesempatan Anda dapat memulai secara manual jika AWS cloud offline. Anda akan ingin memilih jawaban administrasi DR yang berjalan di lingkungan AWS dan Azure/GCP dan yang dapat dengan cepat mengatur replikasi informasi dari instans SQL Server di AWS ke penyimpanan yang terhubung ke infrastruktur di lingkungan cloud Azure/GCP Anda. Jika Anda benar-benar tidak menerapkan opsi administrasi DR serupa di dua lingkungan, Anda mungkin tidak mereplikasi pengetahuan Anda dengan tepat di cloud.
Anda juga akan ingin mengonfigurasi hubungan komunitas pribadi digital (VPN) berkecepatan tinggi di antara infrastruktur utama dan DR Anda. AWS, Azure, dan GCP semuanya menghadirkan produk dan layanan VPN yang dapat mengizinkan tautan cloud-to-cloud yang aman (dan juga ada alternatif pertemuan ketiga), dan ini akan menjadi saluran di mana jawaban manajemen DR Anda mereplikasi jawaban Anda. informasi penting antara infrastruktur cloud. Tentu saja, jika Anda telah menggunakan AWS VPN Remedy pada bulan Desember, itu mungkin sudah lama offline selama pemadaman – tetapi dalam skenario ini tidak apa-apa. Pengelolaan resolusi administrasi DR di AWS mereplikasi semua operasi penulisan lingkungan ke mitra penyimpanannya di infrastruktur DR secepat yang dimungkinkan oleh komunitas, jadi pada saat penyedia AWS offline, perangkat lunak DR akan mereplikasi semua (atau hampir semua) data AWS vital ke infrastruktur DR. Segera setelah terbukti bahwa cloud utama tidak hadir secara offline, Anda akan meningkatkan infrastruktur di cloud DR dan itu dapat mulai memberikan akses konsumen ke tujuan penting Anda dengan gangguan yang dapat diabaikan. Anda mungkin tidak bangun dan mengelola dalam jangka waktu kurang dari 5 menit yang Anda andalkan dari solusi HA, tetapi Anda akan beroperasi secara signifikan lebih cepat daripada jika Anda pernah menunggu selama 7 jam agar AWS mendapatkan operasinya kembali on line.
Ketersediaan perangkat lunak
Dalam jangka panjang, mengonfigurasi untuk HA adalah tentang mengonfigurasi untuk memastikan ketersediaan substansial aplikasi Anda. Anda dapat menghasilkan FCI yang akan menjamin HA VM dan penyimpanan Anda tanpa masalah. Semua vendor bantuan cloud terbiasa mengakomodasi Anda di level itu. Namun, untuk HA kesimpulan-ke-kesimpulan yang benar, Anda perlu memberikan kesadaran tambahan ke semua tautan balik lainnya dalam rantai ketersediaan. Beberapa akan lebih lemah dari yang Anda kenal kecuali Anda mengambil cara yang berlebihan untuk memperkuat mereka.
Dave Bermingham, Penginjil Teknis Senior, Inovasi Teknologi SIOS