Fortalecimento da cadeia de disponibilidade | ITProPortal

Publicados: 2022-01-10

O que você acredita inicialmente quando pensa em garantir a disponibilidade superior (HA) de seus aplicativos e detalhes mais importantes? Se você ou seus usuários precisam ser capazes de acessar esses aplicativos 99,99% do tempo, é natural pensar primeiro sobre como garantir o acesso às fontes de computação e armazenamento. Se você estiver trabalhando no SQL Server na nuvem, por exemplo, você pode configurar uma Instância de Cluster de Failover (FCI) do Windows Home para responder à falha de fontes de computação ou armazenamento, indo instantaneamente as cargas de computação e armazenamento para um nó alternativo do cluster de failover. Problema HA resolvido!

Mas e se não forem os meios de computação ou armazenamento que não tiverem êxito? Existem muitos backlinks na cadeia de disponibilidade conectando você e seus compradores a recursos de computação e armazenamento individuais. Você precisa pensar em todos esses links para garantir a experiência de trabalho de HA que você está se esforçando para alcançar.

Disponibilidade de rede

Se você estiver operando seus aplicativos importantes na nuvem, sua empresa de suporte à nuvem garantirá a disponibilidade da intranet conectando os fatores de sua infraestrutura em nuvem. AWS, Azure e Google Cloud System fornecem velocidade superior, redes internas robustas com vários caminhos, de modo que as principais redes de nuvem são absolutamente capazes de oferecer suporte ao seu destino de HA de 99,99 pc.

Você simplesmente não pode gerenciar como seus compradores se vinculam a seus programas baseados em nuvem, mas você pode controlar como você se junta a eles. Você pode estar empregando um VPN Gateway ou serviços de conectividade dedicados, como Azure ExpressRoute, AWS Direct Connect ou Google Direct Interconnect. Todas essas soluções podem fornecer uma conexão de velocidade significativa e latência muito baixa com a nuvem, mas todas oferecem SLAs diferentes — e muitas delas expõem backlinks fracos na cadeia de disponibilidade. A configuração padrão do Azure ExpressRoute oferece apenas uma disponibilidade de 99,95 pc, garantindo que a configuração essencial do AWS Immediate Join seja ainda menor – apenas 99,9 pc. Na verdade, as VMs configuradas para HA nas nuvens do Azure ou AWS podem continuar operando sem interrupção - mas isso é muito fácil e confortável se você não puder acessá-las porque o ExpressRoute ou o Immediate Join está inativo.

Você pode configurar o Azure ExpressRoute ou o AWS Immediate Connect para HA, basta organizar. Você precisará configurar pelo menos dois circuitos ExpressRoute e 4 circuitos de junção imediata para adquirir um SLA de 99,99%. Se você estiver usando provedores análogos no GCP, convém usar a Assistência de interconexão imediata do Google para aplicativos em estágio de criação em vez dos serviços de interconexão imediata do Google para aplicativos não críticos para obter o SLA de 99,99 pc.

Disponibilidade de infraestrutura

Mesmo se você reforçar os links unidirecionais fracos na rede, continuará havendo links fracos potenciais dentro da própria infraestrutura de nuvem – entre balanceadores de carga, servidores DNS, servidores de identidade e autenticação, farms de servidores de sites e similares. Não se esqueça da interrupção realmente pública no Facebook em outubro de 2021? As interrupções que influenciam a entrada nos servidores DNS internos do Facebook – não os métodos de produção que suportam as principais tendências de negócios do Facebook – eram confiáveis para derrubar todo o negócio por horas. Você precisa olhar para esses componentes de sua infra-estrutura geral de forma tão eficaz para certificar-se de que você está totalmente configurado para HA.

O SLA do Google para soluções de servidor DNS é de 100 pc, o que é encorajador, mas seu SLA para empresas de Cloud Id é de apenas 99,9%. Da mesma forma, o suporte a DNS não público do Route 53 da AWS se esforça para fornecer um SLA de 100%, mas sua oferta de soluções de diretório atinge 99,9%. Os produtos e serviços fundamentais e de qualidade do Azure Energetic Directory oferecem um SLA de 100 pc, mas o SLA para os serviços do Especialista em Domínio de Listagem Ativa do Azure chega a 99,9%.

Assim como na conectividade da comunidade, há questões que podem ser feitas para aumentar a confiabilidade da infraestrutura interna que dá suporte a seus aplicativos vitais baseados em nuvem. Por exemplo, você pode configurar seu ambiente natural da AWS com muitos controladores de área, o que pode fortalecer a confiabilidade dos produtos e serviços da listagem da AWS que se aproximam dos graus de acessibilidade de 99,99% que você procura.

A alternativa multinuvem

Há períodos, no entanto, como na interrupção de 7 horas da AWS de 7 de dezembro de 2021, em que até as empresas mais bem preparadas podem se deparar com um tempo de inatividade imprevisto. Na circunstância da interrupção da AWS, os problemas não se originaram de dispositivos que os clientes em potencial estavam usando, mas, como observa a AWS, de problemas ocorridos em uma comunidade interna feita “para hospedar serviços fundamentais, como monitoramento, DNS interno, produtos e serviços de autorização, e elementos do plano de comando do EC2. e serviços, balanceadores de carga e outras peças cuja capacidade de operar adequadamente foi comprometida pelas consequências em cascata dos erros ocorridos na comunidade do interior.

Como seus aplicativos podem continuar operacionais e acessíveis quando o backlink fraco na cadeia de disponibilidade acaba sendo a própria nuvem? Sua maior possibilidade neste artigo é depender de uma resposta de recuperação de catástrofe (DR) de várias nuvens. Basicamente, você desenvolveria uma infraestrutura de espelho para dar suporte aos seus programas mais vitais em uma nuvem completamente individual. Se sua infraestrutura crucial do SQL Server opera na AWS, por exemplo, você produziria uma ocasião semelhante do SQL Server no Azure ou GCP, uma ocasião em que você poderia iniciar manualmente se a nuvem da AWS ficasse offline. Você desejará escolher uma resposta de administração de DR que seja executada nos ambientes AWS e Azure/GCP e que possa orquestrar rapidamente a replicação de informações da instância do SQL Server na AWS para armazenamento conectado à infraestrutura em seu ambiente de nuvem Azure/GCP. Se você realmente não implantar a opção de administração de DR semelhante nos dois ambientes, possivelmente não poderá replicar adequadamente seu conhecimento envolvendo as nuvens.

Você também desejará configurar um relacionamento de comunidade privada digital (VPN) de velocidade substancial entre suas infraestruturas principal e de DR. AWS, Azure e GCP, todos apresentam produtos e serviços de VPN que podem permitir um link seguro de nuvem para nuvem (e também existem alternativas de 3ª reunião), e isso se tornará o canal pelo qual sua resposta de gerenciamento de DR replicará sua informações significativas entre as infraestruturas de nuvem. É claro que, se você estiver usando um AWS VPN Remedy em dezembro, ele pode ter ficado offline durante a interrupção – mas, nesse cenário, tudo bem. A resolução de administração de DR gerenciada na AWS replica todas as operações de gravação de vizinhança para sua contraparte de armazenamento na infraestrutura de DR tão prontamente quanto a comunidade permitir, de modo que, quando os provedores da AWS ficarem offline, o software de DR teria replicado tudo (ou quase todos) dos dados vitais da AWS para a infraestrutura de DR. Assim que ficou claro que a nuvem principal não estava off-line, você aumentaria a infraestrutura na nuvem de DR e ela poderia começar a fornecer informações ao consumidor para seus objetivos essenciais com interrupção insignificante. Você pode não estar pronto e gerenciando no prazo de menos de 5 minutos com o qual você conta com uma solução de HA, mas você estaria operando muito mais rapidamente do que estaria se tivesse esperado por 7 horas para que a AWS recebesse suas operações de volta em linha.

Disponibilidade de software

A longo prazo, configurar para HA é configurar para garantir a disponibilidade substancial de seu aplicativo. Você pode gerar FCIs que garantirão a HA de suas VMs e armazenamento sem problemas. Todos os fornecedores de assistência em nuvem estão acostumados a acomodá-lo nesse nível. Para HA de conclusão a conclusão correta, porém, você precisa prestar mais atenção a todos os outros links de retorno na cadeia de disponibilidade. Alguns serão mais fracos do que você reconhece, a menos que você tome maneiras excessivas de fortalecê-los.

Dave Bermingham, Evangelista Técnico Sênior, SIOS Inovação Tecnológica