Introdução à continuidade dos negócios e recuperação de desastres

Este tópico descreve os principais casos de uso para replicação e failover em regiões e plataformas de nuvem. A funcionalidade de replicação e failover/failback do Snowflake é composta dos seguintes recursos:

Coletivamente, esses recursos individuais são projetados para oferecer suporte a uma série de diferentes cenários empresariais fundamentais de continuidade, inclusive:

  • Failovers planejados: para simulações de recuperação de desastres a fim de testar a preparação bem como medir tempo e ponto de recuperação.

  • Failovers não planejados: no caso de uma interrupção em uma região ou uma plataforma de nuvem, promova objetos de conta e bancos de dados secundários em outra região ou plataforma de nuvem para servir como objetos primários de leitura-gravação.

  • Migração: mova sua conta Snowflake para uma região ou plataforma de nuvem diferente sem impactar seus negócios. Por exemplo, para manter a continuidade dos negócios durante fusões e aquisições, ou facilitar uma mudança na estratégia de nuvem.

  • Múltiplos secundários legíveis: objetos de conta e bancos de dados podem ser replicados para várias contas em diferentes regiões e plataformas de nuvem, mitigando o risco de interrupções em múltiplas regiões ou plataformas de nuvem.

Além disso, o Snowflake Secure Data Sharing e a replicação de banco de dados permitem o compartilhamento seguro de dados entre regiões e plataformas de nuvem.

Neste tópico:

Recursos de replicação e failover/failback de conta

Replicação e failover/failback

A replicação usa dois objetos do Snowflake, grupo de replicação e grupo de failover, para replicar um grupo de objetos com consistência pontual de uma conta de origem para uma ou mais contas de destino. Um grupo de replicação permite aos clientes especificar o que replicar, para onde replicar e com que frequência. Isso significa especificar quais objetos replicar, para quais regiões ou plataformas de nuvem e em intervalos programados personalizáveis. Um grupo de failover permite a replicação e failover dos objetos de conta em um grupo.

Os objetos de conta podem incluir warehouses, usuários e funções, juntamente com bancos de dados e compartilhamentos (consulte Objetos replicados para obter a lista completa de objetos que podem ser incluídos em um grupo de replicação ou failover). Os objetos de conta podem ser agrupados em um ou vários grupos.

No caso de failover, a replicação de contas permite o failover de sua conta para uma região ou plataforma de nuvem diferente. Cada grupo de replicação e failover tem seu próprio cronograma de replicação, permitindo definir a frequência de replicação em diferentes intervalos para diferentes grupos de objetos. No caso de grupos de failover, também é permitido o failover de grupos individualmente. Você pode escolher executar o failover de todos os grupos de failover ou apenas selecionar grupos de failover.

Redirecionamento do cliente

O Redirecionamento do cliente fornece uma URL de conexão que pode ser usada pelos clientes Snowflake para se conectar ao Snowflake. A URL de conexão pode redirecionar clientes Snowflake para uma conta Snowflake diferente, conforme a necessidade.

Continuidade dos negócios e recuperação de desastres

No caso de uma interrupção maciça (devido a um problema de rede, bug de software, etc.) que afete os serviços de nuvem em uma determinada região, o acesso ao Snowflake não estará disponível até que a fonte da interrupção seja resolvida e os serviços sejam restaurados. Para garantir a disponibilidade contínua e durabilidade dos dados em tal cenário, replique seus objetos de bancos de dados críticos para outra conta Snowflake em sua organização em uma região diferente.

Com a replicação assíncrona, as réplicas secundárias normalmente ficam atrasadas em relação aos objetos primários, com base no cronograma de replicação que você configura. Por exemplo, se você optar por replicar um grupo primário de replicação ou failover a cada 30 minutos, os objetos secundários de réplica no grupo ficarão no máximo 30 minutos atrás dos primários durante uma interrupção.

Dependendo de suas necessidades comerciais, você pode optar por:

  • Recupere leituras primeiro para permitir que os aplicativos clientes leiam os dados que estão 30 minutos desatualizados.

  • Recupere gravações primeiro para reconciliar os últimos 30 minutos de dados no novo primário antes de abrir as leituras dos aplicativos clientes.

  • Recupere leituras e gravações simultaneamente, ou seja, abra leituras dos aplicativos clientes de dados que estão 30 minutos desatualizados enquanto reconcilia os últimos 30 minutos de dados no novo primário.

Estado normal: a região está operacional

  1. Replicação de objetos de conta: replique o(s) grupo(s) de failover com objetos de contas críticos para uma ou mais contas Snowflake em regiões diferentes da região da conta que armazena o(s) grupo(s) primário(s) de failover (de origem). Atualize o(s) grupo(s) de failover frequentemente.

Interrupção da região

Para priorizar tanto a leitura como a gravação, siga as etapas em um dos cenários de exemplo a seguir. Quando uma interrupção ocorre em uma região, opte por fazer failover do(s) grupo(s) de failover críticos e das conexões dos clientes Snowflake ao mesmo tempo.

Leituras antes de gravações

Quando uma interrupção em uma região resulta em perda total ou parcial da disponibilidade do Snowflake, esse caminho permite que você redirecione os clientes do Snowflake para réplicas somente leitura dos objetos de conta em grupo(s) de failover crítico(s) primeiro, para ter um tempo mínimo de inatividade. A escolha de operar em modo somente leitura é muitas vezes desejável durante interrupções de curto prazo.

Uma interrupção a longo prazo combinada com a necessidade dos dados mais recentes requer o modo de leitura-gravação.

  1. Redirecionamento do cliente: aponte a URL de conexão utilizada pelos clientes para uma conta Snowflake que armazena seu(s) grupo(s) de failover de réplicas somente leitura (secundários).

  2. Failover (quando necessário): no caso de uma interrupção a longo prazo, promova o(s) grupo(s) de failover secundário(s) na conta Snowflake para onde sua URL de conexão está apontando para servir como grupo(s) de failover primários de leitura-gravação.

Gravações antes de leituras

Quando uma interrupção em uma região resulta em perda total ou parcial da disponibilidade do Snowflake, esse caminho permite recuperar grupo(s) de failover com objetos de conta críticos e continuar a processar os dados primeiro. Esta opção é preferível para administradores de conta que querem realizar o failover de seus processos de bancos de dados e ETL (Extrair, Transformar, Carregar) primeiro e depois escolher redirecionar clientes Snowflake somente quando os dados estiverem atuais.

  1. Failover: promova o(s) grupo(s) de failover secundário(s) com objetos de conta críticos em uma região diferente para servir como grupo(s) de failover primário(s), o que possibilita a gravação para os objetos de conta incluídos em cada grupo de failover. Uma vez que os bancos de dados no(s) grupo(s) sejam graváveis, você pode usar seus processos ETL para priorizar gravações e reconciliar dados.

  2. Redirecionamento do cliente (quando necessário): aponte a URL de conexão utilizada pelos clientes para a conta Snowflake que armazena o(s) novo(s) grupo(s) de failover primários.

Estado normal: a interrupção foi resolvida

  1. Replicação: atualize o(s) grupo(s) de failover na conta Snowflake na região onde ocorreu a interrupção.

  2. Failback: promova o(s) grupo(s) de failover na conta Snowflake onde ocorreu a interrupção para servirem novamente como grupo(s) de failover primários.

  3. Redirecionamento do cliente: Aponte a URL de conexão utilizada pelos clientes para a conta Snowflake na região onde ocorreu a interrupção.

Migração de contas

A migração de contas é o processo de migração (ou transferência) uma única vez dos objetos Snowflake e seus dados armazenados para uma conta em outra região ou em uma plataforma de nuvem diferente. As razões típicas para a migração de sua conta incluem uma maior proximidade com sua base de usuários ou uma preferência por uma plataforma de nuvem diferente, com base em sua estratégia corporativa ou para colocação com outros ativos da nuvem (por exemplo, um data lake).

A replicação de objetos de conta oferece suporte à replicação de objetos de conta, como warehouses, usuários e funções, juntamente com bancos de dados e compartilhamentos. Consulte Objetos replicados para a lista completa de objetos replicados.

Nota

O failover/failback e a replicação de objetos de conta exigem Business Critical Edition (ou superior). O Snowflake pode renunciar temporariamente a esta exigência para uma migração de conta uma única vez.