Réplication des objets du compte

Cette rubrique décrit les étapes nécessaires pour répliquer les objets et les données de compte entre les comptes Snowflake de la même organisation, et maintenir la synchronisation des objets et des données. La réplication de comptes peut se produire entre des comptes Snowflake dans différentes régions et entre des plateformes Cloud.

Note

Lorsque vous mettez à niveau un compte vers Business Critical Edition (ou une version supérieure), il peut s’écouler jusqu’à 12 heures avant que les fonctionnalités de basculement ne soient disponibles.

Dans ce chapitre :

Prise en charge de la région pour la réplication et le basculement/la récupération

Les clients peuvent répliquer dans toutes les régions d’un groupe de régions. Pour effectuer une réplication entre des régions de Groupes de régions différentes (par exemple, d’une région commerciale Snowflake à une région gouvernementale Snowflake), veuillez contacter l’assistance de Snowflake afin d’autoriser l’accès.

Transition de la réplication de base de données à la réplication par groupe

Les bases de données pour lesquelles la réplication a été activée à l’aide de ALTER DATABASE doivent avoir la réplication désactivée avant qu’elles puissent être ajoutées à un groupe de réplication ou de basculement.

Note

Exécutez les instructions SQL de cette section en utilisant le rôle ACCOUNTADMIN.

Étape 1. Désactiver la réplication pour une base de données pour laquelle la réplication a été autorisée

Exécutez la fonction SYSTEM$DISABLE_DATABASE_REPLICATION pour désactiver la réplication d’une base de données principale, ainsi que de toutes les bases de données secondaires qui lui sont liées, afin de l’ajouter à un groupe de réplication ou de basculement.

Exécutez l’instruction SQL suivante depuis le compte source avec la base de données principale :

SELECT SYSTEM$DISABLE_DATABASE_REPLICATION('mydb');
Copy

Étape 2. Ajouter la base de données à un groupe de basculement principal et créer un groupe de basculement secondaire

Une fois que vous avez réussi à désactiver la réplication pour une base de données, vous pouvez ajouter la base de données principale à un groupe de basculement dans le compte source.

Ensuite, créez un groupe de basculement secondaire dans le compte cible. Lorsque le groupe de basculement secondaire est actualisé dans le compte cible, la base de données précédemment secondaire sera automatiquement ajoutée en tant que membre du groupe de basculement secondaire et actualisée avec les modifications de la base de données principale.

Pour plus de détails sur la création de groupes de basculement principaux et secondaires, voir Workflow.

Note

Lorsque vous ajoutez une base de données précédemment répliquée à un groupe de réplication ou de basculement, Snowflake ne réplique pas à nouveau les données qui ont déjà été répliquées pour cette base de données. Seules les modifications depuis la dernière actualisation sont répliquées lorsque le groupe est actualisé.

Workflow

Les instructions SQL suivantes démontrent le flux de travail pour activer la réplication des objets de compte et de base de données et pour actualiser les objets. Chaque étape est examinée en détail ci-dessous.

Note

Les exemples suivants exigent que la réplication soit activée pour les comptes source et cible. Pour plus de détails, voir Prérequis : activer la réplication des comptes dans l’organisation.

Exemples

Exécutez les instructions SQL suivantes dans votre client Snowflake préféré pour activer la réplication et le basculement des objets de compte et de base de données, et actualiser les objets.

Exécuter à partir du compte source

  1. Créez un rôle et accordez-lui le privilège CREATE FAILOVER GROUP. Cette étape est facultative :

    USE ROLE ACCOUNTADMIN;
    
    CREATE ROLE myrole;
    
    GRANT CREATE FAILOVER GROUP ON ACCOUNT
      TO ROLE myrole;
    
    Copy
  2. Créez un groupe de basculement dans le compte source et activez la réplication vers des comptes cibles spécifiques.

    Note

    • Si vous avez des bases de données à ajouter à un groupe de réplication ou de basculement qui ont été précédemment activées pour la réplication de base de données et le basculement à l’aide de ALTER DATABASE, suivez les instructions Transition de la réplication de base de données à la réplication par groupe (dans cette rubrique) avant de les ajouter à un groupe.

    • Pour ajouter une base de données à un groupe de basculement, le rôle actif doit avoir le privilège MONITOR sur la base de données. Pour plus de détails sur les privilèges de la base de données, voir Privilèges de base de données (dans une rubrique distincte).

    USE ROLE myrole;
    
    CREATE FAILOVER GROUP myfg
      OBJECT_TYPES = USERS, ROLES, WAREHOUSES, RESOURCE MONITORS, DATABASES
      ALLOWED_DATABASES = db1, db2
      ALLOWED_ACCOUNTS = myorg.myaccount2, myorg.myaccount3
      REPLICATION_SCHEDULE = '10 MINUTE';
    
    Copy

Exécuté sur le compte cible

  1. Créez un rôle dans le compte cible et accordez-lui le privilège CREATE FAILOVER GROUP. Cette étape est facultative :

    USE ROLE ACCOUNTADMIN;
    
    CREATE ROLE myrole;
    
    GRANT CREATE FAILOVER GROUP ON ACCOUNT
      TO ROLE myrole;
    
    Copy
  2. Créez un groupe de basculement dans le compte cible comme un réplica du groupe de basculement dans le compte source.

    Note

    S’il existe dans le compte cible des objets de compte (par exemple des utilisateurs ou des rôles) qui n’existent pas dans le compte source, reportez-vous à Réplication initiale des utilisateurs et des rôles avant de créer un groupe secondaire.

    USE ROLE myrole;
    
    CREATE FAILOVER GROUP myfg
      AS REPLICA OF myorg.myaccount1.myfg;
    
    Copy
  3. Actualisez manuellement le groupe de basculement secondaire. Il s’agit d’une étape facultative. Si le groupe de basculement primaire est créé avec un plan de réplication, le rafraîchissement initial du groupe de basculement secondaire est automatiquement exécuté lors de la création du groupe de basculement secondaire.

    1. Créez un rôle avec le privilège REPLICATE sur le groupe de basculement. Cette étape est facultative.

      Exécution dans le compte cible à l’aide d’un rôle doté du privilège OWNERSHIP sur le groupe de basculement :

      GRANT REPLICATE ON FAILOVER GROUP myfg TO ROLE my_replication_role;
      
      Copy
    2. Exécutez l’instruction d’actualisation à l’aide d’un rôle doté du privilège REPLICATE :

      USE ROLE my_replication_role;
      
      ALTER FAILOVER GROUP myfg REFRESH;
      
      Copy

Réplication d’objets de compte et de bases de données

Les instructions de cette section expliquent comment préparer vos comptes pour la réplication, activer la réplication d’objets spécifiques du compte source vers le compte cible, et synchroniser les objets dans le compte cible.

Important

Les comptes cibles n’ont pas Tri-Secret Secure ou une connectivité privée au service Snowflake (par exemple AWS PrivateLink) activé par défaut. Si vous avez besoin de Tri-Secret Secure ou d’une connectivité privée au service Snowflake à des fins de conformité, de sécurité ou à d’autres fins, il est de votre responsabilité de configurer et d’activer ces fonctionnalités dans le compte cible.

Prérequis : activer la réplication des comptes dans l’organisation

L’administrateur de l’organisation (rôle ORGADMIN) doit activer la réplication pour les comptes source et cible.

Pour activer la réplication pour les comptes, un utilisateur ayant le rôle ORGADMIN utilise la fonction SYSTEM$GLOBAL_ACCOUNT_SET_PARAMETER pour définir le paramètre ENABLE_ACCOUNT_DATABASE_REPLICATION sur true. Notez que plusieurs comptes dans une organisation peuvent être activés pour la réplication à partir du même compte ORGADMIN.

Connectez-vous à un compte ORGADMIN pour activer la réplication pour chaque compte source et cible de votre organisation.

USE ROLE ORGADMIN;

-- View the list of the accounts in your organization
-- Note the organization name and account name for each account for which you are enabling replication
SHOW ORGANIZATION ACCOUNTS;

-- Enable replication by executing this statement for each source and target account in your organization
SELECT SYSTEM$GLOBAL_ACCOUNT_SET_PARAMETER('<organization_name>.<account_name>', 'ENABLE_ACCOUNT_DATABASE_REPLICATION', 'true');
Copy

Bien que la fonction SYSTEM$GLOBAL_ACCOUNT_SET_PARAMETER prenne en charge l’ancien identificateur de localisateur de compte , elle donne des résultats inattendus lorsqu’une organisation possède plusieurs comptes qui partagent le même localisateur (dans différentes régions).

Étape 1 : Créer un rôle avec le privilège CREATE FAILOVER GROUP dans le compte source — Facultatif

Créez un rôle et accordez-lui le privilège CREATE FAILOVER GROUP. Cette étape est facultative. Si vous avez déjà créé ce rôle, passez à Étape 2 : Créer un groupe de basculement principal dans un compte source.

USE ROLE ACCOUNTADMIN;

CREATE ROLE myrole;

GRANT CREATE FAILOVER GROUP ON ACCOUNT
    TO ROLE myrole;
Copy

Étape 2 : Créer un groupe de basculement principal dans un compte source

Créez un groupe de basculement principal et activez la réplication et le basculement d’objets spécifiques du compte actuel (source) vers un ou plusieurs comptes cibles dans la même organisation.

Voir tous les comptes pour lesquels la réplication est activée

Pour récupérer la liste des comptes de votre organisation pour lesquels la réplication est activée, utilisez SHOW REPLICATION ACCOUNTS.

Exécutez l’instruction SQL suivante en utilisant le rôle ACCOUNTADMIN :

SHOW REPLICATION ACCOUNTS;
Copy

Renvoie :

+------------------+-------------------------------+--------------+-----------------+-----------------+-------------------+--------------+
| snowflake_region | created_on                    | account_name | account_locator | comment         | organization_name | is_org_admin |
+------------------+-------------------------------+--------------+-----------------+-----------------+-------------------+--------------+
| AWS_US_WEST_2    | 2020-07-15 21:59:25.455 -0800 | myaccount1   | myacctlocator1  |                 | myorg             | true         |
+------------------+-------------------------------+--------------+-----------------+-----------------+-------------------+--------------+
| AWS_US_EAST_1    | 2020-07-23 14:12:23.573 -0800 | myaccount2   | myacctlocator2  |                 | myorg             | false        |
+------------------+-------------------------------+--------------+-----------------+-----------------+-------------------+--------------+
| AWS_US_EAST_2    | 2020-07-25 19:25:04.412 -0800 | myaccount3   | myacctlocator3  |                 | myorg             | false        |
+------------------+-------------------------------+--------------+-----------------+-----------------+-------------------+--------------+

Voir la liste complète des IDs de région.

Afficher l’appartenance à un groupe de basculement et de réplication

Les objets de compte, de base de données et de partage ont des contraintes sur l’appartenance à un groupe. Avant de créer de nouveaux groupes ou d’ajouter des objets aux groupes existants, vous pouvez consulter la liste des groupes de basculement existants et les objets de chaque groupe.

Note

Seuls un administrateur de compte (utilisateur avec le rôle ACCOUNTADMIN) ou le propriétaire du groupe (rôle avec le privilège OWNERSHIP sur le groupe) peuvent exécuter les instructions SQL de cette section.

Voir tous les groupes de basculement liés au compte actuel et les types d’objets dans chaque groupe :

SHOW FAILOVER GROUPS;
Copy

Voir toutes les bases de données du groupe de basculement myfg :

SHOW DATABASES IN FAILOVER GROUP myfg;
Copy

Voir tous les partages du groupe de basculement myfg :

SHOW SHARES IN FAILOVER GROUP myfg;
Copy

Activer la réplication d’objets de compte et de base de données d’un compte source vers un compte cible

Créez un groupe de basculement d’objets de compte et de base de données spécifiés dans le compte source et activez la réplication et le basculement vers une liste de comptes cibles. Pour plus d’informations sur la syntaxe, voir CREATE FAILOVER GROUP.

Par exemple, activez la réplication d’utilisateurs, de rôles, d’entrepôts, de moniteurs de ressources et de bases de données db1 et db2 du compte source vers le compte myaccount2 dans la même organisation. Définissez la planification de réplication pour actualiser automatiquement myaccount2 toutes les 10 minutes.

Note

Si vous avez des bases de données à ajouter à un groupe de réplication ou de basculement pour lesquelles la réplication de base de données est activée à l’aide de ALTER DATABASE, suivez les instructions Transition de la réplication de base de données à la réplication par groupe (dans cette rubrique) avant de les ajouter à un groupe.

Exécution sur le compte source :

USE ROLE myrole;

CREATE FAILOVER GROUP myfg
    OBJECT_TYPES = USERS, ROLES, WAREHOUSES, RESOURCE MONITORS, DATABASES, INTEGRATIONS, NETWORK POLICIES
    ALLOWED_DATABASES = db1, db2
    ALLOWED_INTEGRATION_TYPES = API INTEGRATIONS
    ALLOWED_ACCOUNTS = myorg.myaccount2
    REPLICATION_SCHEDULE = '10 MINUTE';
Copy

Étape 3 : Créer un rôle avec le privilège CREATE FAILOVER GROUP dans le compte cible — Facultatif

Créez un rôle dans le compte cible et accordez-lui le privilège CREATE FAILOVER GROUP. Cette étape est facultative. Si vous avez déjà créé ce rôle, passez à Étape 4 : Créer un groupe de basculement secondaire dans le compte cible.

USE ROLE ACCOUNTADMIN;

CREATE ROLE myrole;

GRANT CREATE FAILOVER GROUP ON ACCOUNT
    TO ROLE myrole;
Copy

Étape 4 : Créer un groupe de basculement secondaire dans le compte cible

Note

S’il existe dans le compte cible des objets de compte (par exemple des utilisateurs ou des rôles) qui n’existent pas dans le compte source, reportez-vous à Réplication initiale des utilisateurs et des rôles avant de créer un groupe secondaire.

Créez un groupe de basculement secondaire dans le compte cible en tant que réplica du groupe de basculement principal dans le compte source.

Exécutez une instruction CREATE FAILOVER GROUP … AS REPLICA OF dans chaque compte cible pour lequel vous avez activé la réplication dans Étape 2 : Créer un groupe de basculement principal dans un compte source (dans cette rubrique).

Exécution à partir de chaque compte cible :

USE ROLE myrole;

CREATE FAILOVER GROUP myfg
  AS REPLICA OF myorg.myaccount1.myfg;
Copy

Étape 5. Créez manuellement un groupe de basculement secondaire dans le compte cible — Facultatif

Pour actualiser manuellement les objets d’un compte cible, exécutez la commande ALTER FAILOVER GROUP … REFRESH.

Nous vous recommandons de planifier vos actualisations secondaires en définissant le paramètre REPLICATION_SCHEDULE à l’aide de CREATE FAILOVER GROUP ou ALTER FAILOVER GROUP.

Note

Si l’utilisateur qui appelle la fonction dans le compte cible a été détruit dans le compte source, l’opération d’actualisation échoue.

Accordez le privilège REPLICATE sur le groupe de basculement au rôle — Facultatif

Pour exécuter la commande d’actualisation d’un groupe de réplication ou de basculement secondaire dans le compte cible, vous devez utiliser un rôle doté du privilège REPLICATE sur le groupe de basculement. Le privilège REPLICATE est actuellement non répliqué et doit être accordé à un groupe de basculement (ou de réplication) dans les comptes source et cible.

Exécution de cette instruction à partir du compte source en utilisant un rôle doté du privilège OWNERSHIP sur le groupe :

GRANT REPLICATE ON FAILOVER GROUP myfg TO ROLE my_replication_role;
Copy

Exécution de cette instruction à partir du compte cible en utilisant un rôle doté du privilège OWNERSHIP sur le groupe :

GRANT REPLICATE ON FAILOVER GROUP myfg TO ROLE my_replication_role;
Copy

Actualiser manuellement un groupe de basculement secondaire

Par exemple, pour actualiser les objets du groupe de basculement myfg, exécutez l’instruction suivante à partir du compte cible :

USE ROLE my_replication_role;

ALTER FAILOVER GROUP myfg REFRESH;
Copy

Appliquer des IDs globaux à des objets créés par des scripts dans des comptes cibles

Si vous avez créé des objets de compte, par exemple des utilisateurs et des rôles, dans votre compte cible par un moyen autre que via la réplication (par exemple en utilisant des scripts), ces utilisateurs et rôles n’ont pas d’identificateur global par défaut. L’opération d’actualisation utilise des identificateurs globaux pour synchroniser ces objets avec les mêmes objets dans le compte source.

Dans la plupart des cas, lorsqu’un compte cible est actualisé à partir du compte source, l’opération d’actualisation détruit tous les objets de compte des types de la liste OBJECT_TYPES du compte cible qui n’ont pas d’identificateur global. La réplication initiale des utilisateurs et des rôles vers un compte cible peut toutefois entraîner l’échec de la première opération d’actualisation. Pour plus de détails sur ce comportement, reportez-vous à Réplication initiale des utilisateurs et des rôles.

Réplication initiale des utilisateurs et des rôles

Le comportement de l’opération d’actualisation initiale pour les types d’objets USERS et ROLES peut varier selon qu’il existe ou non des objets correspondants portant le même nom dans le compte cible.

Note

  • Le comportement décrit dans cette section ne s’applique que la première fois que ces types d’objets sont répliqués sur le compte cible.

  • Les scénarios ci-dessous décrivent la réplication de USERS. Il en va de même pour la réplication de ROLES.

  • S’il existe dans le compte cible des utilisateurs portant le même nom que des utilisateurs du compte source, l’opération d’actualisation initiale échoue et décrit les deux options à votre disposition pour continuer :

    • Forcer l’opération d’actualisation et permettre la suppression de tout utilisateur existant dans le compte cible. Les utilisateurs du compte source seront répliqués dans le compte cible.

      Pour forcer l’actualisation d’un groupe, utilisez le paramètre FORCE de la commande refresh. Par exemple, pour forcer l’actualisation d’un groupe de basculement, exécutez la commande suivante :

      ALTER FAILOVER GROUP <fg_name> REFRESH FORCE;
      
      Copy
    • Lier les objets du compte par leur nom. La fonction SYSTEM$LINK_ACCOUNT_OBJECTS_BY_NAME relie les utilisateurs portant le même nom dans le compte cible et le compte source. Les utilisateurs du compte cible qui sont liés ne sont pas supprimés.

      Pour lier les comptes par leur nom, exécutez la commande suivante :

      SELECT SYSTEM$LINK_ACCOUNT_OBJECTS_BY_NAME('<rg_name>');
      
      Copy

      Note

      Tout utilisateur dans le compte cible qui n’a pas d’utilisateur correspondant dans le compte source avec le même nom est supprimé.

  • S’il n’y a aucun utilisateur dans le compte cible dont les noms correspondent à ceux des utilisateurs du compte source, l’opération d’actualisation initiale dans le compte cible supprime tous les utilisateurs. Cela peut entraîner les pertes de données et de métadonnées suivantes :

    • Si des USERS sont inclus dans la liste OBJECT_TYPES pour un groupe de réplication ou de basculement :

      • Les feuilles de calcul sont perdues.

      • L’historique des requêtes est perdu.

    • Si des USERS sont inclus dans la liste OBJECT_TYPES, mais pas de ROLES :

      • Les privilèges accordés aux utilisateurs sont perdus.

    • Si des ROLES sont inclus dans la liste OBJECT_TYPES :

      • Les privilèges accordés pour partager des objets sont perdus.

Pour éviter de supprimer des utilisateurs ou des rôles dans le compte cible :

  1. Dans le compte source, recréez manuellement les utilisateurs ou les rôles qui n’existent que dans le compte cible avant la réplication initiale.

  2. Dans le compte cible, reliez les objets correspondants portant le même nom dans les deux comptes à l’aide de la fonction SYSTEM$LINK_ACCOUNT_OBJECTS_BY_NAME.

Configurer l’accès au stockage dans le Cloud pour les intégrations de stockage secondaire

Si vous activez la réplication de l’intégration de stockage, vous devez prendre des mesures supplémentaires après la réplication de l’intégration de stockage sur les comptes cibles. L’intégration répliquée possède sa propre entité de gestion des identités et des accès (IAM) qui est différente de l’identité et de l’entité IAM de l’intégration principale. Par conséquent, vous devez mettre à jour les autorisations de votre fournisseur Cloud afin d’accorder à l’intégration répliquée l’accès à votre stockage sur le Cloud.

Vous ne devez configurer cette relation de confiance sur les comptes cibles qu’une seule fois.

Le processus est similaire à l’attribution d’un accès au compte source. Pour plus d’informations, consultez les pages suivantes :

Configuration de l’actualisation automatique des tables de répertoire sur les zones de préparation secondaires

Si vous répliquez une zone de préparation externe avec une table de répertoire et que vous avez configuré l’actualisation automatique pour la table de répertoire source, vous devez prendre des mesures pour configurer l’actualisation automatique de la table de répertoire secondaire.

La procédure est similaire à la mise en place de l’actualisation automatique dans votre compte source. Pour plus d’informations, voir ce qui suit :

Important

  • Après avoir effectué ces étapes de configuration dans votre compte cible, vous devez procéder à une actualisation complète de votre table de répertoire afin de vous assurer qu’aucune notification n’a été omise.

  • Pour Google Cloud Storage et Azure Blob Storage, le nom de l’intégration de notification dans chaque compte cible doit correspondre au nom de l’intégration de notification dans le compte source.

Configurer les notifications pour les canaux secondaires d’intégration automatique

Vous devez prendre des mesures supplémentaires pour configurer les notifications Cloud pour les canaux d’intégration automatique secondaires avant le basculement. Cette section explique pourquoi cette configuration supplémentaire est nécessaire et comment la compléter pour chaque fournisseur Cloud pris en charge.

Amazon S3

Le processus de configuration dépend de la manière dont vous avez configuré les notifications d’événements. Par exemple, supposons que vous ayez un canal d’intégration automatique qui s’appuie sur un sujet Amazon Simple Notification Service (SNS) pour publier des messages sur l’emplacement de la zone de préparation Snowflake.

Lorsque vous répliquez le canal vers un compte cible, Snowflake crée automatiquement une nouvelle file d’attente Amazon Simple Queue Service (SQS). Vous devez abonner cette file d’attente SQS pour votre compte cible au sujet SNS pour recevoir des notifications sur l’emplacement de la zone de préparation.

Stockage d’objets blob Microsoft Azure

Un canal qui charge automatiquement des données à partir de fichiers situés sur une zone de préparation dans le stockage blob de Microsoft Azure nécessite un abonnement Event Grid, une file d’attente de stockage et une intégration de notification liée à la file d’attente de stockage. Un canal secondaire dans un compte cible nécessite un Event Grid distinct, une file d’attente de stockage et une intégration de notification liée à la file d’attente de stockage. Event Grid des comptes source et cible doit être configuré en tant que points de terminaison pour la même source Azure Storage.

Voir le diagramme ci-dessous pour les détails de la configuration :

Pipe replication for Azure

Suivez les instructions détaillées dans Configuration de l’automatisation avec Azure Event Grid pour configurer l’abonnement à Event Grid et l’intégration des notifications.

Important

Le nom de l’intégration de notification dans chaque compte cible doit correspondre au nom de l’intégration de notification dans le compte source.

Zone de préparation externe pour Google Cloud Storage

Un canal qui charge automatiquement des données à partir de fichiers situés dans Google Cloud Storage nécessite un abonnement Google Pub/Sub et une intégration de notification qui fait référence à cet abonnement. Chaque canal répliqué dans un compte cible nécessite également un abonnement Google Pub/Sub et une intégration de notification qui fait référence à cet abonnement. L’abonnement Pub/Sub de chaque compte source et cible doit être souscrit au même sujet Pub/Sub qui reçoit les notifications de la source Google Cloud Storage.

Voir le diagramme ci-dessous pour les détails de la configuration :

Pipe replication for GCP

Pour des instructions détaillées sur la création d’un abonnement Pub/Sub et l’intégration des notifications, voir Configuration de l’automatisation à l’aide de Pub/Sub GCS.

Important

Le nom de l’intégration de notification dans chaque compte cible doit correspondre au nom de l’intégration de notification dans le compte source.

Mettre à jour le service distant pour les intégrations API

Si vous avez activé la réplication de l’intégration API, des étapes supplémentaires sont nécessaires après la réplication de l’intégration API sur le compte cible. L’intégration répliquée possède sa propre entité de gestion des identités et des accès (IAM) qui sont différents de l’identité et de l’entité IAM de l’intégration principale. Par conséquent, vous devez mettre à jour les autorisations sur le service distant pour accorder l’accès à des fonctions répliquées. Le processus est similaire à l’octroi d’accès à des fonctions sur le compte principal. Voir les liens ci-dessous pour plus de détails :

Surveillance de la réplication

Cette section fournit des informations sur la façon de surveiller la progression, l’historique et les coûts de réplication des comptes.

Surveiller la progression d’une actualisation de groupe de réplication ou de basculement

Pour surveiller la progression d’une actualisation de groupe de réplication ou de basculement, interrogez la fonction de table REPLICATION_GROUP_REFRESH_PROGRESS, REPLICATION_GROUP_REFRESH_PROGRESS_BY_JOB (dans le Schéma d’information de Snowflake).

Exemple

Visualiser la progression de l’opération d’actualisation la plus récente pour le groupe de basculement myfg :

SELECT PHASE_NAME, START_TIME, END_TIME, PROGRESS, DETAILS
  FROM TABLE(information_schema.replication_group_refresh_progress('myfg'));
Copy

Historique de la réplication

Pour afficher l’historique de réplication d’un groupe de réplication ou de basculement spécifique dans une période spécifiée, effectuez l’une des requêtes suivantes :

Exemples

Interrogez la fonction de table Information Schema REPLICATION_GROUP_REFRESH_HISTORY pour afficher l’historique de réplication de compte du groupe de basculement myfg au cours des 7 derniers jours :

SELECT PHASE_NAME, START_TIME, END_TIME, TOTAL_BYTES, OBJECT_COUNT
  FROM TABLE(information_schema.replication_group_refresh_history('myfg'))
  WHERE START_TIME >= current_date - interval '7 days';
Copy

Interrogez la vue REPLICATION_GROUP_REFRESH_HISTORY de Account Usage pour voir l’historique de réplication de compte pour le mois en cours :

SELECT REPLICATION_GROUP_NAME, PHASE_NAME, START_TIME, END_TIME, TOTAL_BYTES, OBJECT_COUNT
  FROM snowflake.account_usage.replication_group_refresh_history
  WHERE START_TIME >= date_trunc('month', current_date());
Copy

Surveiller les coûts de réplication

Pour surveiller l’utilisation du crédit pour la réplication, effectuez l’une des requêtes suivantes :

Exemples

Interroger la fonction de table REPLICATION_GROUP_USAGE_HISTORY pour voir les crédits utilisés pour la réplication de compte au cours des 7 derniers jours :

SELECT start_time, end_time, replication_group_name, credits_used, bytes_transferred
  FROM table(information_schema.replication_group_usage_history(date_range_start=>dateadd('day', -7, current_date())));
Copy

Interrogez la vue Account Usage REPLICATION_GROUP_USAGE_HISTORY pour voir les crédits utilisés par la réplication ou le groupe de basculement pour l’historique de réplication de compte dans le mois en cours :

SELECT start_time, 
  end_time, 
  replication_group_name, 
  credits_used, 
  bytes_transferred
FROM snowflake.account_usage.replication_group_usage_history
WHERE start_time >= DATE_TRUNC('month', CURRENT_DATE());
Copy

Surveiller les coûts de réplication des bases de données

Le coût de la réplication pour une base de données individuelle incluse dans un groupe de réplication ou de basculement peut être calculé en récupérant le nombre d’octets copiés pour la base de données et en l’associant aux crédits utilisés.

Exemples

Interrogation des vues de Account Usage

Les exemples suivants calculent les coûts de la réplication de la base de données dans un groupe de réplication pour les 30 derniers jours.

  1. Interrogez la vue REPLICATION_GROUP_REFRESH_HISTORY de Account Usage et calculez la somme du nombre d’octets répliqués par base de données.

    Par exemple, pour calculer la somme du nombre d’octets répliqués pour les bases de données du groupe de réplication myrg au cours des 30 derniers jours :

    select sum(value:totalBytesToReplicate) as sum_database_bytes
    from snowflake.account_usage.replication_group_refresh_history rh,
        lateral flatten(input => rh.total_bytes:databases)
    where rh.replication_group_name = 'MYRG'
    and rh.start_time >= current_date - interval '30 days';
    
    Copy

    Notez la sortie de la somme des octets de la base de données :

    +--------------------+
    | SUM_DATABASE_BYTES |
    |--------------------|
    |              22016 |
    +--------------------+
    
    Copy
  2. Interrogez la vue REPLICATION_GROUP_USAGE_HISTORY de Account Usage et calculez la somme du nombre de crédits utilisés et la somme des octets transférés pour la réplication.

    Par exemple, pour calculer la somme du nombre de crédits utilisés et la somme des octets transférés pour la réplication du groupe de réplication myrg au cours des 30 derniers jours :

    select sum(credits_used) as credits_used, SUM(bytes_transferred) as bytes_transferred
    from snowflake.account_usage.replication_group_usage_history
    where replication_group_name = 'MYRG'
    and start_time >= current_date - interval '30 days';
    
    Copy

    Notez la sortie de la somme des crédits utilisés et de la somme des octets transférés :

    +--------------+-------------------+
    | CREDITS_USED | BYTES_TRANSFERRED |
    |--------------+-------------------|
    |  1.357923604 |             22013 |
    +--------------+-------------------+
    
    Copy
  3. Calculez les coûts de réplication pour les bases de données en utilisant les valeurs des octets transférés pour les bases de données, la somme des crédits utilisés, et la somme de tous les octets transférés pour la réplication des deux étapes précédentes :

    (<octets_de_base_de_données_transférés> / <octets_transférés>) * <crédits_utilisés>

    Par exemple :

    (22016 / 22013) * 1.357923604 = 1.35810866)

Interrogation des fonctions de table d’Information Schema

Pour les opérations d’actualisation effectuées au cours des 14 derniers jours, interrogez les fonctions de la table Information Schema associée.

  1. Interroger la fonction de table REPLICATION_GROUP_REFRESH_HISTORY pour voir la somme du nombre d’octets copiés pour la réplication de la base de données pour le groupe de réplication myrg :

    select sum(value:totalBytesToReplicate)
      from table(information_schema.replication_group_refresh_history('myrg')) as rh,
      lateral flatten(input => total_bytes:databases)
      where rh.phase_name = 'COMPLETED'
      and rh.start_time >= current_date - interval '14 days';
    
    Copy
  2. Interroger la fonction de la table REPLICATION_GROUP_USAGE_HISTORY pour voir la somme du nombre de crédits utilisés et la somme des octets transférés pour la réplication pour le groupe de réplication myrg :

    select sum(credits_used), sum(bytes_transferred)
      from table(information_schema.replication_group_usage_history(
          date_range_start=>dateadd('day', -14, current_date()),
          replication_group_name => 'myrg'
      ));
    
    Copy

Comparaison des ensembles de données dans les bases de données principales et secondaires

Si les objets de la base de données sont répliqués dans un groupe de réplication ou de basculement, la fonction HASH_AGG peut être utilisée pour comparer les lignes d’un ensemble aléatoire de tables dans une base de données primaire et secondaire afin de vérifier la cohérence des données. La fonction HASH_AGG renvoie une valeur de hachage globale signée de 64 bits sur l’ensemble (non ordonné) des lignes d’entrée. Interrogez cette fonction sur tout ou un sous-ensemble aléatoire de tables dans une base de données secondaire et sur la base de données principale (à partir de l’horodatage de l’instantané de la base de données principale) et comparez la sortie.

Exemple

Dans les exemples ci-dessous, la base de données mydb est incluse dans le groupe de basculement myfg. La base de données mydb contient la table mytable.

Exécuté sur le compte cible

  1. Interrogez la fonction de table REPLICATION_GROUP_REFRESH_PROGRESS (dans Schéma d’information de Snowflake). Notez le primarySnapshotTimestamp dans la colonne DETAILS pour la phase PRIMARY_UPLOADING_METADATA. Il s’agit de l’horodatage du dernier instantané de la base de données principale.

    SELECT PARSE_JSON(details)['primarySnapshotTimestamp']
      FROM TABLE(information_schema.replication_group_refresh_progress('myfg'))
      WHERE PHASE_NAME = 'PRIMARY_UPLOADING_METADATA';
    
    Copy
  2. Interrogez la fonction HASH_AGG pour une table spécifiée d’une base de données secondaire. La requête suivante renvoie une valeur de hachage pour toutes les lignes de la table mytable :

    SELECT HASH_AGG( * ) FROM mytable;
    
    Copy

Exécuter à partir du compte source

  1. Interrogez la fonction HASH_AGG pour la même table dans la base de données principale. À l’aide de Time Travel, spécifiez l’horodatage auquel le dernier instantané a été pris pour la base de données secondaire :

    SELECT HASH_AGG( * ) FROM mytable AT(TIMESTAMP => '<primarySnapshotTimestamp>'::TIMESTAMP);
    
    Copy
  2. Comparez les résultats des deux requêtes. La sortie doit être identique.

Destruction d’une réplication secondaire ou d’un groupe de basculement

Vous pouvez détruire une réplication secondaire ou un basculement en utilisant la commande DROP REPLICATION GROUP ou DROP FAILOVER GROUP. Seul le propriétaire du groupe de réplication ou de basculement (c’est-à-dire le rôle ayant le privilège OWNERSHIP sur le groupe) peut détruire le groupe.

Destruction d’une réplication principale ou d’un groupe de basculement

Un groupe de réplication ou de basculement principal ne peut être détruit qu’après que toutes les répliques du groupe (c’est-à-dire les groupes de réplication ou de basculement secondaires) aient été détruites. Vous pouvez également promouvoir un groupe de basculement secondaire pour qu’il serve de groupe de basculement principal, puis supprimer l’ancien groupe de basculement principal.

Notez que seul le propriétaire du groupe peut détruire le groupe.