Réplication de bases de données sur plusieurs comptes

Cette rubrique décrit les étapes nécessaires à la réplication de bases de données sur plusieurs comptes Snowflake tout en conservant la synchronisation des objets de base de données et des données stockées. La réplication de la base de données peut se produire entre des comptes Snowflake situés dans la même région ou dans des régions différentes.

Dans ce chapitre :

Prise en charge de la région pour la réplication de la base de données et le basculement/la récupération

Toutes les régions Snowflake sur Amazon Web Services, Google Cloud Platform et Microsoft Azure prennent désormais en charge la fonctionnalité de réplication de base de données et le basculement/la récupération.

Remarque : les comptes peuvent répliquer des bases de données entre Groupes de régions (par exemple, entre Virtual Private Snowflake (VPS) et des régions mutualisées) pour faciliter le partage de données et les migrations de compte entre ces régions. Cette capacité est désactivée par défaut. Vous pouvez contacter le support Snowflake pour activer l’accès.

Interface Web pour la réplication de la base de données et basculement /récupération

Les administrateurs de comptes (utilisateurs ayant le rôle ACCOUNTADMIN) peuvent gérer les actions de réplication et de basculement/restauration dans Snowsight ou dans l”Classic Console.

Snowsight

Navigation :

Data » Databases

Promouvoir une base de données locale

  1. Connectez-vous à un compte Snowflake qui contient une base de données locale que vous souhaitez répliquer vers un ou plusieurs autres comptes.

  2. Cliquez sur le menu déroulant dans le coin supérieur gauche (à côté de votre nom de connexion) » Switch Role » ACCOUNTADMIN.

  3. Dans la partie gauche de la page Databases, cliquez sur une base de données locale dans l’explorateur d’objets de base de données. La page des détails de la base de données s’ouvre.

  4. Cliquez sur le bouton des actions () dans le coin supérieur droit de la page » Enable Replication. La boîte de dialogue Enable replication s’ouvre.

    Cette boîte de dialogue vous permet d’effectuer les actions suivantes :

    • Permettre à la base de données locale de servir de base de données principale.

    • Créer une base de données secondaire dans un ou plusieurs comptes cibles.

    • Actualiser chaque base de données secondaire une fois, après sa création.

  5. Pour chaque compte cible de cette base de données, cochez les options permettant de créer une base de données secondaire et d’actualiser la base de données.

  6. Connectez-vous au compte cible en tant qu’utilisateur à qui on a précédemment accordé le rôle ACCOUNTADMIN dans ce compte.

    Snowflake effectue les actions demandées et affiche un message de réussite.

    Gérez la réplication pour cette base de données à partir de l’onglet Replication dans les détails de la base de données.

Créer des bases de données secondaires

  1. Connectez-vous à un compte qui contient une base de données secondaire.

  2. Cliquez sur le menu déroulant dans le coin supérieur gauche (à côté de votre nom de connexion) » Switch Role » ACCOUNTADMIN.

  3. Dans la partie gauche de la page Databases cliquez sur une base de données secondaire dans l’explorateur d’objets de base de données. La page des détails de la base de données s’ouvre.

  4. Cliquez sur l’onglet Replication.

    Les actions suivantes sont disponibles à partir du bouton actions () situé dans le coin supérieur droit de la page :

    • Promouvoir la base de données secondaire comme base de données principale. Cette fonctionnalité nécessite Business Critical (ou une version supérieure).

    • Actualiser la base de données secondaire.

    • Copier un modèle pour créer une tâche qui actualise la base de données secondaire selon une planification. Coller le modèle dans une feuille de calcul Snowsight et le modifiez pour spécifier le calendrier souhaité.

Console classique

Utilisez la zone Replication de l’onglet Databases Databases tab dans l”Classic Console pour effectuer la plupart des actions liées à la configuration et à la gestion de la réplication de la base de données, y compris les actions suivantes :

  • Permettre à une base de données locale de servir de base de données principale.

  • Activer le basculement pour une base de données principale (comptes Business Critical Edition ou versions ultérieures).

  • Actualiser une base de données secondaire, une fois (manuellement) ou de manière répétée (selon un calendrier, à l’aide d’une tâche).

  • Promouvoir une base de données secondaire pour servir de base de données principale (comptes Business Critical Edition ou versions supérieures).

  • Désactiver la réplication et/ou le basculement pour une base de données principale.

Réplication d’une base de données vers un autre compte

Les instructions de cette section expliquent comment préparer vos comptes pour la réplication, promouvoir une base de données locale pour qu’elle serve de base de données principale, effectuer la réplication initiale de cette base de données principale vers un autre compte, et planifier l’actualisation de bases de données secondaires.

Important

Les comptes cibles n’ont pas Tri-Secret Secure ou une connectivité privée au service Snowflake (par exemple AWS PrivateLink) activé par défaut. Si vous avez besoin de Tri-Secret Secure ou d’une connectivité privée au service Snowflake à des fins de conformité, de sécurité ou à d’autres fins, il est de votre responsabilité de configurer et d’activer ces fonctionnalités dans le compte cible.

Prérequis : activer la réplication des comptes dans l’organisation

L’administrateur de l’organisation (rôle ORGADMIN) doit activer la réplication pour les comptes source et cible avant de répliquer une base de données. Pour des instructions détaillées, voir Prérequis : activer la réplication des comptes dans l’organisation.

Permettre la réplication et le basculement des bases de données, et actualiser les bases de données secondaires

Note

Sauf exception, seuls les administrateurs de compte (utilisateurs dotés du rôle ACCOUNTADMIN) peuvent exécuter l’instruction SQL dans cette section.

Étape 1 : Afficher tous les comptes de votre entreprise

Récupérez la liste des comptes de votre organisation pour lesquels la réplication a été activée. Toute base de données permanente ou transitoire existante dans ces comptes peut être modifiée pour servir de base de données primaire. Les réplicas d’une base de données principale (c.-à-d. les bases de données secondaires) ne peuvent être créés que dans ces comptes.

Pour afficher la liste des comptes de votre entreprise, interrogez SHOW REPLICATION ACCOUNTS.

SHOW REPLICATION ACCOUNTS;

+------------------+---------------------------------+---------------+------------------+---------+-------------------+
| snowflake_region | created_on                      | account_name  | account_locator  | comment | organization_name |
|------------------+---------------------------------+---------------+------------------+---------+-------------------|
| AWS_US_WEST_2    | 2018-11-19 16:11:12.720 -0700   | ACCOUNT1      | MYACCOUNT1       |         | MYORG             |
| AWS_US_EAST_1    | 2019-06-02 14:12:23.192 -0700   | ACCOUNT2      | MYACCOUNT2       |         | MYORG             |
+------------------+---------------------------------+---------------+------------------+---------+-------------------+
Copy

Voir la liste complète des IDs de région.

Étape 2 : Promotion d’une base de données locale pour qu’elle serve de base de données principale

Modifiez une base de données permanente ou transitoire existante pour qu’elle serve de base de données principale à l’aide d’une instruction ALTER DATABASE … ENABLE REPLICATION TO ACCOUNTS. Fournissez une liste de comptes de votre entreprise séparés par des virgules pouvant stocker un réplica de cette base de données (c’est-à-dire une base de données secondaire), permettant ainsi aux utilisateurs de ces comptes d’interroger des objets dans la base de données secondaire.

Exemple

Promouvez la base de données locale mydb1 (dans le compte account1) pour qu’elle serve de base de données principale et indiquez que les comptes account2 et account3 peuvent chacun stocker un réplica de cette base de données :

ALTER DATABASE mydb1 ENABLE REPLICATION TO ACCOUNTS myorg.account2, myorg.account3;
Copy

Étape 3 : Activation du basculement pour une base de données principale

Note

Le basculement/la restauration automatique nécessite Business Critical (ou une version supérieure). Pour en savoir plus sur la mise à niveau, veuillez contacter le support Snowflake.

Activez le basculement pour une base de données principale sur un ou plusieurs comptes de votre entreprise à l’aide d’une instruction ALTER DATABASE … ENABLE FAILOVER TO ACCOUNTS . Le réplica de cette base de données principale dans l’un de ces comptes (c’est-à-dire une base de données secondaire) peut être promu pour servir de base de données principale.

Notez que l’activation du basculement pour une base de données principale peut être effectuée avant ou après la création d’un réplica de la base de données principale dans un compte spécifié.

Exemple

Activez le basculement de la base de données principale mydb1 vers les comptes account2 et account3.

-- Executed from primary account
ALTER DATABASE mydb1 ENABLE FAILOVER TO ACCOUNTS myorg.account2, myorg.account3;
Copy

Étape 4 : Création d’une base de données secondaire

Créez un réplica d’une base de données principale existante dans le même compte que celui qui stocke la base de données principale, ou un compte différent (dans la même région ou dans une autre). Notez que vous ne pouvez créer une base de données secondaire que dans un compte spécifié dans l’instruction ALTER DATABASE … ENABLE REPLICATION TO ACCOUNTS de Étape 2 : Promotion d’une base de données locale pour qu’elle serve de base de données principale.

Note

Les commandes de réplication (par exemple, la promotion d’une base de données vers une base de données principale dans un compte source) déclenchent généralement des opérations à travers les régions et peuvent prendre quelques secondes pour prendre effet. Par exemple, si vous promouvez par programmation une base de données pour servir de base de données principale dans un compte source et créez une base de données secondaire dans un compte cible, il peut s’écouler quelques secondes avant que vous puissiez créer la base de données secondaire.

Exécutez une instruction CREATE DATABASE … AS REPLICA OF dans chaque compte cible pour créer un réplica de la base de données principale spécifiée.

Important

Il est recommandé de donner à chaque base de données secondaire le même nom que sa base de données principale. Cette recommandation prend en charge le référencement d’objets pleinement qualifiés (c’est-à-dire '<bd>.<schéma>.<objet>') par d’autres objets dans la même base de données, comme la requête d’un nom de table complet dans une vue.

Si une base de données secondaire a un autre nom que celui de la base de données principale, ces références d’objet ne fonctionneraient plus dans la base de données secondaire.

Pour afficher la liste des bases de données principales et secondaires de votre entreprise, interrogez SHOW REPLICATION DATABASES. Après la création d’une base de données secondaire, un administrateur de compte peut transférer la propriété de la base de données à un autre rôle (à l’aide de GRANT OWNERSHIP.)

Exemple

L’exemple suivant crée un réplica de la base de données principale myorg.account1.mydb1 dans le compte myorg.account2 :

-- Log into the ACCOUNT2 account.

-- Query the set of primary and secondary databases in your organization.
-- In this example, the MYORG.ACCOUNT1 primary database is available to replicate.
SHOW REPLICATION DATABASES;

+------------------+-------------------------------+-----------------+----------+---------+------------+----------------------------+---------------------------------+------------------------------+-------------------+-----------------+
| snowflake_region | created_on                    | account_name    | name     | comment | is_primary | primary                    | replication_allowed_to_accounts | failover_allowed_to_accounts | organization_name | account_locator |
|------------------+-------------------------------+-----------------+----------+---------+------------+----------------------------+---------------------------------+------------------------------+-------------------+-----------------|
| AWS_US_WEST_2    | 2019-11-15 00:51:45.473 -0700 | ACCOUNT1        | MYDB1    | NULL    | true       | MYORG.ACCOUNT1.MYDB1       | MYORG.ACCOUNT2, MYORG,ACCOUNT1  | MYORG.ACCOUNT1               | MYORG             | MYACCOUNT1      |
+------------------+-------------------------------+-----------------+----------+---------+------------+----------------------------+---------------------------------+------------------------------+-------------------+-----------------+

-- Create a replica of the 'mydb1' primary database
-- If the primary database has the DATA_RETENTION_TIME_IN_DAYS parameter set to a value other than the default value,
-- set the same value for the parameter on the secondary database.
CREATE DATABASE mydb1
  AS REPLICA OF myorg.account1.mydb1
  DATA_RETENTION_TIME_IN_DAYS = 10;

-- Verify the secondary database
SHOW REPLICATION DATABASES;

+------------------+-------------------------------+---------------+----------+---------+------------+-------------------------+---------------------------------+------------------------------+-------------------+-----------------+
| snowflake_region | created_on                    | account_name  | name     | comment | is_primary | primary                 | replication_allowed_to_accounts | failover_allowed_to_accounts | organization_name | account_locator |
|------------------+-------------------------------+---------------+----------+---------+------------+------------------------------------------+----------------+------------------------------+-------------------------------------|
| AWS_US_WEST_2    | 2019-11-15 00:51:45.473 -0700 | ACCOUNT1      | MYDB1    | NULL    | true       | MYORG.ACCOUNT1.MYDB1    | MYORG.ACCOUNT2, MYORG.ACCOUNT1  | MYORG.ACCOUNT1               | MYORG             | MYACCOUNT1      |
| AWS_US_EAST_1    | 2019-08-15 15:51:49.094 -0700 | ACCOUNT2      | MYDB1    | NULL    | false      | MYORG.ACCOUNT1.MYDB1    |                                 |                              | MYORG             | MYACCOUNT2      |
+------------------+-------------------------------+---------------+----------+---------+------------+-------------------------+---------------------------------+------------------------------+-------------------+-----------------+
Copy

Étape 5 : Actualisation de chaque base de données secondaire

Les instructions de cette section expliquent comment actualiser une base de données secondaire à partir d’un instantané de sa base de données principale (à l’aide de ALTER DATABASE … REFRESH). Un instantané inclut les modifications apportées aux objets et aux données. Pour la réplication initiale d’une très grande base de données principale, nous recommandons d’augmenter le délai d’attente de l’instruction.

Notez que le propriétaire de la base de données secondaire (rôle doté du privilège OWNERSHIP sur la base de données) est propriétaire des nouveaux objets ajoutés à la suite d’une actualisation de la base de données.

Note

Pour actualiser une base de données secondaire, le rôle utilisé pour effectuer l’opération doit disposer du privilège OWNERSHIP sur la base de données.

Pour vérifier la région actuelle après vous être connecté à un compte, interrogez la fonction CURRENT_REGION .

ALTER DATABASE mydb1 REFRESH;
Copy

Vous pouvez également rafraîchir une base de données secondaire dans l’interface utilisateur Web.

Étape 6. Actualisation d’une base de données secondaire sur une planification

Nous vous recommandons de planifier les actualisations de votre base de données secondaire. Cette section fournit des instructions pour démarrer automatiquement une actualisation de la base de données selon un calendrier spécifié.

La fréquence à laquelle vous actualisez une base de données secondaire dépend de l’objectif du point de récupération (RPO) pour les données de la base de données secondaire. Par exemple, si les applications qui s’appuient sur les données peuvent tolérer jusqu’à 1 heure de perte de données, vous devez actualiser les données au moins toutes les heures. Si la tolérance de perte de données est de 5 minutes, actualisez la base de données secondaire au moins toutes les 5 minutes.

Note

  • Nous vous recommandons d’exécuter manuellement la réplication initiale d’une base de données principale (à l’aide de ALTER DATABASE … REFRESH) et de ne planifier que les actualisations suivantes.

  • Il existe une limite de 60 minutes par défaut pour une seule exécution d’une tâche. Cette limitation a été mise en œuvre à titre de protection contre les tâches ne se terminant pas. Dans de rares circonstances, une actualisation d’une très grande base de données peut dépasser la limite d’exécution de tâches par défaut. Pour déterminer si cela s’est produit, interrogez la fonction de table TASK_HISTORY . Envisagez d’augmenter le délai d’expiration de la tâche en exécutant ALTER TASK … SET USER_TASK_TIMEOUT_MS = <num>.

Suivez les étapes décrites dans cette section pour démarrer automatiquement une actualisation de la base de données selon une planification spécifiée.

Conditions préalables

Les objets Snowflake suivants sont requis dans le compte qui stocke la base de données secondaire :

  • La base de données secondaire.

  • Une base de données distincte pour stocker les nouveaux objets créés dans cette section. Comme les bases de données secondaires sont en lecture seule, cette base de données doit être distincte de la base de données secondaire. Cette base de données doit également inclure les objets suivants :

    • Schéma : Utilisez le schéma PUBLIC ou créez un nouveau schéma à l’aide de CREATE SCHEMA.

    • Entrepôt. Tout entrepôt peut être fourni ici pour répondre à l’exigence syntaxique, mais n’est pas utilisé pour l’actualisation de la base de données. Créez un nouvel entrepôt en utilisant CREATE WAREHOUSE.

    • Tâche qui actualise la base de données secondaire selon une planification.

Privilèges requis

Les étapes décrites dans cette section nécessitent un rôle avec les privilèges suivants dans le compte dans lequel la base de données secondaire est actualisée :

Type d’objet

Objet

Privilège

Remarques

Compte

Compte qui stocke la base de données secondaire

EXECUTE TASK

Requis pour exécuter la nouvelle tâche.

Base de données

Base de données secondaire

OWNERSHIP

Requis pour actualiser la base de données secondaire.

Base de données

Base de données qui stocke la nouvelle tâche

USAGE

Schéma

Schéma qui stocke la nouvelle tâche

USAGE, CREATE TASK

Tâche

OWNERSHIP

Le rôle qui crée la tâche possède l’objet par défaut. La propriété peut être transférée vers un rôle différent à l’aide de GRANT privileges … TO ROLE.

Entrepôt

Entrepôt utilisé pour configurer la tâche

USAGE

La spécification d’un entrepôt est nécessaire pour configurer la tâche, mais l’entrepôt n’est pas utilisé pour exécuter la tâche ou pour l’opération d’actualisation.

Étapes

Effectuez les étapes suivantes pour chaque base de données secondaire que vous souhaitez actualiser selon une planification :

  1. Créez une tâche qui lance l’actualisation de la base de données selon une planification (à l’aide de CREATE TASK). Bien que la syntaxe CREATETASK pour spécifier un calendrier de réplication nécessite un entrepôt, l’entrepôt n’est pas utilisé pour la réplication.

    Par exemple, créez une tâche nommée refresh_mydb1_task qui actualise une base de données secondaire nommée mydb1 toutes les 10 minutes avec un délai d’expiration de 4 heures. La tâche est configurée en utilisant l’entrepôt existant mywh:

    CREATE TASK refresh_mydb1_task
      WAREHOUSE = mywh
      SCHEDULE = '10 minute'
      USER_TASK_TIMEOUT_MS = 14400000
    AS
      ALTER DATABASE mydb1 REFRESH;
    
    Copy
  2. Une tâche est suspendue par défaut lors de sa création. Reprenez la tâche pour qu’elle puisse s’exécuter en fonction des paramètres spécifiés dans la définition de la tâche :

ALTER TASK refresh_mydb1_task RESUME;
Copy

Exemple

Exécutez les instructions SQL suivantes dans votre client Snowflake préféré pour activer la réplication et le basculement, effectuez une actualisation initiale de la base de données et mettez en place des actualisations programmées.

Exécuter à partir du compte source
-- The commands below are executed from the source account

-- View replication enabled accounts
SHOW REPLICATION ACCOUNTS;

ALTER DATABASE mydb ENABLE REPLICATION TO ACCOUNTS myorg.account2, myorg.account3;
ALTER DATABASE mydb ENABLE FAILOVER TO ACCOUNTS myorg.account2, myorg.account3;
Copy
Exécuter à partir de chaque compte cible
-- The commands below are executed from each target account

-- View replication enabled databases
-- Note the primary column of the source database for the CREATE DATABASE statement below
SHOW REPLICATION DATABASES;

-- If the primary database has the DATA_RETENTION_TIME_IN_DAYS parameter set to a value other than the default value,
-- set the same value for the parameter on the secondary database.
CREATE DATABASE mydb
  AS REPLICA OF myorg.account1.mydb
  DATA_RETENTION_TIME_IN_DAYS = 10;

-- Increase statement timeout for initial refresh
-- Optional but recommended for initial refresh of a large database
ALTER SESSION SET STATEMENT_TIMEOUT_IN_SECONDS = 604800;
-- If you have an active warehouse in current session, update warehouse statement timeout
SELECT CURRENT_WAREHOUSE();
ALTER WAREHOUSE my_wh SET STATEMENT_TIMEOUT_IN_SECONDS = 604800;
-- Reset warehouse statement timeout after initial refresh
ALTER WAREHOUSE my_wh UNSET STATEMENT_TIMEOUT_IN_SECONDS;

-- Refresh a secondary database
ALTER DATABASE mydb REFRESH;

-- Create task
-- Set up refresh schedule for each secondary database using a separate database
USE DATABASE my_db2;

-- Create a task and RESUME the task for each secondary database
-- Edit the task schedule and timeout for your specific use case
CREATE TASK my_refresh_task
  WAREHOUSE = my_wh
  SCHEDULE = '10 minute'
  USER_TASK_TIMEOUT_MS = 14400000
AS
  ALTER DATABASE mydb REFRESH;

-- Start task
ALTER TASK my_refresh_task RESUME;
Copy

Utilisation de l’ancien localisateur de comptes

Bien que l’ancien format snowflake_region.account_locator soit actuellement pris en charge pour l’identification d’un compte dans les commandes de réplication et de basculement, son utilisation est déconseillée, car il pourrait cesser de fonctionner à l’avenir.

Augmentation du délai d’expiration de l’instruction pour la réplication initiale

La réplication de base de données utilise des ressources de calcul fournies par Snowflake au lieu de votre propre entrepôt virtuel pour copier des objets et des données. Cependant, le paramètre de session/objet STATEMENT_TIMEOUT_IN_SECONDS contrôle toujours le temps d’exécution d’une instruction avant son annulation. La valeur par défaut est de 172800 (2 jours). Étant donné que la réplication initiale d’une très grande base de données principale peut durer plus de deux jours (en fonction de la quantité de métadonnées dans la base de données ainsi que de la quantité de données dans les objets de base de données), nous vous recommandons d’augmenter la valeur STATEMENT_TIMEOUT_IN_SECONDS et de la définir sur 604800 (sept jours, la valeur maximale) pour la session dans laquelle vous exécutez l’opération de réplication.

Exécutez l’instruction ALTER SESSION suivante avant l’exécution de l’instruction ALTER DATABASE secondary_db_name REFRESH dans la même session :

ALTER SESSION SET STATEMENT_TIMEOUT_IN_SECONDS = 604800;
Copy

Notez que le paramètre STATEMENT_TIMEOUT_IN_SECONDS s’applique également à l’entrepôt actif dans une session. Le paramètre respecte la valeur inférieure définie au niveau de la session ou de l’entrepôt. Si vous avez un entrepôt actif dans la session en cours, définissez également STATEMENT_TIMEOUT_IN_SECONDS sur 604800 pour cet entrepôt (avec ALTER WAREHOUSE) également.

Par exemple :

-- determine the active warehouse in the current session (if any)
SELECT CURRENT_WAREHOUSE();

+---------------------+
| CURRENT_WAREHOUSE() |
|---------------------|
| MY_WH               |
+---------------------+

-- change the STATEMENT_TIMEOUT_IN_SECONDS value for the active warehouse

ALTER WAREHOUSE my_wh SET STATEMENT_TIMEOUT_IN_SECONDS = 604800;
Copy

vous pouvez réinitialiser la valeur du paramètre à la valeur par défaut une fois l’opération de réplication terminée :

ALTER WAREHOUSE my_wh UNSET STATEMENT_TIMEOUT_IN_SECONDS;
Copy

Surveillance de la progression d’une actualisation de la base de données

Pour déterminer le statut actuel de la réplication de base de données initiale ou d’une actualisation ultérieure de la base de données secondaire, interrogez la fonction de table DATABASE_REFRESH_PROGRESS , DATABASE_REFRESH_PROGRESS_BY_JOB (dans Schéma d’information de Snowflake).

Une opération d’actualisation de la base de données peut nécessiter plusieurs heures ou plus, en fonction de la quantité de données à répliquer.

Pour afficher l’historique de réplication d’une base de données en particulier dans une plage de dates spécifiée, interrogez au choix :

Exemple

Surveillez la progression de l’actualisation de la base de données secondaire mydb1 :

select *
  from table(information_schema.database_refresh_progress(mydb1));
Copy

Surveillance de la progression d’une actualisation de la base de données dans la console classique

Démarrez manuellement une actualisation de la base de données secondaire dans Classic Console pour afficher une barre de progression dynamique indiquant le statut actuel de l’opération d’actualisation avec des statistiques.

Pour démarrer une opération d’actualisation de base de données secondaire :

  1. Dans Classic Console, cliquez sur l’onglet Databases Databases tab » Replication.

  2. Sélectionnez la base de données secondaire à actualiser.

  3. Cliquez sur le bouton Refresh now. La boîte de dialogue Refresh Database s’ouvre.

  4. Cliquez sur le bouton Refresh.

La colonne Last Refresh Status affiche le statut de l’opération d’actualisation en cours. La barre de progression est mise à jour dynamiquement.

Les statistiques Refresh History dans la fenêtre latérale affichent également le statut d’actualisation actuel, ainsi que l’heure de début d’actualisation, le nombre d’octets transférés et d’autres statistiques.

Secondary refresh operation in the Classic Console

Affichage de l’historique d’actualisation de la base de données

Pour afficher l’historique des opérations d’actualisation de la base de données secondaire, interrogez la fonction de table DATABASE_REFRESH_HISTORY (dans Schéma d’information de Snowflake). Cette fonction renvoie l’activité d’actualisation de la base de données au cours des 14 derniers jours.

ou

Interrogez le schéma Vue DATABASE_REPLICATION_USAGE_HISTORY (dans le schéma Account Usage de la base de données Snowflake partagée). Cette vue renvoie l’activité d’utilisation de la réplication de base de données au cours des 365 derniers jours (1 an).

Exemple

Afficher l’historique de l’opération d’actualisation de la base de données secondaire mydb1 :

select *
  from table(information_schema.database_refresh_history(mydb1));
Copy

Comparaison des ensembles de données dans les bases de données principales et secondaires

Utilisez éventuellement la fonction HASH_AGG pour comparer les lignes d’un ensemble aléatoire de tables dans une base de données primaire et secondaire pour vérifier la cohérence des données. La fonction HASH_AGG renvoie une valeur de hachage globale signée de 64 bits sur l’ensemble (non ordonné) des lignes d’entrée. Interrogez cette fonction sur tout ou un sous-ensemble aléatoire de tables dans une base de données secondaire et sur la base de données principale (à partir de l’horodatage de l’instantané de la base de données principale) et comparez la sortie.

Exemple

Exécutée sur la base de données secondaire

  1. Sur la base de données secondaire, interrogez la fonction de table DATABASE_REFRESH_PROGRESS (dans Schéma d’information de Snowflake). Notez le snapshot_transaction_timestamp dans la colonne DETAILS pour la phase PRIMARY_UPLOADING_DATA. Il s’agit de l’horodatage du dernier instantané de la base de données principale.

    select parse_json(details)['snapshot_transaction_timestamp']
    from table(information_schema.database_refresh_progress(mydb))
    where phase_name = 'PRIMARY_UPLOADING_DATA';
    
    Copy
  2. Interrogez la fonction HASH_AGG pour une table spécifiée. La requête suivante renvoie une valeur de hachage pour toutes les lignes de la table mytable :

    SELECT HASH_AGG( * ) FROM mytable;
    
    Copy

Exécutée sur la base de données principale

  1. Sur la base de données principale, interrogez la fonction HASH_AGG pour la même table. À l’aide de Time Travel, spécifiez l’horodatage auquel le dernier instantané a été pris pour la base de données secondaire :

    SELECT HASH_AGG( * ) FROM mytable AT(TIMESTAMP => '<snapshot_transaction_timestamp>'::TIMESTAMP);
    
    Copy
  2. Comparez les résultats des deux requêtes. La sortie doit être identique.