Réplication de bases de données sur plusieurs comptes¶
Cette rubrique décrit les étapes nécessaires à la réplication de bases de données sur plusieurs comptes Snowflake tout en conservant la synchronisation des objets de base de données et des données stockées. La réplication de la base de données peut se produire entre des comptes Snowflake situés dans la même région ou dans des régions différentes.
Dans ce chapitre :
Interface Web pour la réplication de la base de données et basculement /récupération
Réplication d’une base de données vers un autre compte
Prérequis : activer la réplication des comptes dans l’organisation
-
Étape 2 : Promotion d’une base de données locale pour qu’elle serve de base de données principale
Étape 3 : Activation du basculement pour une base de données principale
Étape 5 : Actualisation de chaque base de données secondaire
Étape 6. Actualisation d’une base de données secondaire sur une planification
Augmentation du délai d’expiration de l’instruction pour la réplication initiale
Surveillance de la progression d’une actualisation de la base de données
Affichage de l’historique d’actualisation de la base de données
Comparaison des ensembles de données dans les bases de données principales et secondaires
Prise en charge de la région pour la réplication de la base de données et le basculement/la récupération¶
Toutes les régions Snowflake sur Amazon Web Services, Google Cloud Platform et Microsoft Azure prennent désormais en charge la fonctionnalité de réplication de base de données et le basculement/la récupération.
Remarque : les comptes peuvent répliquer des bases de données entre Groupes de régions (par exemple, entre Virtual Private Snowflake (VPS) et des régions mutualisées) pour faciliter le partage de données et les migrations de compte entre ces régions. Cette capacité est désactivée par défaut. Vous pouvez contacter le support Snowflake pour activer l’accès.
Interface Web pour la réplication de la base de données et basculement /récupération¶
Les administrateurs de comptes (utilisateurs ayant le rôle ACCOUNTADMIN) peuvent gérer les actions de réplication et de basculement/restauration dans Snowsight ou dans l”Classic Console.
Snowsight¶
- Navigation :
Data » Databases
Promouvoir une base de données locale¶
Connectez-vous à un compte Snowflake qui contient une base de données locale que vous souhaitez répliquer vers un ou plusieurs autres comptes.
Cliquez sur le menu déroulant dans le coin supérieur gauche (à côté de votre nom de connexion) » Switch Role »
ACCOUNTADMIN
.Dans la partie gauche de la page Databases, cliquez sur une base de données locale dans l’explorateur d’objets de base de données. La page des détails de la base de données s’ouvre.
Cliquez sur le bouton des actions (…) dans le coin supérieur droit de la page » Enable Replication. La boîte de dialogue Enable replication s’ouvre.
Cette boîte de dialogue vous permet d’effectuer les actions suivantes :
Permettre à la base de données locale de servir de base de données principale.
Créer une base de données secondaire dans un ou plusieurs comptes cibles.
Actualiser chaque base de données secondaire une fois, après sa création.
Pour chaque compte cible de cette base de données, cochez les options permettant de créer une base de données secondaire et d’actualiser la base de données.
Connectez-vous au compte cible en tant qu’utilisateur à qui on a précédemment accordé le rôle ACCOUNTADMIN dans ce compte.
Snowflake effectue les actions demandées et affiche un message de réussite.
Gérez la réplication pour cette base de données à partir de l’onglet Replication dans les détails de la base de données.
Créer des bases de données secondaires¶
Connectez-vous à un compte qui contient une base de données secondaire.
Cliquez sur le menu déroulant dans le coin supérieur gauche (à côté de votre nom de connexion) » Switch Role »
ACCOUNTADMIN
.Dans la partie gauche de la page Databases cliquez sur une base de données secondaire dans l’explorateur d’objets de base de données. La page des détails de la base de données s’ouvre.
Cliquez sur l’onglet Replication.
Les actions suivantes sont disponibles à partir du bouton actions (…) situé dans le coin supérieur droit de la page :
Promouvoir la base de données secondaire comme base de données principale. Cette fonctionnalité nécessite Business Critical (ou une version supérieure).
Actualiser la base de données secondaire.
Copier un modèle pour créer une tâche qui actualise la base de données secondaire selon une planification. Coller le modèle dans une feuille de calcul Snowsight et le modifiez pour spécifier le calendrier souhaité.
Console classique¶
Utilisez la zone Replication de l’onglet Databases dans l”Classic Console pour effectuer la plupart des actions liées à la configuration et à la gestion de la réplication de la base de données, y compris les actions suivantes :
Permettre à une base de données locale de servir de base de données principale.
Activer le basculement pour une base de données principale (comptes Business Critical Edition ou versions ultérieures).
Actualiser une base de données secondaire, une fois (manuellement) ou de manière répétée (selon un calendrier, à l’aide d’une tâche).
Promouvoir une base de données secondaire pour servir de base de données principale (comptes Business Critical Edition ou versions supérieures).
Désactiver la réplication et/ou le basculement pour une base de données principale.
Réplication d’une base de données vers un autre compte¶
Les instructions de cette section expliquent comment préparer vos comptes pour la réplication, promouvoir une base de données locale pour qu’elle serve de base de données principale, effectuer la réplication initiale de cette base de données principale vers un autre compte, et planifier l’actualisation de bases de données secondaires.
Important
Les comptes cibles n’ont pas Tri-Secret Secure ou une connectivité privée au service Snowflake (par exemple AWS PrivateLink) activé par défaut. Si vous avez besoin de Tri-Secret Secure ou d’une connectivité privée au service Snowflake à des fins de conformité, de sécurité ou à d’autres fins, il est de votre responsabilité de configurer et d’activer ces fonctionnalités dans le compte cible.
Prérequis : activer la réplication des comptes dans l’organisation¶
L’administrateur de l’organisation (rôle ORGADMIN) doit activer la réplication pour les comptes source et cible avant de répliquer une base de données. Pour des instructions détaillées, voir Prérequis : activer la réplication des comptes dans l’organisation.
Permettre la réplication et le basculement des bases de données, et actualiser les bases de données secondaires¶
Note
Sauf exception, seuls les administrateurs de compte (utilisateurs dotés du rôle ACCOUNTADMIN) peuvent exécuter l’instruction SQL dans cette section.
Étape 1 : Afficher tous les comptes de votre entreprise¶
Récupérez la liste des comptes de votre organisation pour lesquels la réplication a été activée. Toute base de données permanente ou transitoire existante dans ces comptes peut être modifiée pour servir de base de données primaire. Les réplicas d’une base de données principale (c.-à-d. les bases de données secondaires) ne peuvent être créés que dans ces comptes.
Pour afficher la liste des comptes de votre entreprise, interrogez SHOW REPLICATION ACCOUNTS.
SHOW REPLICATION ACCOUNTS;
+------------------+---------------------------------+---------------+------------------+---------+-------------------+
| snowflake_region | created_on | account_name | account_locator | comment | organization_name |
|------------------+---------------------------------+---------------+------------------+---------+-------------------|
| AWS_US_WEST_2 | 2018-11-19 16:11:12.720 -0700 | ACCOUNT1 | MYACCOUNT1 | | MYORG |
| AWS_US_EAST_1 | 2019-06-02 14:12:23.192 -0700 | ACCOUNT2 | MYACCOUNT2 | | MYORG |
+------------------+---------------------------------+---------------+------------------+---------+-------------------+
Voir la liste complète des IDs de région.
Étape 2 : Promotion d’une base de données locale pour qu’elle serve de base de données principale¶
Modifiez une base de données permanente ou transitoire existante pour qu’elle serve de base de données principale à l’aide d’une instruction ALTER DATABASE … ENABLE REPLICATION TO ACCOUNTS. Fournissez une liste de comptes de votre entreprise séparés par des virgules pouvant stocker un réplica de cette base de données (c’est-à-dire une base de données secondaire), permettant ainsi aux utilisateurs de ces comptes d’interroger des objets dans la base de données secondaire.
Exemple¶
Promouvez la base de données locale mydb1
(dans le compte account1
) pour qu’elle serve de base de données principale et indiquez que les comptes account2
et account3
peuvent chacun stocker un réplica de cette base de données :
ALTER DATABASE mydb1 ENABLE REPLICATION TO ACCOUNTS myorg.account2, myorg.account3;
Étape 3 : Activation du basculement pour une base de données principale¶
Note
Le basculement/la restauration automatique nécessite Business Critical (ou une version supérieure). Pour en savoir plus sur la mise à niveau, veuillez contacter le support Snowflake.
Activez le basculement pour une base de données principale sur un ou plusieurs comptes de votre entreprise à l’aide d’une instruction ALTER DATABASE … ENABLE FAILOVER TO ACCOUNTS . Le réplica de cette base de données principale dans l’un de ces comptes (c’est-à-dire une base de données secondaire) peut être promu pour servir de base de données principale.
Notez que l’activation du basculement pour une base de données principale peut être effectuée avant ou après la création d’un réplica de la base de données principale dans un compte spécifié.
Exemple¶
Activez le basculement de la base de données principale mydb1
vers les comptes account2
et account3
.
-- Executed from primary account
ALTER DATABASE mydb1 ENABLE FAILOVER TO ACCOUNTS myorg.account2, myorg.account3;
Étape 4 : Création d’une base de données secondaire¶
Créez un réplica d’une base de données principale existante dans le même compte que celui qui stocke la base de données principale, ou un compte différent (dans la même région ou dans une autre). Notez que vous ne pouvez créer une base de données secondaire que dans un compte spécifié dans l’instruction ALTER DATABASE … ENABLE REPLICATION TO ACCOUNTS de Étape 2 : Promotion d’une base de données locale pour qu’elle serve de base de données principale.
Note
Les commandes de réplication (par exemple, la promotion d’une base de données vers une base de données principale dans un compte source) déclenchent généralement des opérations à travers les régions et peuvent prendre quelques secondes pour prendre effet. Par exemple, si vous promouvez par programmation une base de données pour servir de base de données principale dans un compte source et créez une base de données secondaire dans un compte cible, il peut s’écouler quelques secondes avant que vous puissiez créer la base de données secondaire.
Exécutez une instruction CREATE DATABASE … AS REPLICA OF dans chaque compte cible pour créer un réplica de la base de données principale spécifiée.
Important
Il est recommandé de donner à chaque base de données secondaire le même nom que sa base de données principale. Cette recommandation prend en charge le référencement d’objets pleinement qualifiés (c’est-à-dire '<bd>.<schéma>.<objet>'
) par d’autres objets dans la même base de données, comme la requête d’un nom de table complet dans une vue.
Si une base de données secondaire a un autre nom que celui de la base de données principale, ces références d’objet ne fonctionneraient plus dans la base de données secondaire.
Pour afficher la liste des bases de données principales et secondaires de votre entreprise, interrogez SHOW REPLICATION DATABASES. Après la création d’une base de données secondaire, un administrateur de compte peut transférer la propriété de la base de données à un autre rôle (à l’aide de GRANT OWNERSHIP.)
Exemple¶
L’exemple suivant crée un réplica de la base de données principale myorg.account1.mydb1
dans le compte myorg.account2
:
-- Log into the ACCOUNT2 account.
-- Query the set of primary and secondary databases in your organization.
-- In this example, the MYORG.ACCOUNT1 primary database is available to replicate.
SHOW REPLICATION DATABASES;
+------------------+-------------------------------+-----------------+----------+---------+------------+----------------------------+---------------------------------+------------------------------+-------------------+-----------------+
| snowflake_region | created_on | account_name | name | comment | is_primary | primary | replication_allowed_to_accounts | failover_allowed_to_accounts | organization_name | account_locator |
|------------------+-------------------------------+-----------------+----------+---------+------------+----------------------------+---------------------------------+------------------------------+-------------------+-----------------|
| AWS_US_WEST_2 | 2019-11-15 00:51:45.473 -0700 | ACCOUNT1 | MYDB1 | NULL | true | MYORG.ACCOUNT1.MYDB1 | MYORG.ACCOUNT2, MYORG,ACCOUNT1 | MYORG.ACCOUNT1 | MYORG | MYACCOUNT1 |
+------------------+-------------------------------+-----------------+----------+---------+------------+----------------------------+---------------------------------+------------------------------+-------------------+-----------------+
-- Create a replica of the 'mydb1' primary database
-- If the primary database has the DATA_RETENTION_TIME_IN_DAYS parameter set to a value other than the default value,
-- set the same value for the parameter on the secondary database.
CREATE DATABASE mydb1
AS REPLICA OF myorg.account1.mydb1
DATA_RETENTION_TIME_IN_DAYS = 10;
-- Verify the secondary database
SHOW REPLICATION DATABASES;
+------------------+-------------------------------+---------------+----------+---------+------------+-------------------------+---------------------------------+------------------------------+-------------------+-----------------+
| snowflake_region | created_on | account_name | name | comment | is_primary | primary | replication_allowed_to_accounts | failover_allowed_to_accounts | organization_name | account_locator |
|------------------+-------------------------------+---------------+----------+---------+------------+------------------------------------------+----------------+------------------------------+-------------------------------------|
| AWS_US_WEST_2 | 2019-11-15 00:51:45.473 -0700 | ACCOUNT1 | MYDB1 | NULL | true | MYORG.ACCOUNT1.MYDB1 | MYORG.ACCOUNT2, MYORG.ACCOUNT1 | MYORG.ACCOUNT1 | MYORG | MYACCOUNT1 |
| AWS_US_EAST_1 | 2019-08-15 15:51:49.094 -0700 | ACCOUNT2 | MYDB1 | NULL | false | MYORG.ACCOUNT1.MYDB1 | | | MYORG | MYACCOUNT2 |
+------------------+-------------------------------+---------------+----------+---------+------------+-------------------------+---------------------------------+------------------------------+-------------------+-----------------+
Étape 5 : Actualisation de chaque base de données secondaire¶
Les instructions de cette section expliquent comment actualiser une base de données secondaire à partir d’un instantané de sa base de données principale (à l’aide de ALTER DATABASE … REFRESH). Un instantané inclut les modifications apportées aux objets et aux données. Pour la réplication initiale d’une très grande base de données principale, nous recommandons d’augmenter le délai d’attente de l’instruction.
Notez que le propriétaire de la base de données secondaire (rôle doté du privilège OWNERSHIP sur la base de données) est propriétaire des nouveaux objets ajoutés à la suite d’une actualisation de la base de données.
Note
Pour actualiser une base de données secondaire, le rôle utilisé pour effectuer l’opération doit disposer du privilège OWNERSHIP sur la base de données.
Pour vérifier la région actuelle après vous être connecté à un compte, interrogez la fonction CURRENT_REGION .
ALTER DATABASE mydb1 REFRESH;
Vous pouvez également rafraîchir une base de données secondaire dans l’interface utilisateur Web.
Étape 6. Actualisation d’une base de données secondaire sur une planification¶
Nous vous recommandons de planifier les actualisations de votre base de données secondaire. Cette section fournit des instructions pour démarrer automatiquement une actualisation de la base de données selon un calendrier spécifié.
La fréquence à laquelle vous actualisez une base de données secondaire dépend de l’objectif du point de récupération (RPO) pour les données de la base de données secondaire. Par exemple, si les applications qui s’appuient sur les données peuvent tolérer jusqu’à 1 heure de perte de données, vous devez actualiser les données au moins toutes les heures. Si la tolérance de perte de données est de 5 minutes, actualisez la base de données secondaire au moins toutes les 5 minutes.
Note
Nous vous recommandons d’exécuter manuellement la réplication initiale d’une base de données principale (à l’aide de ALTER DATABASE … REFRESH) et de ne planifier que les actualisations suivantes.
Il existe une limite de 60 minutes par défaut pour une seule exécution d’une tâche. Cette limitation a été mise en œuvre à titre de protection contre les tâches ne se terminant pas. Dans de rares circonstances, une actualisation d’une très grande base de données peut dépasser la limite d’exécution de tâches par défaut. Pour déterminer si cela s’est produit, interrogez la fonction de table TASK_HISTORY . Envisagez d’augmenter le délai d’expiration de la tâche en exécutant ALTER TASK … SET USER_TASK_TIMEOUT_MS = <num>.
Suivez les étapes décrites dans cette section pour démarrer automatiquement une actualisation de la base de données selon une planification spécifiée.
- Conditions préalables
Les objets Snowflake suivants sont requis dans le compte qui stocke la base de données secondaire :
La base de données secondaire.
Une base de données distincte pour stocker les nouveaux objets créés dans cette section. Comme les bases de données secondaires sont en lecture seule, cette base de données doit être distincte de la base de données secondaire. Cette base de données doit également inclure les objets suivants :
Schéma : Utilisez le schéma PUBLIC ou créez un nouveau schéma à l’aide de CREATE SCHEMA.
Entrepôt. Tout entrepôt peut être fourni ici pour répondre à l’exigence syntaxique, mais n’est pas utilisé pour l’actualisation de la base de données. Créez un nouvel entrepôt en utilisant CREATE WAREHOUSE.
Tâche qui actualise la base de données secondaire selon une planification.
- Privilèges requis
Les étapes décrites dans cette section nécessitent un rôle avec les privilèges suivants dans le compte dans lequel la base de données secondaire est actualisée :
Type d’objet
Objet
Privilège
Remarques
Compte
Compte qui stocke la base de données secondaire
EXECUTE TASK
Requis pour exécuter la nouvelle tâche.
Base de données
Base de données secondaire
OWNERSHIP
Requis pour actualiser la base de données secondaire.
Base de données
Base de données qui stocke la nouvelle tâche
USAGE
Schéma
Schéma qui stocke la nouvelle tâche
USAGE, CREATE TASK
Tâche
OWNERSHIP
Le rôle qui crée la tâche possède l’objet par défaut. La propriété peut être transférée vers un rôle différent à l’aide de GRANT
privileges
… TO ROLE.Entrepôt
Entrepôt utilisé pour configurer la tâche
USAGE
La spécification d’un entrepôt est nécessaire pour configurer la tâche, mais l’entrepôt n’est pas utilisé pour exécuter la tâche ou pour l’opération d’actualisation.
- Étapes
Effectuez les étapes suivantes pour chaque base de données secondaire que vous souhaitez actualiser selon une planification :
Créez une tâche qui lance l’actualisation de la base de données selon une planification (à l’aide de CREATE TASK). Bien que la syntaxe CREATETASK pour spécifier un calendrier de réplication nécessite un entrepôt, l’entrepôt n’est pas utilisé pour la réplication.
Par exemple, créez une tâche nommée
refresh_mydb1_task
qui actualise une base de données secondaire nomméemydb1
toutes les 10 minutes avec un délai d’expiration de 4 heures. La tâche est configurée en utilisant l’entrepôt existantmywh
:CREATE TASK refresh_mydb1_task WAREHOUSE = mywh SCHEDULE = '10 minute' USER_TASK_TIMEOUT_MS = 14400000 AS ALTER DATABASE mydb1 REFRESH;
Une tâche est suspendue par défaut lors de sa création. Reprenez la tâche pour qu’elle puisse s’exécuter en fonction des paramètres spécifiés dans la définition de la tâche :
ALTER TASK refresh_mydb1_task RESUME;
Exemple¶
Exécutez les instructions SQL suivantes dans votre client Snowflake préféré pour activer la réplication et le basculement, effectuez une actualisation initiale de la base de données et mettez en place des actualisations programmées.
Exécuter à partir du compte source¶
-- The commands below are executed from the source account
-- View replication enabled accounts
SHOW REPLICATION ACCOUNTS;
ALTER DATABASE mydb ENABLE REPLICATION TO ACCOUNTS myorg.account2, myorg.account3;
ALTER DATABASE mydb ENABLE FAILOVER TO ACCOUNTS myorg.account2, myorg.account3;
Exécuter à partir de chaque compte cible¶
-- The commands below are executed from each target account
-- View replication enabled databases
-- Note the primary column of the source database for the CREATE DATABASE statement below
SHOW REPLICATION DATABASES;
-- If the primary database has the DATA_RETENTION_TIME_IN_DAYS parameter set to a value other than the default value,
-- set the same value for the parameter on the secondary database.
CREATE DATABASE mydb
AS REPLICA OF myorg.account1.mydb
DATA_RETENTION_TIME_IN_DAYS = 10;
-- Increase statement timeout for initial refresh
-- Optional but recommended for initial refresh of a large database
ALTER SESSION SET STATEMENT_TIMEOUT_IN_SECONDS = 604800;
-- If you have an active warehouse in current session, update warehouse statement timeout
SELECT CURRENT_WAREHOUSE();
ALTER WAREHOUSE my_wh SET STATEMENT_TIMEOUT_IN_SECONDS = 604800;
-- Reset warehouse statement timeout after initial refresh
ALTER WAREHOUSE my_wh UNSET STATEMENT_TIMEOUT_IN_SECONDS;
-- Refresh a secondary database
ALTER DATABASE mydb REFRESH;
-- Create task
-- Set up refresh schedule for each secondary database using a separate database
USE DATABASE my_db2;
-- Create a task and RESUME the task for each secondary database
-- Edit the task schedule and timeout for your specific use case
CREATE TASK my_refresh_task
WAREHOUSE = my_wh
SCHEDULE = '10 minute'
USER_TASK_TIMEOUT_MS = 14400000
AS
ALTER DATABASE mydb REFRESH;
-- Start task
ALTER TASK my_refresh_task RESUME;
Utilisation de l’ancien localisateur de comptes¶
Bien que l’ancien format snowflake_region.account_locator
soit actuellement pris en charge pour l’identification d’un compte dans les commandes de réplication et de basculement, son utilisation est déconseillée, car il pourrait cesser de fonctionner à l’avenir.
Augmentation du délai d’expiration de l’instruction pour la réplication initiale¶
La réplication de base de données utilise des ressources de calcul fournies par Snowflake au lieu de votre propre entrepôt virtuel pour copier des objets et des données. Cependant, le paramètre de session/objet STATEMENT_TIMEOUT_IN_SECONDS contrôle toujours le temps d’exécution d’une instruction avant son annulation. La valeur par défaut est de 172800
(2 jours). Étant donné que la réplication initiale d’une très grande base de données principale peut durer plus de deux jours (en fonction de la quantité de métadonnées dans la base de données ainsi que de la quantité de données dans les objets de base de données), nous vous recommandons d’augmenter la valeur STATEMENT_TIMEOUT_IN_SECONDS et de la définir sur 604800
(sept jours, la valeur maximale) pour la session dans laquelle vous exécutez l’opération de réplication.
Exécutez l’instruction ALTER SESSION suivante avant l’exécution de l’instruction ALTER DATABASE secondary_db_name REFRESH
dans la même session :
ALTER SESSION SET STATEMENT_TIMEOUT_IN_SECONDS = 604800;
Notez que le paramètre STATEMENT_TIMEOUT_IN_SECONDS s’applique également à l’entrepôt actif dans une session. Le paramètre respecte la valeur inférieure définie au niveau de la session ou de l’entrepôt. Si vous avez un entrepôt actif dans la session en cours, définissez également STATEMENT_TIMEOUT_IN_SECONDS sur 604800
pour cet entrepôt (avec ALTER WAREHOUSE) également.
Par exemple :
-- determine the active warehouse in the current session (if any)
SELECT CURRENT_WAREHOUSE();
+---------------------+
| CURRENT_WAREHOUSE() |
|---------------------|
| MY_WH |
+---------------------+
-- change the STATEMENT_TIMEOUT_IN_SECONDS value for the active warehouse
ALTER WAREHOUSE my_wh SET STATEMENT_TIMEOUT_IN_SECONDS = 604800;
vous pouvez réinitialiser la valeur du paramètre à la valeur par défaut une fois l’opération de réplication terminée :
ALTER WAREHOUSE my_wh UNSET STATEMENT_TIMEOUT_IN_SECONDS;
Surveillance de la progression d’une actualisation de la base de données¶
Pour déterminer le statut actuel de la réplication de base de données initiale ou d’une actualisation ultérieure de la base de données secondaire, interrogez la fonction de table DATABASE_REFRESH_PROGRESS , DATABASE_REFRESH_PROGRESS_BY_JOB (dans Schéma d’information de Snowflake).
Une opération d’actualisation de la base de données peut nécessiter plusieurs heures ou plus, en fonction de la quantité de données à répliquer.
Pour afficher l’historique de réplication d’une base de données en particulier dans une plage de dates spécifiée, interrogez au choix :
la fonction de table DATABASE_REPLICATION_USAGE_HISTORY (dans Schéma d’information de Snowflake). Cette fonction renvoie l’activité d’utilisation de la réplication au cours des 14 derniers jours.
Vue DATABASE_REPLICATION_USAGE_HISTORY (dans Account Usage). Cette vue renvoie l’activité d’utilisation de la réplication au cours des 365 derniers jours (1 an).
Exemple¶
Surveillez la progression de l’actualisation de la base de données secondaire mydb1
:
select *
from table(information_schema.database_refresh_progress(mydb1));
Surveillance de la progression d’une actualisation de la base de données dans la console classique¶
Démarrez manuellement une actualisation de la base de données secondaire dans Classic Console pour afficher une barre de progression dynamique indiquant le statut actuel de l’opération d’actualisation avec des statistiques.
Pour démarrer une opération d’actualisation de base de données secondaire :
Dans Classic Console, cliquez sur l’onglet Databases
» Replication.
Sélectionnez la base de données secondaire à actualiser.
Cliquez sur le bouton Refresh now. La boîte de dialogue Refresh Database s’ouvre.
Cliquez sur le bouton Refresh.
La colonne Last Refresh Status affiche le statut de l’opération d’actualisation en cours. La barre de progression est mise à jour dynamiquement.
Les statistiques Refresh History dans la fenêtre latérale affichent également le statut d’actualisation actuel, ainsi que l’heure de début d’actualisation, le nombre d’octets transférés et d’autres statistiques.

Affichage de l’historique d’actualisation de la base de données¶
Pour afficher l’historique des opérations d’actualisation de la base de données secondaire, interrogez la fonction de table DATABASE_REFRESH_HISTORY (dans Schéma d’information de Snowflake). Cette fonction renvoie l’activité d’actualisation de la base de données au cours des 14 derniers jours.
ou
Interrogez le schéma Vue DATABASE_REPLICATION_USAGE_HISTORY (dans le schéma Account Usage de la base de données Snowflake partagée). Cette vue renvoie l’activité d’utilisation de la réplication de base de données au cours des 365 derniers jours (1 an).
Exemple¶
Afficher l’historique de l’opération d’actualisation de la base de données secondaire mydb1
:
select *
from table(information_schema.database_refresh_history(mydb1));
Comparaison des ensembles de données dans les bases de données principales et secondaires¶
Utilisez éventuellement la fonction HASH_AGG pour comparer les lignes d’un ensemble aléatoire de tables dans une base de données primaire et secondaire pour vérifier la cohérence des données. La fonction HASH_AGG renvoie une valeur de hachage globale signée de 64 bits sur l’ensemble (non ordonné) des lignes d’entrée. Interrogez cette fonction sur tout ou un sous-ensemble aléatoire de tables dans une base de données secondaire et sur la base de données principale (à partir de l’horodatage de l’instantané de la base de données principale) et comparez la sortie.
Exemple¶
Exécutée sur la base de données secondaire¶
Sur la base de données secondaire, interrogez la fonction de table DATABASE_REFRESH_PROGRESS (dans Schéma d’information de Snowflake). Notez le
snapshot_transaction_timestamp
dans la colonneDETAILS
pour la phasePRIMARY_UPLOADING_DATA
. Il s’agit de l’horodatage du dernier instantané de la base de données principale.select parse_json(details)['snapshot_transaction_timestamp'] from table(information_schema.database_refresh_progress(mydb)) where phase_name = 'PRIMARY_UPLOADING_DATA';
Interrogez la fonction HASH_AGG pour une table spécifiée. La requête suivante renvoie une valeur de hachage pour toutes les lignes de la table
mytable
:SELECT HASH_AGG( * ) FROM mytable;
Exécutée sur la base de données principale¶
Sur la base de données principale, interrogez la fonction HASH_AGG pour la même table. À l’aide de Time Travel, spécifiez l’horodatage auquel le dernier instantané a été pris pour la base de données secondaire :
SELECT HASH_AGG( * ) FROM mytable AT(TIMESTAMP => '<snapshot_transaction_timestamp>'::TIMESTAMP);
Comparez les résultats des deux requêtes. La sortie doit être identique.