Réplication automatique pour les annonces¶
Si vous êtes un fournisseur, vous pouvez utiliser l’exécution automatique inter-Cloud (exécution automatique) pour un listing afin de répliquer automatiquement votre produit de données vers d’autres régions Snowflake sans avoir à répliquer manuellement les données.
Lorsque l’exécution automatique est activée pour une annonce, Snowflake exécute automatiquement votre produit de données dans les régions des consommateurs, selon les besoins. Un produit de données est un paquet d’application ou un partage qui est joint à votre listing.
En utilisant l’exécution automatique, vous pouvez éviter de répliquer manuellement vos produits de données et d’approuver les demandes pour vos annonces, ce qui permet aux consommateurs d’accéder plus rapidement à vos annonces.
Note
L’utilisation de l’exécution automatique inter-Cloud dans un Snowflake Native App with Snowpark Container Services est prise en charge uniquement sur Amazon Web Services (AWS) et Microsoft Azure. Voir Comprendre les limites de Snowflake Native App Framework pour plus d’informations.
Comprendre l’exécution automatique¶
L’exécution automatique inter-Cloud vous permet de proposer un produit de données dans n’importe quelle région Snowflake prise en charge, en fonction des options de disponibilité et d’accès que vous avez sélectionnées pour votre listing, sans avoir à répliquer manuellement les données.
Vous pouvez configurer et activer la réplication automatique lorsqu’une annonce est à l’état de projet ou de publication. Lorsque l’exécution automatique est activée pour une annonce, Snowflake exécute automatiquement le produit de votre annonce dans les régions, selon les besoins.
La manière dont vous mettez votre produit de données à disposition dans d’autres régions dépend de votre produit de données et du mode d’accès des consommateurs à votre annonce :
Si votre produit de données est un paquet d’application, utilisez l’exécution automatique pour mettre votre produit de données à disposition dans d’autres régions.
Si votre produit de données est un partage, utilisez l’exécution automatique dans la plupart des cas :
Pour les listings gratuits ou d’essai limités sur le Snowflake Marketplace, vous pouvez utiliser l’exécution automatique inter-Cloud ou répliquer manuellement les données.
Pour les annonces payantes, vous utilisez l’exécution automatique.
Pour toutes les annonces partagées avec des comptes consommateurs spécifiques, Snowsight détecte automatiquement si le compte cible se trouve ou non dans une autre région et active l’exécution automatique. Vous ne pouvez pas répliquer manuellement des annonces privées dans d’autres régions.
Lorsque vous mettez un produit de données à disposition dans d’autres régions, vous devez supporter des coûts supplémentaires. Voir Coûts d’exécution automatique.
Comment fonctionne l’exécution automatique ?¶
En tant que fournisseur, lorsque vous configurez l’exécution automatique inter-Cloud pour votre listing, Snowflake gère le provisionnement pour une zone de partage sécurisée (SSA) et l’exécution automatique de votre produit de données dans des régions distantes. La SSA est gérée par Snowflake. Si votre produit de données existe déjà dans la région distante, les consommateurs de cette région peuvent obtenir le produit de données instantanément.
Votre listing est associé à un produit de données, qu’il s’agisse d’une action ou d’un paquet d’application. Ce produit de données contient des objets provenant d’une ou de plusieurs bases de données, ainsi que la logique d’application d’un paquet d’application. Le moment exact où votre produit de données est automatiquement exécuté dans une région distante dépend de la façon dont vous mettez votre annonce à disposition :
Les annonces privées sont exécutées automatiquement une fois que les consommateurs spécifiés ont reçu votre annonce.
Les annonces publiques partagées sur Snowflake Marketplace sont exécutées automatiquement une fois qu’un consommateur de la région concernée a reçu l’annonce.
Lorsque votre produit de données est exécuté automatiquement dans une nouvelle région pour la première fois, il est transféré vers un SSA dans cette région. Contrairement à la réplication, l’exécution automatique ne maintient pas une réplique synchronisée en permanence. L’exécution automatique peut être configurée avec les paramètres FULL_DATABASE ou SUBDB. FULL_DATABASE met à disposition tous les objets d’une base de données, mais sans synchronisation permanente. SUBDB permet à des objets sélectionnés d’être disponibles à la demande. En matière de réplication, FULL_DATABASE assure une copie synchronisée périodiquement, tandis que SUB_DATABASE synchronise des composants spécifiques.
Plusieurs annonces peuvent utiliser la même base de données, mais celle-ci n’est exécutée automatiquement qu’une seule fois vers une nouvelle région.
Note
Pour Business Critical Edition (BCE), le traitement des données partagées diffère des déploiements de haute sécurité tels que VPS. Bien que BCE n’exige pas la création d’un SSA distinct pour la région, il assure une sécurité des données et une conformité strictes grâce à des fonctions telles que le chiffrement Tri-Secret Secure.
Pour les déploiements tels que Virtual Private Snowflake (VPS) et les environnements Snowflake spécifiques au gouvernement, il existe une zone de partage sécurisée distincte (SSA) pour chaque déploiement. Ainsi, l’exécution automatique reste conforme aux exigences strictes en matière de sécurité et d’isolement des données propres à ces environnements.
Comment l’exécution automatique rafraîchit les données ?¶
Lorsque vous configurez l’exécution automatique pour votre listing, vous pouvez définir un intervalle de rafraîchissement pour votre produit de données.
Après l’exécution automatique initiale de votre produit de données vers le SSA dans une région, les modifications apportées à votre produit de données sont synchronisées à partir de votre compte en fonction de l’actualisation configurée des données :
Type d’actualisation des données |
Description |
---|---|
Actualisation des données basée sur des déclencheurs |
Les fournisseurs peuvent utiliser SYSTEM$TRIGGER_LISTING_REFRESH pour déclencher une actualisation des données à la demande, garantissant ainsi que les consommateurs reçoivent les informations les plus récentes. Snowflake recommande d’utiliser l’actualisation des données basée sur des déclencheurs lorsqu’un processus de pipeline extraction-transformation-chargement (ETL) en amont se termine et que vous souhaitez déclencher une réplication une fois les données prêtes. Par exemple, si vous êtes un fournisseur de données qui fournit une analyse boursière à des institutions financières, vous pouvez déclencher une mise à jour pour tous les analystes avec de nouveaux ensembles de données dès qu’ils sont mis à jour dans votre pipeline ETL en amont. Remarque : Cette fonction n’est disponible qu’avec SQL. |
Actualisation d’un paquet d’application basée sur des déclencheurs |
Si le produit de données d’un listing est un paquet d’application, les fournisseurs peuvent définir SYSTEM$TRIGGER_LISTING_REFRESH pour déclencher une actualisation à la demande du paquet d’application. Toutefois, les fournisseurs doivent exécuter cette fonction chaque fois que le paquet d’application doit être actualisé. Pour configurer le paquet d’application de manière à ce qu’il soit actualisé chaque fois que la directive de version est modifiée, utilisez la clause LISTING_AUTO_REFRESH de la commande ALTER APPLICATION PACKAGE. |
Actualisation des données basée sur des intervalles |
Les fournisseurs peuvent établir une actualisation des données basée sur des intervalles pour tous les consommateurs d’un listing, avec des périodes allant d’une minute à huit jours. Chaque listing associé à une base de données opère selon le même intervalle d’actualisation. La configuration de l’actualisation des données basée sur des intervalles est recommandée lorsque vous avez besoin de mises à jour à une cadence prédéfinie. Par exemple, les fournisseurs qui actualisent les ensembles de données chaque semaine peuvent utiliser l’actualisation basée sur des intervalles pour mettre à jour leur base de données selon la même planification. L’achèvement de chaque actualisation déclenche l’actualisation suivante en fonction de la cadence. Voir Définir l’intervalle d’actualisation au niveau du compte pour plus de détails. Remarque : Cette fonction est disponible avec SQL ou Provider Studio dans Snowsight. |
Actualisation des données basée sur des planifications |
Les fournisseurs peuvent établir un horodatage et une planification pour l’actualisation des données pour tous les consommateurs d’un listing. Tous les listings qui utilisent une base de données sont soumis à la même planification. L’actualisation des données basée sur des planifications est recommandée pour les cas d’utilisation où les mises à jour des listings doivent avoir lieu à un horodatage et selon une planification spécifiques. Par exemple, les fournisseurs de données qui ont besoin d’offrir un horodatage prévisible lorsque les actualisations sont disponibles pour tous les consommateurs. Il n’est pas possible d’utiliser simultanément des actualisations de données basées sur des intervalles et des actualisations de données basées sur des planifications. Si les deux sont configurés, l’un écrasera l’autre. Par exemple, si une expression cron est configurée pour une actualisation planifiée qui a déjà un intervalle d’actualisation, elle sera remplacée pour prendre en charge l’actualisation planifiée. Voir auto_fulfillment pour plus de détails. Remarque : Cette fonction est disponible avec SQL ou Provider Studio dans Snowsight. |
Considérations relatives à l’exécution automatique¶
Lorsque vous utilisez l’exécution automatique pour vos annonces, tenez compte des éléments suivants :
Si vous vous êtes inscrit à Snowflake en utilisant AWS Marketplace, GCP Marketplace, ou Azure Marketplace, vous ne pouvez créer des comptes et des SSAs que dans ces Clouds. L’exécution des annonces dans des régions situées en dehors de votre région actuelle de service Cloud échouera.
Il peut s’écouler un certain temps avant que le produit de données soit disponible pour le consommateur, selon la taille du produit de données. La taille de votre produit de données peut également influencer le coût de l’exécution automatique. Voir Coûts d’exécution automatique pour plus de détails sur le coût.
Le mode niveau objet (SUBDB) est utilisé par défaut.
Si une annonce utilise des objets situés dans une base de données qui est déjà en mode base de données complète (FULL_DATABASE), un avertissement s’affiche dans Snowsight et la base de données reste en mode base de données complète.
Si vous utilisez Tri-Secret Secure, vous devez contacter le support Snowflake pour activer Tri-Secret Secure pour les zones de partage sécurisées utilisées pour l’exécution automatique.
Avec Tri-Secret Secure, les résultats de la requête sont chiffrés à l’aide de trois clés : une fournie par le fournisseur, une par Snowflake et une par le consommateur. Chaque clé régit l’accès de manière indépendante. Si une clé est révoquée, seul son propriétaire en perd l’accès. Par exemple, la révocation de la clé du fournisseur n’empêche pas le consommateur d’accéder aux données qui ont déjà été récupérées.
Note
La réplication automatique impose une limite de 10TB à la taille du produit de données. Si vous rencontrez une erreur de dimensionnement, voir La base de données est supérieure à 10 téraoctets.
Après avoir évalué les implications financières, vous pouvez contacter le support Snowflake pour augmenter la taille limite.