Continuous data pipeline examples¶
Cette rubrique fournit des exemples pratiques de cas d’utilisation pour des pipelines de données.
Conditions préalables¶
Le rôle utilisé pour exécuter les instructions SQL dans ces exemples nécessite les privilèges de contrôle d’accès suivants :
EXECUTE TASKPrivilège EXECUTE TASK global pour exécuter des tâches
USAGEPrivilège USAGE sur la base de données et le schéma dans lesquels les instructions SQL sont exécutées, ainsi que sur l’entrepôt qui exécute les tâches dans ces exemples.
CREATE objectDivers privilèges
CREATE objectsur le schéma dans lequel les instructions SQL sont exécutées, pour créer des objets tels que des tables, des flux et des tâches.
Pour plus d’informations sur le contrôle d’accès dans Snowflake, voir Aperçu du contrôle d’accès.
Transform loaded JSON data on a schedule¶
L’exemple suivant charge des données JSON brutes dans une seule table de destination nommée raw. Deux tâches interrogent les flux de table créés sur la table raw et insèrent des sous-ensembles de lignes dans plusieurs tables. Étant donné que chaque tâche consomme les enregistrements de capture de données modifiées dans un flux de table, plusieurs flux sont requis.
Unload data on a schedule¶
L’exemple suivant décharge les enregistrements de capture de données modifiées dans un flux dans une zone de préparation interne (c’est-à-dire Snowflake).
Refresh external table metadata on a schedule¶
L’exemple suivant actualise les métadonnées d’une table externe nommée mydb.myschema.exttable (à l’aide de ALTER EXTERNAL TABLE … REFRESH) selon une planification.
Note
Lorsqu’une table externe est créée, le paramètre AUTO_REFRESH est défini sur TRUE par défaut. Nous vous recommandons d’accepter cette valeur par défaut pour les tables externes qui référencent les fichiers de données dans les zones de préparation Amazon S3 ou Microsoft Azure. Cependant, l’option d’actualisation automatique n’est pas disponible actuellement pour les tables externes qui font référence aux zones de préparation de Google Cloud Storage. Pour ces tables externes, l’actualisation manuelle des métadonnées selon une planification peut être utile.