Juin 2022¶
Les nouvelles fonctionnalités, les changements de comportement et les mises à jour (améliorations, corrections, etc.) suivants ont été introduits ce mois-ci. Si vous avez des questions sur ces ajouts, veuillez contacter le support Snowflake.
Important
Chaque version peut inclure des mises à jour nécessitant l’actualisation de l’interface Web.
En règle générale, pour éviter que ces mises à jour nuisent à votre utilisation, nous vous recommandons d’actualiser l’interface Web après le déploiement de chaque version de Snowflake.
Dans ce chapitre :
Nouvelles fonctionnalités¶
Snowpark API pour Python — Avant-première¶
Nous avons le plaisir d’annoncer l’avant-première de l’API Snowpark pour Python.
Snowpark est une nouvelle expérience de développement qui offre une API intuitive pour l’interrogation et le traitement des données dans un pipeline de données. Grâce à cette bibliothèque, vous pouvez créer des applications qui traitent les données dans Snowflake sans les déplacer vers le système où s’exécute le code de votre application.
Les fonctionnalités en avant-première sont destinées à des fins d’évaluation et de test et ne sont pas recommandées pour une utilisation en production.
Pour plus d’informations, voir Guide du développeur Snowpark pour Python.
UDFs Python — Avant-première¶
Nous avons le plaisir d’annoncer en avant-première l’introduction d’UDFs Python (fonctions définies par l’utilisateur).
Les utilisateurs peuvent désormais écrire des fonctions personnalisées dans le langage de programmation Python et les appeler comme s’il s’agissait de fonctions intégrées.
Les fonctionnalités en avant-première sont destinées à des fins d’évaluation et de test et ne sont pas recommandées pour une utilisation en production.
Pour plus d’informations, voir Introduction aux UDFs Python.
Interface lots UDF Python — Avant-première¶
Nous avons le plaisir d’annoncer en avant-première l’introduction de l’API par lots UDF Python
L’API par lots UDF Python permet de définir des fonctions Python qui reçoivent des lots de lignes d’entrée sous forme de DataFrames Pandas et renvoient des lots de résultats sous forme de tableaux ou de séries Pandas. Vous appelez des UDFs Python qui utilisent l’API par lots de la même manière que vous appelez les autres UDFs Python.
Les fonctionnalités en avant-première sont destinées à des fins d’évaluation et de test et ne sont pas recommandées pour une utilisation en production.
Pour plus d’informations, voir UDFs Python vectorisées.
UDTFs Python — Avant-première¶
Nous avons le plaisir d’annoncer en avant-première l’introduction d’UDTFs Python (fonctions de table définies par l’utilisateur).
Les UDTFs Python étendent les capacités de développement natives de Snowflake en combinant les avantages des fonctions de table avec la puissance, la flexibilité et la facilité de la programmation en Python.
Les fonctionnalités en avant-première sont destinées à des fins d’évaluation et de test et ne sont pas recommandées pour une utilisation en production.
Pour plus d’informations, voir Écriture d’une UDTF en Python.
Procédures stockées Snowpark pour Python — Avant-première¶
Nous avons le plaisir d’annoncer en avant-première l’introduction de procédures stockées Snowpark for Python. Vous pourrez ainsi écrire des procédures stockées en Python en utilisant l’API Snowpark.
Dans votre procédure stockée, vous pouvez utiliser l’API Snowpark pour Python pour héberger vos pipelines de données dans Snowflake. Par exemple, vous pouvez écrire des procédures stockées dans les cas où vous devez exécuter votre code Snowpark sans lancer une application client (par exemple, à partir d’une tâche).
Les fonctionnalités en avant-première sont destinées à des fins d’évaluation et de test et ne sont pas recommandées pour une utilisation en production.
Pour plus d’informations, voir Écriture de procédures stockées en Python.
Nouvelles régions¶
Nous avons le plaisir d’annoncer la disponibilité immédiate de la nouvelle région suivante :
Plate-forme Cloud |
Région |
---|---|
Microsoft Azure |
Inde centrale (Pune) |
Avec l’ajout de cette région, Snowflake prend désormais en charge 32 régions du monde sur trois plates-formes de Cloud (AWS, GCP et Azure), dont trois régions qui répondent à la conformité avec les réglementations gouvernementales US.
La nouvelle région prend en charge toutes les éditions de Snowflake. Vous pouvez provisionner les comptes initiaux dans la région par le biais du libre-service ou d’un représentant de Snowflake.
Mises à jour SQL¶
Commande ALTER TAG : ajout d’une prise en charge de la politique de masquage¶
Avec cette version, Snowflake met à jour la commande ALTER TAG pour permettre de spécifier une politique de masquage.
Syntaxe |
Description |
---|---|
ALTER TAG <nom_balise> SET MASKING POLICY <nom_politique_masquage> [ , MASKING POLICY <nom_politique_masquage_2> , … ] ALTER TAG <nom_balise> UNSET MASKING POLICY <nom_politique_masquage> [ , MASKING POLICY <nom_politique_masquage_2> , … ] |
Utilisez une commande ALTER TAG pour définir une politique de masquage sur une balise ou pour désactiver une politique de masquage sur une balise. Notez que la syntaxe de la commande ALTER TAG permet d’assigner plusieurs politiques de masquage à une balise dans une seule instruction, et que la commande ne prend en charge qu’une seule politique de masquage pour chaque type de données (par exemple, VARCHAR, NUMBER). |
Nouvelles fonctions¶
Les fonctions suivantes sont désormais disponibles avec cette version :
Catégorie |
Nom |
Description |
---|---|---|
Système |
Renvoie la valeur de la chaîne de balise attribuée à la colonne en fonction de la balise spécifiée ou NULL si aucune balise n’est attribuée à la colonne spécifiée. Notez que cette fonction ne peut être utilisée qu’à l’intérieur des conditions de la politique de masquage. |
|
Système |
Renvoie la valeur de la chaîne de balise attribuée à la table en fonction de la balise spécifiée ou NULL si aucune balise n’est attribuée à la table spécifiée. Notez que cette fonction ne peut être utilisée qu’à l’intérieur des conditions de la politique de masquage ou des conditions de la politique d’accès aux lignes. |
Mises à jour de l’entrepôt virtuel¶
Améliorations de latence DML¶
Nous avons le plaisir d’annoncer des améliorations de latence DML pour les charges de travail comportant un nombre élevé d’opérations DML simultanées (par exemple, plus de 100 tâches DML par seconde), telles que les charges de travail d’ingestion ou les charges de travail de type OLTP. Ces améliorations permettent d’accélérer les charges de travail à forte intensité d’écriture et de réduire la charge de l’entrepôt.
Entrepôts plus grands — Avant-première¶
Avec cette version, nous avons le plaisir d’annoncer une amélioration des performances des entrepôts de grande taille (5X-LARGE et 6X-LARGE). Ces entrepôts plus grands peuvent améliorer les performances des charges de travail à forte intensité de calcul et permettre un traitement plus rapide des grands ensembles de données.
Cette fonction en avant-première n’est actuellement disponible que sur Amazon Web Services (AWS) en EU (Irlande), d’autres régions suivront. Avant de provisionner un entrepôt 5X-LARGE ou 6X-LARGE, veuillez contacter l’assistance Snowflake. Les délais de provisionnement pour ces tailles peuvent être légèrement plus longs pendant la phase de prévisualisation.
Pour plus d’informations, voir Vue d’ensemble des entrepôts.
Mises à jour du chargement des données¶
Snowpipe : notifications d’erreur pour Google Cloud Pub/Sub ou Microsoft Azure Event Grid — Avant-première¶
Nous avons le plaisir d’annoncer la prise en charge en avant-première des notifications d’erreur Snowpipe envoyées vers le service de messagerie Cloud Google Cloud Platform Pub/Sub ou Microsoft Azure Event Grid. Lorsque Snowpipe rencontre des erreurs lors du chargement des données de fichiers en zone de préparation dans un service de stockage Cloud pris en charge, cette fonctionnalité déclenche une notification qui décrit les erreurs, ce qui permet une analyse plus approfondie des données des fichiers.
Note
La prise en charge de l’envoi de messages d’erreur à Amazon Simple Notification Service (SNS) est disponible depuis janvier.
Le support cross-Cloud n’est pas disponible pour cette fonctionnalité. Snowpipe peut charger des données à partir de fichiers dans n’importe quel service de stockage Cloud pris en charge ; toutefois, cette fonctionnalité ne peut envoyer des notifications d’erreur qu’au service de messagerie respectif de la plate-forme Cloud qui héberge votre compte Snowflake :
Amazon Simple Notification Service
Google Pub/Sub
Microsoft Azure Event Grid
Cette fonction permet d’envoyer des notifications d’erreur pour les charges provenant de l’auto-ingestion Snowpipe ou les appels à l’API REST Snowpipe.
Les fonctionnalités disponibles en avant-première sont destinées à des fins d’évaluation et de test et ne sont pas recommandées pour une utilisation en production.
Snowpipe : prise en charge de l’appel de l’API REST Snowpipe par des non-propriétaires de canaux¶
Avec cette version, l’appel des points de terminaison REST Snowpipe publics pour charger des données et récupérer des rapports sur l’historique de chargement n’est plus limité au propriétaire d’un canal (c’est-à-dire le rôle ayant le privilège OWNERSHIP sur le canal) ou à un rôle supérieur dans une hiérarchie de rôles. Les privilèges de canaux suivants permettent d’appeler des points de terminaison REST spécifiques :
Privilège de canal |
Points de terminaison REST |
---|---|
MONITOR |
|
OPERATE |
|
Les autres exigences en matière de contrôle d’accès existantes restent les mêmes.
Mises à jour des pipelines de données¶
Tâches : prise en charge de DAG — Avant-première¶
Nous avons le plaisir d’annoncer en avant-première l’introduction de la prise en charge des graphes orientés acycliques (DAG) de tâches. Un DAG est une série de tâches composée d’une seule tâche racine et de tâches supplémentaires, organisées en fonction de leurs dépendances. Auparavant, les utilisateurs étaient limités aux arborescences de tâches, dans lesquelles chaque tâche avait au maximum une seule tâche prédécesseur (parent). Dans un DAG, chaque tâche non-racine peut avoir des dépendances sur plusieurs tâches prédécesseurs, ainsi que sur plusieurs tâches suivantes (enfants) qui dépendent d’elle.
Voici un exemple très simple :
La tâche racine (A) s’exécute selon un calendrier, tel que « toutes les 5 minutes » ou « tous les jours à 5 h (5 AM) et 17 h (5 PM) ». Les tâches B et C s’exécutent simultanément lorsque la tâche A est terminée. La tâche D ne s’exécute que lorsque les deux tâches B et C terminent leur exécution.
Les DAGs permettent des flux de traitement parallèles qui étaient impossibles ou difficiles à réaliser à l’aide d’arborescences de tâches, notamment :
Mise à jour simultanée d’un ensemble de tables de dimension avant d’agréger les faits pour un tableau de bord.
Envoi d’une notification par le biais d’un service de messagerie à distance à l’aide d’une fonction externe après l’achèvement de toutes les tâches précédentes.
Mises à jour de la gouvernance des données¶
Classification des données — Disponibilité générale¶
Avec cette version, Snowflake a le plaisir d’annoncer la disponibilité générale de Introduction à la classification pour les comptes Enterprise Edition (ou supérieurs) sur AWS et Azure. Cette fonctionnalité a été introduite en avant-première en février et est toujours en avant-première sur GCP.
La classification permet de catégoriser les données potentiellement personnelles et/ou sensibles stockées dans les tables et les vues Snowflake, qui peuvent ensuite être utilisées pour permettre une variété de cas d’utilisation de gouvernance, partage et confidentialité des données.
Avec la GA de cette fonctionnalité, nous avons introduit un nouveau modèle de classification des données qui génère des modèles de prédiction et des modèles de données améliorés. En outre, le processus de classification inclut désormais des résultats pour chaque colonne de table spécifiée en entrée, notamment :
Des colonnes dont les types de données ne pouvaient pas être classés auparavant.
Des colonnes comportant uniquement des valeurs NULL.
Pour voir les avantages des améliorations de la GA, vous devez générer de nouveaux résultats pour toutes les données qui ont été classées à l’aide du modèle de classification des données précédent.
Note
Étant donné que le nouveau modèle de classification des données donnera probablement des résultats potentiellement différents lors de la re-classification des données, il n’a pas encore été activé de manière générale. Au lieu de cela, il a été mis en œuvre comme un changement de comportement dans le bundle 2022_04.
Actuellement, pour utiliser le nouveau modèle de classification des données, vous devez opter pour le bundle 2022_04. Pour plus de détails sur le bundle, voir les Notes de version sur les changements de comportement 6.21.
Politiques de masquage basées sur les balises — Avant-première¶
Avec cette version, Snowflake est heureux d’annoncer les politiques de masquage basées sur les balises en avant-première. Une politique de masquage basée sur les balises combine les fonctions de balisage d’objets et de politique de masquage pour permettre de définir une politique de masquage sur une balise à l’aide d’une commande ALTER TAG. Cette fonctionnalité introduit également deux nouvelles fonctions système, SYSTEM$GET_TAG_ON_CURRENT_COLUMN et SYSTEM$GET_TAG_ON CURRENT_TABLE, qui peuvent être utilisées pour obtenir la valeur de la chaîne de balises dans les conditions de la politique.
Lorsque le type de données dans la signature de la politique de masquage et le type de données de la colonne correspondent, la colonne balisée est automatiquement protégée par les conditions de la politique de masquage. Cela simplifie les efforts de protection des données, car les données de la colonne qui doivent être protégées ne nécessitent plus une politique de masquage appliquée manuellement à la colonne pour protéger les données.
Notez qu’une politique de masquage appliquée directement à une colonne à l’aide d’une commande ALTER TABLE … ALTER COLUMN est prioritaire sur la politique de masquage basée sur les balises. Pour plus de détails, voir Politiques de masquage basées sur les balises.
Documentation et matériel d’apprentissage¶
Sujets restructurés sur l’intégration de la sécurité¶
Avec cette version, Snowflake a amélioré la documentation pour les commandes SQL suivantes :
CREATE SECURITY INTEGRATION
ALTER SECURITY INTEGRATION
Le contenu des rubriques existantes est désormais divisé en rubriques plus restreintes portant exclusivement sur chacun des types d’intégration de la sécurité suivants :
OAuth externe
Snowflake OAuth
SCIM
SAML2
Pour soutenir ce changement, huit nouvelles entrées ont été ajoutées sous SQL Command Reference » All Commands dans la TOC.