Janvier 2022

Les nouvelles fonctionnalités, les changements de comportement et les mises à jour (améliorations, corrections, etc.) suivants ont été introduits ce mois-ci. Si vous avez des questions sur ces ajouts, veuillez contacter le support Snowflake.

Important

Chaque version peut inclure des mises à jour nécessitant l’actualisation de l’interface Web.

En règle générale, pour éviter que ces mises à jour nuisent à votre utilisation, nous vous recommandons d’actualiser l’interface Web après le déploiement de chaque version de Snowflake.

Dans ce chapitre :

Nouvelles fonctionnalités

UDFs Java sur AWS — Disponibilité générale

Avec cette version, Snowflake a le plaisir d’annoncer la disponibilité générale de la prise en charge des UDFs Java (fonctions définies par l’utilisateur) sur AWS.

Les utilisateurs peuvent écrire des fonctions personnalisées dans le langage de programmation Java et les appeler comme s’il s’agissait de fonctions intégrées. Les utilisateurs peuvent fournir le code source Java en ligne ou apporter leurs fichiers JAR, y compris les bibliothèques.

Pour plus d’informations, voir Introduction aux UDFs Java.

Snowpark sur AWS — Disponibilité générale

Avec cette version, nous avons le plaisir d’annoncer la disponibilité générale de Snowpark sur AWS.

Snowpark est une nouvelle expérience de développement qui offre une API intuitive pour l’interrogation et le traitement des données dans un pipeline de données. Grâce à cette bibliothèque, vous pouvez créer des applications qui traitent les données dans Snowflake sans les déplacer vers le système où s’exécute le code de votre application.

Snowpark possède plusieurs fonctionnalités qui le distinguent des autres bibliothèques clientes :

  • L’API de Snowpark fournit des constructions de langage de programmation pour construire des instructions SQL.

    Par exemple, l’API fournit une méthode de sélection que vous pouvez utiliser pour spécifier les noms de colonnes à retourner, plutôt que d’écrire « nom_colonne_selection » sous forme de chaîne.

    Bien que vous puissiez toujours utiliser une chaîne pour spécifier l’instruction SQL à exécuter, vous bénéficiez de fonctionnalités telles que le remplissage automatique et intelligent du code et la vérification des types lorsque vous utilisez les constructions du langage de programmation fournies par Snowpark.

  • Les opérations Snowpark sont exécutées de manière « lazy » sur le serveur, ce qui réduit la quantité de données transférées entre votre client et la base de données Snowflake.

    L’abstraction de base dans Snowpark est le DataFrame, qui représente un ensemble de données et fournit des méthodes pour opérer sur ces données. Dans votre code client, vous construisez un objet DataFrame et le configurez pour récupérer les données que vous souhaitez utiliser (par exemple, les colonnes contenant les données, le filtre à appliquer aux lignes, etc.)

    Les données ne sont pas récupérées au moment où vous construisez l’objet DataFrame. Au lieu de cela, lorsque vous êtes prêt à récupérer les données, vous pouvez exécuter une action qui évalue les objets DataFrame et envoie les instructions SQL correspondantes à la base de données Snowflake en vue de leur exécution.

  • Vous pouvez créer des fonctions définies par l’utilisateur (UDFs) dans votre code, et Snowpark peut pousser votre code vers le serveur, où le code peut opérer sur les données.

    Vous pouvez écrire des fonctions dans le même langage que celui que vous utilisez pour écrire votre code client (par exemple, en utilisant des fonctions anonymes au format Scala). Pour utiliser ces fonctions afin de traiter les données de la base de données Snowflake, vous devez définir et appeler des fonctions définies par l’utilisateur (UDFs) dans votre code personnalisé.

    Snowpark pousse automatiquement le code personnalisé pour les UDFs vers la base de données Snowflake. Lorsque vous appelez l’UDF dans votre code client, votre code personnalisé est exécuté sur le serveur (où se trouvent les données). Vous n’avez pas besoin de transférer les données à votre client afin d’exécuter la fonction sur les données.

Snowpark est disponible pour le langage de programmation Scala.

Pour plus d’informations, voir API Snowpark.

Prise en charge des données non structurées — Disponibilité générale

Avec cette version, nous avons le plaisir d’annoncer la disponibilité générale de la prise en charge des données non structurées dans Snowflake. Cette fonctionnalité permet aux utilisateurs de consulter, de charger, de gérer et de partager des fichiers non structurés de types de données pour lesquels Snowflake n’a pas de prise en charge native, y compris certains types spécifiques à l’industrie. La prise en charge des fichiers non structurés vient s’ajouter à la prise en charge déjà solide des données structurées et semi-structurées.

La prise en charge des fichiers de données non structurés est assurée par la fonctionnalité suivante :

Exécution de scripts Snowflake — Avant-première

Avec cette version, nous sommes heureux d’annoncer en avant-première l’introduction d’Exécution de scripts Snowflake.

Exécution de scripts Snowflake est une extension de Snowflake SQL qui ajoute la prise en charge de la logique procédurale. Vous pouvez utiliser Exécution de scripts Snowflake pour écrire des procédures stockées dans SQL.

Pour plus d’informations, voir Guide du développeur Exécution de scripts Snowflake.

Mises à jour du chargement des données

Snowpipe : notifications d’erreur pour les comptes Snowflake sur Amazon Web Services — Avant-première

Avec cette version, nous sommes heureux d’annoncer en avant-première l’introduction des notifications d’erreur pour Snowpipe. Lorsque Snowpipe rencontre des erreurs lors du chargement des données d’un fichier en zone de préparation, cette fonctionnalité déclenche une notification qui décrit les erreurs à l’aide de la messagerie dans le Cloud, ce qui permet une analyse plus approfondie des données du fichier.

Note

Cette fonctionnalité est actuellement limitée aux comptes Snowflake hébergés sur Amazon Web Services (AWS). Les objets Pipe d’un compte peuvent charger des données à partir de fichiers dans n’importe quel service de stockage dans le Cloud pris en charge. Toutefois, Snowpipe ne peut envoyer des notifications d’erreur qu’à Amazon Simple Notification Service.

La prise en charge des comptes Snowflake hébergés sur Google Cloud ou Microsoft Azure et des services de messagerie dans le Cloud respectifs est prévue.

Cette fonctionnalité prend en charge les appels vers l’API REST de Snowpipe ainsi que Snowpipe automatisé (auto-ingest) à l’aide d’un service de messagerie dans le Cloud.

Les fonctionnalités disponibles en avant-première sont destinées à des fins d’évaluation et de test et ne sont pas recommandées pour une utilisation en production.

Mises à jour de la gouvernance des données

Politique de masquage avec des colonnes conditionnelles — Disponibilité générale

Avec cette version, Snowflake a le plaisir d’annoncer la disponibilité générale des colonnes conditionnelles (c’est-à-dire des arguments) en tant que configuration optionnelle de la signature de la politique de masquage. Lorsque vous utilisez des colonnes conditionnelles dans la signature de la politique de masquage, la première colonne et son type de données spécifient toujours la colonne sur laquelle l’expression de la politique de masquage opère (c’est-à-dire qu’elle masque ou non les données).

Ces colonnes supplémentaires peuvent être incluses dans l’expression de la politique de masquage pour déterminer si les données de la première colonne doivent être masquées ou non. L’utilisation de colonnes conditionnelles dans une signature de politique de masquage donne aux administrateurs de la politique de masquage une plus grande liberté lors de la création de conditions de politique pour masquer ou non les données.

Pour plus d’informations, voir Comprendre la sécurité au niveau des colonnes.

Mises à jour de l’interface Web

Nouvelle interface Web : Tableau de bord de l’historique des copies — Avant-première

Avec cette version, Snowflake introduit le tableau de bord Copies Over Time qui présente une vue sur 365 jours de l’historique des copies pour les chargements de données en masse (c’est-à-dire à l’aide de la commande COPY INTO <table>) et Snowpipe. Pour voir l’historique des copies pour toutes les tables de votre compte, dans la barre de navigation de gauche, cliquez sur Compute » History » Copies.

Vous pouvez également visualiser la page Copies Over Time pour une table. Pour visualiser le tableau de bord, explorez les objets de votre base de données et sélectionnez une table. Sur la page des détails de la table, cliquez sur Copy History.

Remarque : la nouvelle interface Web est actuellement disponible en avant-première.