Catalogue Snowflake Horizon¶
Snowflake Horizon Catalog permet aux entreprises de découvrir et de gouverner les données, les applications et les modèles grâce à un ensemble intégré de fonctionnalités de conformité, de sécurité, de confidentialité, de découverte et de collaboration. Il s’agit d’une solution unifiée qui résout les problèmes à l’échelle de l’entreprise, en répondant aux besoins uniques des différents utilisateurs qui travaillent avec le contenu de l’organisation.
Qui bénéficie de Snowflake Horizon Catalog ?¶
Snowflake Horizon Catalog fournit une solution à tous ceux qui ont un intérêt dans la gestion, la découverte ou l’action sur le contenu d’une organisation. Ces parties prenantes sont les suivantes :
- Gestionnaires de données:
Les gestionnaires de données veulent fournir un accès aux données, aux applications et aux modèles tout en veillant à ce que les bonnes personnes aient accès au contenu. Ils veulent identifier les données sensibles et les protéger de manière appropriée. Il leur incombe de déterminer qui utilise quelles données et de comprendre la qualité de ces données.
Snowflake Horizon Catalog permet aux gestionnaires de données de gouverner efficacement le contenu de l’organisation grâce à une solution intégrée. Ils peuvent protéger le contenu à un niveau granulaire pour le rendre accessible en toute sécurité à un public plus large ; utiliser des outils qui contrôlent la sécurité, la qualité des données et le flux de données sensibles : et vérifier en permanence qui a accédé aux données et si cet accès s’est fait en toute sécurité.
- Équipes de données:
Les équipes de données composées d’analystes, de scientifiques des données et d’ingénieurs de données ont souvent du mal à trouver les données, l’application ou le modèle qui conviennent à leur tâche. Après avoir trouvé un objet, il est difficile de savoir si les données sont à jour et fiables, ce que les colonnes signifient et qui en est le propriétaire. Même lorsqu’ils ont déterminé qu’il s’agit des bonnes données, l’accès à celles-ci peut prendre des jours, voire des semaines.
Snowflake Horizon Catalog aide les équipes chargées des données à trouver et à collaborer plus rapidement sur des contenus pertinents. Snowflake Horizon Catalog aide ces équipes à extraire plus de valeur du contenu en facilitant la recherche des bonnes données, la compréhension des données afin de s’assurer qu’elles répondent aux exigences et l’action sur ces données.
Portée du contenu d’une organisation¶
Horizon Catalog régit et rend accessible bien plus que les tables et vues Snowflake dans le stockage interne d’un compte. Il couvre un large éventail de contenus, dont les suivants :
Données, applications et modèles dans les comptes de l’ensemble de votre organisation.
Données provenant de tables Tables Apache Iceberg™ et de tables externes </user-guide/tables-external-intro>.
Données partagées par le biais d’annonces privées par des partenaires de confiance.
Données accessibles au public et chaque Snowflake Native App de Snowflake Marketplace.
Données provenant d’applications et de systèmes de données tiers introduites dans Snowflake à l’aide de connecteurs.
Contenu de gouvernance¶
Snowflake Horizon Catalog fournit les outils dont un gestionnaire de données a besoin pour gouverner les données, les applications et les modèles d’une organisation.
- Conformité:
Horizon Catalog vous permet d’effectuer les opérations suivantes :
Auditez l’historique des accès à et les dépendances à l’objet du contenu.
Contrôlez la qualité des données à l’aide des fonctions intégrées et personnalisées de métrique des données, ce qui vous permet de résoudre les problèmes et de les visualiser. Vous pouvez configurer une alerte basée sur la table centralisée pour permettre des notifications de qualité des données en temps quasi réel.
Affichez la lignée des données dans Snowsight [1] pour comprendre la lignée des tables et des colonnes d’une table source à une table cible, et définissez des balises sur les colonnes qui apparaissent dans une table en aval ou en amont.
Vue des objets [1] à l’aide d’une interface utilisateur qui vous permet d’obtenir des informations sur les tables et les vues sans avoir à écrire du SQL. Vous pouvez déterminer qui accède aux données, les requêtes qui accèdent le plus fréquemment aux données, si quelqu’un a modifié la gouvernance des données, s’il existe des dépendances en aval ou en amont des données, et si les données ont été classées comme sensibles.
Suivez les données en contrôlant les balises, qui peuvent être des balises définies par l’utilisateur mises en œuvre avec le balisage des objets ou des balises de classification (définies par le système ou personnalisées) qui ont été automatiquement attribuées aux colonnes sur la base du contenu de la colonne.
[1] Actuellement en avant-première privée.
- Sécurité:
Horizon Catalog vous permet d’effectuer les opérations suivantes :
Utilisez le Centre de confiance pour déterminer le niveau de sécurité actuel d’un compte et notamment s’il répond aux benchmarks établis par le Center for Internet Security (CIS).
Utilisez le chiffrement de bout en bout pour empêcher les tiers de lire les données au repos ou en transit vers et depuis Snowflake tout en réduisant la surface d’attaque.
Choisissez votre méthode d’authentification préférée telle que OAuth ou authentification fédérée.
Utilisez les contrôles d’autorisation granulaires pour contrôler l’accès aux objets.
Définissez et appliquez des politiques d’accès aux données afin de fournir des protections au niveau des colonnes et des lignes.
- Confidentialité:
Horizon Catalog vous permet d’effectuer les opérations suivantes :
Définissez et affectez des politiques d’agrégation et des politiques de projection pour contrôler le type de requêtes pouvant être exécutées sur les données partagées. Les politiques d’agrégation obligent les analystes à exécuter des requêtes qui agrègent les données plutôt que d’extraire des lignes individuelles. Les politiques de projection déterminent si un analyste peut utiliser une instruction SELECT pour projeter une colonne particulière.
Ouvrez les données hautement sensibles aux analystes tout en protégeant l’identité des personnes. Confidentialité différentielle utilise des mathématiques rigoureuses pour protéger vos données contre des attaques sophistiquées relatives à la confidentialité.
Facilitez la collaboration tout en préservant la confidentialité en utilisant une Snowflake Data Clean Room.
Développez qui peut tirer des enseignements des données sensibles en générant des données de manière synthétique [2] avec des caractéristiques similaires avec lesquelles il est possible de travailler directement.
[2] Actuellement en avant-première privée.
- Découverte:
Horizon Catalog vous permet de comprendre vos données plus rapidement à l’aide des descriptions d’objets alimentées par AI [3].
[3] Actuellement en avant-première privée.
Découvrir et agir sur le contenu¶
Les équipes chargées des données s’appuient sur les données, les applications et les modèles d’une organisation pour faire leur travail. Snowflake Horizon Catalog fournit à ces équipes les outils dont elles ont besoin pour découvrir du contenu pour leur tâche, évaluer ce contenu pour s’assurer qu’il est pertinent et digne de confiance et prendre des mesures sur le contenu.
- Découverte:
Horizon Catalog vous permet d’effectuer les opérations suivantes :
Recherchez des données, des applications et des modèles à l’aide de Universal Search, qui est une interface utilisateur qui vous permet de trouver du contenu à l’intérieur et à l’extérieur de votre organisation en utilisant le langage naturel.
Parcourez le contenu de Snowflake au sein d’une organisation en utilisant le Marketplace interne pour trouver des listes d’organisations [4].
Parcourez les données publiquement disponibles sur la Snowflake Marketplace.
Évaluez la pertinence des données en utilisant les connaissances sur les objets dans Snowsight [4] pour examiner la popularité, l’accès, la qualité et les dépendances du contenu.
Agissez sur une liste en faisant référence à ses données à l’aide d’un Localisateur d’annonces uniformes [4], qui vous permet d’écrire des requêtes sur les données d’une annonce sans avoir à créer une base de données ou à disposer de privilèges administratifs.
[4] Actuellement en avant-première privée.
- Collaboration:
Horizon Catalog vous permet d’effectuer les opérations suivantes :
Partagez des données au sein de votre organisation sur le Marketplace interne [5] et en privé avec des partenaires commerciaux externes à l’aide d”annonces privées.
Achetez et vendez des produits de données sur Snowflake Marketplace.
Gérez vos annonces avec une interface utilisateur ou à l’aide de commandes SQL de manière programmatique.
[5] Actuellement en avant-première privée.
Cas d’utilisation : voir Horizon Catalog en action¶
Supposons que BazFin, une grande entreprise de services financiers, doive garantir la conformité, la qualité des données et la facilité d’utilisation de son contenu, qui consiste en 10 PB de données. BazFin utilise Horizon Catalog pour gouverner et découvrir le contenu.
- Gouverner le contenu
Le chief data officer (CDO) de BazFin doit assurer aux parties prenantes de l’entreprise que les décisions commerciales sont fondées sur des données de haute qualité. Le CDO demande au gestionnaire de données d’exploiter les fonctions de métrique des données définies par le système et personnalisées afin de contrôler régulièrement la qualité des données. Chaque jour, le CDO peut consulter un tableau de bord conçu à partir de la table des événements pour rendre compte de la qualité des données.
Reprenant son travail de la journée, la gestionnaire de données ouvre le Centre de confiance pour vérifier la sécurité globale d’un compte Snowflake récemment créé pour une nouvelle division. À partir d’une interface intégrée, il identifie que quelqu’un a oublié de définir une politique réseau pour protéger le compte du trafic réseau inconnu.
- Découvrir le contenu et agir dessus
Un analyste BazFin souhaite créer un nouveau tableau de bord pour afficher les produits les plus performants. L’analyste se rend sur le Marketplace interne [6] et trouve la bonne annonce organisationnelle [6] avec les données de performance publiées par l’équipe financière. L’analyste consulte un dictionnaire de données pour avoir un aperçu des données, puis lance immédiatement une requête à l’aide du localisateur unifié d’annonces [6].
L’analyste souhaite également enrichir les données de BazFin avec des données de tiers. En se tournant vers Universal Search, l’analyste utilise le terme de recherche en langage naturel
income bands for zipcodes
, qui renvoie un produit de données de Snowflake Marketplace qu’il peut associer aux données de performance du produit BazFin.[6] Actuellement en avant-première privée.