Catalogue Snowflake Horizon

Snowflake Horizon Catalog permet aux organisations de découvrir et de gouverner les données, les applications et les modèles grâce à un ensemble intégré de fonctionnalités de conformité, de sécurité, de confidentialité, de découverte et de collaboration. Il s’agit d’une solution unifiée qui permet de relever les défis à l’échelle de l’entreprise tout en répondant aux divers besoins des utilisateurs qui travaillent avec le contenu de l’organisation.

Qui bénéficie de Snowflake Horizon Catalog ?

Snowflake Horizon Catalog fournit une solution à tous ceux qui ont un intérêt dans la gestion, la découverte ou l’action sur le contenu d’une organisation. Ces parties prenantes sont les suivantes :

Gestionnaires de données:

Les gestionnaires de données veulent fournir un accès aux données, aux applications et aux modèles tout en veillant à ce que les bonnes personnes aient accès au contenu. Ils veulent identifier les données sensibles et les protéger de manière appropriée. Il leur incombe de déterminer qui utilise quelles données et de comprendre la qualité de ces données.

Snowflake Horizon Catalog permet aux gestionnaires de données de gouverner efficacement le contenu de l’organisation grâce à une solution intégrée. Ils peuvent protéger le contenu à un niveau granulaire pour le rendre accessible en toute sécurité à un public plus large ; utiliser des outils qui contrôlent la sécurité, la qualité des données et le flux de données sensibles : et vérifier en permanence qui a accédé aux données et si cet accès s’est fait en toute sécurité.

Équipes de données:

Les équipes de données composées d’analystes, de scientifiques des données et d’ingénieurs de données ont souvent du mal à trouver les données, l’application ou le modèle qui conviennent à leur tâche. Après avoir trouvé un objet, il est difficile de savoir si les données sont à jour et fiables, ce que les colonnes signifient et qui en est le propriétaire. Même lorsqu’ils ont déterminé qu’il s’agit des bonnes données, l’accès à celles-ci peut prendre des jours, voire des semaines.

Snowflake Horizon Catalog aide les équipes chargées des données à trouver et à collaborer plus rapidement sur des contenus pertinents. Snowflake Horizon Catalog aide ces équipes à extraire plus de valeur du contenu en facilitant la recherche des bonnes données, la compréhension des données afin de s’assurer qu’elles répondent aux exigences et l’action sur ces données. Les équipes chargées des données peuvent améliorer la collaboration et les décisions fondées sur les données en s’appuyant sur les annonces d’organisation pour découvrir et inclure des produits de données pertinents et à jour partagés par leurs collègues et répliqués automatiquement par le biais du Marketplace interne.

Portée du contenu d’une organisation

Horizon Catalog régit et rend accessible bien plus que les tables et vues Snowflake dans le stockage interne d’un compte. Il couvre un large éventail de contenus, dont les suivants :

  • Données, applications et modèles dans les comptes de l’ensemble de votre organisation, y compris les données partagées à l’aide des annonces d’organisation et du Marketplace interne.

  • Données provenant de tables Tables Apache Iceberg™ et de tables externes </user-guide/tables-external-intro>.

  • Données partagées par le biais d’annonces privées par des partenaires de confiance.

  • Données accessibles au public et chaque Snowflake Native App de Snowflake Marketplace.

  • Données provenant d’applications et de systèmes de données tiers introduites dans Snowflake à l’aide de connecteurs.

Contenu de gouvernance

Snowflake Horizon Catalog fournit les outils dont un gestionnaire de données a besoin pour gouverner les données, les applications et les modèles d’une organisation.

Conformité:

Horizon Catalog vous permet d’effectuer les opérations suivantes :

  • Auditez l’historique des accès à et les dépendances à l’objet du contenu.

  • Contrôlez la qualité des données à l’aide des fonctions intégrées et personnalisées de métrique des données, ce qui vous permet de résoudre les problèmes et de les visualiser. Vous pouvez configurer une alerte basée sur la table centralisée pour permettre des notifications de qualité des données en temps quasi réel.

  • Voir lignée des données dans l”Snowsight pour comprendre la lignée des tables et des colonnes d’une table source vers une table cible et pour définir des balises sur les colonnes qui apparaissent dans une table en aval ou en amont.

  • Vue des objets [1] à l’aide d’une interface utilisateur qui vous permet d’obtenir des informations sur les tables et les vues sans avoir à écrire du SQL. Vous pouvez déterminer qui accède aux données, les requêtes qui accèdent le plus fréquemment aux données, si quelqu’un a modifié la gouvernance des données, s’il existe des dépendances en aval ou en amont des données, et si les données ont été classées comme sensibles.

  • Suivez les données en contrôlant les balises, qui peuvent être des balises définies par l’utilisateur mises en œuvre avec le balisage des objets ou des balises de classification (définies par le système ou personnalisées) qui ont été automatiquement attribuées aux colonnes sur la base du contenu de la colonne.

[1] Actuellement en avant-première privée.

Sécurité:

Horizon Catalog vous permet d’effectuer les opérations suivantes :

Confidentialité:

Horizon Catalog vous permet d’effectuer les opérations suivantes :

  • Définissez et affectez des politiques d’agrégation et des politiques de projection pour contrôler le type de requêtes pouvant être exécutées sur les données partagées. Les politiques d’agrégation obligent les analystes à exécuter des requêtes qui agrègent les données plutôt que d’extraire des lignes individuelles. Les politiques de projection déterminent si un analyste peut utiliser une instruction SELECT pour projeter une colonne particulière.

  • Ouvrez les données hautement sensibles aux analystes tout en protégeant l’identité des personnes. Confidentialité différentielle utilise des mathématiques rigoureuses pour protéger vos données contre des attaques sophistiquées relatives à la confidentialité.

  • Facilitez la collaboration tout en préservant la confidentialité en utilisant une Snowflake Data Clean Room.

  • Développez qui peut tirer des enseignements de données sensibles en générant synthétiquement des données présentant des caractéristiques similaires avec lesquelles ils peuvent travailler directement.

Découvrir et agir sur le contenu

Les équipes chargées des données s’appuient sur les données, les applications et les modèles d’une organisation pour faire leur travail. Snowflake Horizon Catalog fournit à ces équipes les outils dont elles ont besoin pour découvrir du contenu pour leur tâche, évaluer ce contenu pour s’assurer qu’il est pertinent et digne de confiance et prendre des mesures sur le contenu.

Découverte:

Horizon Catalog vous permet d’effectuer les opérations suivantes :

  • Utilisez le Marketplace interne pour découvrir les données au sein de votre organisation et prendre les mesures qui s’imposent. Le Marketplace interne est un site réservé aux entreprises qui vous permet de découvrir des annonces d’organisation. Les pages d’annonce de type Wiki, complétées par des dictionnaires de données et des exemples SQL validés, simplifient l’identification des produits de données élaborés par les équipes internes. Aucune configuration supplémentaire n’est nécessaire - il suffit de copier le nom de l’annonce et les données sont prêtes à être utilisées immédiatement.

  • Recherchez des données, des applications et des modèles à l’aide de Universal Search, qui est une interface utilisateur qui vous permet de trouver du contenu à l’intérieur et à l’extérieur de votre organisation en utilisant le langage naturel.

  • Comprenez rapidement le contenu d’une table et de ses colonnes en lisant les descriptions générées par AI. Les propriétaires d’objets peuvent cliquer sur un simple bouton dans l”Snowsight pour générer ces descriptions, ce qui augmente la probabilité que les objets et les colonnes aient des commentaires utiles. Ces commentaires utiles améliorent la possibilité de découvrir des objets grâce à Universal Search.

  • Parcourez les données publiquement disponibles sur la Snowflake Marketplace.

  • Évaluez la pertinence des données en utilisant les connaissances sur les objets dans l”Snowsight [3] pour examiner la popularité, l’accès, la qualité et les dépendances du contenu.

[3] Actuellement en avant-première privée.

Collaboration:

Horizon Catalog vous permet d’effectuer les opérations suivantes :

Cas d’utilisation : voir Horizon Catalog en action

Supposons que BazFin, une grande entreprise de services financiers, doive garantir la conformité, la qualité des données et la facilité d’utilisation de son contenu, qui consiste en 10 PB de données. BazFin utilise Horizon Catalog pour gouverner et découvrir le contenu.

Gouverner le contenu

Le chief data officer (CDO) de BazFin doit assurer aux parties prenantes de l’entreprise que les décisions commerciales sont fondées sur des données de haute qualité. Le CDO demande au gestionnaire de données d’exploiter les fonctions de métrique des données définies par le système et personnalisées afin de contrôler régulièrement la qualité des données. Chaque jour, le CDO peut consulter un tableau de bord conçu à partir de la table des événements pour rendre compte de la qualité des données.

Reprenant son travail de la journée, la gestionnaire de données ouvre le Centre de confiance pour vérifier la sécurité globale d’un compte Snowflake récemment créé pour une nouvelle division. À partir d’une interface intégrée, il identifie que quelqu’un a oublié de définir une politique réseau pour protéger le compte du trafic réseau inconnu.

Découvrir le contenu et agir dessus

Un analyste BazFin souhaite créer un nouveau tableau de bord pour afficher les produits les plus performants. L’analyste se rend sur le Marketplace interne et trouve l’annonce de l’organisation qui lui convient, avec les données de performance publiées par l’équipe financière. L’analyste consulte un Data Dictionary pour avoir un avant-première des données, puis commence immédiatement à faire des requêtes sur les données à l’aide du localisateur d’annonces unifiées de l’emplacement.

L’analyste souhaite également enrichir les données de BazFin avec des données de tiers. En se tournant vers Universal Search, l’analyste utilise le terme de recherche en langage naturel income bands for zipcodes, qui renvoie un produit de données de Snowflake Marketplace qu’il peut associer aux données de performance du produit BazFin.