À propos de Snowflake Notebooks¶
Snowflake Notebooks est une interface de développement unifiée dans l”Snowsight qui offre un environnement de programmation interactif, basé sur des cellules, pour Python, SQL et Markdown. Sur Snowflake Notebooks, vous pouvez exploiter vos données Snowflake pour effectuer des analyses de données exploratoires, développer des modèles de machine learning et exécuter d’autres workflows de science des données et d’ingénierie des données, le tout dans la même interface.
Explorez et expérimentez les données déjà présentes dans Snowflake, ou chargez de nouvelles données dans Snowflake à partir de fichiers locaux, d’un stockage cloud externe ou d’ensembles de données provenant de Snowflake Marketplace.
Écrivez du code SQL ou Python et comparez rapidement les résultats avec le développement et l’exécution cellule par cellule.
Visualisez vos données de manière interactive à l’aide de visualisations Streamlit intégrées et d’autres bibliothèques comme Altair, Matplotlib ou seaborn.
Intégrez Git pour collaborer avec un outil de contrôle des versions efficace. Voir Synchroniser Snowflake Notebooks avec un référentiel Git.
Contextualisez les résultats et prenez des notes sur les différents résultats à l’aide de cellules et de graphiques Markdown.
Exécutez votre notebook selon une planification pour automatiser les pipelines. Voir Planifiez l’exécution de votre notebook Snowflake.
Utilisez le contrôle d’accès basé sur les rôles et les autres fonctionnalités de gouvernance des données disponibles dans Snowflake pour permettre à d’autres utilisateurs ayant le même rôle de voir le notebook et de collaborer dessus.
Créez un notebook privé stocké dans votre base de données personnelle, dans lequel vous pouvez développer du code de manière interactive et expérimenter avec des données de production. Voir Notebooks privés.

Exécutions des notebooks¶
Snowflake Notebooks propose deux types d’environnements d’exécution : l’environnement d’exécution de l’entrepôt et l’environnement d’exécution du conteneur. Notebooks s’appuie sur des entrepôts virtuels et/ou des pools de calcul Snowpark Container Services pour fournir la ressource de calcul. Pour les deux architectures, les requêtes SQL et Snowpark sont toujours poussées vers le bas pour être exécutées sur l’entrepôt afin d’optimiser les performances.
L’environnement d’exécution de l’entrepôt est le moyen le plus rapide de démarrer, avec un environnement d’entrepôt familier et généralement disponible. Le runtime de conteneur fournit un environnement plus flexible qui peut prendre en charge de nombreux types de charges de travail différents, notamment l’ingénierie des données et les analyses SQL. Vous pouvez installer des paquets Python supplémentaires si le runtime de conteneur n’inclut pas ce dont vous avez besoin par défaut. L’environnement d’exécution du conteneur existe également en versions CPU et GPU qui disposent de nombreux paquets ML populaires préinstallés, ce qui les rend idéales pour les charges de travail ML et d’apprentissage en profondeur.
Le tableau suivant présente les fonctionnalités prises en charge pour chaque type de runtime. Vous pouvez utiliser ce tableau pour vous aider à décider quel runtime est le mieux adapté à votre cas d’utilisation.
Fonctionnalités prises en charge |
Runtime d’entrepôt |
Container Runtime |
---|---|---|
Calcul |
Le noyau fonctionne sur l’entrepôt du notebook. |
Le noyau s’exécute sur le nœud Compute Pool. |
Environnement |
Python 3.9 |
Python 3.10 |
Image de base |
Streamlit + Snowpark |
Runtime de conteneur Snowflake. Les images CPU et GPU sont préinstallées avec un ensemble de bibliothèques Python. |
Bibliothèques Python supplémentaires |
Installation via Snowflake Anaconda ou à partir d’une zone de préparation Snowflake. |
Installation via |
Assistance à l’édition |
|
Identique à l’entrepôt |
Accès |
Rôle de propriétaire requis pour pouvoir accéder aux notebooks et les modifier. |
Identique à l’entrepôt |
Fonctions prises en charge par les notebooks (encore en avant-première) |
|
Identique à l’entrepôt |
Premiers pas avec Snowflake Notebooks¶
Pour commencer à expérimenter Snowflake Notebooks, connectez-vous à Snowsight, configurez votre compte de sorte à pouvoir utiliser des notebooks, puis sélectionnez Notebooks dans le volet Projects. Vous trouverez dans votre compte une liste des notebooks auxquels vous avez accès. Vous pouvez soit créer un nouveau notebook à partir de zéro, soit charger un fichier .ipynb
existant.
Le tableau suivant indique les rubriques à consulter si vous ne connaissez pas encore sur les Snowflake Notebooks :
Guide de prise en main |
|
---|---|
Configurer Snowflake Notebooks Instructions pour les développeurs et les administrateurs avant d’utiliser un notebook. |
|
Créez un nouveau notebook à partir de zéro ou d’un fichier existant. |
|
Développer et exécuter du code dans un notebook Snowflake Créez, modifiez, exécutez des cellules Python, SQL, Markdown. |
Guides du développeur¶
Guide |
Description |
---|---|
Accès et modification du contexte de la session. |
|
Sauvegarde des notebooks et des résultats d’une session à l’autre. |
|
Importer des paquets Python pour les utiliser dans les notebooks |
Importation du paquet Python depuis le canal Anaconda. |
Visualisez et interagissez avec vos données dans le notebook |
Visualisez des données avec matplotlib, plotly, altair et développez une application de données avec Streamlit. |
Référence à la sortie de cellules SQL et à des valeurs de variables Python. |
|
Tirez parti des raccourcis clavier pour naviguer et rationaliser l’expérience de modification. |
Améliorer les workflows de votre notebook¶
Guide |
Description |
---|---|
Contrôlez la version de votre notebook pour la collaboration et le développement. |
|
Gérez et travaillez avec des fichiers dans l’environnement de votre notebook. |
|
Planifiez l’exécution des notebooks et exécutez le code au sein de Snowflake. |
|
Tirez parti d’autres capacités de Snowflake au sein des Snowflake Notebooks. |
|
Dépannage des erreurs que vous pouvez rencontrer lors de l’utilisation de Snowflake Notebooks. |
Démarrages rapides (Quickstarts)¶
Commencer avec votre premier notebook Snowflake [Vidéo] [Source]
Apprenez à démarrer rapidement votre premier projet de notebook en moins de 10 minutes.
Visualisation de données avec Snowflake Notebooks [Vidéo] [Source]
Découvrez comment vous pouvez créer des récits de données convaincants à l’aide de visualisations, de Markdown, d’images et d’applications de données interactives, le tout dans votre notebook, aux côtés de votre code et de vos données.
Cas d’utilisation mis en évidence¶
Consultez les cas d’utilisation mis en évidence pour la science des données, l’ingénierie des données et ML/AI dans Github.
Développez, gérez, planifiez et exécutez des pipelines de données évolutifs avec SQL et Snowpark. |
|
Explorez, visualisez et analysez vos données avec Python et SQL. |
|
Ingénierie des fonctions, entraînement et développement de modèles avec Cortex et Snowpark ML. |
Note
Ces démarrages rapides ne sont donnés qu’à titre d’exemple. Suivre l’exemple peut nécessiter des droits supplémentaires sur les données, les produits ou les services de tiers qui ne sont pas détenus ou fournis par Snowflake. Snowflake ne garantit pas l’exactitude de ces exemples.
Ressources supplémentaires¶
Pour les démonstrations, les tutoriels et les exemples de notebooks, voir la collection de démonstrations Snowflake Notebooks dans GitHub.
Pour voir des tutoriels en vidéo, consultez la liste de lecture Snowflake Notebooks YouTube.
Pour en savoir plus sur les commandes SQL permettant de créer, d’exécuter et d’afficher des notebooks, consultez la référence d’API |sf-notebooks|.
Vous recherchez des architectures de référence, des cas d’utilisation spécifiques à votre secteur d’activité et les meilleures pratiques en matière de solutions utilisant des notebooks ? Voir des exemples de notebooks dans le Snowflake Solution Center.