À propos de Snowflake Notebooks¶
Snowflake Notebooks est une interface de développement dans Snowsight qui offre un environnement de programmation interactif, basé sur des cellules, pour Python et SQL. Dans Snowflake Notebooks, vous pouvez effectuer des analyses de données exploratoires, développer des modèles de machine learning et effectuer d’autres tâches de science des données et d’ingénierie des données en un seul endroit.
Explorez et expérimentez les données déjà présentes dans Snowflake, ou chargez de nouvelles données dans Snowflake à partir de fichiers locaux, d’un stockage cloud externe ou d’ensembles de données provenant de Snowflake Marketplace.
Écrivez du code SQL ou Python et comparez rapidement les résultats avec le développement et l’exécution cellule par cellule.
Visualisez vos données de manière interactive à l’aide de visualisations Streamlit intégrées et d’autres bibliothèques comme Altair, Matplotlib ou seaborn.
Contextualisez les résultats et prenez des notes sur les différents résultats à l’aide de cellules Markdown.
Conservez vos données actualisées en vous fiant au comportement par défaut qui consiste à exécuter une cellule et toutes les cellules modifiées qui la précèdent ou déboguez votre notebook en l’exécutant cellule par cellule.
Exécutez votre notebook selon une planification. Voir Planifiez l’exécution de votre notebook Snowflake.
Utilisez le contrôle d’accès basé sur les rôles et les autres fonctionnalités de gouvernance des données disponibles dans Snowflake pour permettre à d’autres utilisateurs ayant le même rôle de voir le notebook et de collaborer dessus.

Exécutions des notebooks¶
Snowflake Notebooks propose deux types de runtime : le runtime d’entrepôt et le runtime de conteneur. Notebooks s’appuie sur des entrepôts virtuels et/ou des pools de calcul Snowpark Container Services pour fournir la ressource de calcul. Pour les deux architectures, les requêtes SQL et Snowpark sont toujours poussées vers le bas pour être exécutées sur l’entrepôt afin d’optimiser les performances.
Le runtime d’entrepôt vous offre le moyen le plus rapide de démarrer, avec un environnement d’entrepôt familier qui est généralement disponible. Le runtime de conteneur fournit un environnement plus flexible qui peut prendre en charge de nombreux types de charges de travail différents, notamment l’ingénierie des données et les analyses SQL. Vous pouvez installer des paquets Python supplémentaires si le runtime de conteneur n’inclut pas ce dont vous avez besoin par défaut. Le runtime de conteneur est également disponible dans les versions CPU et GPU qui comportent un grand nombre de paquets ML populaires préinstallés, ce qui les rend idéaux pour les charges de travail d’apprentissage profond (deep learning) et ML.
Le tableau suivant présente les fonctionnalités prises en charge pour chaque type de runtime. Vous pouvez utiliser ce tableau pour vous aider à décider quel runtime est le mieux adapté à votre cas d’utilisation.
Fonctionnalités prises en charge |
Runtime d’entrepôt |
Container Runtime |
---|---|---|
Calcul |
Le noyau s’exécute sur l’entrepôt par défaut géré par Snowflake. |
Le noyau s’exécute sur le nœud Compute Pool. |
Environnement |
Python 3.9 |
Python 3.10 |
Image de base |
Streamlit + Snowpark |
Runtime de conteneur Snowflake. Les images CPU et GPU sont préinstallées avec un ensemble de bibliothèques Python. |
Bibliothèques Python supplémentaires |
Installation via Snowflake Anaconda ou à partir d’une zone de préparation Snowflake. |
Installation via |
Assistance à l’édition |
|
Identique à l’entrepôt |
Accès |
Rôle de propriétaire requis pour pouvoir accéder aux notebooks et les modifier. |
Identique à l’entrepôt |
Fonctionnalités de notebook prises en charge |
|
Identique à l’entrepôt |
Premiers pas avec Snowflake Notebooks¶
Pour commencer à expérimenter Snowflake Notebooks, connectez-vous à Snowsight, configurez votre compte de sorte à pouvoir utiliser des notebooks, puis sélectionnez Notebooks dans le volet Projects. Vous trouverez dans votre compte une liste des notebooks auxquels vous avez accès. Vous pouvez soit créer un nouveau notebook à partir de zéro, soit charger un fichier .ipynb
existant.
Le tableau suivant indique les rubriques à consulter si vous ne connaissez pas encore sur les Snowflake Notebooks :
Guide de prise en main |
|
---|---|
Configurer Snowflake Notebooks Instructions pour les développeurs et les administrateurs avant d’utiliser un notebook. |
|
Créez un nouveau notebook à partir de zéro ou d’un fichier existant. |
|
Développer et exécuter du code dans un notebook Snowflake Créez, modifiez, exécutez des cellules Python, SQL, Markdown. |
Guides du développeur¶
Guide |
Description |
---|---|
Accès et modification du contexte de la session. |
|
Enregistrement des notebooks et des résultats d’une session à l’autre. |
|
Importer des paquets Python pour les utiliser dans les notebooks |
Importation du paquet Python depuis le canal Anaconda. |
Visualisez et interagissez avec vos données dans le notebook |
Visualisez des données avec matplotlib, plotly, altair et développez une application de données avec Streamlit. |
Référence à la sortie de cellules SQL et à des valeurs de variables Python. |
|
Tirez parti des raccourcis clavier pour naviguer et rationaliser l’expérience de modification. |
Améliorer les workflows de votre notebook¶
Guide |
Description |
---|---|
Contrôlez la version de votre notebook pour la collaboration et le développement. |
|
Gérez et travaillez avec des fichiers dans l’environnement de votre notebook. |
|
Planifiez l’exécution des notebooks et exécutez le code au sein de Snowflake. |
|
Tirez parti d’autres capacités de Snowflake au sein des Snowflake Notebooks. |
|
Dépannage des erreurs que vous pouvez rencontrer lors de l’utilisation de Snowflake Notebooks. |
Démarrages rapides (Quickstarts)¶
Commencer avec votre premier notebook Snowflake [Vidéo] [Source]
Apprenez à démarrer rapidement votre premier projet de notebook en moins de 10 minutes.
Visualisation de données avec Snowflake Notebooks [Vidéo] [Source]
Découvrez comment vous pouvez créer des récits de données convaincants à l’aide de visualisations, de Markdown, d’images et d’applications de données interactives, le tout dans votre notebook, aux côtés de votre code et de vos données.
Cas d’utilisation mis en évidence¶
Consultez les cas d’utilisation mis en évidence pour la science des données, l’ingénierie des données et ML/AI dans Github.
Développez, gérez, planifiez et exécutez des pipelines de données évolutifs avec SQL et Snowpark. |
|
Explorez, visualisez et analysez vos données avec Python et SQL. |
|
Ingénierie des fonctions, entraînement et développement de modèles avec Cortex et Snowpark ML. |
Note
Ici, ce ne sont que des exemples, et si vous suivez l’exemple, vous pourriez avoir besoin de droits supplémentaires sur des données, des produits ou des services tiers qui ne sont pas détenus ou fournis par Snowflake. Snowflake ne garantit pas l’exactitude de ces exemples.
Ressources supplémentaires¶
Pour des démonstrations, des tutoriels et des exemples de notebooks, consultez la collection de démonstrations de Snowflake Notebooks sur Github.
Pour voir des vidéos de tutoriels, consultez la playlist YouTube relative aux Snowflake Notebooks.
Pour en savoir plus sur les commandes SQL permettant de créer, d’exécuter et d’afficher des notebooks, consultez la référence d’API |sf-notebooks|.
Vous recherchez des architectures de référence, des cas d’utilisation spécifiques à votre secteur d’activité et les meilleures pratiques en matière de solutions utilisant des notebooks ? Voir des exemples de notebooks dans le Snowflake Solution Center.