À propos de Snowflake Notebooks

Snowflake Notebooks est une interface de développement dans Snowsight qui offre un environnement de programmation interactif, basé sur des cellules, pour Python et SQL. Dans Snowflake Notebooks, vous pouvez effectuer des analyses de données exploratoires, développer des modèles de machine learning et effectuer d’autres tâches de science des données et d’ingénierie des données en un seul endroit.

  • Explorez et expérimentez les données déjà présentes dans Snowflake, ou chargez de nouvelles données dans Snowflake à partir de fichiers locaux, d’un stockage cloud externe ou d’ensembles de données provenant de Snowflake Marketplace.

  • Écrivez du code SQL ou Python et comparez rapidement les résultats avec le développement et l’exécution cellule par cellule.

  • Visualisez vos données de manière interactive à l’aide de visualisations Streamlit intégrées et d’autres bibliothèques comme Altair, Matplotlib ou seaborn.

  • Contextualisez les résultats et prenez des notes sur les différents résultats à l’aide de cellules Markdown.

  • Conservez vos données actualisées en vous fiant au comportement par défaut qui consiste à exécuter une cellule et toutes les cellules modifiées qui la précèdent ou déboguez votre notebook en l’exécutant cellule par cellule.

  • Exécutez votre notebook selon une planification. Voir Planifiez l’exécution de votre notebook Snowflake.

  • Utilisez le contrôle d’accès basé sur les rôles et les autres fonctionnalités de gouvernance des données disponibles dans Snowflake pour permettre à d’autres utilisateurs ayant le même rôle de voir le notebook et de collaborer dessus.

Un exemple de notebook dans Snowsight UI

Exécutions des notebooks

Snowflake Notebooks propose deux types de runtime : le runtime d’entrepôt et le runtime de conteneur. Notebooks s’appuie sur des entrepôts virtuels et/ou des pools de calcul Snowpark Container Services pour fournir la ressource de calcul. Pour les deux architectures, les requêtes SQL et Snowpark sont toujours poussées vers le bas pour être exécutées sur l’entrepôt afin d’optimiser les performances.

Le runtime d’entrepôt vous offre le moyen le plus rapide de démarrer, avec un environnement d’entrepôt familier qui est généralement disponible. Le runtime de conteneur fournit un environnement plus flexible qui peut prendre en charge de nombreux types de charges de travail différents, notamment l’ingénierie des données et les analyses SQL. Vous pouvez installer des paquets Python supplémentaires si le runtime de conteneur n’inclut pas ce dont vous avez besoin par défaut. Le runtime de conteneur est également disponible dans les versions CPU et GPU qui comportent un grand nombre de paquets ML populaires préinstallés, ce qui les rend idéaux pour les charges de travail d’apprentissage profond (deep learning) et ML.

Le tableau suivant présente les fonctionnalités prises en charge pour chaque type de runtime. Vous pouvez utiliser ce tableau pour vous aider à décider quel runtime est le mieux adapté à votre cas d’utilisation.

Fonctionnalités prises en charge

Runtime d’entrepôt

Container Runtime

Calcul

Le noyau s’exécute sur l’entrepôt par défaut géré par Snowflake.

Le noyau s’exécute sur le nœud Compute Pool.

Environnement

Python 3.9

Python 3.10

Image de base

Streamlit + Snowpark

Runtime de conteneur Snowflake. Les images CPU et GPU sont préinstallées avec un ensemble de bibliothèques Python.

Bibliothèques Python supplémentaires

Installation via Snowflake Anaconda ou à partir d’une zone de préparation Snowflake.

Installation via pip ou à partir d’une zone de préparation Snowflake.

Assistance à l’édition

  • Cellules Python, SQL et Markdown.

  • Sorties de référence des cellules SQL dans les cellules Python et inversement.

  • Utilisation de bibliothèques de visualisation comme Streamlit.

Identique à l’entrepôt

Accès

Rôle de propriétaire requis pour pouvoir accéder aux notebooks et les modifier.

Identique à l’entrepôt

Fonctionnalités de notebook prises en charge

  • Intégration Git

  • Modification de plusieurs fichiers

  • Planification

Identique à l’entrepôt

Premiers pas avec Snowflake Notebooks

Pour commencer à expérimenter Snowflake Notebooks, connectez-vous à Snowsight, configurez votre compte de sorte à pouvoir utiliser des notebooks, puis sélectionnez Notebooks dans le volet Projects. Vous trouverez dans votre compte une liste des notebooks auxquels vous avez accès. Vous pouvez soit créer un nouveau notebook à partir de zéro, soit charger un fichier .ipynb existant.

Le tableau suivant indique les rubriques à consulter si vous ne connaissez pas encore sur les Snowflake Notebooks :

Guide de prise en main

Configurer un notebook Snowflake

Configurer Snowflake Notebooks

Instructions pour les développeurs et les administrateurs avant d’utiliser un notebook.

Créer un notebook Snowflake

Créer un notebook Snowflake

Créez un nouveau notebook à partir de zéro ou d’un fichier existant.

Développer et exécuter du code dans le notebook Snowflake

Développer et exécuter du code dans un notebook Snowflake

Créez, modifiez, exécutez des cellules Python, SQL, Markdown.

Guides du développeur

Guide

Description

Contexte de la session dans les notebooks

Accès et modification du contexte de la session.

Enregistrement des résultats dans les notebooks

Enregistrement des notebooks et des résultats d’une session à l’autre.

Importer des paquets Python pour les utiliser dans les notebooks

Importation du paquet Python depuis le canal Anaconda.

Visualisez et interagissez avec vos données dans le notebook

Visualisez des données avec matplotlib, plotly, altair et développez une application de données avec Streamlit.

Référencement de cellules et de variables dans le notebook

Référence à la sortie de cellules SQL et à des valeurs de variables Python.

Raccourcis clavier pour les notebooks

Tirez parti des raccourcis clavier pour naviguer et rationaliser l’expérience de modification.

Améliorer les workflows de votre notebook

Guide

Description

Synchroniser Snowflake Notebooks avec Git

Contrôlez la version de votre notebook pour la collaboration et le développement.

Travailler avec des fichiers dans un notebook

Gérez et travaillez avec des fichiers dans l’environnement de votre notebook.

Planifier les exécutions du notebook

Planifiez l’exécution des notebooks et exécutez le code au sein de Snowflake.

Explorer Snowflake avec des notebooks

Tirez parti d’autres capacités de Snowflake au sein des Snowflake Notebooks.

Dépanner les erreurs de Snowflake Notebooks

Dépannage des erreurs que vous pouvez rencontrer lors de l’utilisation de Snowflake Notebooks.

Démarrages rapides (Quickstarts)

Cas d’utilisation mis en évidence

Consultez les cas d’utilisation mis en évidence pour la science des données, l’ingénierie des données et ML/AI dans Github.

Ingénierie des données sur les notebooks Snowflake

Ingénierie des données

Développez, gérez, planifiez et exécutez des pipelines de données évolutifs avec SQL et Snowpark.

Science des données à l'aide de notebooks Snowflake

Science de données

Explorez, visualisez et analysez vos données avec Python et SQL.

Machine learning à l'aide de notebooks Snowflake

Machine Learning et AI

Ingénierie des fonctions, entraînement et développement de modèles avec Cortex et Snowpark ML.

Note

Ici, ce ne sont que des exemples, et si vous suivez l’exemple, vous pourriez avoir besoin de droits supplémentaires sur des données, des produits ou des services tiers qui ne sont pas détenus ou fournis par Snowflake. Snowflake ne garantit pas l’exactitude de ces exemples.

Ressources supplémentaires

  • Pour des démonstrations, des tutoriels et des exemples de notebooks, consultez la collection de démonstrations de Snowflake Notebooks sur Github.

  • Pour voir des vidéos de tutoriels, consultez la playlist YouTube relative aux Snowflake Notebooks.

  • Pour en savoir plus sur les commandes SQL permettant de créer, d’exécuter et d’afficher des notebooks, consultez la référence d’API |sf-notebooks|.

  • Vous recherchez des architectures de référence, des cas d’utilisation spécifiques à votre secteur d’activité et les meilleures pratiques en matière de solutions utilisant des notebooks ? Voir des exemples de notebooks dans le Snowflake Solution Center.