À propos de Snowflake Notebooks

Snowflake Notebooks est une interface de développement unifiée dans l”Snowsight qui offre un environnement de programmation interactif, basé sur des cellules, pour Python, SQL et Markdown. Sur Snowflake Notebooks, vous pouvez exploiter vos données Snowflake pour effectuer des analyses de données exploratoires, développer des modèles de machine learning et exécuter d’autres workflows de science des données et d’ingénierie des données, le tout dans la même interface.

  • Explorez et expérimentez les données déjà présentes dans Snowflake, ou chargez de nouvelles données dans Snowflake à partir de fichiers locaux, d’un stockage cloud externe ou d’ensembles de données provenant de Snowflake Marketplace.

  • Écrivez du code SQL ou Python et comparez rapidement les résultats avec le développement et l’exécution cellule par cellule.

  • Visualisez vos données de manière interactive à l’aide de visualisations Streamlit intégrées et d’autres bibliothèques comme Altair, Matplotlib ou seaborn.

  • Intégrez Git pour collaborer avec un outil de contrôle des versions efficace. Voir Synchroniser Snowflake Notebooks avec un référentiel Git.

  • Contextualisez les résultats et prenez des notes sur les différents résultats à l’aide de cellules et de graphiques Markdown.

  • Exécutez votre notebook selon une planification pour automatiser les pipelines. Voir Planifiez l’exécution de votre notebook Snowflake.

  • Utilisez le contrôle d’accès basé sur les rôles et les autres fonctionnalités de gouvernance des données disponibles dans Snowflake pour permettre à d’autres utilisateurs ayant le même rôle de voir le notebook et de collaborer dessus.

  • Créez un notebook privé stocké dans votre base de données personnelle, dans lequel vous pouvez développer du code de manière interactive et expérimenter avec des données de production. Voir Notebooks privés.

Un exemple de notebook dans Snowsight UI

Exécutions des notebooks

Snowflake Notebooks propose deux types d’environnements d’exécution : l’environnement d’exécution de l’entrepôt et l’environnement d’exécution du conteneur. Notebooks s’appuie sur des entrepôts virtuels et/ou des pools de calcul Snowpark Container Services pour fournir la ressource de calcul. Pour les deux architectures, les requêtes SQL et Snowpark sont toujours poussées vers le bas pour être exécutées sur l’entrepôt afin d’optimiser les performances.

L’environnement d’exécution de l’entrepôt est le moyen le plus rapide de démarrer, avec un environnement d’entrepôt familier et généralement disponible. Le runtime de conteneur fournit un environnement plus flexible qui peut prendre en charge de nombreux types de charges de travail différents, notamment l’ingénierie des données et les analyses SQL. Vous pouvez installer des paquets Python supplémentaires si le runtime de conteneur n’inclut pas ce dont vous avez besoin par défaut. L’environnement d’exécution du conteneur existe également en versions CPU et GPU qui disposent de nombreux paquets ML populaires préinstallés, ce qui les rend idéales pour les charges de travail ML et d’apprentissage en profondeur.

Le tableau suivant présente les fonctionnalités prises en charge pour chaque type de runtime. Vous pouvez utiliser ce tableau pour vous aider à décider quel runtime est le mieux adapté à votre cas d’utilisation.

Fonctionnalités prises en charge

Runtime d’entrepôt

Container Runtime

Calcul

Le noyau fonctionne sur l’entrepôt du notebook.

Le noyau s’exécute sur le nœud Compute Pool.

Environnement

Python 3.9

Python 3.10

Image de base

Streamlit + Snowpark

Runtime de conteneur Snowflake. Les images CPU et GPU sont préinstallées avec un ensemble de bibliothèques Python.

Bibliothèques Python supplémentaires

Installation via Snowflake Anaconda ou à partir d’une zone de préparation Snowflake.

Installation via pip ou à partir d’une zone de préparation Snowflake.

Assistance à l’édition

  • Cellules Python, SQL et Markdown.

  • Sorties de référence des cellules SQL dans les cellules Python et inversement.

  • Utilisation de bibliothèques de visualisation comme Streamlit.

Identique à l’entrepôt

Accès

Rôle de propriétaire requis pour pouvoir accéder aux notebooks et les modifier.

Identique à l’entrepôt

Fonctions prises en charge par les notebooks (encore en avant-première)

  • Intégration de Git (avant-première)

  • Planification (avant-première)

Identique à l’entrepôt

Premiers pas avec Snowflake Notebooks

Pour commencer à expérimenter Snowflake Notebooks, connectez-vous à Snowsight, configurez votre compte de sorte à pouvoir utiliser des notebooks, puis sélectionnez Notebooks dans le volet Projects. Vous trouverez dans votre compte une liste des notebooks auxquels vous avez accès. Vous pouvez soit créer un nouveau notebook à partir de zéro, soit charger un fichier .ipynb existant.

Le tableau suivant indique les rubriques à consulter si vous ne connaissez pas encore sur les Snowflake Notebooks :

Guide de prise en main

Configurer un notebook Snowflake

Configurer Snowflake Notebooks

Instructions pour les développeurs et les administrateurs avant d’utiliser un notebook.

Créer un notebook Snowflake

Créer un notebook Snowflake

Créez un nouveau notebook à partir de zéro ou d’un fichier existant.

Développer et exécuter du code dans le notebook Snowflake

Développer et exécuter du code dans un notebook Snowflake

Créez, modifiez, exécutez des cellules Python, SQL, Markdown.

Guides du développeur

Guide

Description

Contexte de la session dans les notebooks

Accès et modification du contexte de la session.

Enregistrement des résultats dans les notebooks

Sauvegarde des notebooks et des résultats d’une session à l’autre.

Importer des paquets Python pour les utiliser dans les notebooks

Importation du paquet Python depuis le canal Anaconda.

Visualisez et interagissez avec vos données dans le notebook

Visualisez des données avec matplotlib, plotly, altair et développez une application de données avec Streamlit.

Référencement de cellules et de variables dans le notebook

Référence à la sortie de cellules SQL et à des valeurs de variables Python.

Raccourcis clavier pour les notebooks

Tirez parti des raccourcis clavier pour naviguer et rationaliser l’expérience de modification.

Améliorer les workflows de votre notebook

Guide

Description

Synchroniser Snowflake Notebooks avec Git

Contrôlez la version de votre notebook pour la collaboration et le développement.

Travailler avec des fichiers dans un notebook

Gérez et travaillez avec des fichiers dans l’environnement de votre notebook.

Planifier les exécutions du notebook

Planifiez l’exécution des notebooks et exécutez le code au sein de Snowflake.

Explorer Snowflake avec des notebooks

Tirez parti d’autres capacités de Snowflake au sein des Snowflake Notebooks.

Dépanner les erreurs de Snowflake Notebooks

Dépannage des erreurs que vous pouvez rencontrer lors de l’utilisation de Snowflake Notebooks.

Démarrages rapides (Quickstarts)

Cas d’utilisation mis en évidence

Consultez les cas d’utilisation mis en évidence pour la science des données, l’ingénierie des données et ML/AI dans Github.

Ingénierie des données sur les notebooks Snowflake

Ingénierie des données

Développez, gérez, planifiez et exécutez des pipelines de données évolutifs avec SQL et Snowpark.

Science des données à l'aide de notebooks Snowflake

Science de données

Explorez, visualisez et analysez vos données avec Python et SQL.

Machine learning à l'aide de notebooks Snowflake

Machine Learning et AI

Ingénierie des fonctions, entraînement et développement de modèles avec Cortex et Snowpark ML.

Note

Ces démarrages rapides ne sont donnés qu’à titre d’exemple. Suivre l’exemple peut nécessiter des droits supplémentaires sur les données, les produits ou les services de tiers qui ne sont pas détenus ou fournis par Snowflake. Snowflake ne garantit pas l’exactitude de ces exemples.

Ressources supplémentaires

  • Pour les démonstrations, les tutoriels et les exemples de notebooks, voir la collection de démonstrations Snowflake Notebooks dans GitHub.

  • Pour voir des tutoriels en vidéo, consultez la liste de lecture Snowflake Notebooks YouTube.

  • Pour en savoir plus sur les commandes SQL permettant de créer, d’exécuter et d’afficher des notebooks, consultez la référence d’API |sf-notebooks|.

  • Vous recherchez des architectures de référence, des cas d’utilisation spécifiques à votre secteur d’activité et les meilleures pratiques en matière de solutions utilisant des notebooks ? Voir des exemples de notebooks dans le Snowflake Solution Center.