Guide du développeur Snowpark pour Python¶
La bibliothèque Snowpark fournit une API intuitive pour l’interrogation et le traitement des données dans un pipeline de données. Grâce à la bibliothèque Snowpark, vous pouvez créer des applications qui traitent les données dans Snowflake sans les déplacer vers le système où s’exécute le code de votre application. Vous pouvez également automatiser la transformation et le traitement des données en écrivant des procédures stockées et en planifiant ces procédures en tant que tâches dans Snowflake.
Prise en main¶
Vous pouvez écrire du code Snowpark Python dans un environnement de développement local ou dans une feuille de calcul Python dans Snowsight.
Si vous devez écrire une application cliente, configurez un environnement de développement local en procédant comme suit :
Configurez votre environnement de développement préféré pour créer des applications Snowpark. Voir Configuration de votre environnement de développement pour Snowpark Python.
Établissez une session pour interagir avec la base de données Snowflake. Voir Création d’une session pour Snowpark Python.
Si vous souhaitez écrire une procédure stockée pour automatiser des tâches dans Snowflake, utilisez des feuilles de calcul Python dans Snowsight. Voir Écriture de code Snowpark dans des feuilles de calcul Python.
Écrire du code Snowpark Python¶
Vous pouvez interroger, traiter et transformer des données de différentes manières à l’aide de Snowpark Python.
Interrogez et traitez des données avec un objet
DataFrame
. Voir Utilisation de DataFrames dans Snowpark Python.Exécutez votre code pandas directement dans vos données dans Snowflake. Voir pandas on Snowflake.
Convertissez des lambdas et des fonctions personnalisées en fonctions définies par l’utilisateur (UDFs) que vous pouvez appeler pour traiter des données. Voir Création de fonctions définies par l’utilisateur (UDFs) pour DataFrames dans Python.
Écrivez une fonction tabulaire définie par l’utilisateur (UDTF) qui traite les données et renvoie les données dans un ensemble de lignes avec une ou plusieurs colonnes. Voir Création de fonctions de table définies par l’utilisateur (UDTFs) pour DataFrames en Python.
Écrivez une procédure stockée que vous pouvez appeler pour traiter des données, ou automatisez avec une tâche pour créer un pipeline de données. Voir Création de procédures stockées pour DataFrames en Python.
Effectuer des tâches de machine learning¶
Vous pouvez utiliser Snowpark Python pour effectuer des tâches de machine learning telles que des modèles d’entraînement :
Entraînez des modèles de machine learning en écrivant des procédures stockées. Voir Formation de modèles de machine learning avec Snowpark Python.
Entraînez, évaluez et ajustez les modèles de machine learning à l’aide des procédures stockées Snowpark Python et déployez les modèles entraînés avec des fonctions définies par l’utilisateur. Voir Machine Learning avec Snowpark Python - Credit Card Approval Prediction Démarrages rapides (Quickstarts) de Snowflake.
Résoudre les problèmes de code Snowpark Python¶
Dépannez votre code avec des instructions de journalisation et en affichant le code SQL sous-jacent. Voir Dépannage avec Snowpark Python.
Enregistrer et analyser les données relatives à l’exécution du code¶
Vous pouvez enregistrer les messages du journal et les événements de trace dans une table d’événements en vue d’une analyse ultérieure. Pour plus d’informations, voir Journalisation, traçage et métriques.
Référence API¶
La référence API Snowpark pour Python contient de nombreux détails sur les classes et méthodes disponibles. Voir Référence de l’API de la bibliothèque Snowpark pour Python.
Pour obtenir la liste des modifications apportées à l’API entre les versions, voir Notes de version de la bibliothèque Snowpark pour Python.