Guide du développeur Snowpark pour Python¶
La bibliothèque Snowpark fournit une API intuitive pour l’interrogation et le traitement des données dans un pipeline de données. Grâce à la bibliothèque Snowpark, vous pouvez créer des applications qui traitent les données dans Snowflake sans les déplacer vers le système où s’exécute le code de votre application. Vous pouvez également automatiser la transformation et le traitement des données en écrivant des procédures stockées et en planifiant ces procédures en tant que tâches dans Snowflake.
Prise en main¶
Vous pouvez écrire du code Snowpark Python dans un environnement de développement local ou dans une feuille de calcul Python dans Snowsight.
Si vous devez écrire une application cliente, configurez un environnement de développement local en procédant comme suit :
Configurez votre environnement de développement préféré pour créer des applications Snowpark. Reportez-vous à Configuration de votre environnement de développement pour Snowpark Python.
Établissez une session pour interagir avec la base de données Snowflake. Reportez-vous à Création d’une session pour Snowpark Python.
Si vous souhaitez écrire une procédure stockée pour automatiser des tâches dans Snowflake, utilisez des feuilles de calcul Python dans Snowsight. Reportez-vous à Écriture de code Snowpark dans des feuilles de calcul Python.
Écrire du code Snowpark Python¶
Vous pouvez interroger, traiter et transformer des données de différentes manières à l’aide de Snowpark Python.
Interrogez et traitez des données avec un objet
DataFrame
. Reportez-vous à Utilisation de DataFrames dans Snowpark Python.Convertissez des lambdas et des fonctions personnalisées en fonctions définies par l’utilisateur (UDFs) que vous pouvez appeler pour traiter des données. Reportez-vous à Création de fonctions définies par l’utilisateur (UDFs) pour DataFrames dans Python.
Écrivez une fonction tabulaire définie par l’utilisateur (UDTF) qui traite les données et renvoie les données dans un ensemble de lignes avec une ou plusieurs colonnes. Reportez-vous à Création de fonctions de table définies par l’utilisateur (UDTFs) pour DataFrames en Python.
Écrivez une procédure stockée que vous pouvez appeler pour traiter des données, ou automatisez avec une tâche pour créer un pipeline de données. Reportez-vous à Création de procédures stockées pour DataFrames en Python.
Effectuer des tâches de machine learning¶
Vous pouvez utiliser Snowpark Python pour effectuer des tâches de machine learning telles que des modèles d’entraînement :
Entraînez des modèles de machine learning en écrivant des procédures stockées. Reportez-vous à Formation de modèles de machine learning avec Snowpark Python.
Entraînez, évaluez et ajustez les modèles de machine learning à l’aide des procédures stockées Snowpark Python et déployez les modèles entraînés avec des fonctions définies par l’utilisateur. Reportez-vous à Machine Learning avec Snowpark Python - Credit Card Approval Prediction Démarrages rapides (Quickstarts) de Snowflake
Résoudre les problèmes de code Snowpark Python¶
Dépannez votre code avec des instructions de journalisation et en affichant le code SQL sous-jacent. Reportez-vous à Dépannage avec Snowpark Python.
Enregistrer et analyser les données relatives à l’exécution du code¶
Vous pouvez enregistrer les messages du journal et les événements de trace dans une table d’événements en vue d’une analyse ultérieure. Pour plus d’informations, reportez-vous à Vue d’ensemble de la journalisation et du traçage.
Référence API¶
La référence API Snowpark pour Python contient de nombreux détails sur les classes et méthodes disponibles. Reportez-vous à Référence de l’API de la bibliothèque Snowpark pour Python.
Pour voir la liste des modifications apportées à l’API entre les versions, reportez-vous à Notes de version de la bibliothèque Snowpark pour Python.