Configuration de votre environnement de développement pour Snowpark Python¶
Configurez votre environnement de développement local préféré pour créer des applications client avec Snowpark Python.
Si vous écrivez une procédure stockée avec Snowpark Python, envisagez plutôt de configurer une feuille de calcul Python.
Dans ce chapitre :
Conditions préalables¶
Les versions de Python prises en charge sont les suivantes :
3,8
3,9
3,10
3,11
Note
Python 3.9 dépend de la version 1.5.0 du client Snowpark. Python 3.10 dépend de la version 1.5.1 du client Snowpark. Python 3.11 dépend de la version 1.9.0 du client Snowpark.
Vous pouvez créer un environnement virtuel Python pour une version particulière de Python à l’aide d’outils tels que Anaconda, Miniconda, ou virtualenv.
Par exemple, pour utiliser conda afin de créer un environnement virtuel Python 3.8, ajouter le canal conda Snowflake et installer les paquets numpy et pandas, tapez :
conda create --name py38_env --override-channels -c https://repo.anaconda.com/pkgs/snowflake python=3.8 numpy pandas pyarrow
Il est recommandé de créer un nouvel environnement conda localement avec le canal Snowflake afin de bénéficier de la meilleure expérience lors de l’utilisation des UDFs. Pour plus d’informations, voir Développement et tests locaux.
Note
Il existe un problème connu d’exécution de Snowpark Python sur les puces Apple M1 en raison de la gestion de la mémoire dans pyOpenSSL. Le message d’erreur affiché est « Cannot allocate write execute memory for ffi.callback() » [Impossible d’allouer de la mémoire en écriture+exécution pour ffi.callback()].
Comme solution de contournement, configurez un environnement virtuel qui utilise Python x86 à l’aide des commandes suivantes :
CONDA_SUBDIR=osx-64 conda create -n snowpark python=3.8 numpy pandas pyarrow --override-channels -c https://repo.anaconda.com/pkgs/snowflake
conda activate snowpark
conda config --env --set subdir osx-64
Ensuite, installez Snowpark dans cet environnement comme décrit dans la section suivante.
Conditions préalables à l’utilisation de DataFrames Pandas¶
L’API Snowpark fournit des méthodes pour écrire des données vers et depuis des DataFrames Pandas. Pandas est une bibliothèque d’analyse de données. Avec Pandas, vous utilisez une structure de données appelée DataFrame pour analyser et manipuler des données bidimensionnelles.
Ces méthodes nécessitent les bibliothèques suivantes :
Pandas 1.0.0 (ou supérieur).
Version 8.0.0. de la bibliothèque PyArrow.
Note
Si PyArrow n’est pas installé, vous n’avez pas besoin d’installer PyArrow vous-même ; l’installation de Snowpark installe automatiquement la version appropriée de PyArrow.
Si vous avez déjà installé une version de la bibliothèque PyArrow autre que la version recommandée ci-dessus, désinstallez PyArrow avant d’installer Snowpark.
Ne réinstallez pas une version différente de PyArrow après avoir installé Snowpark.
Instructions d’installation¶
Note
Avant d’exécuter les commandes de cette section, assurez-vous que vous vous trouvez dans un environnement Python et que la version de Python est prise en charge. Vous pouvez le vérifier en saisissant la commande python -V
. Si la version affichée n’est pas une version prise en charge, reportez-vous à la section précédente.
Installez le paquet Snowpark Python dans l’environnement virtuel Python en utilisant conda
ou pip
.
conda install snowflake-snowpark-python
-ou-
pip install snowflake-snowpark-python
En option, spécifiez les paquets que vous souhaitez installer dans l’environnement, comme, par exemple, le package d’analyse de données Pandas :
conda install snowflake-snowpark-python pandas pyarrow
-ou-
pip install "snowflake-snowpark-python[pandas]"
Vous pouvez consulter la description du projet Snowpark Python sur le dépôt Python Package Index (PyPi).
Configuration d’un carnet Jupyter pour Snowpark¶
Pour commencer à utiliser Snowpark avec Jupyter Notebooks, procédez comme suit :
Installez Jupyter Notebooks :
pip install notebook
Démarrez un Jupyter Notebook :
jupyter notebook
Dans le coin supérieur droit de la page Web qui s’est ouverte, sélectionnez New » Python 3 Notebook.
Dans une cellule, créez une session. Pour plus d’informations, voir Création d’une session.
Mise en place d’un IDE pour Snowpark¶
Vous pouvez utiliser Snowpark avec un environnement de développement intégré (IDE).
Pour utiliser Snowpark avec Microsoft Visual Studio Code, installez l’extension Python et spécifiez ensuite l’environnement Python à utiliser.
Pour utiliser les fonctionnalités de création et de débogage des procédures stockées Snowpark Python dans le VS Code, installez l” Snowflake Extension for Visual Studio Code. L’extension vous permet de vous connecter à Snowflake et d’exécuter des instructions SQL directement dans VS Code.
Important
Vous devez sélectionner manuellement l’environnement Python que vous avez créé lorsque vous avez configuré votre environnement de développement. Pour ce faire, utilisez la commande Python: Select Interpreter
de la Command Palette
. Pour plus d’informations, voir Utilisation des environnements Python dans du code VS dans la documentation de Microsoft Visual Studio.
Importation de modules¶
Les principales classes de l’API Snowpark se trouvent dans le module snowflake.snowpark
.
Pour importer des noms particuliers d’un module, spécifiez les noms. Par exemple :
>>> from snowflake.snowpark.functions import avg