Configuration de votre environnement de développement pour Snowpark Python

Configurez votre environnement de développement local préféré pour créer des applications client avec Snowpark Python.

Si vous écrivez une procédure stockée avec Snowpark Python, envisagez plutôt de configurer une feuille de calcul Python.

Dans ce chapitre :

Conditions préalables

Les versions de Python prises en charge sont les suivantes :

  • 3,8

  • 3,9

  • 3,10

  • 3,11

Note

Python 3.9 dépend de la version 1.5.0 du client Snowpark. Python 3.10 dépend de la version 1.5.1 du client Snowpark. Python 3.11 dépend de la version 1.9.0 du client Snowpark.

Si vous utilisez Python 3.11, l’administrateur de votre organisation Snowflake doit accepter les conditions d’utilisation de tiers de Snowflake. Pour plus d’informations, voir Utilisation de paquets tiers à partir d’Anaconda.

Vous pouvez créer un environnement virtuel Python pour une version particulière de Python à l’aide d’outils tels que Anaconda, Miniconda, ou virtualenv.

Par exemple, pour utiliser conda afin de créer un environnement virtuel Python 3.8, ajouter le canal conda Snowflake et installer les paquets numpy et pandas, tapez :

conda create --name py38_env --override-channels -c https://repo.anaconda.com/pkgs/snowflake python=3.8 numpy pandas pyarrow
Copy

Il est recommandé de créer un nouvel environnement conda localement avec le canal Snowflake afin de bénéficier de la meilleure expérience lors de l’utilisation des UDFs. Pour plus d’informations, voir Développement et tests locaux.

Note

Il existe un problème connu d’exécution de Snowpark Python sur les puces Apple M1 en raison de la gestion de la mémoire dans pyOpenSSL. Le message d’erreur affiché est « Cannot allocate write execute memory for ffi.callback() » [Impossible d’allouer de la mémoire en écriture+exécution pour ffi.callback()].

Comme solution de contournement, configurez un environnement virtuel qui utilise Python x86 à l’aide des commandes suivantes :

CONDA_SUBDIR=osx-64 conda create -n snowpark python=3.8 numpy pandas pyarrow --override-channels -c https://repo.anaconda.com/pkgs/snowflake
conda activate snowpark
conda config --env --set subdir osx-64
Copy

Ensuite, installez Snowpark dans cet environnement comme décrit dans la section suivante.

Conditions préalables à l’utilisation de DataFrames Pandas

L’API Snowpark fournit des méthodes pour écrire des données vers et depuis des DataFrames Pandas. Pandas est une bibliothèque d’analyse de données. Avec Pandas, vous utilisez une structure de données appelée DataFrame pour analyser et manipuler des données bidimensionnelles.

Ces méthodes nécessitent les bibliothèques suivantes :

Note

Si PyArrow n’est pas installé, vous n’avez pas besoin d’installer PyArrow vous-même ; l’installation de Snowpark installe automatiquement la version appropriée de PyArrow.

Si vous avez déjà installé une version de la bibliothèque PyArrow autre que la version recommandée ci-dessus, désinstallez PyArrow avant d’installer Snowpark.

Ne réinstallez pas une version différente de PyArrow après avoir installé Snowpark.

Instructions d’installation

Note

Avant d’exécuter les commandes de cette section, assurez-vous que vous vous trouvez dans un environnement Python et que la version de Python est prise en charge. Vous pouvez le vérifier en saisissant la commande python -V. Si la version affichée n’est pas une version prise en charge, reportez-vous à la section précédente.

Installez le paquet Snowpark Python dans l’environnement virtuel Python en utilisant conda ou pip.

conda install snowflake-snowpark-python
Copy

-ou-

pip install snowflake-snowpark-python
Copy

En option, spécifiez les paquets que vous souhaitez installer dans l’environnement, comme, par exemple, le package d’analyse de données Pandas :

conda install snowflake-snowpark-python pandas pyarrow
Copy

-ou-

pip install "snowflake-snowpark-python[pandas]"
Copy

Vous pouvez consulter la description du projet Snowpark Python sur le dépôt Python Package Index (PyPi).

Configuration d’un carnet Jupyter pour Snowpark

Pour commencer à utiliser Snowpark avec Jupyter Notebooks, procédez comme suit :

  1. Installez Jupyter Notebooks :

    pip install notebook
    
    Copy
  2. Démarrez un Jupyter Notebook :

    jupyter notebook
    
    Copy
  3. Dans le coin supérieur droit de la page Web qui s’est ouverte, sélectionnez New » Python 3 Notebook.

  4. Dans une cellule, créez une session. Pour plus d’informations, voir Création d’une session.

Mise en place d’un IDE pour Snowpark

Vous pouvez utiliser Snowpark avec un environnement de développement intégré (IDE).

Pour utiliser Snowpark avec Microsoft Visual Studio Code, installez l’extension Python et spécifiez ensuite l’environnement Python à utiliser.

Important

Vous devez sélectionner manuellement l’environnement Python que vous avez créé lorsque vous avez configuré votre environnement de développement. Pour ce faire, utilisez la commande Python: Select Interpreter de la Command Palette. Pour plus d’informations, voir Utilisation des environnements Python dans du code VS dans la documentation de Microsoft Visual Studio.

Importation de modules

Les principales classes de l’API Snowpark se trouvent dans le module snowflake.snowpark.

Pour importer des noms particuliers d’un module, spécifiez les noms. Par exemple :

>>> from snowflake.snowpark.functions import avg
Copy