Einrichten Ihrer Entwicklungsumgebung für Snowpark Python

Richten Sie Ihre bevorzugte lokale Entwicklungsumgebung ein, um Clientanwendungen mit Snowpark Python zu erstellen.

Wenn Sie eine gespeicherte Prozedur mit Snowpark Python schreiben, sollten Sie stattdessen ein Python-Arbeitsblatt einrichten.

Unter diesem Thema:

Voraussetzungen

Folgende Versionen von Python werden unterstützt:

  • 3.8

  • 3.9

  • 3.10

  • 3.11

Bemerkung

Python 3.9 hängt von der Snowpark-Client-Version 1.5.0 ab. Python 3.10 hängt von der Snowpark-Client-Version 1.5.1 ab. Python 3.11 hängt von der Snowpark-Client-Version 1.9.0 ab.

Wenn Sie Python 3.11 verwenden, muss Ihr Snowflake-Organisationsadministrator die Snowflake-Bedingungen für Drittanbieter anerkennen. Weitere Informationen dazu finden Sie unter Verwenden von Drittanbieterpaketen aus Anaconda.

Sie können eine virtuelle Python-Umgebung für eine bestimmte Python-Version mit Tools wie Anaconda, Miniconda oder virtualenv erstellen.

Beispiel: Wenn Sie eine virtuelle Python 3.8-Umgebung mit Conda erstellen möchten, fügen Sie den Snowflake-Conda-Kanal hinzu, und installieren Sie dann die Pakete „numpy“ und „pandas“, indem Sie Folgendes eingeben:

conda create --name py38_env --override-channels -c https://repo.anaconda.com/pkgs/snowflake python=3.8 numpy pandas pyarrow
Copy

Es wird empfohlen, lokal eine neue Conda-Umgebung mit dem Snowflake-Kanal zu erstellen, um bei Verwendung von UDFs die bestmöglichen Nutzungsbedingungen zu erhalten. Weitere Informationen dazu finden Sie unter Lokale Entwicklung und Testen.

Bemerkung

Bei der Ausführung von Snowpark Python auf Apple M1-Chips gibt es ein bekanntes Problem mit der Arbeitsspeicherbehandlung in pyOpenSSL. Die angezeigte Fehlermeldung lautet: „Cannot allocate write execute memory for ffi.callback()“.

Als Problemumgehung können Sie eine virtuelle Umgebung einrichten, die x86 Python verwendet, indem Sie folgende Befehle verwenden:

CONDA_SUBDIR=osx-64 conda create -n snowpark python=3.8 numpy pandas pyarrow --override-channels -c https://repo.anaconda.com/pkgs/snowflake
conda activate snowpark
conda config --env --set subdir osx-64
Copy

Installieren Sie dann Snowpark in dieser Umgebung wie im nächsten Abschnitt beschrieben.

Voraussetzungen für die Verwendung von Pandas DataFrames

Der Snowpark-API bietet Methoden zum Schreiben von Daten in und aus Pandas DataFrames. Pandas ist eine Bibliothek für die Datenanalyse. Bei Pandas verwenden Sie eine Datenstruktur namens DataFrame, um zweidimensionale Daten zu analysieren und zu bearbeiten.

Diese Methoden erfordern die folgenden Bibliotheken:

Bemerkung

Wenn PyArrow bei Ihnen nicht installiert ist, müssen Sie PyArrow nicht selbst installieren. Wenn Sie Snowpark installieren, wird automatisch die passende Version von PyArrow installiert.

Wenn Sie bereits eine andere Version der PyArrow-Bibliothek als die oben empfohlene Version installiert haben, deinstallieren Sie PyArrow, bevor Sie Snowpark installieren.

Führen Sie nach der Installation von Snowpark keine Neuinstallation einer anderen Version von PyArrow durch.

Installationsanleitung

Bemerkung

Bevor Sie die Befehle in diesem Abschnitt ausführen, stellen Sie sicher, dass Sie sich in der Python-Umgebung einer unterstützten Python-Version befinden. Sie können dies überprüfen, indem Sie den Befehl python -V eingeben. Wenn die angezeigte Version keine der unterstützten Python-Versionen ist, lesen Sie den vorherigen Abschnitt.

Installieren Sie das Snowpark Python-Paket mit conda oder pip in der virtuellen Python-Umgebung.

conda install snowflake-snowpark-python
Copy

oder

pip install snowflake-snowpark-python
Copy

Geben Sie optional Pakete an, die Sie in der Umgebung installieren möchten, wie z. B. das Datenanalysepaket Pandas:

conda install snowflake-snowpark-python pandas pyarrow
Copy

oder

pip install "snowflake-snowpark-python[pandas]"
Copy

Die Projektbeschreibung für Snowpark Python finden Sie im Python Package Index (PyPi)-Repository.

Einrichten eines Jupyter-Notebooks für Snowpark

Um mit der Verwendung von Snowpark mit Jupyter Notebooks zu beginnen, gehen Sie wie folgt vor:

  1. Installieren Sie Jupyter Notebooks:

    pip install notebook
    
    Copy
  2. Starten Sie ein Jupyter Notebook:

    jupyter notebook
    
    Copy
  3. Wählen Sie in der rechten oberen Ecke der geöffneten Webseite die Option New » Python 3 Notebook aus.

  4. Erstellen Sie in einer Zelle eine Sitzung. Weitere Informationen dazu finden Sie unter Erstellen einer Sitzung.

Einrichten einer IDE für Snowpark

Sie können Snowpark mit einer integrierten Entwicklungsumgebung (IDE) verwenden.

Um Snowpark mit Microsoft Visual Studio Code zu verwenden, installieren Sie die Python-Erweiterung, und geben Sie dann die zu verwendende Python-Umgebung an.

Wichtig

Sie müssen die Python-Umgebung manuell auswählen, die Sie beim Einrichten Ihrer Entwicklungsumgebung erstellt haben. Verwenden Sie dazu den Befehl Python: Select Interpreter aus dem Menü Command Palette. Weitere Informationen dazu finden Sie in der Microsoft Visual Studio-Dokumentation unter Verwenden von Python-Umgebungen in VS-Code.

Importieren von Modulen

Die wichtigsten Klassen der Snowpark-API befinden sich im Modul snowflake.snowpark.

Um bestimmte Namen aus einem Modul zu importieren, geben Sie die Namen an. Beispiel:

>>> from snowflake.snowpark.functions import avg
Copy