Einrichten Ihrer Entwicklungsumgebung für Snowpark Python

Dieser Themenkomplex enthält eine Anleitung zum Einrichten unterschiedlicher Typen von Anwendungsentwicklungsumgebungen für die Verwendung von Snowpark.

Unter diesem Thema:

Voraussetzungen

Die Snowpark-API erfordert Python 3.8.

Sie können eine virtuelle Python 3.8-Umgebung mit Tools wie Anaconda, Miniconda oder virtualenv erstellen.

Beispiel: Wenn Sie eine virtuelle Python 3.8-Umgebung mit Conda erstellen möchten, fügen Sie den Snowflake-Conda-Kanal hinzu, und installieren Sie dann die Pakete „numpy“ und „pandas“, indem Sie Folgendes eingeben:

conda create --name py38_env --override-channels -c https://repo.anaconda.com/pkgs/snowflake python=3.8 numpy pandas

Es wird empfohlen, lokal eine neue Conda-Umgebung mit dem Snowflake-Kanal zu erstellen, um bei Verwendung von UDFs die bestmöglichen Nutzungsbedingungen zu erhalten. Weitere Informationen dazu finden Sie unter Lokale Entwicklung und Testen.

Bemerkung

Bei der Ausführung von Snowpark Python auf Apple M1-Chips gibt es ein bekanntes Problem mit der Arbeitsspeicherbehandlung in pyOpenSSL. Die angezeigte Fehlermeldung lautet: „Cannot allocate write execute memory for ffi.callback()“.

Als Problemumgehung können Sie eine virtuelle Umgebung einrichten, die x86 Python verwendet, indem Sie folgende Befehle verwenden:

CONDA_SUBDIR=osx-64 conda create -n snowpark python=3.8 numpy pandas --override-channels -c https://repo.anaconda.com/pkgs/snowflake
conda activate snowpark
conda config --env --set subdir osx-64

Installieren Sie dann Snowpark in dieser Umgebung wie im nächsten Abschnitt beschrieben.

Voraussetzungen für die Verwendung von Pandas DataFrames

Der Snowpark-API bietet Methoden zum Schreiben von Daten in und aus Pandas DataFrames. Pandas ist eine Bibliothek für die Datenanalyse. Bei Pandas verwenden Sie eine Datenstruktur namens DataFrame, um zweidimensionale Daten zu analysieren und zu bearbeiten.

Diese Methoden erfordern die folgenden Bibliotheken:

Bemerkung

Wenn PyArrow bei Ihnen nicht installiert ist, müssen Sie PyArrow nicht selbst installieren. Wenn Sie Snowpark installieren, wird automatisch die passende Version von PyArrow installiert.

Wenn Sie bereits eine andere Version der PyArrow-Bibliothek als die oben empfohlene Version installiert haben, deinstallieren Sie PyArrow, bevor Sie Snowpark installieren.

Führen Sie nach der Installation von Snowpark keine Neuinstallation einer anderen Version von PyArrow durch.

Installationsanleitung

Bemerkung

Bevor Sie die Befehle in diesem Abschnitt ausführen, stellen Sie sicher, dass Sie sich in einer Python 3.8-Umgebung befinden. Sie können dies überprüfen, indem Sie den Befehl python -V eingeben. Wenn die angezeigte Version nicht Python 3.8 ist, lesen Sie den vorherigen Abschnitt.

Installieren Sie das Snowpark Python-Paket mit conda oder pip in der virtuellen Python 3.8-Umgebung.

conda install snowflake-snowpark-python

oder

pip install snowflake-snowpark-python

Geben Sie optional Pakete an, die Sie in der Umgebung installieren möchten, wie z. B. das Datenanalysepaket Pandas:

conda install snowflake-snowpark-python pandas

oder

pip install "snowflake-snowpark-python[pandas]"

Die Projektbeschreibung für Snowpark Python finden Sie im Python Package Index (PyPi)-Repository.

Einrichten eines Jupyter-Notebooks für Snowpark

Um mit der Verwendung von Snowpark mit Jupyter Notebooks zu beginnen, finden Sie hier eine Schnellstartanleitung:

  1. Installieren Sie Jupyter Notebooks:

    pip install notebook
    
  2. Starten Sie ein Jupyter Notebook:

    jupyter notebook
    
  3. Wählen Sie in der rechten oberen Ecke der geöffneten Webseite die Option New » Python 3 Notebook aus.

  4. Erstellen Sie in einer Zelle eine Sitzung. Weitere Informationen dazu finden Sie unter Erstellen einer Sitzung.

Einrichten einer IDE für Snowpark

Sie können Snowpark mit einer integrierten Entwicklungsumgebung (IDE) verwenden.

Um Snowpark mit Microsoft Visual Studio Code zu verwenden, installieren Sie die Python-Erweiterung, und geben Sie dann die zu verwendende Python-Umgebung an.

Wichtig

Sie müssen die Python 3.8-Umgebung manuell auswählen, die Sie beim Einrichten Ihrer Entwicklungsumgebung erstellt haben. Verwenden Sie dazu den Befehl Python: Select Interpreter aus dem Menü Command Palette. Weitere Informationen dazu finden Sie in der Microsoft Visual Studio-Dokumentation unter Verwenden von Python-Umgebungen in VS-Code.

Importieren von Modulen

Die wichtigsten Klassen der Snowpark-API befinden sich im Modul snowflake.snowpark.

Um bestimmte Namen aus einem Modul zu importieren, geben Sie die Namen an. Beispiel:

>>> from snowflake.snowpark.functions import avg