Snowpark-Entwicklerhandbuch für Python¶
Die Snowpark-Bibliothek bietet eine intuitive API für das Abfragen und Verarbeiten von Daten in einer Datenpipeline. Mit der Snowpark-Bibliothek können Sie Anwendungen erstellen, die Daten in Snowflake verarbeiten, ohne dass Daten in das System verschoben werden müssen, das Ihren Anwendungscode ausführt. Sie können die Datenumwandlung und -verarbeitung auch automatisieren, indem Sie gespeicherte Prozeduren schreiben und diese Prozeduren als Aufgaben in Snowflake planen.
Erste Schritte¶
Sie können Snowpark Python-Code in einer lokalen Entwicklungsumgebung oder in einem Python-Arbeitsblatt in Snowsight schreiben.
Wenn Sie eine Clientanwendung schreiben müssen, richten Sie eine lokale Entwicklungsumgebung ein, indem Sie wie folgt vorgehen:
Richten Sie Ihre bevorzugte Entwicklungsumgebung ein, um Snowpark-Apps zu erstellen. Siehe Einrichten Ihrer Entwicklungsumgebung für Snowpark Python.
Richten Sie eine Sitzung ein, um mit der Snowflake-Datenbank zu interagieren. Siehe Erstellen einer Sitzung für Snowpark Python.
Wenn Sie eine gespeicherte Prozedur schreiben möchten, um Aufgaben in Snowflake zu automatisieren, verwenden Sie Python-Arbeitsblätter in Snowsight. Siehe Schreiben von Snowpark-Code in Python-Arbeitsblättern.
Snowpark Python-Code schreiben¶
Mit Snowpark Python können Sie Daten auf vielfältige Weise abfragen, verarbeiten und umwandeln.
Abfragen und Verarbeiten von Daten mit einem
DataFrame
-Objekt. Siehe Verwenden von DataFrames in Snowpark Python.Führen Sie Ihren pandas-Code direkt auf Ihren Daten in Snowflake aus. Siehe pandas on Snowflake.
Konvertieren von kundenspezifischen Lambdas und Funktionen in benutzerdefinierte Funktionen (UDFs), die Sie zum Verarbeiten von Daten aufrufen können. Siehe Erstellen von benutzerdefinierten Funktionen (UDFs) für DataFrames in Python.
Schreiben Sie eine benutzerdefinierte Tabellenfunktion (UDTF), die Daten verarbeitet und Daten in einer Menge von Zeilen mit einer oder mehreren Spalten zurückgibt. Siehe Erstellen von benutzerdefinierten Tabellenfunktionen (UDTFs) für DataFrames in Python.
Schreiben einer gespeicherten Prozedur, die Sie aufrufen können, um Daten zu verarbeiten, oder Automatisieren mit einer Aufgabe, um eine Datenpipeline zu erstellen. Siehe Gespeicherte Prozeduren für DataFrames in Python erstellen.
Machine Learning-Aufgaben ausführen¶
Sie können Snowpark Python verwenden, um Aufgaben zum maschinellen Lernen wie das Trainieren von Modellen auszuführen:
Trainieren von Modellen für maschinelles Lernen durch Schreiben von gespeicherten Prozeduren. Siehe Training von Machine Learning-Modellen mit Snowpark Python.
Trainieren, Bewerten und Optimieren von Modellen für maschinelles Lernen mithilfe von gespeicherten Snowpark Python-Prozeduren und Bereitstellen der trainierten Modelle über benutzerdefinierten Funktionen. Siehe Maschinelles Lernen mit Snowpark Python – Vorhersage von Kreditkartengenehmigungen (Snowflake Quickstarts).
Problembehandlung von Snowpark Python-Code¶
Beheben Sie Fehler in Ihrem Code mit Protokollierungsanweisungen und durch Anzeigen der zugrunde liegenden SQL. Siehe Problembehandlung mit Snowpark Python.
Daten zur Code-Ausführung erfassen und analysieren¶
Sie können Protokollmeldungen und Ablaufverfolgungsereignisse zur späteren Analyse in einer Ereignistabelle erfassen. Weitere Informationen dazu finden Sie unter Protokollierung, Ablaufverfolgung und Metriken.
API-Referenz¶
Die Referenz zur Snowpark Python-API enthält ausführliche Informationen zu den verfügbaren Klassen und Methoden. Siehe Snowpark-Bibliothek für Python-API-Referenz.
Eine Liste der Änderungen an der API zwischen den Versionen finden Sie unter Versionshinweise zur Snowpark-Bibliothek für Python.