Snowpark-Entwicklerhandbuch für Python¶
Die Snowpark-Bibliothek bietet eine intuitive API für das Abfragen und Verarbeiten von Daten in einer Datenpipeline. Mit der Snowpark-Bibliothek können Sie Anwendungen erstellen, die Daten in Snowflake verarbeiten, ohne dass Daten in das System verschoben werden müssen, das Ihren Anwendungscode ausführt. Sie können die Datenumwandlung und -verarbeitung auch automatisieren, indem Sie gespeicherte Prozeduren schreiben und diese Prozeduren als Aufgaben in Snowflake planen.
Erste Schritte¶
Sie können Snowpark Python-Code in einer lokalen Entwicklungsumgebung oder in einem Python-Arbeitsblatt in Snowsight schreiben.
Wenn Sie eine Clientanwendung schreiben müssen, richten Sie eine lokale Entwicklungsumgebung ein, indem Sie wie folgt vorgehen:
Richten Sie Ihre bevorzugte Entwicklungsumgebung ein, um Snowpark-Apps zu erstellen. Weitere Informationen dazu finden Sie unter Einrichten Ihrer Entwicklungsumgebung für Snowpark Python.
Richten Sie eine Sitzung ein, um mit der Snowflake-Datenbank zu interagieren. Weitere Informationen dazu finden Sie unter Erstellen einer Sitzung für Snowpark Python.
Wenn Sie eine gespeicherte Prozedur schreiben möchten, um Aufgaben in Snowflake zu automatisieren, verwenden Sie Python-Arbeitsblätter in Snowsight. Weitere Informationen dazu finden Sie unter Schreiben von Snowpark-Code in Python-Arbeitsblättern.
Snowpark Python-Code schreiben¶
Mit Snowpark Python können Sie Daten auf vielfältige Weise abfragen, verarbeiten und umwandeln.
Abfragen und Verarbeiten von Daten mit einem
DataFrame
-Objekt. Weitere Informationen dazu finden Sie unter Verwenden von DataFrames in Snowpark Python.Konvertieren von kundenspezifischen Lambdas und Funktionen in benutzerdefinierte Funktionen (UDFs), die Sie zum Verarbeiten von Daten aufrufen können. Weitere Informationen dazu finden Sie unter Erstellen von benutzerdefinierten Funktionen (UDFs) für DataFrames in Python.
Schreiben Sie eine benutzerdefinierte Tabellenfunktion (UDTF), die Daten verarbeitet und Daten in einer Menge von Zeilen mit einer oder mehreren Spalten zurückgibt. Weitere Informationen dazu finden Sie unter Erstellen von benutzerdefinierten Tabellenfunktionen (UDTFs) für DataFrames in Python.
Schreiben einer gespeicherten Prozedur, die Sie aufrufen können, um Daten zu verarbeiten, oder Automatisieren mit einer Aufgabe, um eine Datenpipeline zu erstellen. Weitere Informationen dazu finden Sie unter Gespeicherte Prozeduren für DataFrames in Python erstellen.
Machine Learning-Aufgaben ausführen¶
Sie können Snowpark Python verwenden, um Aufgaben zum maschinellen Lernen wie das Trainieren von Modellen auszuführen:
Trainieren von Modellen für maschinelles Lernen durch Schreiben von gespeicherten Prozeduren. Weitere Informationen dazu finden Sie unter Training von Machine Learning-Modellen mit Snowpark Python.
Trainieren, Bewerten und Optimieren von Modellen für maschinelles Lernen mithilfe von gespeicherten Snowpark Python-Prozeduren und Bereitstellen der trainierten Modelle über benutzerdefinierten Funktionen. Weitere Informationen dazu finden Sie unter Maschinelles Lernen mit Snowpark Python – Vorhersage von Kreditkartengenehmigungen (Snowflake-Quickstarts)
Problembehandlung von Snowpark Python-Code¶
Beheben Sie Fehler in Ihrem Code mit Protokollierungsanweisungen und durch Anzeigen der zugrunde liegenden SQL. Weitere Informationen dazu finden Sie unter Problembehandlung mit Snowpark Python.
Daten zur Code-Ausführung erfassen und analysieren¶
Sie können Protokollmeldungen und Ablaufverfolgungsereignisse zur späteren Analyse in einer Ereignistabelle erfassen. Weitere Informationen dazu finden Sie unter Übersicht zu Protokollierung und Ablaufverfolgung.
API-Referenz¶
Die Referenz zur Snowpark Python-API enthält ausführliche Informationen zu den verfügbaren Klassen und Methoden. Weitere Informationen finden Sie in der Snowpark-Bibliothek für Python-API-Referenz
Eine Liste der Änderungen an der API zwischen den Versionen finden Sie unter Versionshinweise zur Snowpark-Bibliothek für Python.