Verwenden von Snowpark zum Lesen von Daten¶
Unabhängig davon, ob sich Ihre Daten in operativen Datenbanken befinden oder als Dateien ankommen, bietet Snowpark Ihnen eine einfache, Python-gestützte Möglichkeit, die Daten abzurufen, in einen DataFrame umzuwandeln und in Snowflake-Tabellen anzuzeigen, sodass Sie ohne Kontextwechsel weiter modellieren, transformieren und analysieren können.
Lesen von Daten aus externen Quellen mit der Snowpark Python DB-API¶
Verwenden Sie Python DB-API 2.0-Standardtreiber zum Abrufen von Daten aus externen Datenbanken (SQL Server, Oracle, PostgreSQL, MySQL, Databricks) und Einfügen direkt in einen Snowpark DataFrame. Die Snowpark Python DB-API kann von Ihrem Client („lokaler“ Modus) oder innerhalb von Snowflake unter Verwendung von gespeicherten Prozeduren oder Notizbüchern (mit Integration für den externen Zugriff) ausgeführt werden. Das Ergebnis verhält sich wie jeder andere DataFrame, den Sie zum Verknüpfen, Transformieren und Schreiben in Snowflake-Tabellen verwenden können. Weitere Informationen dazu finden Sie unter Verwenden der Snowpark Python-DB-API.
Lesen von Daten aus externen Quellen mit der Snowpark Python JDBC¶
Verwenden Sie von Ihnen bereitgestellte Standard-JDBC-Treiber, um Daten aus externen Datenbanken direkt in einen Snowpark DataFrame zu ziehen. Snowpark Python JDBC kann von Ihrem Client („lokaler“ Modus) oder innerhalb von Snowflake unter Verwendung von gespeicherten Prozeduren oder Notizbüchern ausgeführt werden. Eine UDTF wird erstellt, um Ihre Zieldaten aufzunehmen. Das Ergebnis verhält sich wie jeder andere DataFrame, den Sie zum Verknüpfen, Transformieren und Schreiben in Snowflake-Tabellen verwenden können. Weitere Informationen dazu finden Sie unter Verwenden der Snowpark Python-JDBC.
Bemerkung
Um dieses Feature zu verwenden, laden Sie den JDBC-Treiber zu einem Stagingbereich hoch, konfigurieren Sie eine externe Zugriffsintegration und stellen Sie sicher, dass Snowflake den Quellendpunkt erreichen kann.
Lesen von Daten aus XML-Dateien mit dem Snowpark XML RowTag-Reader¶
Verwenden Sie Snowpark XML zum effizienten Lesen großer XML-Stagingdateien: Der Reader teilt die Datei anhand von rowTag auf, lädt jede Übereinstimmung als eine Zeile und ordnet untergeordnete Elemente VARIANT-Spalten zu (wobei die verschachtelte Struktur erhalten bleibt), um sie sofort mit Snowpark oder SQL abzufragen. Sie können auch jede Zeile anhand einer XSD mit PERMISSIVE (ungültige Zeilen in _corrupt_record unter Quarantäne stellen) oder von FAILFAST-Verhalten validieren. Die Ausgabe ist ein Standard-DataFrame, den Sie umwandeln und in Tabellen speichern können. Weitere Informationen dazu finden Sie unter Using the Snowpark XML RowTag Reader.