Verwenden von Snowpark zum Lesen von Daten

Snowpark holt Sie dort ab, wo Ihre Daten gespeichert sind. Unabhängig davon, ob sich Ihre Daten in operativen Datenbanken befinden oder als Dateien ankommen, bietet Snowpark Ihnen eine einfache, Python-gestützte Möglichkeit, die Daten abzurufen, in einen DataFrame umzuwandeln und in Snowflake-Tabellen zu speichern, sodass Sie ohne Kontextwechsel weiter modellieren, transformieren und analysieren können.

Lesen von Daten aus externen Quellen mit der Snowpark Python DB-API

Verwenden Sie Python DB-API 2.0-Standardtreiber zum Abrufen von Daten aus externen Datenbanken (SQL Server, Oracle, PostgreSQL, MySQL, Databricks) und Einfügen direkt in einen Snowpark DataFrame. Die Snowpark Python DB-API kann von Ihrem Client („lokaler“ Modus) oder innerhalb von Snowflake unter Verwendung von gespeicherten Prozeduren oder Notizbüchern (mit Integration für den externen Zugriff) ausgeführt werden. Das Ergebnis verhält sich wie jeder andere DataFrame, den Sie zum Verknüpfen, Transformieren und Schreiben in Snowflake-Tabellen verwenden können. Weitere Informationen dazu finden Sie unter Using the Snowpark Python DB-API.

Lesen von Daten aus XML-Dateien mit dem Snowpark XML RowTag-Reader

Verwenden Sie Snowpark XML zum effizienten Lesen großer XML-Stagingdateien: Der Reader teilt die Datei anhand von rowTag auf, lädt jede Übereinstimmung als eine Zeile und ordnet untergeordnete Elemente VARIANT-Spalten zu (die verschachtelte Struktur bleibt erhalten), um sie sofort mit Snowpark oder SQL abzufragen. Sie können auch jede Zeile anhand einer XSD mit PERMISSIVE (ungültige Zeilen in _corrupt_record unter Quarantäne stellen) oder von FAILFAST-Verhalten validieren. Die Ausgabe ist ein Standard-DataFrame, den Sie umwandeln und in Tabellen speichern können. Weitere Informationen dazu finden Sie unter Verwenden von Snowpark XML RowTag Reader.