Utilisation de Snowpark pour lire des données

Snowpark vous retrouve là où se trouvent vos données. Que vos données se trouvent dans des bases de données opérationnelles ou qu’elles arrivent sous forme de fichiers, Snowpark vous offre un moyen simple et axé sur Python de les extraire, de les convertir en DataFrame et de les stocker dans des tables Snowflake, afin que vous puissiez continuer à modéliser, transformer et analyser sans avoir à changer de contexte.

Lecture de données provenant de sources externes à l’aide de Snowpark Python DB-API

Utilisez les pilotes Python DB-API 2.0 standard pour extraire des données de bases de données externes (SQL Server, Oracle, PostgreSQL, MySQL, Databricks) directement dans un DataFrame Snowpark. Snowpark Python DB-API peut être exécuté à partir de votre client (mode « local ») ou à l’intérieur de Snowflake à l’aide de procédures stockées ou de notebooks (avec intégration d’accès externe). Le résultat se comporte comme n’importe quel autre DataFrame que vous pouvez utiliser pour joindre, transformer et écrire dans des tables Snowflake. Pour plus d’informations, voir Using the Snowpark Python DB-API.

Lecture de données provenant de fichiers XML utilisant le lecteur Snowpark XML RowTag

Utilisez Snowpark XML pour lire efficacement les fichiers XML volumineux en zone de préparation : le lecteur divise le fichier sur rowTag, charge chaque correspondance sous la forme d’une seule ligne, et mappe les éléments enfants dans des colonnes VARIANT (structure imbriquée préservée) pour une interrogation immédiate avec Snowpark ou SQL. Vous pouvez également valider chaque ligne par rapport à un XSD avec un comportement PERMISSIVE (mise en quarantaine des lignes non valides dans _corrupt_record) ou FAILFAST. La sortie est un DataFrame standard que vous pouvez transformer et enregistrer dans des tables. Pour plus d’informations, voir Utilisation du lecteur XML RowTag.