Snowparkを使用したデータの読み取り¶
Snowparkは、データが存在する場所にあります。データが運用データベースにあるか、ファイルとして到着するかに関係なく、Snowparkは、データを取り込み、 DataFrame に変換し、Snowflakeテーブルに配置する、簡単なPython優先の方法を提供します。このため、コンテキストを切り替えずにモデリング、変換、分析を続けることができます。
Snowpark Python DB-API を使用した外部ソースからのデータの読み取り¶
標準のPython DB-API 2.0ドライバーを使用して、外部データベース( SQL Server、Oracle、 PostgreSQL 、 MySQL 、Databricks)からSnowpark DataFrame に直接データを取り出します。Snowpark Python DB-API は、クライアント(「ローカル」モード)から、またはSnowflake内でストアドプロシージャまたはノートブック(外部アクセス統合を使用)を使用して実行できます。結果は、結合、変換し、Snowflakeテーブルに書き込める他の DataFrame と同じように動作します。詳細については、 Using the Snowpark Python DB-API をご参照ください。
Snowpark XMLRowTag リーダーを使用した XML ファイルからのデータの読み取り¶
Snowpark XML を使用して大規模なステージングされた XML ファイルを効率的に読み取ります。リーダーは rowTag でファイルを分割し、各一致を1行としてロードし、子要素を VARIANT 列にマッピング(ネストされた構造を保持)するので、Snowparkまたは SQL で直ちにクエリできます。また、各行を PERMISSIVE ( _corrupt_record で無効な行を隔離)または FAILFAST 動作を持つ XSD で検証できます。出力は、変換してテーブルに保存できる標準 DataFrame です。詳細については、 Snowpark XMLRowTag リーダーの使用 をご参照ください。