Microsoft Azureからの一括ロード¶
既にMicrosoft Azureアカウントをお持ちで、データファイルの保存と管理にAzure BLOBストレージコンテナーを使用している場合は、Snowflakeへの一括ロードに既存のコンテナーとフォルダーパスを利用できます。
このトピックセットでは、 COPY コマンドを使用してAzureコンテナーからテーブルにデータをロードする方法について説明します。
Snowflakeは現在、BLOBストレージからのロードのみをサポートしています。Snowflakeは、次のタイプのストレージアカウントをサポートしています。
BLOBストレージ
Data Lake Storage Gen2
汎用v1
汎用v2
Snowflakeは、Data Lake Storage Gen1をサポート していません。
注釈
ブロック、追加、およびページBLOBからのロードがサポートされています。アンロードされたファイルはブロックBLOBとして作成されます。これらのBLOBタイプの詳細については、 BLOBタイプに関するAzureドキュメント をご参照ください。
Data Lake Storage Gen2で階層型名前空間が有効になっている場合、Snowflakeは COPY コマンドによるファイルのパージをサポートしません。階層型名前空間は、データをディレクトリとサブディレクトリに整理します。Azureでは空のディレクトリしか削除できないため、 PURGE オプションと COPY コマンドを使って再帰的にディレクトリを削除することはできません。
次の図に示すように、Azureコンテナーからのデータのロードは2つの手順で実行されます。
- ステップ1:
Snowflakeでは、データファイルが既にAzureコンテナーにステージングされていることを前提としています。まだステージングされていない場合は、Microsoftが提供するアップロードインターフェイス/ユーティリティを使用してファイルをステージングします。
- ステップ2:
COPY INTO <テーブル> コマンドを使用して、ステージングされたファイルの内容をSnowflakeデータベーステーブルにロードします。バケットからは直接ロードできますが、Snowflakeでは、バケットを参照する外部ステージを作成し、代わりに外部ステージを使用することをお勧めします。
コマンドを手動またはスクリプト内で実行する場合は、使用する方法に関係なく、このステップでは、稼働中の現行の仮想ウェアハウスがセッションのために必要です。ウェアハウスは、テーブルに行を実際に挿入するコンピューティングリソースを提供します。
Tip
この一連のトピックの手順では、 データのロードの準備 を読み終えて、必要がある場合は、名前付きファイル形式が作成済みであることを前提としています。
始める前に、ベストプラクティス、ヒント、およびその他のガイダンスについて データロードに関する考慮事項 を読むこともできます。
次のトピック:
構成タスク(必要に応じて完了):
データのロードタスク(ロードするファイルの各セットについて完了):