ステップ6。まとめとクリーンアップ

おめでとうございます。この入門チュートリアルを無事完了しました。

数分かけて、短い要約とチュートリアルで説明されている重要な点を確認してください。チュートリアルで作成したオブジェクトをドロップして、クリーンアップを検討することもできます。また、ページの下部には、詳細を学ぶために使用できるSnowflakeドキュメントの他のトピックへのリンクがいくつかあります。

このトピックの内容:

チュートリアルの概要とキーポイント

要約すると、データのロードは2ステップで実行されます。

ステップ1

ロードするデータを含むファイルをステージングします。ファイルは、内部(Snowflake内)または外部の場所にステージングできます。

ステップ2

ステージングされたファイルからターゲットテーブルにデータをコピーします。このステップには、実行中のアクティブなウェアハウスが必要です。また、この手順を実行するには、ファイルのデータがロードされる既存のテーブルが必要です。

CSV ファイルのロードについて覚えておくべき重要なポイントは次の通りです。

  • CSV ファイルは、1以上のレコードで構成され、各レコードには1以上のフィールドがあり、場合によってはヘッダーレコードもあります。

  • 各ファイルのレコードとフィールドは、区切り文字で区切られています。デフォルトの区切り文字は次のとおりです。

    記録

    改行文字

    フィールド

    コンマ

    つまり、Snowflakeは、 CSV ファイルの各レコードが改行で区切られ、各レコードのフィールド(つまり個々の値)がカンマで区切られることを期待しています。レコードおよびフィールドの区切り文字として 異なる 文字を使用する場合、ロード時にファイル形式の一部として 明示的に 指定する必要があります。

  • ファイルのフィールドとロードするテーブルの列の間には、次の点で 直接的な 相関があります。

    • フィールド(ファイル内)および列(ターゲットテーブル内)の数。

    • それぞれのファイル/テーブル内のフィールドと列の位置。

    • フィールドと列の文字列、数、日付などのデータ型。

    数、位置、およびデータ型がすべて揃っていない場合、記録はロードされません。

    注釈

    Snowflakeは、フィールドとターゲットテーブルの列が正確に揃っていないファイルのロードをサポートしています。ただし、これはより高度なデータロードトピックです( ロード中のデータの変換 で説明)。

チュートリアルのクリーンアップ(オプション)

次の DROP <オブジェクト> ステートメントを実行して、チュートリアルを開始する前の状態にシステムを戻します。

DROP DATABASE IF EXISTS sf_tuts;

DROP WAREHOUSE IF EXISTS sf_tuts_wh;

ちなみに

ウェアハウスをドロップする前に、ウェアハウスを必要とする他のチュートリアルを完了するかどうかを検討します。他のチュートリアルにこのウェアハウスを再利用すると、時間とクレジットを節約できる場合があります。

次の内容

次のリソースを使用して、Snowflakeについて引き続き学習することをお勧めします。