データのアンロードの準備

このトピックでは、データをアンロードするためにサポートされているデータファイル形式の概要を説明します。

このトピックの内容:

サポートされているファイル形式

次のファイル形式がサポートされています。

構造化/半構造化

注意

構造化

区切り(CSV、 TSVなど)

有効なシングルバイト区切り文字がサポートされています。デフォルトはカンマです(つまり、CSV).

半構造化

JSON、Parquet

ファイル形式オプションは、ファイルに含まれるデータのタイプ、およびデータの形式に関するその他の関連特性を指定します。指定できるファイル形式オプションは、アンロードするデータのタイプによって異なります。Snowflakeは、ファイル形式オプションのデフォルトの完全なセットを提供します。

半構造化データ

JSON ファイルにアンロードするとき、Snowflakeは ndjson (「改行区切りJSON」)標準形式で出力します。

ファイル形式オプションの指定

個々のファイル形式オプションは、次のいずれかの場所で指定できます。

  • テーブルの定義内。

  • 名前付きステージの定義内。詳細については、 CREATE STAGE をご参照ください。

  • データをアンロードするときに直接 COPY INTO <場所> のコマンド内。

さらに、データのアンロードを簡素化するために、Snowflakeは、必要なすべての形式情報をカプセル化するデータベースオブジェクトである名前付きファイル形式の作成をサポートしています。名前付きファイル形式は、個々のファイル形式オプションを指定できるすべての場所で入力として使用できるため、同様の形式のデータのアンロードプロセスを効率化できます。

名前付きファイル形式はオプションですが、同様の形式のデータを定期的にアンロードする予定がある場合は お勧め します。

名前付きファイル形式の作成

ウェブインターフェイスまたは SQLを使用して、ファイル形式を作成できます。

ウェブインターフェイス

Databases Databases tab » <データベース名> » File Formats をクリックします

SQL

CREATE FILE FORMAT

すべてのファイル形式オプションの詳細な説明については、 CREATE FILE FORMAT をご参照ください。

次の例では、指定されたフィールド区切り文字を使用して名前付き CSV ファイル形式を作成します。

CREATE OR REPLACE FILE FORMAT my_csv_unload_format
  TYPE = 'CSV'
  FIELD_DELIMITER = '|';

次の例では、名前付き JSON ファイル形式を作成します。

CREATE OR REPLACE FILE FORMAT my_json_unload_format
  TYPE = 'JSON';