データロード機能の概要

このトピックでは、 COPY INTO <テーブル> コマンドを使用してファイルからSnowflakeテーブルにデータをロードするためにサポートされている機能のクイックリファレンスを提供します。

このトピックの内容:

データファイルの詳細

次のテーブルは、データのロードに使用されるファイルの一般的な詳細を示しています。

機能

サポート対象

メモ

ファイルの場所

ローカル環境

ファイルは最初に内部(Snowflake)ステージにコピー(「ステージング」)され、次にテーブルにロードされます。

Amazon S3

ファイルは、ユーザーが提供するバケットから直接ロードできます。

Google Cloud Storage

ファイルは、ユーザーが提供するバケットから直接ロードできます。

Microsoft Azureクラウドストレージ

  • BLOBストレージ

  • Data Lake Storage Gen2

  • 汎用v1

  • 汎用v2

ファイルは、ユーザーが提供するコンテナーから直接ロードできます。

ファイル形式

区切りファイル(CSV、 TSVなど)

有効な区切り文字がサポートされています。デフォルトはカンマ(つまり、 CSV)です。

半構造化形式

Unstructured formats

ファイルエンコーディング

ファイル形式固有

区切りファイル(CSV、 TSVなど)の場合、デフォルトの文字セットは UTF-8です。他の文字セットを使用するには、ロードに使用するエンコーディングを明示的に指定する必要があります。サポートされている文字セットのリストについては、 区切りファイルでサポートされている文字セット (このトピック内)をご参照ください。

半構造化ファイル形式(JSON、Avroなど)の場合、サポートされている文字セットは UTF-8のみです。

区切りファイルでサポートされている文字セット

次のテーブルに、区切りファイル(CSV、 TSVなど)からデータをロードするためにサポートされているエンコード文字セットを示します。

文字 セット

ENCODING 値

サポートされている言語

メモ

Big5

BIG5

中国語(繁体字)

EUC-JP

EUCJP

日本語

EUC-KR

EUCKR

韓国語

GB18030

GB18030

中国語

IBM420

IBM420

アラビア語

IBM424

IBM424

ヘブライ語

IBM949

IBM949

韓国語

ISO-2022-CN

ISO2022CN

中国語(簡体字)

ISO-2022-JP

ISO2022JP

日本語

ISO-2022-KR

ISO2022KR

韓国語

ISO-8859-1

ISO88591

デンマーク語、オランダ語、英語、フランス語、ドイツ語、イタリア語、ノルウェー語、ポルトガル語、スウェーデン語

ISO-8859-2

ISO88592

チェコ語、ハンガリー語、ポーランド語、ルーマニア語

ISO-8859-5

ISO88595

ロシア語

ISO-8859-6

ISO88596

アラビア語

ISO-8859-7

ISO88597

ギリシャ語

ISO-8859-8

ISO88598

ヘブライ語

ISO-8859-9

ISO88599

トルコ語

ISO-8859-15

ISO885915

デンマーク語、オランダ語、英語、フランス語、ドイツ語、イタリア語、ノルウェー語、ポルトガル語、スウェーデン語

ユーロ通貨記号を含む8文字を除いて、 ISO-8859-1と同じです。

KOI8-R

KOI8R

ロシア語

Shift_JIS

SHIFTJIS

日本語

UTF-8

UTF8

すべての言語

区切りファイル(CSV、 TSVなど)からデータをロードする場合、 UTF-8がデフォルトです。 . . サポートされている他のすべてのファイル形式(JSON、Avroなど)からデータをロードおよびアンロードする場合、サポートされる文字セットは UTF-8のみです。

UTF-16

UTF16

すべての言語

UTF-16BE

UTF16BE

すべての言語

UTF-16LE

UTF16LE

すべての言語

UTF-32

UTF32

すべての言語

UTF-32BE

UTF32BE

すべての言語

UTF-32LE

UTF32LE

すべての言語

windows-949

WINDOWS949

韓国語

windows-1250

WINDOWS1250

チェコ語、ハンガリー語、ポーランド語、ルーマニア語

windows-1251

WINDOWS1251

ロシア語

windows-1252

WINDOWS1252

デンマーク語、オランダ語、英語、フランス語、ドイツ語、イタリア語、ノルウェー語、ポルトガル語、スウェーデン語

windows-1253

WINDOWS1253

ギリシャ語

windows-1254

WINDOWS1254

トルコ語

windows-1255

WINDOWS1255

ヘブライ語

windows-1256

WINDOWS1256

アラビア語

ステージングされたファイルの圧縮

次のテーブルは、Snowflakeがロードするデータファイルの圧縮をどのように処理するかを説明しています。オプションは、ファイルがステージングされているか、圧縮されていないか、すでに圧縮されているかによって異なります。

機能

サポート対象

メモ

非圧縮ファイル

gzip

Snowflakeステージで非圧縮ファイルをステージングする場合、圧縮が明示的に無効にされていない限り、ファイルはgzipを使用して自動的に圧縮されます。

すでに圧縮されたファイル

gzip

bzip2

deflate

raw_deflate

Snowflakeは、これらの圧縮方法を自動的に検出するか、ファイルの圧縮に使用された方法を明示的に指定できます。

Brotli

Zstandard

自動検出は、Brotliで圧縮されたファイルではまだサポート されていません。 Brotliで圧縮されたファイルをステージングまたはロードするときは、使用された圧縮方法を明示的に指定する必要があります。

ステージングされたファイルの暗号化

次のテーブルは、Snowflakeがロードするデータファイルの暗号化をどのように処理するかを説明しています。オプションは、ステージされたファイルが暗号化されていないか、既に暗号化されているかによって異なります。

機能

サポート対象

メモ

暗号化されていないファイル

128ビットまたは256ビットキー

データのロードおよびアンロード操作のために内部ステージに格納されているすべてのファイルは、サーバー側で AES-256の強力な暗号化を使用して自動的に暗号化されます。デフォルトでは、Snowflakeは128ビットのキー(オプションで256ビットのキーを構成可能)による追加のクライアント側の暗号化を提供します。

既に暗号化されたファイル

ユーザー提供のキー

すでに暗号化されているファイルは、外部クラウドストレージからSnowflakeにロードできます。ファイルの暗号化に使用されるキーをSnowflakeに提供する必要があります。