データロード機能の概要

このトピックでは、 COPY INTO <テーブル> コマンドを使用してファイルからSnowflakeテーブルにデータをロードするためにサポートされている機能のクイックリファレンスを提供します。

このトピックの内容:

データファイルの詳細

次のテーブルは、データのロードに使用されるファイルの一般的な詳細を示しています。

機能

サポート対象

注意

ファイルの場所

ローカル環境

ファイルはまずSnowflakeステージでステージングされ、次にテーブルにロードされます。

Amazon S3

ファイルは、ユーザーが提供するS3バケットから直接ロードできます。

Google Cloud Storage

ファイルは、ユーザーが提供するCloud Storageコンテナーから直接ロードできます。

Microsoft Azure

ファイルは、ユーザーが提供する任意のAzureコンテナーから直接ロードできます。

ファイル形式

区切りファイル(CSV、 TSVなど)

有効な区切り文字がサポートされています。デフォルトはカンマ(つまり、 CSV)です。

JSON

Avro

Snappyを使用して圧縮された、ステージ済みAvroファイルの自動検出と処理が含まれます。

ORC

Snappyまたはzlibを使用して圧縮されたステージングされた ORC ファイルの自動検出と処理が含まれます。

Parquet

Snappyを使用して圧縮された、ステージ済みParquetファイルの自動検出と処理が含まれます。

XML

プレビュー機能 としてサポートされています。

ファイルエンコーディング

ファイル形式固有

区切りファイル(CSV、 TSVなど)の場合、デフォルトの文字セットは UTF-8です。他の文字セットを使用するには、ロードに使用するエンコーディングを明示的に指定する必要があります。サポートされている文字セットのリストについては、以下をご参照ください。

サポートされている他のすべてのファイル形式(JSON、Avroなど)でサポートされている文字セットは UTF-8のみです。

区切りファイルでサポートされている文字セット

次のテーブルに、区切りファイル(CSV、 TSVなど)からデータをロードするためにサポートされているエンコード文字セットを示します。

文字 セット

ENCODING 値

サポートされている言語

注意

Big5

BIG5

中国語(繁体字)

EUC-JP

EUCJP

日本語

EUC-KR

EUCKR

韓国語

GB18030

GB18030

中国語

IBM420

IBM420

アラビア語

IBM424

IBM424

ヘブライ語

ISO-2022-CN

ISO2022CN

中国語(簡体字)

ISO-2022-JP

ISO2022JP

日本語

ISO-2022-KR

ISO2022KR

韓国語

ISO-8859-1

ISO88591

デンマーク語、オランダ語、英語、フランス語、ドイツ語、イタリア語、ノルウェー語、ポルトガル語、スウェーデン語

ISO-8859-2

ISO88592

チェコ語、ハンガリー語、ポーランド語、ルーマニア語

ISO-8859-5

ISO88595

ロシア語

ISO-8859-6

ISO88596

アラビア語

ISO-8859-7

ISO88597

ギリシャ語

ISO-8859-8

ISO88598

ヘブライ語

ISO-8859-9

ISO88599

トルコ語

KOI8-R

KOI8R

ロシア語

Shift_JIS

SHIFTJIS

日本語

UTF-8

UTF8

すべての言語

区切りファイル(CSV、 TSVなど)からデータをロードする場合、 UTF-8がデフォルトです。 . . サポートされている他のすべてのファイル形式(JSON、Avroなど)からデータをロードおよびアンロードする場合、サポートされる文字セットは UTF-8のみです。

UTF-16

UTF16

すべての言語

UTF-16BE

UTF16BE

すべての言語

UTF-16LE

UTF16LE

すべての言語

UTF-32

UTF32

すべての言語

UTF-32BE

UTF32BE

すべての言語

UTF-32LE

UTF32LE

すべての言語

windows-1250

WINDOWS1250

チェコ語、ハンガリー語、ポーランド語、ルーマニア語

windows-1251

WINDOWS1251

ロシア語

windows-1252

WINDOWS1252

デンマーク語、オランダ語、英語、フランス語、ドイツ語、イタリア語、ノルウェー語、ポルトガル語、スウェーデン語

windows-1253

WINDOWS1253

ギリシャ語

windows-1254

WINDOWS1254

トルコ語

windows-1255

WINDOWS1255

ヘブライ語

windows-1256

WINDOWS1256

アラビア語

ステージングされたファイルの圧縮

次のテーブルは、Snowflakeがロードするデータファイルの圧縮をどのように処理するかを説明しています。オプションは、ファイルがステージングされているか、圧縮されていないか、すでに圧縮されているかによって異なります。

機能

サポート対象

注意

非圧縮ファイル

gzip

Snowflakeステージで非圧縮ファイルをステージングする場合、圧縮が明示的に無効にされていない限り、ファイルはgzipを使用して自動的に圧縮されます。

すでに圧縮されたファイル

gzip

bzip2

deflate

raw_deflate

Snowflakeは、これらの圧縮方法を自動的に検出するか、ファイルの圧縮に使用された方法を明示的に指定できます。

Brotli

Zstandard

これらのメソッドでは、自動検出はまだサポートされて いません 。これらの方法のいずれかで圧縮されたファイルをステージングまたはロードするときは、使用された圧縮方法を明示的に指定する必要があります。

ステージングされたファイルの暗号化

次のテーブルは、Snowflakeがロードするデータファイルの暗号化をどのように処理するかを説明しています。オプションは、ステージされたファイルが暗号化されていないか、既に暗号化されているかによって異なります。

機能

サポート対象

注意

暗号化されていないファイル

128ビットまたは256ビットキー

Snowflakeの内部の場所に暗号化されていないファイルをステージングする場合、ファイルは128ビットキーを使用して自動的に暗号化されます。256ビットキーを有効にすることができます(より強力な暗号化のため)。ただし、追加の構成が必要です。

既に暗号化されたファイル

ユーザー提供のキー

すでに暗号化されているファイルは、外部クラウドストレージからSnowflakeにロードできます。ファイルの暗号化に使用されるキーをSnowflakeに提供する必要があります。