データロード機能の概要¶
このトピックでは、 COPY INTO <テーブル> コマンドを使用してファイルからSnowflakeテーブルにデータをロードするためにサポートされている機能のクイックリファレンスを提供します。
このトピックの内容:
データファイルの詳細¶
次のテーブルは、データのロードに使用されるファイルの一般的な詳細を示しています。
機能 |
サポート対象 |
メモ |
---|---|---|
ファイルの場所 |
ローカル環境 |
ファイルは最初に内部(Snowflake)ステージにコピー(「ステージング」)され、次にテーブルにロードされます。 |
Amazon S3 |
ファイルは、ユーザーが提供するバケットから直接ロードできます。 |
|
Google Cloud Storage |
ファイルは、ユーザーが提供するバケットから直接ロードできます。 |
|
Microsoft Azureクラウドストレージ
|
ファイルは、ユーザーが提供するコンテナーから直接ロードできます。 |
|
ファイル形式 |
区切りファイル(CSV、 TSVなど) |
有効な区切り文字がサポートされています。デフォルトはカンマ(つまり、 CSV)です。 |
|
||
ファイルエンコーディング |
ファイル形式固有 |
区切りファイル(CSV、 TSVなど)の場合、デフォルトの文字セットは UTF-8です。他の文字セットを使用するには、ロードに使用するエンコーディングを明示的に指定する必要があります。サポートされている文字セットのリストについては、 区切りファイルでサポートされている文字セット (このトピック内)をご参照ください。 |
半構造化ファイル形式(JSON、Avroなど)の場合、サポートされている文字セットは UTF-8のみです。 |
区切りファイルでサポートされている文字セット¶
次のテーブルに、区切りファイル(CSV、 TSVなど)からデータをロードするためにサポートされているエンコード文字セットを示します。
文字 セット |
|
サポートされている言語 |
メモ |
---|---|---|---|
Big5 |
|
中国語(繁体字) |
|
EUC-JP |
|
日本語 |
|
EUC-KR |
|
韓国語 |
|
GB18030 |
|
中国語 |
|
IBM420 |
|
アラビア語 |
|
IBM424 |
|
ヘブライ語 |
|
IBM949 |
|
韓国語 |
|
ISO-2022-CN |
|
中国語(簡体字) |
|
ISO-2022-JP |
|
日本語 |
|
ISO-2022-KR |
|
韓国語 |
|
ISO-8859-1 |
|
デンマーク語、オランダ語、英語、フランス語、ドイツ語、イタリア語、ノルウェー語、ポルトガル語、スウェーデン語 |
|
ISO-8859-2 |
|
チェコ語、ハンガリー語、ポーランド語、ルーマニア語 |
|
ISO-8859-5 |
|
ロシア語 |
|
ISO-8859-6 |
|
アラビア語 |
|
ISO-8859-7 |
|
ギリシャ語 |
|
ISO-8859-8 |
|
ヘブライ語 |
|
ISO-8859-9 |
|
トルコ語 |
|
ISO-8859-15 |
|
デンマーク語、オランダ語、英語、フランス語、ドイツ語、イタリア語、ノルウェー語、ポルトガル語、スウェーデン語 |
ユーロ通貨記号を含む8文字を除いて、 ISO-8859-1と同じです。 |
KOI8-R |
|
ロシア語 |
|
Shift_JIS |
|
日本語 |
|
UTF-8 |
|
すべての言語 |
区切りファイル(CSV、 TSVなど)からデータをロードする場合、 UTF-8がデフォルトです。 . . サポートされている他のすべてのファイル形式(JSON、Avroなど)からデータをロードおよびアンロードする場合、サポートされる文字セットは UTF-8のみです。 |
UTF-16 |
|
すべての言語 |
|
UTF-16BE |
|
すべての言語 |
|
UTF-16LE |
|
すべての言語 |
|
UTF-32 |
|
すべての言語 |
|
UTF-32BE |
|
すべての言語 |
|
UTF-32LE |
|
すべての言語 |
|
windows-949 |
|
韓国語 |
|
windows-1250 |
|
チェコ語、ハンガリー語、ポーランド語、ルーマニア語 |
|
windows-1251 |
|
ロシア語 |
|
windows-1252 |
|
デンマーク語、オランダ語、英語、フランス語、ドイツ語、イタリア語、ノルウェー語、ポルトガル語、スウェーデン語 |
|
windows-1253 |
|
ギリシャ語 |
|
windows-1254 |
|
トルコ語 |
|
windows-1255 |
|
ヘブライ語 |
|
windows-1256 |
|
アラビア語 |
ステージングされたファイルの圧縮¶
次のテーブルは、Snowflakeがロードするデータファイルの圧縮をどのように処理するかを説明しています。オプションは、ファイルがステージングされているか、圧縮されていないか、すでに圧縮されているかによって異なります。
機能 |
サポート対象 |
メモ |
---|---|---|
非圧縮ファイル |
gzip |
Snowflakeステージで非圧縮ファイルをステージングする場合、圧縮が明示的に無効にされていない限り、ファイルはgzipを使用して自動的に圧縮されます。 |
すでに圧縮されたファイル |
gzip bzip2 deflate raw_deflate |
Snowflakeは、これらの圧縮方法を自動的に検出するか、ファイルの圧縮に使用された方法を明示的に指定できます。 |
Brotli Zstandard |
自動検出は、Brotliで圧縮されたファイルではまだサポート されていません。 Brotliで圧縮されたファイルをステージングまたはロードするときは、使用された圧縮方法を明示的に指定する必要があります。 |
ステージングされたファイルの暗号化¶
次のテーブルは、Snowflakeがロードするデータファイルの暗号化をどのように処理するかを説明しています。オプションは、ステージされたファイルが暗号化されていないか、既に暗号化されているかによって異なります。
機能 |
サポート対象 |
メモ |
---|---|---|
暗号化されていないファイル |
128ビットまたは256ビットキー |
データのロードおよびアンロード操作のために内部ステージに格納されているすべてのファイルは、サーバー側で AES-256の強力な暗号化を使用して自動的に暗号化されます。デフォルトでは、Snowflakeは128ビットのキー(オプションで256ビットのキーを構成可能)による追加のクライアント側の暗号化を提供します。 |
既に暗号化されたファイル |
ユーザー提供のキー |
すでに暗号化されているファイルは、外部クラウドストレージからSnowflakeにロードできます。ファイルの暗号化に使用されるキーをSnowflakeに提供する必要があります。 |