데이터 로딩 기능 요약

이 항목에서는 COPY INTO <테이블> 명령을 사용하여 파일에서 Snowflake 테이블로 데이터를 로드할 수 있도록 지원되는 기능에 대한 빠른 참조를 제공합니다.

이 항목의 내용:

데이터 파일 세부 정보

다음 테이블은 데이터 로드에서 사용되는 파일에 대한 일반 세부 정보를 설명합니다.

기능

지원됨

참고

파일 위치

로컬 환경

파일은 우선 내부 (Snowflake) 스테이지에 복사(“스테이징”)된 다음, 테이블로 로딩됩니다.

Amazon S3

사용자가 제공하는 버킷에서 직접 파일을 로딩할 수 있습니다.

Google Cloud Storage

사용자가 제공하는 버킷에서 직접 파일을 로딩할 수 있습니다.

Microsoft Azure 클라우드 저장소

  • Blob 저장소

  • Data Lake Storage Gen2

  • 범용 v1

  • 범용 v2

사용자가 제공하는 컨테이너에서 파일을 직접 로딩할 수 있습니다.

파일 형식

구분 기호로 분리된 파일(CSV, TSV 등)

모든 유효한 구분 기호가 지원되며, 기본값은 쉼표(즉, CSV)입니다.

반정형 형식

Unstructured formats

파일 인코딩

파일 형식별

구분된 파일(CSV, TSV 등)의 경우 기본 문자 세트는 UTF-8입니다. 다른 문자 세트를 사용하려면 로드에 사용할 인코딩을 명시적으로 지정해야 합니다. 지원되는 문자 세트의 목록은 (이 항목에서) 구분된 파일용으로 지원되는 문자 세트 를 참조하십시오.

반정형 파일 형식(JSON, Avro 등)에서는 UTF-8 문자 세트만 지원됩니다.

구분된 파일에서 지원되는 문자 세트

다음 테이블에서는 구분된 파일(CSV, TSV 등)에서 데이터를 로드할 수 있도록 지원되는 인코딩 문자 세트를 보여줍니다.

문자 세트

ENCODING 값

지원되는 언어

참고

Big5

BIG5

중국어 번체

EUC-JP

EUCJP

일본어

EUC-KR

EUCKR

한국어

GB18030

GB18030

중국어

IBM420

IBM420

아랍어

IBM424

IBM424

히브리어

IBM949

IBM949

한국어

ISO-2022-CN

ISO2022CN

중국어 간체

ISO-2022-JP

ISO2022JP

일본어

ISO-2022-KR

ISO2022KR

한국어

ISO-8859-1

ISO88591

덴마크어, 네덜란드어, 영어, 프랑스어, 독일어, 이탈리아어, 노르웨이어, 포르투갈어, 스웨덴어

ISO-8859-2

ISO88592

체코어, 헝가리어, 폴란드어, 루마니아어

ISO-8859-5

ISO88595

러시아어

ISO-8859-6

ISO88596

아랍어

ISO-8859-7

ISO88597

그리스어

ISO-8859-8

ISO88598

히브리어

ISO-8859-9

ISO88599

터키어

ISO-8859-15

ISO885915

덴마크어, 네덜란드어, 영어, 프랑스어, 독일어, 이탈리아어, 노르웨이어, 포르투갈어, 스웨덴어

유로화 기호를 포함하여, 8자를 제외하면 ISO-8859-1과 동일합니다.

KOI8-R

KOI8R

러시아어

Shift_JIS

SHIFTJIS

일본어

UTF-8

UTF8

모든 언어

구분된 파일(CSV, TSV 등)에서 데이터를 로딩하는 경우 UTF-8이 기본값입니다. . . 지원되는 다른 모든 파일 형식(JSON, Avro 등)에서 데이터를 로딩할 뿐 아니라 언로딩하는 경우 UTF-8이 유일하게 지원되는 문자 세트입니다.

UTF-16

UTF16

모든 언어

UTF-16BE

UTF16BE

모든 언어

UTF-16LE

UTF16LE

모든 언어

UTF-32

UTF32

모든 언어

UTF-32BE

UTF32BE

모든 언어

UTF-32LE

UTF32LE

모든 언어

windows-949

WINDOWS949

한국어

windows-1250

WINDOWS1250

체코어, 헝가리어, 폴란드어, 루마니아어

windows-1251

WINDOWS1251

러시아어

windows-1252

WINDOWS1252

덴마크어, 네덜란드어, 영어, 프랑스어, 독일어, 이탈리아어, 노르웨이어, 포르투갈어, 스웨덴어

windows-1253

WINDOWS1253

그리스어

windows-1254

WINDOWS1254

터키어

windows-1255

WINDOWS1255

히브리어

windows-1256

WINDOWS1256

아랍어

스테이징된 파일의 압축

다음 테이블은 로드하기 위해 Snowflake가 데이터 파일 압축을 처리하는 방법을 설명합니다. 옵션은 파일이 스테이징, 압축 해제 또는 압축 상태인지의 여부에 따라 다릅니다.

기능

지원됨

참고

비압축 파일

gzip

Snowflake 스테이지에서 압축되지 않은 파일을 스테이징하는 경우 파일은 gzip을 사용하여 자동으로 압축됩니다. 단, 압축이 명시적으로 비활성화된 경우에는 제외됩니다.

이미 압축된 파일

gzip

bzip2

deflate

raw_deflate

Snowflake가 이러한 압축 방법을 자동으로 감지하거나 사용자가 파일 압축에서 사용된 방법을 명시적으로 지정할 수 있습니다.

Brotli

Zstandard

자동 감지에서는 아직 Brotli 압축 파일을 지원하지 않습니다. Brotli 압축 파일을 스테이징하거나 로드할 때 사용된 압축 방법을 사용자가 명시적으로 지정해야 합니다.

스테이징된 파일의 암호화

다음 테이블은 로드하기 위해 Snowflake가 데이터 파일의 암호화를 처리하는 방법을 설명합니다. 옵션은 파일이 암호화되지 않고 스테이징되었는지 또는 이미 암호화되었는지에 따라 다릅니다.

기능

지원됨

참고

암호화되지 않은 파일

128비트 또는 256비트 키

데이터 로딩 및 언로딩 작업을 위해 내부 스테이지에 저장되는 모든 파일은 서버 측에서 강력한 AES-256 암호화를 사용하여 자동으로 암호화됩니다. 기본적으로, Snowflake는 (256비트 키를 구성하는 옵션과 함께) 128비트 키를 사용하여 추가적인 클라이언트 측 암호화를 제공합니다.

이미 암호화된 파일

사용자 제공 키

이미 암호화된 파일을 외부 클라우드 저장소에서 Snowflake로 로드할 수 있으며, 이 경우 파일을 암호화하기 위해 사용한 키를 Snowflake에 제공해야 합니다.