데이터 로딩 기능 요약¶
이 항목에서는 COPY INTO <테이블> 명령을 사용하여 파일에서 Snowflake 테이블로 데이터를 로드할 수 있도록 지원되는 기능에 대한 빠른 참조를 제공합니다.
이 항목의 내용:
데이터 파일 세부 정보¶
다음 테이블은 데이터 로드에서 사용되는 파일에 대한 일반 세부 정보를 설명합니다.
기능 |
지원됨 |
참고 |
---|---|---|
파일 위치 |
로컬 환경 |
파일은 우선 내부 (Snowflake) 스테이지에 복사(“스테이징”)된 다음, 테이블로 로딩됩니다. |
Amazon S3 |
사용자가 제공하는 버킷에서 직접 파일을 로딩할 수 있습니다. |
|
Google Cloud Storage |
사용자가 제공하는 버킷에서 직접 파일을 로딩할 수 있습니다. |
|
Microsoft Azure 클라우드 저장소
|
사용자가 제공하는 컨테이너에서 파일을 직접 로딩할 수 있습니다. |
|
파일 형식 |
구분 기호로 분리된 파일(CSV, TSV 등) |
모든 유효한 구분 기호가 지원되며, 기본값은 쉼표(즉, CSV)입니다. |
|
||
파일 인코딩 |
파일 형식별 |
구분된 파일(CSV, TSV 등)의 경우 기본 문자 세트는 UTF-8입니다. 다른 문자 세트를 사용하려면 로드에 사용할 인코딩을 명시적으로 지정해야 합니다. 지원되는 문자 세트의 목록은 (이 항목에서) 구분된 파일용으로 지원되는 문자 세트 를 참조하십시오. |
반정형 파일 형식(JSON, Avro 등)에서는 UTF-8 문자 세트만 지원됩니다. |
구분된 파일에서 지원되는 문자 세트¶
다음 테이블에서는 구분된 파일(CSV, TSV 등)에서 데이터를 로드할 수 있도록 지원되는 인코딩 문자 세트를 보여줍니다.
문자 세트 |
|
지원되는 언어 |
참고 |
---|---|---|---|
Big5 |
|
중국어 번체 |
|
EUC-JP |
|
일본어 |
|
EUC-KR |
|
한국어 |
|
GB18030 |
|
중국어 |
|
IBM420 |
|
아랍어 |
|
IBM424 |
|
히브리어 |
|
IBM949 |
|
한국어 |
|
ISO-2022-CN |
|
중국어 간체 |
|
ISO-2022-JP |
|
일본어 |
|
ISO-2022-KR |
|
한국어 |
|
ISO-8859-1 |
|
덴마크어, 네덜란드어, 영어, 프랑스어, 독일어, 이탈리아어, 노르웨이어, 포르투갈어, 스웨덴어 |
|
ISO-8859-2 |
|
체코어, 헝가리어, 폴란드어, 루마니아어 |
|
ISO-8859-5 |
|
러시아어 |
|
ISO-8859-6 |
|
아랍어 |
|
ISO-8859-7 |
|
그리스어 |
|
ISO-8859-8 |
|
히브리어 |
|
ISO-8859-9 |
|
터키어 |
|
ISO-8859-15 |
|
덴마크어, 네덜란드어, 영어, 프랑스어, 독일어, 이탈리아어, 노르웨이어, 포르투갈어, 스웨덴어 |
유로화 기호를 포함하여, 8자를 제외하면 ISO-8859-1과 동일합니다. |
KOI8-R |
|
러시아어 |
|
Shift_JIS |
|
일본어 |
|
UTF-8 |
|
모든 언어 |
구분된 파일(CSV, TSV 등)에서 데이터를 로딩하는 경우 UTF-8이 기본값입니다. . . 지원되는 다른 모든 파일 형식(JSON, Avro 등)에서 데이터를 로딩할 뿐 아니라 언로딩하는 경우 UTF-8이 유일하게 지원되는 문자 세트입니다. |
UTF-16 |
|
모든 언어 |
|
UTF-16BE |
|
모든 언어 |
|
UTF-16LE |
|
모든 언어 |
|
UTF-32 |
|
모든 언어 |
|
UTF-32BE |
|
모든 언어 |
|
UTF-32LE |
|
모든 언어 |
|
windows-949 |
|
한국어 |
|
windows-1250 |
|
체코어, 헝가리어, 폴란드어, 루마니아어 |
|
windows-1251 |
|
러시아어 |
|
windows-1252 |
|
덴마크어, 네덜란드어, 영어, 프랑스어, 독일어, 이탈리아어, 노르웨이어, 포르투갈어, 스웨덴어 |
|
windows-1253 |
|
그리스어 |
|
windows-1254 |
|
터키어 |
|
windows-1255 |
|
히브리어 |
|
windows-1256 |
|
아랍어 |
스테이징된 파일의 압축¶
다음 테이블은 로드하기 위해 Snowflake가 데이터 파일 압축을 처리하는 방법을 설명합니다. 옵션은 파일이 스테이징, 압축 해제 또는 압축 상태인지의 여부에 따라 다릅니다.
기능 |
지원됨 |
참고 |
---|---|---|
비압축 파일 |
gzip |
Snowflake 스테이지에서 압축되지 않은 파일을 스테이징하는 경우 파일은 gzip을 사용하여 자동으로 압축됩니다. 단, 압축이 명시적으로 비활성화된 경우에는 제외됩니다. |
이미 압축된 파일 |
gzip bzip2 deflate raw_deflate |
Snowflake가 이러한 압축 방법을 자동으로 감지하거나 사용자가 파일 압축에서 사용된 방법을 명시적으로 지정할 수 있습니다. |
Brotli Zstandard |
자동 감지에서는 아직 Brotli 압축 파일을 지원하지 않습니다. Brotli 압축 파일을 스테이징하거나 로드할 때 사용된 압축 방법을 사용자가 명시적으로 지정해야 합니다. |
스테이징된 파일의 암호화¶
다음 테이블은 로드하기 위해 Snowflake가 데이터 파일의 암호화를 처리하는 방법을 설명합니다. 옵션은 파일이 암호화되지 않고 스테이징되었는지 또는 이미 암호화되었는지에 따라 다릅니다.
기능 |
지원됨 |
참고 |
---|---|---|
암호화되지 않은 파일 |
128비트 또는 256비트 키 |
데이터 로딩 및 언로딩 작업을 위해 내부 스테이지에 저장되는 모든 파일은 서버 측에서 강력한 AES-256 암호화를 사용하여 자동으로 암호화됩니다. 기본적으로, Snowflake는 (256비트 키를 구성하는 옵션과 함께) 128비트 키를 사용하여 추가적인 클라이언트 측 암호화를 제공합니다. |
이미 암호화된 파일 |
사용자 제공 키 |
이미 암호화된 파일을 외부 클라우드 저장소에서 Snowflake로 로드할 수 있으며, 이 경우 파일을 암호화하기 위해 사용한 키를 Snowflake에 제공해야 합니다. |