CREATE FILE FORMAT¶

Snowflake 테이블에 액세스하거나 로딩할 스테이지 상태 데이터 세트를 설명하는 명명된 파일 형식을 만듭니다.

이 명령은 다음 변형을 지원합니다.

CREATE OR ALTER FILE FORMAT: 파일 형식이 없는 경우 명명된 파일 형식을 만들거나 기존 파일 형식을 변경합니다.

참고 항목:

ALTER FILE FORMAT , DROP FILE FORMAT , SHOW FILE FORMATS , DESCRIBE FILE FORMAT

COPY INTO <위치> , COPY INTO <테이블> , CREATE OR ALTER <오브젝트>

구문¶

CREATE [ OR REPLACE ] [ { TEMP | TEMPORARY | VOLATILE } ] FILE FORMAT [ IF NOT EXISTS ] <name>
  [ TYPE = { CSV | JSON | AVRO | ORC | PARQUET | XML } [ formatTypeOptions ] ]
  [ COMMENT = '<string_literal>' ]

여기서

formatTypeOptions ::=
-- If TYPE = CSV
     COMPRESSION = AUTO | GZIP | BZ2 | BROTLI | ZSTD | DEFLATE | RAW_DEFLATE | NONE
     RECORD_DELIMITER = '<string>' | NONE
     FIELD_DELIMITER = '<string>' | NONE
     MULTI_LINE = TRUE | FALSE
     FILE_EXTENSION = '<string>'
     PARSE_HEADER = TRUE | FALSE
     SKIP_HEADER = <integer>
     SKIP_BLANK_LINES = TRUE | FALSE
     DATE_FORMAT = '<string>' | AUTO
     TIME_FORMAT = '<string>' | AUTO
     TIMESTAMP_FORMAT = '<string>' | AUTO
     BINARY_FORMAT = HEX | BASE64 | UTF8
     ESCAPE = '<character>' | NONE
     ESCAPE_UNENCLOSED_FIELD = '<character>' | NONE
     TRIM_SPACE = TRUE | FALSE
     FIELD_OPTIONALLY_ENCLOSED_BY = '<character>' | NONE
     NULL_IF = ( '<string>' [ , '<string>' ... ] )
     ERROR_ON_COLUMN_COUNT_MISMATCH = TRUE | FALSE
     REPLACE_INVALID_CHARACTERS = TRUE | FALSE
     EMPTY_FIELD_AS_NULL = TRUE | FALSE
     SKIP_BYTE_ORDER_MARK = TRUE | FALSE
     ENCODING = '<string>' | UTF8
-- If TYPE = JSON
     COMPRESSION = AUTO | GZIP | BZ2 | BROTLI | ZSTD | DEFLATE | RAW_DEFLATE | NONE
     DATE_FORMAT = '<string>' | AUTO
     TIME_FORMAT = '<string>' | AUTO
     TIMESTAMP_FORMAT = '<string>' | AUTO
     BINARY_FORMAT = HEX | BASE64 | UTF8
     TRIM_SPACE = TRUE | FALSE
     MULTI_LINE = TRUE | FALSE
     NULL_IF = ( '<string>' [ , '<string>' ... ] )
     FILE_EXTENSION = '<string>'
     ENABLE_OCTAL = TRUE | FALSE
     ALLOW_DUPLICATE = TRUE | FALSE
     STRIP_OUTER_ARRAY = TRUE | FALSE
     STRIP_NULL_VALUES = TRUE | FALSE
     REPLACE_INVALID_CHARACTERS = TRUE | FALSE
     IGNORE_UTF8_ERRORS = TRUE | FALSE
     SKIP_BYTE_ORDER_MARK = TRUE | FALSE
-- If TYPE = AVRO
     COMPRESSION = AUTO | GZIP | BROTLI | ZSTD | DEFLATE | RAW_DEFLATE | NONE
     TRIM_SPACE = TRUE | FALSE
     REPLACE_INVALID_CHARACTERS = TRUE | FALSE
     NULL_IF = ( '<string>' [ , '<string>' ... ] )
-- If TYPE = ORC
     TRIM_SPACE = TRUE | FALSE
     REPLACE_INVALID_CHARACTERS = TRUE | FALSE
     NULL_IF = ( '<string>' [ , '<string>' ... ] )
-- If TYPE = PARQUET
     COMPRESSION = AUTO | LZO | SNAPPY | NONE
     SNAPPY_COMPRESSION = TRUE | FALSE
     BINARY_AS_TEXT = TRUE | FALSE
     USE_LOGICAL_TYPE = TRUE | FALSE
     TRIM_SPACE = TRUE | FALSE
     USE_VECTORIZED_SCANNER = TRUE | FALSE
     REPLACE_INVALID_CHARACTERS = TRUE | FALSE
     NULL_IF = ( '<string>' [ , '<string>' ... ] )
-- If TYPE = XML
     COMPRESSION = AUTO | GZIP | BZ2 | BROTLI | ZSTD | DEFLATE | RAW_DEFLATE | NONE
     IGNORE_UTF8_ERRORS = TRUE | FALSE
     PRESERVE_SPACE = TRUE | FALSE
     STRIP_OUTER_ELEMENT = TRUE | FALSE
     DISABLE_AUTO_CONVERT = TRUE | FALSE
     REPLACE_INVALID_CHARACTERS = TRUE | FALSE
     SKIP_BYTE_ORDER_MARK = TRUE | FALSE

베리언트 구문¶

CREATE OR ALTER FILE FORMAT¶

아직 존재하지 않는 파일 형식이 있는 경우 새 파일 형식을 만들거나 기존 파일 형식을 문에 정의된 형식으로 변환합니다. CREATE OR ALTER FILE FORMAT 문은 CREATE FILE FORMAT 문의 구문 규칙을 따르며 ALTER FILE FORMAT 문과 제한 사항이 동일합니다.

지원되는 변경 사항에는 formatTypeOptions 및 COMMENT 속성에 대한 변경이 포함됩니다. TYPE 속성은 변경할 수 없습니다.

자세한 내용은 CREATE OR ALTER FILE FORMAT 사용법 노트 섹션을 참조하십시오.

CREATE OR ALTER [ { TEMP | TEMPORARY | VOLATILE } ] FILE FORMAT <name>
  [ TYPE = { CSV | JSON | AVRO | ORC | PARQUET | XML } [ formatTypeOptions ] ]
  [ COMMENT = '<string_literal>' ]

필수 매개 변수¶

name

파일 형식에 대한 식별자를 지정하는데, 파일 형식이 생성된 스키마에 대해 고유한 식별자여야 합니다.

식별자 값은 알파벳 문자로 시작해야 하며 전체 식별자 문자열을 큰따옴표(예: "My object")로 묶지 않는 한 공백이나 특수 문자를 포함할 수 없습니다. 큰따옴표로 묶인 식별자도 대/소문자를 구분합니다.

자세한 내용은 식별자 요구 사항 섹션을 참조하십시오.

선택적 매개 변수¶

{ TEMP | TEMPORARY | VOLATILE }

파일 형식이 해당 파일을 생성한 세션 의 지속 기간 동안만 지속되도록 지정합니다. 세션이 끝나면 임시 파일 형식이 삭제됩니다.

기본값: 값 없음. 파일 형식이 TEMPORARY 로 선언되지 않은 경우 파일 형식은 영구적입니다.

예기치 않은 충돌을 방지하려면 스키마에 이미 있는 파일 형식을 따라 임시 파일 형식의 이름을 지정하지 마십시오.

스키마의 다른 파일 형식과 이름이 같은 임시 파일 형식을 만든 경우 파일 형식에 사용된 모든 쿼리와 작업은 임시 파일 형식을 삭제할 때까지 세션의 임시 파일 형식에만 영향을 미칩니다. DROP FILE FORMAT 명령을 사용하여 파일 형식을 삭제하면 스키마에 이미 존재하는 파일 형식이 아닌 임시 파일 형식이 삭제됩니다.

입력 파일(데이터 로딩용) 또는 출력 파일(데이터 언로딩용)의 형식을 지정합니다. 형식 유형에 따라 추가적인 형식별 옵션을 지정할 수 있습니다. 자세한 내용은 (이 항목의) 형식 유형 옵션 을 참조하십시오.

유효한 값은 파일 형식이 데이터 로딩용인지 언로딩용인지에 따라 달라집니다.

CSV (로딩 또는 언로딩용)
다음과 같은 특정 문자를 사용하는 구분된 플랫 일반 텍스트 파일입니다.

레코드 내 필드를 구분하는 기호(예: 쉼표).

레코드 구분 기호(예: 줄 바꿈 문자).

이름(CSV)은 쉼표로 구분된 값을 제안하지만 유효한 모든 문자를 필드 구분 기호로 사용할 수 있습니다.

JSON (로딩 또는 언로딩용)
하나 이상의 JSON 문서(예: 오브젝트 또는 배열)가 포함된 모든 일반 텍스트 파일입니다. JSON은 반정형 파일 형식입니다. 문서는 쉼표로 구분할 수 있으며 선택적으로 큰 배열로 묶을 수 있습니다. 단일 JSON 문서는 여러 라인에 걸쳐 있을 수 있습니다.

참고

파일에서 테이블로 데이터를 로딩할 때, Snowflake는 (줄 바꿈으로 구분된 JSON) 표준 형식 또는 NDJSON 쉼표로 구분된 JSON 형식을 지원합니다.

테이블 데이터를 파일로 언로드하면 Snowflake는 NDJSON 형식으로만 출력합니다.

AVRO (로드 전용이며, 데이터를 AVRO 형식으로 언로드할 수 없음)
AVRO 형식의 이진 파일입니다.

ORC (로드 전용이며, 데이터를 ORC 형식으로 언로드할 수 없음)
ORC 형식의 이진 파일입니다.

PARQUET (로딩 또는 언로딩용)
PARQUET 형식의 이진 파일입니다.

XML (로드 전용이며, 데이터를 XML 형식으로 언로드할 수 없음)
XML 요소가 있는 일반 텍스트 파일입니다.

For more information about CSV, see Usage Notes in this topic. For more information about JSON and the other semi-structured file formats, see Introduction to loading semi-structured data.

기본값: CSV

COMMENT = 'string_literal'

파일 형식에 대한 설명을 지정합니다.

기본값: 값 없음

형식 유형 옵션(`formatTypeOptions`)¶

지정된 파일 형식 유형(TYPE = ...)에 따라 다음 형식별 옵션(공백, 쉼표 또는 줄 바꿈으로 구분) 중 하나 이상을 포함할 수 있습니다.

TYPE = CSV¶

용도:

데이터 로딩, 데이터 언로딩, 외부 테이블

정의:

데이터를 로딩할 때 데이터 파일에 대한 현재 압축 알고리즘을 지정합니다. Snowflake는 이 옵션을 사용하여 이미 압축된 데이터 파일을 압축한 방식을 감지해 로딩을 위해 파일의 압축 데이터를 추출할 수 있습니다.
데이터를 언로딩할 때 지정된 압축 알고리즘을 사용하여 데이터 파일을 압축합니다.

값:


지원되는 값	참고
`AUTO`	데이터를 로딩할 때 현재 자동으로 감지할 수 없는 Brotli 압축 파일을 제외하고 압축 알고리즘이 자동으로 감지됩니다. 데이터를 언로딩할 때 파일은 기본값인 gzip을 사용하여 자동으로 압축됩니다.
`GZIP`
`BZ2`
`BROTLI`	Brotli 압축 파일을 로딩/언로딩할 때 지정해야 합니다.
`ZSTD`	Zstandard v0.8 이상이 지원됩니다.
`DEFLATE`	Deflate 압축 파일(zlib 헤더 RFC1950 포함).
`RAW_DEFLATE`	원시 Deflate 압축 파일(헤더 RFC1951 제외).
`NONE`	데이터를 로딩할 때 파일이 압축되지 않았음을 나타냅니다. 데이터를 언로딩할 때 언로딩된 파일이 압축되지 않도록 지정합니다.

기본값:

AUTO

RECORD_DELIMITER = 'string' | NONE

용도:

데이터 로딩, 데이터 언로딩, 외부 테이블

정의:

입력 파일(데이터 로딩) 또는 언로딩된 파일(데이터 언로딩)에서 레코드를 구분하는 하나 이상의 싱글바이트 또는 멀티바이트 문자입니다. 일반적인 이스케이프 시퀀스 또는 다음 싱글바이트 또는 멀티바이트 문자를 허용합니다.

싱글바이트 문자:

8진수 값(\\ 접두사가 붙음) 또는 16진수 값(0x 또는 \x 접두사가 붙음). 예를 들어, 곡절 악센트(^) 문자로 구분된 레코드의 경우 8진수(\\136) 또는 16진수(0x5e) 값을 지정합니다.

멀티바이트 문자:

16진수 값(\x 접두사가 붙음). 예를 들어, 센트(¢) 문자로 구분된 레코드의 경우 16진수(\xC2\xA2) 값을 지정합니다.

RECORD_DELIMITER 또는 FIELD_DELIMITER 의 구분 기호는 다른 파일 형식 옵션의 구분 기호의 하위 문자열이 될 수 없습니다(예: FIELD_DELIMITER = 'aa' RECORD_DELIMITER = 'aabb').

지정된 구분 기호는 임의의 바이트 시퀀스가 아니라 유효한 UTF-8 문자여야 합니다. 또한, 구분 기호는 최대 20자로 제한됩니다.

NONE 의 값도 허용합니다.

기본값:

데이터 로딩:: 줄 바꿈 문자입니다. “줄 바꿈”은 \r\n 이 Windows 플랫폼에서 파일에 대한 줄 바꿈으로 이해되게끔 하는 논리입니다.
데이터 언로딩:: 줄 바꿈 문자(\n).

FIELD_DELIMITER = 'string' | NONE

용도:

데이터 로딩, 데이터 언로딩, 외부 테이블

정의:

입력 파일(데이터 로딩) 또는 언로딩된 파일(데이터 언로딩)에서 필드를 구분하는 하나 이상의 싱글바이트 또는 멀티바이트 문자입니다. 일반적인 이스케이프 시퀀스 또는 다음 싱글바이트 또는 멀티바이트 문자를 허용합니다.

싱글바이트 문자:

멀티바이트 문자:

16진수 값(\x 접두사가 붙음). 예를 들어, 센트(¢) 문자로 구분된 레코드의 경우 16진수(\xC2\xA2) 값을 지정합니다.

참고

비 ASCII 문자의 경우 결정적 동작을 얻으려면 16진수 바이트 시퀀스 값을 사용해야 합니다.

지정된 구분 기호는 임의의 바이트 시퀀스가 아니라 유효한 UTF-8 문자여야 합니다. 또한, 구분 기호는 최대 20자로 제한됩니다.

NONE 의 값도 허용합니다.

기본값:

쉼표(,)

MULTI_LINE = TRUE | FALSE

용도:: 데이터 로딩 및 외부 테이블
정의:: 여러 줄 허용 여부를 지정하는 부울입니다. MULTI_LINE 이 FALSE 로 설정되어 있고 지정된 레코드 구분 기호가 CSV 필드 내에 있는 경우 해당 필드를 포함하는 레코드는 오류로 해석됩니다.
기본값:: TRUE

참고

RFC4180 사양을 따르는 압축되지 않은 대용량 CSV 파일(128MB보다 큼)을 로드하는 경우 Snowflake는 MULTI_LINE이 FALSE 로 설정되어 있고, COMPRESSION이 NONE 으로 설정되어 있고, ON_ERROR가 ABORT_STATEMENT 또는 CONTINUE 로 설정되어 있을 때 이러한 CSV 파일의 병렬 스캔을 지원합니다.

FILE_EXTENSION = 'string' | NONE

용도:: 데이터 언로딩 전용
정의:: 스테이지로 언로딩된 파일의 확장명을 지정합니다. 모든 확장명을 허용합니다. 원하는 소프트웨어나 서비스에서 읽을 수 있는 파일 확장명은 사용자가 지정해야 합니다.
기본값:: null, 즉 파일 확장명이 형식 유형 .csv[compression] 으로 결정된다는 의미로, 여기서 compression 은 COMPRESSION 이 설정된 경우 압축 방법에 따라 추가되는 확장명입니다.

참고

SINGLE 복사 옵션이 TRUE 인 경우 COPY 명령을 실행하면 기본적으로 파일 확장명이 없는 파일이 언로딩됩니다. 파일 확장자를 지정하려면 internal_location 또는 external_location 경로에 파일 이름과 확장자를 입력합니다(예: copy into @stage/data.csv).

PARSE_HEADER = TRUE | FALSE

용도:: 데이터 로딩 전용
정의:: 열 이름을 결정하기 위해 데이터 파일의 첫 번째 행 머리글을 사용할지 여부를 지정하는 부울입니다.

이 파일 형식 옵션은 다음 작업에만 적용됩니다.

INFER_SCHEMA 함수를 사용하여 열 정의를 자동으로 감지.

INFER_SCHEMA 함수 및 MATCH_BY_COLUMN_NAME 복사 옵션을 사용하여 CSV 데이터를 개별 열에 로드.

이 옵션을 TRUE로 설정하면 첫 번째 행 머리글을 사용해 열 이름을 결정합니다. 기본값 FALSE로 그대로 두면 열 이름이 c 로 반환되며 여기서 는 열의 위치입니다.

참고

이 옵션은 외부 테이블에서 지원되지 않습니다.
SKIP_HEADER 를 설정한 경우 PARSE_HEADER = TRUE 옵션은 지원되지 않습니다.

기본값:: FALSE

SKIP_HEADER = integer

용도:: 데이터 로딩 및 외부 테이블
정의:: 파일 시작에서 건너뛸 줄의 개수입니다.

참고로, SKIP_HEADER는 헤더 줄이 무엇인지 결정하기 위해 RECORD_DELIMITER 또는 FIELD_DELIMITER 값을 사용하지는 않으며, 오히려 파일에서 지정된 수만큼 CRLF(캐리지 리턴, 줄 바꿈)로 구분된 줄을 건너뜁니다. 그런 다음 RECORD_DELIMITER와 FIELD_DELIMITER를 사용해 로딩할 데이터 행을 결정합니다.

기본값:: 0

SKIP_BLANK_LINES = TRUE | FALSE

용도:: 데이터 로딩 및 외부 테이블
정의:: 데이터 파일에서 발견되는 빈 줄을 건너뛰도록 지정하는 부울입니다. 그렇지 않으면 빈 줄로 인해 레코드 끝 오류를 발생합니다(기본 동작).
기본값:: FALSE

DATE_FORMAT = 'string' | AUTO

용도:: 데이터 로딩 및 언로딩
정의:: 데이터 파일(데이터 로딩) 또는 테이블(데이터 언로딩)의 날짜 값 형식을 정의합니다. 값이 지정되지 않거나 AUTO 인 경우 DATE_INPUT_FORMAT (데이터 로딩) 또는 DATE_OUTPUT_FORMAT (데이터 언로딩) 매개 변수의 값이 사용됩니다.
기본값:: AUTO

TIME_FORMAT = 'string' | AUTO

용도:: 데이터 로딩 및 언로딩
정의:: 데이터 파일(데이터 로딩) 또는 테이블(데이터 언로딩)의 시간 값 형식을 정의합니다. 값이 지정되지 않거나 AUTO 인 경우 TIME_INPUT_FORMAT (데이터 로딩) 또는 TIME_OUTPUT_FORMAT (데이터 언로딩) 매개 변수의 값이 사용됩니다.
기본값:: AUTO

TIMESTAMP_FORMAT = string' | AUTO

용도:: 데이터 로딩 및 언로딩
정의:: 데이터 파일(데이터 로딩) 또는 테이블(데이터 언로딩)의 타임스탬프 값 형식을 정의합니다. 값이 지정되지 않거나 AUTO 인 경우 TIMESTAMP_INPUT_FORMAT (데이터 로딩) 또는 TIMESTAMP_OUTPUT_FORMAT (데이터 언로딩) 매개 변수의 값이 사용됩니다.
기본값:: AUTO

BINARY_FORMAT = HEX | BASE64 | UTF8

용도:: 데이터 로딩 및 언로딩
정의:: 이진 입력 또는 출력의 인코딩 형식을 정의합니다. 이 옵션은 테이블의 이진 열로 데이터를 로딩하거나 이진 열에서 데이터를 언로딩할 때 사용할 수 있습니다.
기본값:: HEX

ESCAPE = 'character' | NONE

용도:

데이터 로딩 및 언로딩

정의:

괄호로 묶이거나 묶이지 않은 필드 값에 대한 이스케이프 문자로 사용되는 싱글바이트 문자열입니다. 이스케이프 문자는 문자 시퀀스의 후속 문자에 대한 대체 해석을 호출합니다. ESCAPE 문자를 사용하여 데이터에 있는 FIELD_OPTIONALLY_ENCLOSED_BY 문자의 인스턴스를 리터럴로 해석할 수 있습니다.

일반적인 이스케이프 시퀀스, 8진수 값 또는 16진수 값을 허용합니다.

데이터 로딩하기:

괄호로 묶인 필드에만 이스케이프 문자를 지정합니다. FIELD_OPTIONALLY_ENCLOSED_BY 를 설정하여 필드를 묶는 데 사용되는 문자를 지정합니다.

참고

이 파일 형식 옵션은 싱글바이트 문자만 지원합니다. UTF-8 문자 인코딩은 상위 ASCII 문자를 멀티바이트 문자로 나타냅니다. 데이터 파일이 UTF-8 문자 세트로 인코딩된 경우 상위 ASCII 문자를 옵션 값으로 지정할 수 없습니다.

또한 상위 ASCII 문자를 지정하는 경우 ENCODING = 'string' 파일 형식 옵션을 데이터 파일의 문자 인코딩으로 설정하여 문자가 올바르게 해석되도록 보장하는 것이 좋습니다.

데이터 언로딩하기:

이 옵션이 설정되면 ESCAPE_UNENCLOSED_FIELD 에 대해 설정된 이스케이프 문자를 재정의합니다.

기본값:

NONE

ESCAPE_UNENCLOSED_FIELD = 'character' | NONE

용도:

데이터 로딩, 데이터 언로딩, 외부 테이블

정의:

괄호로 묶이지 않은 필드 값에 대해서만 이스케이프 문자로 사용되는 싱글바이트 문자열입니다. 이스케이프 문자는 문자 시퀀스의 후속 문자에 대한 대체 해석을 호출합니다. ESCAPE 문자를 사용하여 데이터에 있는 FIELD_DELIMITER 또는 RECORD_DELIMITER 문자의 인스턴스를 리터럴로 해석할 수 있습니다. 이스케이프 문자는 데이터에서 자신의 인스턴스를 이스케이프하는 데 사용할 수도 있습니다.

일반적인 이스케이프 시퀀스, 8진수 값 또는 16진수 값을 허용합니다.

데이터 로딩하기:

괄호로 묶이지 않은 필드에만 이스케이프 문자를 지정합니다.

참고

기본값은 \\ 입니다. 데이터 파일의 행이 백슬래시(\) 문자로 끝날 경우 이 문자는 RECORD_DELIMITER 파일 형식 옵션에 대해 지정된 줄 바꿈 또는 캐리지 리턴 문자를 이스케이프합니다. 결과적으로, 로딩 작업에서 이 행과 다음 행을 단일 데이터 행으로 처리합니다. 이 문제를 방지하려면 값을 NONE 으로 설정하십시오.
이 파일 형식 옵션은 싱글바이트 문자만 지원합니다. UTF-8 문자 인코딩은 상위 ASCII 문자를 멀티바이트 문자로 나타냅니다. 데이터 파일이 UTF-8 문자 세트로 인코딩된 경우 상위 ASCII 문자를 옵션 값으로 지정할 수 없습니다.

또한 상위 ASCII 문자를 지정하는 경우 ENCODING = 'string' 파일 형식 옵션을 데이터 파일의 문자 인코딩으로 설정하여 문자가 올바르게 해석되도록 보장하는 것이 좋습니다.

데이터 언로딩하기:

ESCAPE 가 설정된 경우 해당 파일 형식 옵션에 대해 설정된 이스케이프 문자가 이 옵션을 재정의합니다.

기본값:

백슬래시(\\)

TRIM_SPACE = TRUE | FALSE

용도:

데이터 로딩 및 외부 테이블

정의:

필드에서 공백을 제거할지 여부를 지정하는 부울입니다.

예를 들어, 외부 데이터베이스 소프트웨어에서 필드를 따옴표로 묶지만 선행 공백을 삽입하는 경우 Snowflake는 여는 따옴표 문자가 아닌 선행 공백을 필드의 시작으로 읽습니다(즉, 따옴표는 필드 데이터 문자열의 일부로 해석됨). 데이터 로딩 중에 불필요한 공백을 제거하려면 이 옵션을 TRUE 로 설정하십시오.

또 다른 예로, 선행 또는 후행 공백이 문자열을 묶는 따옴표 주위에 있는 경우 이 옵션을 사용하여 주위의 공백을 제거하고 FIELD_OPTIONALLY_ENCLOSED_BY 옵션을 사용하여 따옴표를 제거할 수 있습니다. 따옴표 안의 모든 공백은 그대로 유지됩니다. 예를 들어 FIELD_DELIMITER = '|' 및 FIELD_OPTIONALLY_ENCLOSED_BY = '"' 를 가정하면 다음과 같습니다.

|"Hello world"|    /* loads as */  >Hello world<
|" Hello world "|  /* loads as */  > Hello world <
| "Hello world" |  /* loads as */  >Hello world<

(이 예에서 대괄호는 로딩되지 않습니다. 대괄호는 로딩된 문자열의 시작과 끝의 경계를 정하는 데 사용됩니다.)

기본값:

FALSE

FIELD_OPTIONALLY_ENCLOSED_BY = 'character' | NONE

용도:

데이터 로딩, 데이터 언로딩, 외부 테이블

정의:

문자열을 묶는 데 사용되는 문자입니다. 값은 NONE, 작은따옴표 문자(') 또는 큰따옴표 문자(")일 수 있습니다. 작은따옴표 문자를 사용하려면 8진수 또는 16진수 표현(0x27) 또는 이중 작은따옴표로 묶인 이스케이프('')를 사용하십시오.

데이터 언로딩 전용:

원본 테이블의 필드에 이 문자가 포함되어 있으면 Snowflake는 언로딩을 위해 동일한 문자를 사용하여 해당 문자를 이스케이프합니다. 예를 들어, 값이 큰따옴표 문자이고 필드에 문자열 A "B" C 가 포함된 경우 Snowflake는 다음과 같이 언로딩을 위해 큰따옴표를 이스케이프합니다.

A ""B"" C

기본값:

NONE

NULL_IF = ( 'string1' [ , 'string2' , ... ] )

용도:

데이터 로딩, 데이터 언로딩, 외부 테이블

정의:

SQL NULL로 변환하거나 그 반대로 변환하는 데 사용되는 문자열:

데이터를 로딩할 때 Snowflake는 데이터 로딩 소스에서 이러한 값을 SQL NULL로 바꿉니다. 둘 이상의 문자열을 지정하려면 문자열 목록을 괄호로 묶고 쉼표를 사용하여 각각의 값을 구분합니다.

Snowflake는 데이터 타입과 관계없이 값의 모든 인스턴스를 NULL로 변환합니다. 예를 들어 2 가 값으로 지정되면 2 의 모든 인스턴스가 문자열 또는 숫자로 변환됩니다.

예:

NULL_IF = ('\N', 'NULL', 'NUL', '')

이 옵션에는 빈 문자열이 포함될 수 있습니다.
데이터를 언로딩할 때, Snowflake는 SQL NULL 값을 목록의 첫 번째 값으로 변환합니다.

기본값:

\N (즉, NULL, ESCAPE_UNENCLOSED_FIELD 값은 \)로 가정합니다

ERROR_ON_COLUMN_COUNT_MISMATCH = TRUE | FALSE

용도:

데이터 로딩 전용

정의:

입력 파일의 구분된 열(즉, 필드) 수가 해당 테이블의 열 수와 일치하지 않는 경우 구문 분석 오류를 생성할지 여부를 지정하는 부울입니다.

FALSE 로 설정하면 오류가 발생하지 않고 로딩이 계속됩니다. 파일이 성공적으로 로딩된 경우 다음과 같습니다.

입력 파일에 테이블의 열보다 많은 수의 필드가 있는 레코드가 포함된 경우 일치하는 필드는 파일에서 나오는 순서대로 로딩되고 나머지 필드는 로딩되지 않습니다.
입력 파일에 테이블의 열보다 적은 수의 필드가 있는 레코드가 포함된 경우 테이블에서 일치하지 않는 열이 NULL 값과 함께 로딩됩니다.

이 옵션에서는 입력 파일 내의 모든 레코드가 같은 길이라고 가정합니다(즉, 이 매개 변수에 대해 지정된 값과 관계없이 다양한 길이의 레코드를 포함한 파일이 오류를 반환함).

기본값:

TRUE

참고

로딩하는 동안 데이터 변환 시(즉, 쿼리를 COPY 명령의 소스로 사용), 이 옵션은 무시됩니다. 데이터 파일의 열 개수 및 순서는 대상 테이블과 같지 않아도 됩니다.

REPLACE_INVALID_CHARACTERS = TRUE | FALSE

용도:: 데이터 로딩 전용
정의:: 유효하지 않은 UTF-8 문자를 유니코드 대체 문자(�)로 대체할지 여부를 지정하는 부울.

TRUE 로 설정하면 Snowflake가 잘못된 UTF-8 문자를 유니코드 대체 문자로 바꿉니다.

FALSE 로 설정하면 잘못된 UTF-8 문자 인코딩이 감지될 때 로딩 작업에서 오류가 발생합니다.

기본값:: FALSE

EMPTY_FIELD_AS_NULL = TRUE | FALSE

용도:

데이터 로딩, 데이터 언로딩, 외부 테이블

정의:

데이터 로딩 중 두 개의 연속된 구분 기호(예: ,,)로 표시되는 입력 파일의 빈 필드에 SQL NULL 을 삽입할지 여부를 지정합니다.

FALSE 로 설정하면 Snowflake가 빈 필드를 해당 열 타입으로 캐스팅하려고 시도합니다. STRING 유형의 열에 빈 문자열이 삽입됩니다. 다른 열 타입의 경우 COPY 명령에서 오류가 발생합니다.
데이터를 언로딩할 때 이 옵션은 FIELD_OPTIONALLY_ENCLOSED_BY 와 함께 사용됩니다. FIELD_OPTIONALLY_ENCLOSED_BY = NONE 일 때, EMPTY_FIELD_AS_NULL = FALSE 를 설정하면 필드 값을 묶는 따옴표 없이 빈 문자열 값으로 테이블의 빈 문자열을 언로딩하도록 지정됩니다.

TRUE 로 설정하면 FIELD_OPTIONALLY_ENCLOSED_BY 가 문자열을 묶을 문자를 지정해야 합니다.

기본값:

TRUE

SKIP_BYTE_ORDER_MARK = TRUE | FALSE

용도:

데이터 로딩 전용

정의:

데이터 파일에 있는 경우 BOM(바이트 순서 표시)를 건너뛸지 여부를 지정하는 부울입니다. BOM은 데이터 파일의 시작 부분에서 바이트 순서와 인코딩 형식을 정의하는 문자 코드입니다.

FALSE 로 설정하면 Snowflake가 데이터 파일에 있는 모든 BOM을 인식하므로, BOM에서 오류가 발생하거나 테이블의 첫 번째 열에 병합되는 결과가 될 수 있습니다.

기본값:

TRUE

ENCODING = 'string'

용도:

데이터 로딩 및 외부 테이블

정의:

데이터를 테이블로 로딩할 때 원본 데이터의 문자 세트를 지정하는 문자열(상수)입니다.


문자 세트	`ENCODING` 값	지원되는 언어	참고
Big5	`BIG5`	중국어 번체
EUC-JP	`EUCJP`	일본어
EUC-KR	`EUCKR`	한국어
GB18030	`GB18030`	중국어
IBM420	`IBM420`	아랍어
IBM424	`IBM424`	히브리어
IBM949	`IBM949`	한국어
ISO-2022-CN	`ISO2022CN`	중국어 간체
ISO-2022-JP	`ISO2022JP`	일본어
ISO-2022-KR	`ISO2022KR`	한국어
ISO-8859-1	`ISO88591`	덴마크어, 네덜란드어, 영어, 프랑스어, 독일어, 이탈리아어, 노르웨이어, 포르투갈어, 스웨덴어
ISO-8859-2	`ISO88592`	체코어, 헝가리어, 폴란드어, 루마니아어
ISO-8859-5	`ISO88595`	러시아어
ISO-8859-6	`ISO88596`	아랍어
ISO-8859-7	`ISO88597`	그리스어
ISO-8859-8	`ISO88598`	히브리어
ISO-8859-9	`ISO88599`	터키어
ISO-8859-15	`ISO885915`	덴마크어, 네덜란드어, 영어, 프랑스어, 독일어, 이탈리아어, 노르웨이어, 포르투갈어, 스웨덴어	유로화 기호를 포함하여, 8자를 제외하면 ISO-8859-1과 동일합니다.
KOI8-R	`KOI8R`	러시아어
Shift_JIS	`SHIFTJIS`	일본어
UTF-8	`UTF8`	모든 언어	구분된 파일(CSV, TSV 등)에서 데이터를 로딩하는 경우 UTF-8이 기본값입니다. . . 지원되는 다른 모든 파일 형식(JSON, Avro 등)에서 데이터를 로딩할 뿐 아니라 언로딩하는 경우 UTF-8이 유일하게 지원되는 문자 세트입니다.
UTF-16	`UTF16`	모든 언어
UTF-16BE	`UTF16BE`	모든 언어
UTF-16LE	`UTF16LE`	모든 언어
UTF-32	`UTF32`	모든 언어
UTF-32BE	`UTF32BE`	모든 언어
UTF-32LE	`UTF32LE`	모든 언어
windows-874	`WINDOWS874`	태국어
windows-949	`WINDOWS949`	한국어
windows-1250	`WINDOWS1250`	체코어, 헝가리어, 폴란드어, 루마니아어
windows-1251	`WINDOWS1251`	러시아어
windows-1252	`WINDOWS1252`	덴마크어, 네덜란드어, 영어, 프랑스어, 독일어, 이탈리아어, 노르웨이어, 포르투갈어, 스웨덴어
windows-1253	`WINDOWS1253`	그리스어
windows-1254	`WINDOWS1254`	터키어
windows-1255	`WINDOWS1255`	히브리어
windows-1256	`WINDOWS1256`	아랍어

기본값:

UTF8

참고

Snowflake는 모든 데이터를 UTF-8 문자 세트에 내부적으로 저장합니다. 데이터는 UTF-8로 변환된 후 Snowflake에 로딩됩니다.

TYPE = JSON¶

용도:

데이터 로딩 및 외부 테이블

정의:

데이터를 로딩할 때 데이터 파일에 대한 현재 압축 알고리즘을 지정합니다. Snowflake는 이 옵션을 사용하여 이미 압축된 데이터 파일을 압축한 방식을 감지해 로딩을 위해 파일의 압축 데이터를 추출할 수 있습니다.
데이터를 언로딩할 때 지정된 압축 알고리즘을 사용하여 데이터 파일을 압축합니다.

값:


지원되는 값	참고
`AUTO`	데이터를 로딩할 때 현재 자동으로 감지할 수 없는 Brotli 압축 파일을 제외하고 압축 알고리즘이 자동으로 감지됩니다. 데이터를 언로딩할 때 파일은 기본값인 gzip을 사용하여 자동으로 압축됩니다.
`GZIP`
`BZ2`
`BROTLI`	Brotli 압축 파일을 로딩/언로딩할 경우 지정해야 합니다.
`ZSTD`	Zstandard v0.8 이상이 지원됩니다.
`DEFLATE`	Deflate 압축 파일(zlib 헤더 RFC1950 포함).
`RAW_DEFLATE`	원시 Deflate 압축 파일(헤더 RFC1951 제외).
`NONE`	데이터를 로딩할 때 파일이 압축되지 않았음을 나타냅니다. 데이터를 언로딩할 때 언로딩된 파일이 압축되지 않도록 지정합니다.

기본값:

AUTO

DATE_FORMAT = 'string' | AUTO

용도:

데이터 로딩 전용

정의:

데이터 파일에서 날짜 문자열 값 형식을 정의합니다. 값이 지정되지 않거나 AUTO 인 경우 DATE_INPUT_FORMAT 매개 변수의 값이 사용됩니다.

이 파일 형식 옵션은 다음 작업에만 적용됩니다.

MATCH_BY_COLUMN_NAME 복사 옵션을 사용하여 JSON 데이터를 별도의 열에 로딩하는 작업.
COPY 문에 쿼리를 지정하여 별개의 열에 JSON 데이터를 로딩하는 작업(즉, COPY 변환).

기본값:

AUTO

TIME_FORMAT = 'string' | AUTO

용도:

데이터 로딩 전용

정의:

데이터 파일에서 시간 문자열 값 형식을 정의합니다. 값이 지정되지 않거나 AUTO 인 경우 TIME_INPUT_FORMAT 매개 변수의 값이 사용됩니다.

이 파일 형식 옵션은 다음 작업에만 적용됩니다.

MATCH_BY_COLUMN_NAME 복사 옵션을 사용하여 JSON 데이터를 별도의 열에 로딩하는 작업.
COPY 문에 쿼리를 지정하여 별개의 열에 JSON 데이터를 로딩하는 작업(즉, COPY 변환).

기본값:

AUTO

TIMESTAMP_FORMAT = string' | AUTO

용도:

데이터 로딩 전용

정의:

데이터 파일에서 타임스탬프 문자열 값 형식을 정의합니다. 값이 지정되지 않거나 AUTO 인 경우 TIMESTAMP_INPUT_FORMAT 매개 변수의 값이 사용됩니다.

이 파일 형식 옵션은 다음 작업에만 적용됩니다.

MATCH_BY_COLUMN_NAME 복사 옵션을 사용하여 JSON 데이터를 별도의 열에 로딩하는 작업.
COPY 문에 쿼리를 지정하여 별개의 열에 JSON 데이터를 로딩하는 작업(즉, COPY 변환).

기본값:

AUTO

BINARY_FORMAT = HEX | BASE64 | UTF8

용도:

데이터 로딩 전용

정의:

데이터 파일의 이진 문자열 값에 대한 인코딩 형식을 정의합니다. 이 옵션은 테이블의 이진 열로 데이터를 로딩할 때 사용할 수 있습니다.

이 파일 형식 옵션은 다음 작업에만 적용됩니다.

MATCH_BY_COLUMN_NAME 복사 옵션을 사용하여 JSON 데이터를 별도의 열에 로딩하는 작업.
COPY 문에 쿼리를 지정하여 별개의 열에 JSON 데이터를 로딩하는 작업(즉, COPY 변환).

기본값:

HEX

TRIM_SPACE = TRUE | FALSE

용도:

데이터 로딩 전용

정의:

문자열에서 선행 공백과 후행 공백을 제거할지 여부를 지정하는 부울입니다.

이 파일 형식 옵션은 MATCH_BY_COLUMN_NAME 복사 옵션을 사용하여 JSON 데이터를 별도의 열에 로딩할 때만 다음 작업에 적용됩니다.

기본값:

FALSE

MULTI_LINE = TRUE | FALSE

사용: 데이터 로딩 및 외부 테이블

정의:: 여러 줄 허용 여부를 지정하는 부울입니다. MULTI_LINE 이 FALSE 로 설정되어 있고 JSON 레코드 내에 새 줄이 있는 경우 새 줄이 포함된 레코드는 오류로 해석됩니다.
기본값:: TRUE

NULL_IF = ( 'string1' [ , 'string2' , ... ] )

용도:

데이터 로딩 전용

정의:

SQL NULL로 변환하거나 그 반대로 변환하는 데 사용되는 문자열입니다. Snowflake는 데이터 로딩 소스의 이러한 문자열을 SQL NULL로 바꿉니다. 둘 이상의 문자열을 지정하려면 문자열 목록을 괄호로 묶고 쉼표를 사용하여 각각의 값을 구분합니다.

이 파일 형식 옵션은 MATCH_BY_COLUMN_NAME 복사 옵션을 사용하여 JSON 데이터를 별도의 열에 로딩할 때만 다음 작업에 적용됩니다.

Snowflake는 데이터 타입과 관계없이 값의 모든 인스턴스를 NULL로 변환합니다. 예를 들어 2 가 값으로 지정되면 2 의 모든 인스턴스가 문자열 또는 숫자로 변환됩니다.

예:

NULL_IF = ('\N', 'NULL', 'NUL', '')

이 옵션에는 빈 문자열이 포함될 수 있습니다.

기본값:

\N (즉, NULL)

FILE_EXTENSION = 'string' | NONE

용도:: 데이터 언로딩 전용
정의:: 스테이지로 언로딩된 파일의 확장명을 지정합니다. 모든 확장명을 허용합니다. 원하는 소프트웨어나 서비스에서 읽을 수 있는 파일 확장명은 사용자가 지정해야 합니다.
기본값:: null, 즉 파일 확장명이 형식 유형 .json[compression] 으로 결정된다는 의미로, 여기서 compression 은 COMPRESSION 이 설정된 경우 압축 방법에 따라 추가되는 확장명입니다.

ENABLE_OCTAL = TRUE | FALSE

용도:: 데이터 로딩 전용
정의:: 8진수 숫자의 구문 분석을 할 수 있게 해주는 부울입니다.
기본값:: FALSE

ALLOW_DUPLICATE = TRUE | FALSE

용도:: 데이터 로딩 및 외부 테이블
정의:: 중복 오브젝트 필드 이름을 허용하도록 지정하는 부울입니다(마지막 이름만 보존됨).
기본값:: FALSE

STRIP_OUTER_ARRAY = TRUE | FALSE

용도:: 데이터 로딩 및 외부 테이블
정의:: JSON 파서에 바깥쪽 대괄호(즉, [ ])를 제거하도록 지시하는 부울입니다.
기본값:: FALSE

STRIP_NULL_VALUES = TRUE | FALSE

용도:

데이터 로딩 및 외부 테이블

정의:

JSON 파서에 null 값이 포함된 오브젝트 필드 또는 배열 요소를 제거하도록 지시하는 부울입니다. 예를 들어 TRUE 로 설정할 경우 다음과 같습니다.


이전	이후
`[null]`	`[]`
`[null,null,3]`	`[,,3]`
`{"a":null,"b":null,"c":123}`	`{"c":123}`
`{"a":[1,null,2],"b":{"x":null,"y":88}}`	`{"a":[1,,2],"b":{"y":88}}`

기본값:

FALSE

REPLACE_INVALID_CHARACTERS = TRUE | FALSE

용도:

데이터 로딩 및 외부 테이블

정의:

유효하지 않은 UTF-8 문자를 유니코드 대체 문자(�)로 대체할지 여부를 지정하는 부울. 이 옵션은 일대일 문자 대체를 수행합니다.

값:

TRUE 로 설정하면 Snowflake가 잘못된 UTF-8 문자를 유니코드 대체 문자로 바꿉니다.

FALSE 로 설정하면 잘못된 UTF-8 문자 인코딩이 감지될 때 로딩 작업에서 오류가 발생합니다.

기본값:

FALSE

IGNORE_UTF8_ERRORS = TRUE | FALSE

용도:

데이터 로딩 및 외부 테이블

정의:

UTF-8 인코딩 오류가 오류 조건을 생성하는지 여부를 지정하는 부울입니다. 이는 REPLACE_INVALID_CHARACTERS 의 대체 구문입니다.

값:

TRUE 로 설정하면 잘못된 UTF-8 시퀀스가 전부 유니코드 문자 U+FFFD (즉, “대체 문자”)로 자동으로 바뀝니다.

FALSE 로 설정하면 잘못된 UTF-8 문자 인코딩이 감지될 때 로딩 작업에서 오류가 발생합니다.

기본값:

FALSE

SKIP_BYTE_ORDER_MARK = TRUE | FALSE

용도:

데이터 로딩 전용

정의:

기본값:

TRUE

TYPE = AVRO¶

용도:

데이터 로딩 전용

정의:

데이터를 로딩할 때 데이터 파일에 대한 현재 압축 알고리즘을 지정합니다. Snowflake는 이 옵션을 사용하여 이미 압축된 데이터 파일을 압축한 방식을 감지해 로딩을 위해 파일의 압축 데이터를 추출할 수 있습니다.
데이터를 언로딩할 때 지정된 압축 알고리즘을 사용하여 데이터 파일을 압축합니다.

값:


지원되는 값	참고
`AUTO`	데이터를 로딩할 때 현재 자동으로 감지할 수 없는 Brotli 압축 파일을 제외하고 압축 알고리즘이 자동으로 감지됩니다. 데이터를 언로딩할 때 파일은 기본값인 gzip을 사용하여 자동으로 압축됩니다.
`GZIP`
`BROTLI`	Brotli 압축 파일을 로딩/언로딩할 경우 지정해야 합니다.
`ZSTD`	Zstandard v0.8 이상이 지원됩니다.
`DEFLATE`	Deflate 압축 파일(zlib 헤더 RFC1950 포함).
`RAW_DEFLATE`	원시 Deflate 압축 파일(헤더 RFC1951 제외).
`NONE`	데이터를 로딩할 때 파일이 압축되지 않았음을 나타냅니다. 데이터를 언로딩할 때 언로딩된 파일이 압축되지 않도록 지정합니다.

기본값:

AUTO.

참고

기본 AUTO 옵션으로 파일 및 코덱 압축이 모두 결정되므로 기본 옵션을 사용하는 것이 좋습니다. 압축 옵션 지정은 블록(코덱) 압축이 아닌 파일 압축을 가리킵니다.

TRIM_SPACE = TRUE | FALSE

용도:

데이터 로딩 전용

정의:

문자열에서 선행 공백과 후행 공백을 제거할지 여부를 지정하는 부울입니다.

이 파일 형식 옵션은 MATCH_BY_COLUMN_NAME 복사 옵션을 사용하여 Avro 데이터를 별도의 열에 로딩할 때만 다음 작업에 적용됩니다.

기본값:

FALSE

REPLACE_INVALID_CHARACTERS = TRUE | FALSE

용도:

데이터 로딩 및 외부 테이블

정의:

유효하지 않은 UTF-8 문자를 유니코드 대체 문자(�)로 대체할지 여부를 지정하는 부울. 이 옵션은 일대일 문자 대체를 수행합니다.

값:

TRUE 로 설정하면 Snowflake가 잘못된 UTF-8 문자를 유니코드 대체 문자로 바꿉니다.

FALSE 로 설정하면 잘못된 UTF-8 문자 인코딩이 감지될 때 로딩 작업에서 오류가 발생합니다.

기본값:

FALSE

NULL_IF = ( 'string1' [ , 'string2' , ... ] )

용도:

데이터 로딩 전용

정의:

이 파일 형식 옵션은 MATCH_BY_COLUMN_NAME 복사 옵션을 사용하여 Avro 데이터를 별도의 열에 로딩할 때만 다음 작업에 적용됩니다.

예:

NULL_IF = ('\N', 'NULL', 'NUL', '')

이 옵션에는 빈 문자열이 포함될 수 있습니다.

기본값:

\N (즉, NULL)

TYPE = ORC¶

TRIM_SPACE = TRUE | FALSE

용도:

데이터 로딩 및 외부 테이블

정의:

문자열에서 선행 공백과 후행 공백을 제거할지 여부를 지정하는 부울입니다.

이 파일 형식 옵션은 MATCH_BY_COLUMN_NAME 복사 옵션을 사용하여 Orc 데이터를 별도의 열에 로딩할 때만 다음 작업에 적용됩니다.

기본값:

FALSE

REPLACE_INVALID_CHARACTERS = TRUE | FALSE

용도:

데이터 로딩 및 외부 테이블

정의:

유효하지 않은 UTF-8 문자를 유니코드 대체 문자(�)로 대체할지 여부를 지정하는 부울. 이 옵션은 일대일 문자 대체를 수행합니다.

값:

TRUE 로 설정하면 Snowflake가 잘못된 UTF-8 문자를 유니코드 대체 문자로 바꿉니다.

FALSE 로 설정하면 잘못된 UTF-8 문자 인코딩이 감지될 때 로딩 작업에서 오류가 발생합니다.

기본값:

FALSE

NULL_IF = ( 'string1' [ , 'string2' , ... ] )

용도:

데이터 로딩 및 외부 테이블

정의:

이 파일 형식 옵션은 MATCH_BY_COLUMN_NAME 복사 옵션을 사용하여 Orc 데이터를 별도의 열에 로딩할 때만 다음 작업에 적용됩니다.

예:

NULL_IF = ('\N', 'NULL', 'NUL', '')

이 옵션에는 빈 문자열이 포함될 수 있습니다.

기본값:

\N (즉, NULL)

TYPE = PARQUET¶

COMPRESSION = AUTO | LZO | SNAPPY | NONE

용도:: 데이터 언로딩 및 외부 테이블
정의:

데이터 언로딩 시 Parquet 파일의 열에 대한 압축 알고리즘을 지정합니다.

값:


지원되는 값	참고
`AUTO`	데이터를 로딩할 때 압축 알고리즘이 자동으로 감지됩니다. Brotli, gzip, Lempel-Ziv-Oberhumer(LZO), LZ4, Snappy 또는 Zstandard v0.8 이상의 압축 알고리즘을 지원합니다. . 데이터를 언로딩할 때 언로딩된 파일은 기본적으로 Snappy 압축 알고리즘을 사용하여 압축됩니다.
`LZO`	데이터를 언로딩할 때 파일은 기본적으로 Snappy 알고리즘을 사용하여 압축됩니다. 데이터를 LZO 압축 파일로 언로딩하는 경우 이 값을 지정합니다.
`SNAPPY`	데이터를 언로딩할 때 파일은 기본적으로 Snappy 알고리즘을 사용하여 압축됩니다. 이 값을 선택적으로 지정할 수 있습니다.
`NONE`	데이터를 로딩할 때 파일이 압축되지 않았음을 나타냅니다. 데이터를 언로딩할 때 언로딩된 파일이 압축되지 않도록 지정합니다.

기본값:

AUTO

SNAPPY_COMPRESSION = TRUE | FALSE

용도:

데이터 언로딩 전용


지원되는 값	참고
`AUTO`	업로드된 파일은 기본적으로 Snappy 압축 알고리즘을 사용하여 압축됩니다.
`SNAPPY`	Snappy 압축 파일을 언로딩하는 경우 지정할 수 있습니다.
`NONE`	데이터를 로딩할 때 파일이 압축되지 않았음을 나타냅니다. 데이터를 언로딩할 때 언로딩된 파일이 압축되지 않도록 지정합니다.

정의:

언로딩된 파일이 SNAPPY 알고리즘을 사용하여 압축되는지 여부를 지정하는 부울입니다.

참고

사용되지 않음. COMPRESSION = SNAPPY 를 대신 사용하십시오.

제한 사항:: 데이터 언로딩 작업용으로만 지원됩니다.
기본값:: TRUE

BINARY_AS_TEXT = TRUE | FALSE

용도:: 데이터 로딩 및 외부 테이블
정의:: 정의된 논리 데이터 타입이 없는 열을 UTF-8 텍스트로 해석할지 여부를 지정하는 부울입니다. FALSE 로 설정하면 Snowflake가 이러한 열을 이진 데이터로 해석합니다.
기본값:: TRUE

참고

잠재적인 변환 문제를 방지하도록 BINARY_AS_TEXT를 FALSE로 설정하는 것이 좋습니다.

TRIM_SPACE = TRUE | FALSE

용도:

데이터 로딩 전용

정의:

문자열에서 선행 공백과 후행 공백을 제거할지 여부를 지정하는 부울입니다.

이 파일 형식 옵션은 MATCH_BY_COLUMN_NAME 복사 옵션을 사용하여 Parquet 데이터를 별도의 열에 로딩할 때만 다음 작업에 적용됩니다.

기본값:

FALSE

USE_LOGICAL_TYPE = TRUE | FALSE

용도:: 데이터 로딩, 스테이징된 파일의 데이터 쿼리, 스키마 감지.
정의:: Parquet 논리 유형을 사용할지 여부를 지정하는 부울입니다. Snowflake는 이 파일 형식 옵션으로 데이터 로드 중에 Parquet 논리 유형을 해석할 수 있습니다. 자세한 내용은 Parquet 논리 유형 정의 를 참조하십시오. Parquet 논리 유형을 활성화하려면 새 파일 형식 옵션을 생성할 때 USE_LOGICAL_TYPE을 TRUE로 설정하십시오.
제한 사항:: 데이터 언로딩에는 지원되지 않습니다.

USE_VECTORIZED_SCANNER = TRUE | FALSE

용도:: 스테이징된 파일에서의 데이터 로딩 및 데이터 쿼리
정의:: Parquet 파일을 로드할 때 벡터화된 스캐너를 사용할지 여부를 지정하는 부울입니다.
기본값:: FALSE. 향후 BCR에서 기본값은 TRUE 입니다.

벡터화된 스캐너를 사용하면 Parquet 파일의 열 형식에 적합하기 때문에 Parquet 파일 로딩 대기 시간을 크게 줄일 수 있습니다. 스캐너는 선택한 열의 하위 집합 등 Parquet 파일에서 관련 섹션만 메모리에 다운로드합니다.

USE_VECTORIZED_SCANNER 가 TRUE 로 설정된 경우 벡터화된 스캐너는 다음과 같은 동작을 수행합니다.

BINARY_AS_TEXT 옵션은 실제 설정된 값에 관계없이 항상 FALSE 로, USE_LOGICAL_TYPE 옵션은 항상 TRUE 로 취급됩니다.
벡터화된 스캐너는 Parquet 맵 유형을 지원합니다. 맵 유형 스캔의 출력은 다음과 같습니다.
"my_map":
  {
   "k1": "v1",
   "k2": "v2"
  }
다음 예제에서 볼 수 있듯이 벡터화된 스캐너는 출력에 NULL 값을 표시합니다.
"person":
 {
  "name": "Adam",
  "nickname": null,
  "age": 34,
  "phone_numbers":
  [
    "1234567890",
    "0987654321",
    null,
    "6781234590"
  ]
  }
벡터화된 스캐너는 시간과 타임스탬프를 다음과 같이 처리합니다.

Parquet

Snowflake 벡터화된 스캐너

TimeType(isAdjustedToUtc=True/False, 단위=MILLIS/MICROS/NANOS)

TIME

TimestampType(isAdjustedToUtc=True, 단위=MILLIS/MICROS/NANOS)

TIMESTAMP_LTZ

TimestampType(isAdjustedToUtc=False, 단위=MILLIS/MICROS/NANOS)

TIMESTAMP_NTZ

INT96

TIMESTAMP_LTZ

Parquet	Snowflake 벡터화된 스캐너
TimeType(isAdjustedToUtc=True/False, 단위=MILLIS/MICROS/NANOS)	TIME
TimestampType(isAdjustedToUtc=True, 단위=MILLIS/MICROS/NANOS)	TIMESTAMP_LTZ
TimestampType(isAdjustedToUtc=False, 단위=MILLIS/MICROS/NANOS)	TIMESTAMP_NTZ
INT96	TIMESTAMP_LTZ

USE_VECTORIZED_SCANNER 가 FALSE 로 설정된 경우 스캐너의 동작은 다음과 같습니다.

이 옵션은 Parquet 맵을 지원하지 않습니다. 맵 유형 스캔의 출력은 다음과 같습니다.
"my_map":
 {
  "key_value":
  [
   {
          "key": "k1",
          "value": "v1"
      },
      {
          "key": "k2",
          "value": "v2"
      }
    ]
  }
다음 예제에서 볼 수 있듯이 이 옵션은 스캔 출력에 NULL 값을 명시적으로 표시하지 않습니다.
"person":
 {
  "name": "Adam",
  "age": 34
  "phone_numbers":
  [
   "1234567890",
   "0987654321",
   "6781234590"
  ]
 }
이 옵션은 시간과 타임스탬프를 다음과 같이 처리합니다.

Parquet

USE_LOGICAL_TYPE = TRUE인 경우

USE_LOGICAL_TYPE = FALSE인 경우

TimeType(isAdjustedToUtc=True/False, 단위=MILLIS/MICROS)

TIME

TIME(ConvertedType이 있는 경우)

INTEGER(ConvertedType이 없는 경우)

TimeType(isAdjustedToUtc=True/False, 단위=NANOS)

TIME

INTEGER

TimestampType(isAdjustedToUtc=True, 단위=MILLIS/MICROS)

TIMESTAMP_LTZ

TIMESTAMP_NTZ

TimestampType(isAdjustedToUtc=True, 단위=NANOS)

TIMESTAMP_LTZ

INTEGER

TimestampType(isAdjustedToUtc=False, 단위=MILLIS/MICROS)

TIMESTAMP_NTZ

TIMESTAMP_LTZ(ConvertedType이 있는 경우)

INTEGER(ConvertedType이 없는 경우)

TimestampType(isAdjustedToUtc=False, 단위=NANOS)

TIMESTAMP_NTZ

INTEGER

INT96

TIMESTAMP_NTZ

TIMESTAMP_NTZ

REPLACE_INVALID_CHARACTERS = TRUE | FALSE

Parquet	USE_LOGICAL_TYPE = TRUE인 경우	USE_LOGICAL_TYPE = FALSE인 경우
TimeType(isAdjustedToUtc=True/False, 단위=MILLIS/MICROS)	TIME	TIME(ConvertedType이 있는 경우) INTEGER(ConvertedType이 없는 경우)
TimeType(isAdjustedToUtc=True/False, 단위=NANOS)	TIME	INTEGER
TimestampType(isAdjustedToUtc=True, 단위=MILLIS/MICROS)	TIMESTAMP_LTZ	TIMESTAMP_NTZ
TimestampType(isAdjustedToUtc=True, 단위=NANOS)	TIMESTAMP_LTZ	INTEGER
TimestampType(isAdjustedToUtc=False, 단위=MILLIS/MICROS)	TIMESTAMP_NTZ	TIMESTAMP_LTZ(ConvertedType이 있는 경우) INTEGER(ConvertedType이 없는 경우)
TimestampType(isAdjustedToUtc=False, 단위=NANOS)	TIMESTAMP_NTZ	INTEGER
INT96	TIMESTAMP_NTZ	TIMESTAMP_NTZ

용도:

데이터 로딩 및 외부 테이블

정의:

유효하지 않은 UTF-8 문자를 유니코드 대체 문자(�)로 대체할지 여부를 지정하는 부울. 이 옵션은 일대일 문자 대체를 수행합니다.

값:

TRUE 로 설정하면 Snowflake가 잘못된 UTF-8 문자를 유니코드 대체 문자로 바꿉니다.

FALSE 로 설정하면 잘못된 UTF-8 문자 인코딩이 감지될 때 로딩 작업에서 오류가 발생합니다.

기본값:

FALSE

NULL_IF = ( 'string1' [ , 'string2' , ... ] )

용도:

데이터 로딩 전용

정의:

이 파일 형식 옵션은 MATCH_BY_COLUMN_NAME 복사 옵션을 사용하여 Parquet 데이터를 별도의 열에 로딩할 때만 다음 작업에 적용됩니다.

예:

NULL_IF = ('\N', 'NULL', 'NUL', '')

이 옵션에는 빈 문자열이 포함될 수 있습니다.

기본값:

\N (즉, NULL)

TYPE = XML¶

용도:

데이터 로딩 전용

정의:

데이터를 로딩할 때 데이터 파일에 대한 현재 압축 알고리즘을 지정합니다. Snowflake는 이 옵션을 사용하여 이미 압축된 데이터 파일을 압축한 방식을 감지해 로딩을 위해 파일의 압축 데이터를 추출할 수 있습니다.
데이터를 언로딩할 때 지정된 압축 알고리즘을 사용하여 데이터 파일을 압축합니다.

값:


지원되는 값	참고
`AUTO`	데이터를 로딩할 때 현재 자동으로 감지할 수 없는 Brotli 압축 파일을 제외하고 압축 알고리즘이 자동으로 감지됩니다. 데이터를 언로딩할 때 파일은 기본값인 gzip을 사용하여 자동으로 압축됩니다.
`GZIP`
`BZ2`
`BROTLI`	Brotli 압축 파일을 로딩/언로딩할 경우 지정해야 합니다.
`ZSTD`	Zstandard v0.8 이상이 지원됩니다.
`DEFLATE`	Deflate 압축 파일(zlib 헤더 RFC1950 포함).
`RAW_DEFLATE`	원시 Deflate 압축 파일(헤더 RFC1951 제외).
`NONE`	데이터를 로딩할 때 파일이 압축되지 않았음을 나타냅니다. 데이터를 언로딩할 때 언로딩된 파일이 압축되지 않도록 지정합니다.

기본값:

AUTO

IGNORE_UTF8_ERRORS = TRUE | FALSE

용도:

데이터 로딩 및 외부 테이블

정의:

UTF-8 인코딩 오류가 오류 조건을 생성하는지 여부를 지정하는 부울입니다. 이는 REPLACE_INVALID_CHARACTERS 의 대체 구문입니다.

값:

TRUE 로 설정하면 잘못된 UTF-8 시퀀스가 전부 유니코드 문자 U+FFFD (즉, “대체 문자”)로 자동으로 바뀝니다.

FALSE 로 설정하면 잘못된 UTF-8 문자 인코딩이 감지될 때 로딩 작업에서 오류가 발생합니다.

기본값:

FALSE

PRESERVE_SPACE = TRUE | FALSE

용도:: 데이터 로딩 전용
정의:: XML 파서가 요소 콘텐츠의 선행 및 후행 공백을 보존할지 여부를 지정하는 부울입니다.
기본값:: FALSE

STRIP_OUTER_ELEMENT = TRUE | FALSE

용도:: 데이터 로딩 전용
정의:: XML 파서가 외부 XML 요소를 제거하여 2차 수준 요소를 별개의 문서로 노출할지 여부를 지정하는 부울입니다.
기본값:: FALSE

DISABLE_AUTO_CONVERT = TRUE | FALSE

용도:: 데이터 로딩 전용
정의:: XML 파서가 숫자 값과 부울 값을 텍스트에서 기본 표현으로 자동 변환하지 못하게 할지 여부를 지정하는 부울입니다.
기본값:: FALSE

REPLACE_INVALID_CHARACTERS = TRUE | FALSE

용도:

데이터 로딩 및 외부 테이블

정의:

유효하지 않은 UTF-8 문자를 유니코드 대체 문자(�)로 대체할지 여부를 지정하는 부울. 이 옵션은 일대일 문자 대체를 수행합니다.

값:

TRUE 로 설정하면 Snowflake가 잘못된 UTF-8 문자를 유니코드 대체 문자로 바꿉니다.

FALSE 로 설정하면 잘못된 UTF-8 문자 인코딩이 감지될 때 로딩 작업에서 오류가 발생합니다.

기본값:

FALSE

SKIP_BYTE_ORDER_MARK = TRUE | FALSE

용도:

데이터 로딩 전용

정의:

입력 파일에 있는 모든 BOM(바이트 순서 표시)을 건너뛸지 여부를 지정하는 부울입니다. BOM은 데이터 파일의 시작 부분에서 바이트 순서와 인코딩 형식을 정의하는 문자 코드입니다.

기본값:

TRUE

액세스 제어 요구 사항¶

이 작업을 실행하는 데 사용되는 역할 에는 최소한 다음 권한 이 있어야 합니다.


권한	오브젝트	참고
CREATE FILE FORMAT	스키마
OWNERSHIP	파일 형식	스키마에 이미 존재하는 오브젝트와 동일한 이름을 가진 임시 오브젝트를 생성하려면 오브젝트에 대한 OWNERSHIP 권한을 역할에 부여하거나 상속해야 합니다. 기존 파일 형식에 대한 CREATE OR ALTER FILE FORMAT 문을 실행하는 데 필수입니다. Note that in a managed access schema, only the schema owner (i.e. the role with the OWNERSHIP privilege on the schema) or a role with the MANAGE GRANTS privilege can grant or revoke privileges on objects in the schema, including future grants.

스키마의 오브젝트에 대한 작업을 수행하려면 상위 데이터베이스에 대한 하나 이상의 권한과 상위 스키마에 대한 하나 이상의 권한이 필요합니다.

지정된 권한 세트로 사용자 지정 역할을 만드는 방법에 대한 지침은 사용자 지정 역할 만들기 섹션을 참조하십시오.

보안 오브젝트 에 대해 SQL 작업을 수행하기 위한 역할과 권한 부여에 대한 일반적인 정보는 액세스 제어의 개요 섹션을 참조하십시오.

CREATE OR ALTER FILE FORMAT 사용법 노트¶

ALTER FILE FORMAT 명령의 모든 제한 사항이 적용됩니다.
TEMP FILE FORMAT 을 일반 FILE FORMAT 으로 바꿀 수 없으며 그 반대의 경우도 마찬가지입니다.
TYPE 속성은 변경할 수 없습니다.

사용법 노트¶

조심

(CREATE OR REPLACE FILE FORMAT을 사용하여) 파일 형식을 다시 만들면 파일 형식과 이를 참조하는 외부 테이블 간의 연결이 끊어집니다. 이는 외부 테이블이 파일 형식의 이름이 아니라 숨겨진 ID를 사용하여 파일 형식에 연결되기 때문입니다. CREATE OR REPLACE 구문이 오브젝트를 삭제하고 다른 숨겨진 ID로 저장소 통합을 다시 생성하는 작업이 백그라운드로 수행됩니다.

하나 이상의 외부 테이블에 연결된 파일 형식을 다시 만들어야 하는 경우 (CREATE OR REPLACE EXTERNAL TABLE을 사용하여) 외부 테이블을 각각 다시 만들어 연결을 다시 설정해야 합니다. GET_DDL 함수를 호출하여 각 외부 테이블을 다시 만드는 DDL 문을 불러옵니다.

SQL 문에서 충돌하는 파일 형식 값은 오류를 발생시킵니다. 같은 옵션을 서로 다른 값(예: ...TYPE = 'CSV' ... TYPE = 'JSON'...)으로 여러 번 지정하면 충돌이 발생합니다.
메타데이터 관련:

주의

고객은 Snowflake 서비스를 사용할 때 개인 데이터(사용자 오브젝트 제외), 민감한 데이터, 수출 통제 대상 데이터 또는 기타 규제 데이터가 메타데이터로 입력되지 않도록 해야 합니다. 자세한 내용은 Snowflake의 메타데이터 필드 섹션을 참조하십시오.

OR REPLACE 및 IF NOT EXISTS 절은 상호 배타적입니다. 두 절을 같은 문에 함께 사용할 수 없습니다.
CREATE OR REPLACE <오브젝트> 문은 원자성입니다. 즉, 오브젝트가 바뀔 때 단일 트랜잭션으로 이전 오브젝트가 삭제되고 새 오브젝트가 생성됩니다.

예¶

모든 기본 CSV 형식 옵션을 사용하고 my_csv_format 으로 명명된 CSV 파일 형식을 만듭니다.

CREATE OR REPLACE FILE FORMAT my_csv_format
  TYPE = CSV
  COMMENT = 'my_file_format';

my_csv_format 을 변경하여 데이터 파일에 대한 다음 규칙을 정의하고 설명을 설정 해제합니다.

필드는 파이프 문자(|)를 사용하여 구분됩니다.
파일은 건너뛸 단일 헤더 줄을 포함합니다.
문자열 NULL 및 null 은 NULL 값으로 대체됩니다.
빈 문자열은 NULL 값으로 해석됩니다.
GZIP 압축을 사용하여 파일을 압축/압축 해제합니다.

CREATE OR ALTER FILE FORMAT my_csv_format
  TYPE = CSV
  FIELD_DELIMITER = '|'
  SKIP_HEADER = 1
  NULL_IF = ('NULL', 'null')
  EMPTY_FIELD_AS_NULL = true
  COMPRESSION = gzip;

모든 기본 JSON 형식 옵션을 사용하고 my_json_format 으로 명명된 JSON 파일 형식을 만듭니다.

CREATE OR REPLACE FILE FORMAT my_json_format
  TYPE = JSON;

물리적 유형이나 레거시 변환 유형 대신 PARQUET 논리 유형을 사용하는 my_parquet_format 이라는 PARQUET 파일 형식을 생성합니다.

CREATE OR REPLACE FILE FORMAT my_parquet_format
  TYPE = PARQUET
  USE_VECTORIZED_SCANNER = TRUE
  USE_LOGICAL_TYPE = TRUE;

CREATE FILE FORMAT¶

구문¶

베리언트 구문¶

CREATE OR ALTER FILE FORMAT¶

필수 매개 변수¶

선택적 매개 변수¶

형식 유형 옵션(formatTypeOptions)¶

TYPE = CSV¶

TYPE = JSON¶

TYPE = AVRO¶

TYPE = ORC¶

TYPE = PARQUET¶

TYPE = XML¶

액세스 제어 요구 사항¶

CREATE OR ALTER FILE FORMAT 사용법 노트¶

사용법 노트¶

예¶

형식 유형 옵션(`formatTypeOptions`)¶