외부 파일에 대한 더 강력한 UTF-8 유효성 검사¶
이 동작 변경 사항은 7.34 릴리스에서 구현되었습니다. 동작 변경 사항에 대한 최신 세부 정보를 보려면 동작 변경 로그 를 참조하십시오.
Snowflake는 외부 파일에 대해 더 강력한 UTF-8 유효성 검사 기능이 있습니다.
- 변경 전:
유효하지 않은 UTF-8 데이터가 포함된 외부 Avro, Parquet, Orc, CSV, JSON 또는 XML 파일을 쿼리하면 대개의 경우 쿼리가 성공합니다.
- 변경 후:
유효하지 않은 UTF-8 데이터가 포함된 외부 Avro, Parquet, Orc, CSV, JSON 또는 XML 파일을 쿼리하면 쿼리가 실패합니다.
유효하지 않은 UTF-8 데이터가 포함된 COPY INTO <테이블> 또는 Snowpipe 를 사용하여 외부 파일을 로드하는 경우 Snowflake는 복사 옵션
ON_ERROR = CONTINUE
를 진행합니다. Snowflake는 유효하지 않은 UTF-8 데이터가 포함된 레코드를 오류로 간주하고 파일을 계속 로드합니다.
UTF-8 유효성 검사 오류를 방지하려면 유효하지 않은 UTF-8 문자가 유니코드 대체 문자(�
)로 바뀌도록 파일 형식에 대해 REPLACE_INVALID_CHARACTERS = TRUE
를 지정하는 것이 좋습니다.
Parquet 파일의 경우 정의된 논리적 데이터 타입이 없는 열이 UTF-8 텍스트 대신 이진 데이터로 해석되도록 파일 형식에 대해 BINARY_AS_TEXT = FALSE
를 설정할 수도 있습니다.
이 동작 변경 사항은 유효하지 않은 UTF8을 현재 로드 중인 기존 계정에는 적용되지 않고 새 계정에만 영향을 미칩니다. 문제가 있는 경우 Snowflake 지원 에 문의하십시오.
참조: 1013 1014