외부 파일에 대한 더 강력한 UTF-8 유효성 검사

이 동작 변경 사항은 7.34 릴리스에서 구현되었습니다. 동작 변경 사항에 대한 최신 세부 정보를 보려면 동작 변경 로그 를 참조하십시오.

Snowflake는 외부 파일에 대해 더 강력한 UTF-8 유효성 검사 기능이 있습니다.

변경 전

유효하지 않은 UTF-8 데이터가 포함된 외부 Avro, Parquet, Orc, CSV, JSON 또는 XML 파일을 쿼리하면 대개의 경우 쿼리가 성공합니다.

변경 후

유효하지 않은 UTF-8 데이터가 포함된 외부 Avro, Parquet, Orc, CSV, JSON 또는 XML 파일을 쿼리하면 쿼리가 실패합니다.

유효하지 않은 UTF-8 데이터가 포함된 COPY INTO <테이블> 또는 Snowpipe 를 사용하여 외부 파일을 로드하는 경우 Snowflake는 복사 옵션 ON_ERROR = CONTINUE 를 진행합니다. Snowflake는 유효하지 않은 UTF-8 데이터가 포함된 레코드를 오류로 간주하고 파일을 계속 로드합니다.

UTF-8 유효성 검사 오류를 방지하려면 유효하지 않은 UTF-8 문자가 유니코드 대체 문자()로 바뀌도록 파일 형식에 대해 REPLACE_INVALID_CHARACTERS = TRUE 를 지정하는 것이 좋습니다.

Parquet 파일의 경우 정의된 논리적 데이터 타입이 없는 열이 UTF-8 텍스트 대신 이진 데이터로 해석되도록 파일 형식에 대해 BINARY_AS_TEXT = FALSE 를 설정할 수도 있습니다.

이 동작 변경 사항은 유효하지 않은 UTF8을 현재 로드 중인 기존 계정에는 적용되지 않고 새 계정에만 영향을 미칩니다. 문제가 있는 경우 Snowflake 지원 에 문의하십시오.

참조: 1013 1014