카테고리:

데이터 로딩/언로딩 DDL

CREATE STAGE

파일에서 Snowflake 테이블로 데이터를 로딩하고 테이블에서 파일로 데이터를 언로딩하는 데 사용할 명명된 새 내부 또는 외부 스테이지를 만듭니다.

내부 스테이지

Snowflake 내에서 데이터 파일을 내부적으로 저장합니다. 내부 스테이지는 영구적이거나 임시적일 수 있습니다. 자세한 내용은 로컬 파일을 위한 내부 스테이지 선택하기 섹션을 참조하십시오.

외부 스테이지

Snowflake 외부의 위치에 저장된 데이터 파일을 참조합니다. 현재, 다음과 같은 클라우드 저장소 서비스가 지원됩니다.

  • Amazon S3 버킷

  • Google Cloud Storage 버킷

  • Microsoft Azure 컨테이너

저장소 위치는 개인/보호된 위치 또는 공용 위치일 수 있습니다.

사용자는 검색하기 전에 복원이 필요한 아카이브 클라우드 저장소 클래스에 있는 데이터에 액세스할 수 없습니다. 이러한 아카이브 저장소 클래스로는 예를 들어 Amazon S3 Glacier Flexible Retrieval 또는 Glacier Deep Archive 저장소 클래스 또는 Microsoft Azure Archive Storage 등이 있습니다.

내부 또는 외부 스테이지에는 디렉터리 테이블 이 포함될 수 있습니다. 디렉터리 테이블 은 스테이징된 파일의 카탈로그를 클라우드 저장소에 저장합니다.

참고 항목:

DROP STAGE , ALTER STAGE , SHOW STAGES , DESCRIBE STAGE

PUT , COPY INTO <테이블>

COPY INTO <위치> , GET

이 항목의 내용:

구문

-- Internal stage
CREATE [ OR REPLACE ] [ TEMPORARY ] STAGE [ IF NOT EXISTS ] <internal_stage_name>
    internalStageParams
    directoryTableParams
  [ FILE_FORMAT = ( { FORMAT_NAME = '<file_format_name>' | TYPE = { CSV | JSON | AVRO | ORC | PARQUET | XML } [ formatTypeOptions ] ) } ]
  [ COPY_OPTIONS = ( copyOptions ) ]
  [ [ WITH ] TAG ( <tag_name> = '<tag_value>' [ , <tag_name> = '<tag_value>' , ... ] ) ]
  [ COMMENT = '<string_literal>' ]

-- External stage
CREATE [ OR REPLACE ] [ TEMPORARY ] STAGE [ IF NOT EXISTS ] <external_stage_name>
    externalStageParams
    directoryTableParams
  [ FILE_FORMAT = ( { FORMAT_NAME = '<file_format_name>' | TYPE = { CSV | JSON | AVRO | ORC | PARQUET | XML } [ formatTypeOptions ] ) } ]
  [ COPY_OPTIONS = ( copyOptions ) ]
  [ [ WITH ] TAG ( <tag_name> = '<tag_value>' [ , <tag_name> = '<tag_value>' , ... ] ) ]
  [ COMMENT = '<string_literal>' ]

여기서:

internalStageParams ::=
  [ ENCRYPTION = (TYPE = 'SNOWFLAKE_FULL' | TYPE = 'SNOWFLAKE_SSE') ]
externalStageParams (for Amazon S3) ::=
  URL = { 's3://<bucket>[/<path>/]' | 's3gov://<bucket>[/<path>/]' }

  [ { STORAGE_INTEGRATION = <integration_name> } | { CREDENTIALS = ( {  { AWS_KEY_ID = '<string>' AWS_SECRET_KEY = '<string>' [ AWS_TOKEN = '<string>' ] } | AWS_ROLE = '<string>'  } ) ) } ]
  [ ENCRYPTION = ( [ TYPE = 'AWS_CSE' ] [ MASTER_KEY = '<string>' ] |
                   [ TYPE = 'AWS_SSE_S3' ] |
                   [ TYPE = 'AWS_SSE_KMS' [ KMS_KEY_ID = '<string>' ] ] |
                   [ TYPE = 'NONE' ] ) ]
externalStageParams (for Google Cloud Storage) ::=
  URL = 'gcs://<bucket>[/<path>/]'
  [ STORAGE_INTEGRATION = <integration_name> ]
  [ ENCRYPTION = ( [ TYPE = 'GCS_SSE_KMS' ] [ KMS_KEY_ID = '<string>' ] | [ TYPE = 'NONE' ] ) ]
externalStageParams (for Microsoft Azure) ::=
  URL = 'azure://<account>.blob.core.windows.net/<container>[/<path>/]'
  [ { STORAGE_INTEGRATION = <integration_name> } | { CREDENTIALS = ( [ AZURE_SAS_TOKEN = <string> ] ) } ]
  [ ENCRYPTION = ( [TYPE = { 'AZURE_CSE' | NONE } ] [ MASTER_KEY = '<string>' ] ) ]
directoryTableParams (for internal stages) ::=
  [ DIRECTORY = ( ENABLE = { TRUE | FALSE }
                  [ REFRESH_ON_CREATE =  { TRUE | FALSE } ] ) ]
directoryTableParams (for Amazon S3) ::=
  [ DIRECTORY = ( ENABLE = { TRUE | FALSE }
                  [ REFRESH_ON_CREATE =  { TRUE | FALSE } ]
                  [ AUTO_REFRESH = { TRUE | FALSE } ] ) ]
directoryTableParams (for Google Cloud Storage) ::=
  [ DIRECTORY = ( ENABLE = { TRUE | FALSE }
                  [ AUTO_REFRESH = { TRUE | FALSE } ]
                  [ REFRESH_ON_CREATE =  { TRUE | FALSE } ]
                  [ NOTIFICATION_INTEGRATION = '<notification_integration_name>' ] ) ]
directoryTableParams (for Microsoft Azure) ::=
  [ DIRECTORY = ( ENABLE = { TRUE | FALSE }
                  [ REFRESH_ON_CREATE =  { TRUE | FALSE } ]
                  [ AUTO_REFRESH = { TRUE | FALSE } ]
                  [ NOTIFICATION_INTEGRATION = '<notification_integration_name>' ] ) ]
formatTypeOptions ::=
-- If TYPE = CSV
     COMPRESSION = AUTO | GZIP | BZ2 | BROTLI | ZSTD | DEFLATE | RAW_DEFLATE | NONE
     RECORD_DELIMITER = '<character>' | NONE
     FIELD_DELIMITER = '<character>' | NONE
     FILE_EXTENSION = '<string>'
     SKIP_HEADER = <integer>
     SKIP_BLANK_LINES = TRUE | FALSE
     DATE_FORMAT = '<string>' | AUTO
     TIME_FORMAT = '<string>' | AUTO
     TIMESTAMP_FORMAT = '<string>' | AUTO
     BINARY_FORMAT = HEX | BASE64 | UTF8
     ESCAPE = '<character>' | NONE
     ESCAPE_UNENCLOSED_FIELD = '<character>' | NONE
     TRIM_SPACE = TRUE | FALSE
     FIELD_OPTIONALLY_ENCLOSED_BY = '<character>' | NONE
     NULL_IF = ( '<string>' [ , '<string>' ... ] )
     ERROR_ON_COLUMN_COUNT_MISMATCH = TRUE | FALSE
     REPLACE_INVALID_CHARACTERS = TRUE | FALSE
     EMPTY_FIELD_AS_NULL = TRUE | FALSE
     SKIP_BYTE_ORDER_MARK = TRUE | FALSE
     ENCODING = '<string>' | UTF8
-- If TYPE = JSON
     COMPRESSION = AUTO | GZIP | BZ2 | BROTLI | ZSTD | DEFLATE | RAW_DEFLATE | NONE
     DATE_FORMAT = '<string>' | AUTO
     TIME_FORMAT = '<string>' | AUTO
     TIMESTAMP_FORMAT = '<string>' | AUTO
     BINARY_FORMAT = HEX | BASE64 | UTF8
     TRIM_SPACE = TRUE | FALSE
     NULL_IF = ( '<string>' [ , '<string>' ... ] )
     FILE_EXTENSION = '<string>'
     ENABLE_OCTAL = TRUE | FALSE
     ALLOW_DUPLICATE = TRUE | FALSE
     STRIP_OUTER_ARRAY = TRUE | FALSE
     STRIP_NULL_VALUES = TRUE | FALSE
     REPLACE_INVALID_CHARACTERS = TRUE | FALSE
     IGNORE_UTF8_ERRORS = TRUE | FALSE
     SKIP_BYTE_ORDER_MARK = TRUE | FALSE
-- If TYPE = AVRO
     COMPRESSION = AUTO | GZIP | BROTLI | ZSTD | DEFLATE | RAW_DEFLATE | NONE
     TRIM_SPACE = TRUE | FALSE
     NULL_IF = ( '<string>' [ , '<string>' ... ] )
-- If TYPE = ORC
     TRIM_SPACE = TRUE | FALSE
     NULL_IF = ( '<string>' [ , '<string>' ... ] )
-- If TYPE = PARQUET
     COMPRESSION = AUTO | LZO | SNAPPY | NONE
     SNAPPY_COMPRESSION = TRUE | FALSE
     BINARY_AS_TEXT = TRUE | FALSE
     TRIM_SPACE = TRUE | FALSE
     NULL_IF = ( '<string>' [ , '<string>' ... ] )
-- If TYPE = XML
     COMPRESSION = AUTO | GZIP | BZ2 | BROTLI | ZSTD | DEFLATE | RAW_DEFLATE | NONE
     IGNORE_UTF8_ERRORS = TRUE | FALSE
     PRESERVE_SPACE = TRUE | FALSE
     STRIP_OUTER_ELEMENT = TRUE | FALSE
     DISABLE_SNOWFLAKE_DATA = TRUE | FALSE
     DISABLE_AUTO_CONVERT = TRUE | FALSE
     SKIP_BYTE_ORDER_MARK = TRUE | FALSE
copyOptions ::=
     ON_ERROR = { CONTINUE | SKIP_FILE | SKIP_FILE_<num> | 'SKIP_FILE_<num>%' | ABORT_STATEMENT }
     SIZE_LIMIT = <num>
     PURGE = TRUE | FALSE
     RETURN_FAILED_ONLY = TRUE | FALSE
     MATCH_BY_COLUMN_NAME = CASE_SENSITIVE | CASE_INSENSITIVE | NONE
     ENFORCE_LENGTH = TRUE | FALSE
     TRUNCATECOLUMNS = TRUE | FALSE
     FORCE = TRUE | FALSE

필수 매개 변수

internal_stage_name 또는 . external_stage_name

스테이지에 대한 식별자를 지정하는데, 스테이지가 생성된 스키마에 대해 고유한 식별자여야 합니다.

또한, 식별자는 알파벳 문자로 시작해야 하며 전체 식별자 문자열을 큰따옴표(예: "My object")로 묶지 않는 한 공백이나 특수 문자를 포함할 수 없습니다. 큰따옴표로 묶인 식별자도 대/소문자를 구분합니다.

자세한 내용은 식별자 요구 사항 섹션을 참조하십시오.

참고

외부 스테이지를 만들 때는 URL도 필요합니다. 자세한 내용은 이 항목에 있는 외부 스테이지 매개 변수 섹션을 참조하십시오.

URL을 지정하지 않을 경우 Snowflake는 기본적으로 내부 스테이지를 만듭니다.

선택적 매개 변수

TEMPORARY

만든 스테이지가 임시적이고 생성된 세션이 끝날 때 삭제될 것임을 지정합니다. 참고:

  • 임시 외부 스테이지가 삭제되면 스테이지 자체만 삭제되고 데이터 파일은 제거되지 않습니다.

  • 임시 내부 스테이지가 삭제되면 그 스테이지의 모든 파일이 로드 상태와 관계없이 Snowflake에서 제거됩니다. 따라서 임시 내부 스테이지의 파일이 데이터 저장소를 사용하지 못하게 되고, 결국 저장소 요금이 발생하지 않게 됩니다. 하지만 이는 스테이지가 삭제되면 Snowflake를 통해 스테이징된 파일을 복구할 수 없다는 뜻이기도 합니다.

    임시 내부 스테이지를 만들고 사용할 계획이라면 Snowflake 외부에 데이터 파일의 복사본을 유지 관리해야 합니다.

FILE_FORMAT = ( FORMAT_NAME = 'file_format_name' ) 또는 . FILE_FORMAT = ( TYPE = CSV | JSON | AVRO | ORC | PARQUET | XML [ ... ] )

다음 중 하나일 수 있는 스테이지의 파일 형식을 지정합니다.

FORMAT_NAME = 'file_format_name'

스테이지에 사용할 기존의 명명된 파일 형식을 지정합니다. 명명된 파일 형식에 따라 이 스테이지를 사용하여 로딩된 데이터 파일의 형식 유형(CSV, JSON 등)뿐 아니라, 기타 형식 옵션도 모두 결정됩니다. 자세한 내용은 CREATE FILE FORMAT 섹션을 참조하십시오.

TYPE = CSV | JSON | AVRO | ORC | PARQUET | XML [ ... ]

스테이지의 파일 형식을 지정합니다.

  • (COPY INTO <테이블> 을 사용해) 스테이지에서 데이터를 로딩하면 지원되는 모든 형식 유형이 포함됩니다.

  • (COPY INTO <위치> 을 사용해) 데이터를 스테이지로 언로딩하면 CSV, JSON 또는 PARQUET 가 포함됩니다.

파일 형식 유형을 지정하면 형식별 옵션을 추가로 지정할 수 있습니다. 자세한 내용은 이 항목의 형식 유형 옵션(formatTypeOptions) 섹션을 참조하십시오.

기본값: TYPE = CSV

참고

FORMAT_NAMETYPE 은 상호 배타적이므로, 한 스테이지에 대해 어느 하나만 지정할 수 있습니다.

COPY_OPTIONS = ( ... )

스테이지에 대해 하나 이상의 복사 옵션을 지정합니다. 자세한 내용은 이 항목의 복사 옵션(copyOptions) 섹션을 참조하십시오.

TAG ( tag_name = 'tag_value' [ , tag_name = 'tag_value' , ... ] )

태그 이름과 태그 문자열 값을 지정합니다.

태그 값은 항상 문자열이며, 태그 값의 최대 문자 수는 256자입니다. 오브젝트에 설정할 수 있는 고유한 태그의 최대 수는 20개입니다. 자세한 내용은 오브젝트/열에 대한 태그 할당량 섹션을 참조하십시오.

단일 CREATE 문으로 오브젝트에서 최대 5개의 태그를 설정할 수 있습니다.

COMMENT = 'string_literal'

스테이지에 대한 설명을 지정합니다.

기본값: 값 없음

내부 스테이지 매개 변수(internalStageParams)

[ ENCRYPTION = (TYPE = 'SNOWFLAKE_FULL' | TYPE = 'SNOWFLAKE_SSE') ]

스테이지에 저장된 모든 파일에 지원되는 암호화 유형을 지정합니다.

TYPE = ...

사용되는 암호화 유형을 지정합니다. 가능한 값은 다음과 같습니다.

  • SNOWFLAKE_FULL: 클라이언트 측 암호화. 클라이언트가 PUT 을 사용하여 파일을 내부 스테이지에 업로드할 때 암호화합니다.

  • SNOWFLAKE_SSE: 서버 측 암호화. 파일이 스테이지에 도착할 때 암호화됩니다.

    스테이징된 파일에 대해 미리 서명된 URL을 쿼리할 계획인 경우 서버 측 암호화를 지정하십시오. 자세한 내용은 파일 액세스에 사용할 수 있는 URL의 유형 섹션을 참조하십시오.

기본값: SNOWFLAKE_FULL

외부 스테이지 매개 변수(externalStageParams)

URL = 'cloud_specific_url'

이 매개 변수를 생략하면 Snowflake는 내부 스테이지를 만듭니다.

중요

  • Snowflake가 문자열을 식별할 수 있도록 URL을 작은따옴표('')로 묶습니다. 따옴표를 생략하면 입력하는 모든 자격 증명을 기록에 일반 텍스트로 표시할 수 있습니다. CREATE STAGE 문의 구문을 꼭 먼저 확인한 후에 실행하는 것이 좋습니다.

    Snowflake 웹 인터페이스에서 스테이지를 만들 때 필요에 따라 필드 값이 자동으로 따옴표로 묶입니다.

  • 지정된 폴더 경로로 필터링할 URL에 슬래시(/)를 추가합니다. 슬래시를 생략하면 지정된 경로의 접두사로 시작하는 모든 파일과 폴더가 포함됩니다.

    스테이지에서 비정형 데이터 파일에 액세스하고 검색하려면 슬래시가 필수적입니다.

Amazon S3

URL = { 's3://{bucket}[/{path}/]' | 's3gov://{bucket}[/{path}/]' }

로딩/언로딩할 데이터 파일을 저장하는 데 사용되는 외부 위치(기존 S3 버킷)의 URL을 지정합니다. 여기서는 다음과 같습니다.

  • s3 접두사는 공용 AWS 리전의 S3 저장소를 나타냅니다.

    s3gov 접두사는 정부 리전 의 S3 저장소를 나타냅니다. 현재, 저장소 통합을 사용하여 AWS 정부 리전의 S3 저장소에 액세스하는 것은 동일한 정부 리전의 AWS에 호스팅된 Snowflake 계정으로 제한됩니다. 직접 자격 증명을 사용하여 정부 리전 외부에 호스팅된 계정에서 S3 저장소에 액세스하는 기능이 지원됩니다.

  • bucket 은 S3 버킷의 이름입니다.

  • path 는 파일 세트를 제한하는 클라우드 저장소 위치에 있는 파일의 선택적 경로로, 대/소문자를 구분합니다(즉, 파일 이름이 공통 문자열로 시작함). 다른 클라우드 저장소 서비스에서는 경로를 접두사 또는 폴더 라고도 합니다.

Google Cloud Storage

URL = 'gcs://bucket[/path/]'

로딩/언로딩할 데이터 파일을 저장하는 데 사용되는 외부 위치(기존 GCS 버킷)의 URL을 지정합니다. 여기서는 다음과 같습니다.

  • bucket 은 GCS 버킷의 이름입니다.

  • path 는 파일 세트를 제한하는 클라우드 저장소 위치에 있는 파일의 선택적 경로로, 대/소문자를 구분합니다(즉, 파일 이름이 공통 문자열로 시작함). 다른 클라우드 저장소 서비스에서는 경로를 접두사 또는 폴더 라고도 합니다.

Microsoft Azure

URL = 'azure://account.blob.core.windows.net/container[/path/]'

로딩할 데이터 파일을 저장하는 데 사용되는 외부 위치(기존 Azure 컨테이너)의 URL을 지정합니다. 여기서는 다음과 같습니다.

  • account 는 Azure 계정의 이름입니다(예: myaccount). Data Lake Storage Gen2를 포함하여, 지원되는 모든 타입의 Azure blob 저장소 계정에 대해 blob.core.windows.net 엔드포인트를 사용합니다.

    현재, 저장소 통합을 사용하여 정부 리전 의 Azure blob 저장소에 액세스하는 것은 동일한 정부 리전의 Azure에 호스팅된 Snowflake 계정으로 제한됩니다. 직접 자격 증명을 사용하여 정부 리전 외부에 호스팅된 계정에서 blob 저장소에 액세스하는 기능이 지원됩니다.

  • container 는 Azure 컨테이너의 이름입니다(예: mycontainer).

  • path 는 파일 세트를 제한하는 클라우드 저장소 위치에 있는 파일의 선택적 경로로, 대/소문자를 구분합니다(즉, 파일 이름이 공통 문자열로 시작함). 다른 클라우드 저장소 서비스에서는 경로를 접두사 또는 폴더 라고도 합니다.

기본값: 값 없음(내부 스테이지가 생성됨)

STORAGE_INTEGRATION = integration_name 또는 . CREDENTIALS = ( cloud_specific_credentials )

저장소 위치가 개인/보호된 위치인 경우에만 필요하며, 공용 버킷/컨테이너에는 필요하지 않음

Amazon S3

STORAGE_INTEGRATION = integration_name

외부 클라우드 저장소에 대한 인증 책임을 Snowflake ID 및 액세스 관리(IAM) 엔터티에 위임하는 데 사용되는 저장소 통합의 이름을 지정합니다. 자세한 내용은 CREATE STORAGE INTEGRATION 섹션을 참조하십시오.

참고

  • 저장소 통합을 꼭 사용하는 것이 좋습니다. 이 옵션을 사용하면 스테이지를 만들거나 데이터를 로딩할 때 CREDENTIALS 매개 변수를 사용하여 클라우드 저장소 자격 증명을 제공할 필요가 없습니다.

  • 저장소 통합을 사용하여 정부 리전의 S3 저장소에 액세스하는 것은 동일한 정부 리전의 AWS에 호스팅된 Snowflake 계정으로 제한됩니다. 직접 자격 증명을 사용하여 정부 리전 외부에 호스팅된 계정에서 S3 저장소에 액세스하는 기능이 지원됩니다.

    저장소 통합

CREDENTIALS = ( AWS_KEY_ID = 'string' AWS_SECRET_KEY = 'string' [ AWS_TOKEN = 'string' ] ) 또는 . CREDENTIALS = ( AWS_ROLE = 'string' )

AWS에 연결하고 로딩/언로딩할 파일이 스테이징되는 개인/보호된 S3 버킷에 액세스하기 위한 보안 자격 증명을 지정합니다. 자세한 내용은 Amazon S3에 대한 보안 액세스 구성하기 섹션을 참조하십시오.

지정하는 자격 증명은 버킷에 대한 Snowflake 액세스 허가를 AWS IAM(Identity & Access Management) 사용자 또는 역할과 연결했는지 여부에 따라 다릅니다.

  • IAM 사용자: IAM 자격 증명이 필요합니다. 임시(일명 《범위 지정》) 자격 증명은 AWS STS(Security Token Service)에 의해 생성되며 다음 세 가지 구성 요소로 이루어집니다.

    • AWS_KEY_ID

    • AWS_SECRET_KEY

    • AWS_TOKEN

    개인/보호된 버킷에 액세스하려면 세 가지가 모두 필요합니다. 지정된 기간이 지나면 임시 자격 증명이 만료되어 더 이상 사용할 수 없습니다. 그런 다음 유효한 임시 자격 증명으로 구성된 새 세트를 생성해야 합니다.

    중요

    COPY 명령을 사용하면 영구적인(일명 《장기》) 자격 증명을 사용할 수도 있지만, Snowflake에서는 보안상의 이유로 이런 자격 증명의 사용을 권장하지 않습니다. 영구 자격 증명을 사용해야 하는 경우에는 외부 스테이지의 영구 자격 증명을 주기적으로 새로 생성하는 것이 좋습니다.

  • IAM 역할: 보안 자격 증명과 액세스 키를 생략하고, 그 대신 AWS_ROLE 을 사용하여 역할을 식별하고 AWS 역할 ARN(Amazon Resource Name)을 지정합니다.

Google Cloud Storage

STORAGE_INTEGRATION = integration_name

외부 클라우드 저장소에 대한 인증 책임을 Snowflake ID 및 액세스 관리(IAM) 엔터티에 위임하는 데 사용되는 저장소 통합의 이름을 지정합니다. 자세한 내용은 CREATE STORAGE INTEGRATION 섹션을 참조하십시오.

Microsoft Azure

STORAGE_INTEGRATION = integration_name

외부 클라우드 저장소에 대한 인증 책임을 Snowflake ID 및 액세스 관리(IAM) 엔터티에 위임하는 데 사용되는 저장소 통합의 이름을 지정합니다. 자세한 내용은 CREATE STORAGE INTEGRATION 섹션을 참조하십시오.

참고

  • 저장소 통합을 꼭 사용하는 것이 좋습니다. 이 옵션을 사용하면 스테이지를 만들거나 데이터를 로딩할 때 CREDENTIALS 매개 변수를 사용하여 클라우드 저장소 자격 증명을 제공할 필요가 없습니다.

  • 저장소 통합을 사용하여 정부 리전 의 Azure blob 저장소에 액세스하는 것은 동일한 정부 리전의 Azure에 호스팅된 Snowflake 계정으로 제한됩니다. 직접 자격 증명을 사용하여 정부 리전 외부에 호스팅된 계정에서 blob 저장소에 액세스하는 기능이 지원됩니다.

CREDENTIALS = ( AZURE_SAS_TOKEN = 'string' )

Azure에 연결하고 로딩된 데이터를 포함한 파일을 스테이징하는 개인/보호된 컨테이너에 액세스하기 위해 SAS(공유 액세스 서명) 토큰을 지정합니다. 자격 증명은 Azure에서 생성됩니다.

기본값: 값 없음(외부 스테이지에 대한 자격 증명이 제공되지 않음)

ENCRYPTION = ( cloud_specific_encryption )

암호화된 파일에서 로딩하거나 암호화된 파일로 언로딩하는 경우에만 필요하며, 저장소 위치와 파일이 암호화되지 않은 경우에는 필요하지 않음

데이터 로딩

저장소 위치에서 암호화된 파일의 암호를 해독하고 데이터를 추출하는 데 사용되는 암호화 설정을 수정합니다.

데이터 언로딩

저장소 위치로 언로딩된 파일을 암호화하는 데 사용되는 암호화 설정을 수정합니다.

Amazon S3

ENCRYPTION = ( [ TYPE = 'AWS_CSE' ] [ MASTER_KEY = '<string>' ] | [ TYPE = 'AWS_SSE_S3' ] | [ TYPE = 'AWS_SSE_KMS' [ KMS_KEY_ID = '<string>' ] ] | [ TYPE = 'NONE' ] )

TYPE = ...

사용되는 암호화 유형을 지정합니다. 가능한 값은 다음과 같습니다.

  • AWS_CSE: 클라이언트 측 암호화(MASTER_KEY 값 필요). 현재, 사용자가 제공하는 클라이언트 측 마스터 키는 대칭 키만 될 수 있습니다. MASTER_KEY 값을 제공하면 Snowflake는 TYPE = AWS_CSE 로 간주합니다(즉, MASTER_KEY 값을 제공할 때 TYPE 이 필요하지 않음).

  • AWS_SSE_S3: 추가 암호화 설정이 필요 없는 서버 측 암호화입니다.

  • AWS_SSE_KMS: 선택적 KMS_KEY_ID 값을 허용하는 서버 측 암호화입니다.

암호화 유형에 대한 자세한 내용은 클라이언트 측 암호화 또는 서버 측 암호화 에 대한 AWS 설명서를 참조하십시오.

  • NONE: 암호화가 없습니다.

MASTER_KEY = 'string' (AWS_CSE 암호화에만 적용)

버킷의 파일을 암호화하는 데 사용되는 클라이언트 측 마스터 키를 지정합니다. 마스터 키는 Base64 인코딩 형식의 128비트 또는 256비트 키여야 합니다.

KMS_KEY_ID = 'string' (AWS_SSE_KMS 암호화에만 적용)

버킷으로 언로딩된 파일을 암호화하는 데 사용되는 AWS KMS 관리 키의 ID를 선택적으로 지정합니다. 아무런 값도 입력하지 않으면 언로딩 시 기본 KMS 키 ID를 사용해 파일을 암호화합니다.

데이터를 로딩할 때는 이 값을 무시합니다.

Google Cloud Storage

ENCRYPTION = ( [ TYPE = 'GCS_SSE_KMS' | 'NONE' ] [ KMS_KEY_ID = 'string' ] )

TYPE = ...

사용되는 암호화 유형을 지정합니다. 가능한 값은 다음과 같습니다.

KMS_KEY_ID = 'string' (GCS_SSE_KMS 암호화에만 적용)

버킷으로 언로딩된 파일을 암호화하는 데 사용되는 Cloud KMS 관리 키의 ID를 선택적으로 지정합니다. 아무런 값도 입력하지 않으면 언로딩 시 버킷에 대해 설정된 기본 KMS 키 ID를 사용해 파일을 암호화합니다.

데이터를 로딩할 때는 이 값을 무시합니다. 서비스 계정이 버킷에 있는 데이터의 암호를 해독하는 데 충분한 권한을 가지고 있다면 로딩 작업에 성공할 것입니다.

Microsoft Azure

ENCRYPTION = ( [ TYPE = 'AZURE_CSE' | 'NONE' ] [ MASTER_KEY = 'string' ] )

TYPE = ...

사용되는 암호화 유형을 지정합니다. 가능한 값은 다음과 같습니다.

  • AZURE_CSE: 클라이언트 측 암호화(MASTER_KEY 값 필요). 자세한 내용은 Microsoft Azure 설명서에서 클라이언트 측 암호화 정보 를 참조하십시오.

  • NONE: 암호화가 없습니다.

MASTER_KEY = 'string' (AZURE_CSE 암호화에만 적용)

파일을 암호화하거나 암호 해독하는 데 사용되는 클라이언트 측 마스터 키를 지정합니다. 마스터 키는 Base64 인코딩 형식의 128비트 또는 256비트 키여야 합니다.

디렉터리 테이블 매개 변수(directoryTableParams)

ENABLE = TRUE | FALSE

스테이지에 디렉터리 테이블을 추가할지 여부를 지정합니다. 값이 TRUE이면 디렉터리 테이블이 스테이지와 함께 생성됩니다.

기본값: FALSE

외부 스테이지

Amazon S3

REFRESH_ON_CREATE = TRUE | FALSE

스테이지가 생성된 직후 디렉터리 테이블 메타데이터를 한 번 자동으로 새로 고칠지 여부를 지정합니다. 디렉터리 테이블 메타데이터를 새로 고치면 지정된 스테이지 경로의 현재 데이터 파일 목록과 메타데이터가 동기화됩니다. 이 작업은 메타데이터가 URL = 설정에 지정된 명명된 스테이지에 기존 데이터 파일을 등록하는 데 필요합니다.

TRUE

Snowflake는 스테이지 생성 후 디렉터리 테이블 메타데이터를 한 번 자동으로 새로 고칩니다.

참고

지정된 클라우드 저장소 URL에 100만 개에 가깝거나 그 이상의 파일이 있는 경우 REFRESH_ON_CREATE = FALSE 를 설정하는 것이 좋습니다. 스테이지를 만든 후, 메타데이터에 저장소 위치의 모든 파일이 포함될 때까지 그 위치의 하위 경로(즉, 새로 고침에 포함할 파일의 하위 세트)를 지정하는 ALTER STAGE … REFRESH 문을 실행하여 디렉터리 테이블 메타데이터를 점진적으로 새로 고칩니다.

FALSE

Snowflake는 디렉터리 테이블 메타데이터를 자동으로 새로 고치지 않습니다. 스테이지에 존재하는 데이터 파일을 등록하려면 ALTER STAGE … REFRESH를 사용하여 디렉터리 테이블 메타데이터를 수동으로 한 번 새로 고쳐야 합니다.

기본값: TRUE

AUTO_REFRESH = TRUE | FALSE

[ WITH ] LOCATION = 설정에 지정된 명명된 외부 스테이지에서 신규 또는 업데이트된 데이터 파일을 사용할 수 있을 때 Snowflake가 디렉터리 테이블 메타데이터의 자동 새로 고침 트리거를 활성화해야 할지 여부를 지정합니다.

TRUE

Snowflake를 사용하면 디렉터리 테이블 메타데이터의 자동 새로 고침을 트리거할 수 있습니다.

FALSE

Snowflake를 사용하여 디렉터리 테이블 메타데이터의 자동 새로 고침을 트리거할 수 없습니다. 메타데이터를 스테이지 경로의 현재 파일 목록과 동기화하려면 ALTER STAGE … REFRESH를 사용하여 디렉터리 테이블 메타데이터를 주기적으로 수동으로 새로 고쳐야 합니다.

기본값: FALSE

Google Cloud Storage

REFRESH_ON_CREATE = TRUE | FALSE

스테이지가 생성된 직후 디렉터리 테이블 메타데이터를 한 번 자동으로 새로 고칠지 여부를 지정합니다. 디렉터리 테이블 메타데이터를 새로 고치면 지정된 스테이지 경로의 현재 데이터 파일 목록과 메타데이터가 동기화됩니다. 이 작업은 메타데이터가 URL = 설정에 지정된 명명된 스테이지에 기존 데이터 파일을 등록하는 데 필요합니다.

TRUE

Snowflake는 스테이지 생성 후 디렉터리 테이블 메타데이터를 한 번 자동으로 새로 고칩니다.

참고

지정된 클라우드 저장소 URL에 100만 개에 가깝거나 그 이상의 파일이 있는 경우 REFRESH_ON_CREATE = FALSE 를 설정하는 것이 좋습니다. 스테이지를 만든 후, 메타데이터에 저장소 위치의 모든 파일이 포함될 때까지 그 위치의 하위 경로(즉, 새로 고침에 포함할 파일의 하위 세트)를 지정하는 ALTER STAGE … REFRESH 문을 실행하여 디렉터리 테이블 메타데이터를 점진적으로 새로 고칩니다.

FALSE

Snowflake는 디렉터리 테이블 메타데이터를 자동으로 새로 고치지 않습니다. 스테이지에 존재하는 데이터 파일을 등록하려면 ALTER STAGE … REFRESH를 사용하여 디렉터리 테이블 메타데이터를 수동으로 한 번 새로 고쳐야 합니다.

기본값: TRUE

AUTO_REFRESH = TRUE | FALSE

[ WITH ] LOCATION = 설정에 지정된 명명된 외부 스테이지에서 신규 또는 업데이트된 데이터 파일을 사용할 수 있을 때 Snowflake가 디렉터리 테이블 메타데이터의 자동 새로 고침 트리거를 활성화해야 할지 여부를 지정합니다.

TRUE

Snowflake를 사용하면 디렉터리 테이블 메타데이터의 자동 새로 고침을 트리거할 수 있습니다.

FALSE

Snowflake를 사용하여 디렉터리 테이블 메타데이터의 자동 새로 고침을 트리거할 수 없습니다. 메타데이터를 스테이지 경로의 현재 파일 목록과 동기화하려면 ALTER STAGE … REFRESH를 사용하여 디렉터리 테이블 메타데이터를 주기적으로 수동으로 새로 고쳐야 합니다.

NOTIFICATION_INTEGRATION = '<알림_통합_이름>'

GCS Pub/Sub 알림을 사용하여 디렉터리 테이블 메타데이터를 자동으로 새로 고치기 위해 사용되는 알림 통합의 이름을 지정합니다. 알림 통합은 Snowflake와 서드 파티 클라우드 메시지 큐 서비스 간의 인터페이스를 제공하는 Snowflake 오브젝트입니다.

Microsoft Azure

REFRESH_ON_CREATE = TRUE | FALSE

스테이지가 생성된 직후 디렉터리 테이블 메타데이터를 한 번 자동으로 새로 고칠지 여부를 지정합니다. 디렉터리 테이블 메타데이터를 새로 고치면 지정된 스테이지 경로의 현재 데이터 파일 목록과 메타데이터가 동기화됩니다. 이 작업은 메타데이터가 URL = 설정에 지정된 명명된 스테이지에 기존 데이터 파일을 등록하는 데 필요합니다.

TRUE

Snowflake는 스테이지 생성 후 디렉터리 테이블 메타데이터를 한 번 자동으로 새로 고칩니다.

참고

지정된 클라우드 저장소 URL에 100만 개에 가깝거나 그 이상의 파일이 있는 경우 REFRESH_ON_CREATE = FALSE 를 설정하는 것이 좋습니다. 스테이지를 만든 후, 메타데이터에 저장소 위치의 모든 파일이 포함될 때까지 그 위치의 하위 경로(즉, 새로 고침에 포함할 파일의 하위 세트)를 지정하는 ALTER STAGE … REFRESH 문을 실행하여 디렉터리 테이블 메타데이터를 점진적으로 새로 고칩니다.

FALSE

Snowflake는 디렉터리 테이블 메타데이터를 자동으로 새로 고치지 않습니다. 스테이지에 존재하는 데이터 파일을 등록하려면 ALTER STAGE … REFRESH를 사용하여 디렉터리 테이블 메타데이터를 수동으로 한 번 새로 고쳐야 합니다.

기본값: TRUE

AUTO_REFRESH = TRUE | FALSE

[ WITH ] LOCATION = 설정에 지정된 명명된 외부 스테이지에서 신규 또는 업데이트된 데이터 파일을 사용할 수 있을 때 Snowflake가 디렉터리 테이블 메타데이터의 자동 새로 고침 트리거를 활성화해야 할지 여부를 지정합니다.

TRUE

Snowflake를 사용하면 디렉터리 테이블 메타데이터의 자동 새로 고침을 트리거할 수 있습니다.

FALSE

Snowflake를 사용하여 디렉터리 테이블 메타데이터의 자동 새로 고침을 트리거할 수 없습니다. 메타데이터를 스테이지 경로의 현재 파일 목록과 동기화하려면 ALTER STAGE … REFRESH를 사용하여 디렉터리 테이블 메타데이터를 주기적으로 수동으로 새로 고쳐야 합니다.

기본값: FALSE

NOTIFICATION_INTEGRATION = '<알림_통합_이름>'

Azure Event Grid 알림을 사용하여 디렉터리 테이블 메타데이터를 자동으로 새로 고치기 위해 사용되는 알림 통합의 이름을 지정합니다. 알림 통합은 Snowflake와 서드 파티 클라우드 메시지 큐 서비스 간의 인터페이스를 제공하는 Snowflake 오브젝트입니다.

형식 유형 옵션(formatTypeOptions)

지정된 파일 형식 유형(FILE_FORMAT = ( TYPE = ... ))에 따라 다음 형식별 옵션(공백, 쉼표 또는 줄 바꿈으로 구분) 중 하나 이상을 포함할 수 있습니다.

TYPE = CSV

COMPRESSION = AUTO | GZIP | BZ2 | BROTLI | ZSTD | DEFLATE | RAW_DEFLATE | NONE
용도

데이터 로딩, 데이터 언로딩, 외부 테이블

정의
  • 데이터를 로딩할 때 데이터 파일에 대한 현재 압축 알고리즘을 지정합니다. Snowflake는 이 옵션을 사용하여 이미 압축된 데이터 파일을 압축한 방식을 감지해 로딩을 위해 파일의 압축 데이터를 추출할 수 있습니다.

  • 데이터를 언로딩할 때 지정된 압축 알고리즘을 사용하여 데이터 파일을 압축합니다.

지원되는 값

참고

AUTO

데이터를 로딩할 때 현재 자동으로 감지할 수 없는 Brotli 압축 파일을 제외하고 압축 알고리즘이 자동으로 감지됩니다. 데이터를 언로딩할 때 파일은 기본값인 gzip을 사용하여 자동으로 압축됩니다.

GZIP

BZ2

BROTLI

Brotli 압축 파일을 로딩/언로딩할 때 지정해야 합니다.

ZSTD

Zstandard v0.8 이상이 지원됩니다.

DEFLATE

Deflate 압축 파일(zlib 헤더 RFC1950 포함).

RAW_DEFLATE

원시 Deflate 압축 파일(헤더 RFC1951 제외).

NONE

데이터를 로딩할 때 파일이 압축되지 않았음을 나타냅니다. 데이터를 언로딩할 때 언로딩된 파일이 압축되지 않도록 지정합니다.

기본값

AUTO

RECORD_DELIMITER = 'character' | NONE
용도

데이터 로딩, 데이터 언로딩, 외부 테이블

정의

입력 파일(데이터 로딩) 또는 언로딩된 파일(데이터 언로딩)에서 레코드를 구분하는 하나 이상의 싱글바이트 또는 멀티바이트 문자입니다. 일반적인 이스케이프 시퀀스 또는 다음 싱글바이트 또는 멀티바이트 문자를 허용합니다.

싱글바이트 문자

8진수 값(\\ 접두사가 붙음) 또는 16진수 값(0x 또는 \x 접두사가 붙음). 예를 들어, 곡절 악센트(^) 문자로 구분된 레코드의 경우 8진수(\\5e) 또는 16진수(0x5e) 값을 지정합니다.

멀티바이트 문자

16진수 값(\x 접두사가 붙음). 예를 들어, 센트(¢) 문자로 구분된 레코드의 경우 16진수(\xC2\xA2) 값을 지정합니다.

RECORD_DELIMITER 또는 FIELD_DELIMITER의 구분 기호는 다른 파일 형식 옵션(예: FIELD_DELIMITER = 'aa' RECORD_DELIMITER = 'aabb')에 대한 구분 기호의 하위 문자열일 수 없습니다.

지정된 구분 기호는 임의의 바이트 시퀀스가 아니라 유효한 UTF-8 문자여야 합니다. 또한, 구분 기호는 최대 20자로 제한됩니다.

NONE 의 값도 허용합니다.

기본값
데이터 로딩

줄 바꿈 문자입니다. 《줄 바꿈》은 \r\n 이 Windows 플랫폼에서 파일에 대한 줄 바꿈으로 이해되게끔 하는 논리입니다.

데이터 언로딩

줄 바꿈 문자(\n).

FIELD_DELIMITER = 'character' | NONE
용도

데이터 로딩, 데이터 언로딩, 외부 테이블

정의

입력 파일(데이터 로딩) 또는 언로딩된 파일(데이터 언로딩)에서 필드를 구분하는 하나 이상의 싱글바이트 또는 멀티바이트 문자입니다. 일반적인 이스케이프 시퀀스 또는 다음 싱글바이트 또는 멀티바이트 문자를 허용합니다.

싱글바이트 문자

8진수 값(\\ 접두사가 붙음) 또는 16진수 값(0x 또는 \x 접두사가 붙음). 예를 들어, 곡절 악센트(^) 문자로 구분된 레코드의 경우 8진수(\\5e) 또는 16진수(0x5e) 값을 지정합니다.

멀티바이트 문자

16진수 값(\x 접두사가 붙음). 예를 들어, 센트(¢) 문자로 구분된 레코드의 경우 16진수(\xC2\xA2) 값을 지정합니다.

RECORD_DELIMITER 또는 FIELD_DELIMITER의 구분 기호는 다른 파일 형식 옵션(예: FIELD_DELIMITER = 'aa' RECORD_DELIMITER = 'aabb')에 대한 구분 기호의 하위 문자열일 수 없습니다.

지정된 구분 기호는 임의의 바이트 시퀀스가 아니라 유효한 UTF-8 문자여야 합니다. 또한, 구분 기호는 최대 20자로 제한됩니다.

NONE 의 값도 허용합니다.

기본값

쉼표(,)

FILE_EXTENSION = 'string' | NONE
용도

데이터 언로딩 전용

정의

스테이지로 언로딩된 파일의 확장명을 지정합니다. 모든 확장명을 허용합니다. 원하는 소프트웨어나 서비스에서 읽을 수 있는 파일 확장명은 사용자가 지정해야 합니다.

기본값

null, 즉 파일 확장명이 형식 유형 .csv[compression] 으로 결정된다는 의미로, 여기서 compressionCOMPRESSION 이 설정된 경우 압축 방법에 따라 추가되는 확장명입니다.

참고

SINGLE 복사 옵션이 TRUE 인 경우 COPY 명령을 실행하면 기본적으로 파일 확장명이 없는 파일이 언로딩됩니다. 파일 확장명을 지정하려면 internal_location 또는 external_location 경로(예: copy into @stage/data.csv)에 파일 이름과 확장명을 입력하십시오.

SKIP_HEADER = integer
용도

데이터 로딩 및 외부 테이블

정의

파일 시작에서 건너뛸 줄의 개수입니다.

참고로, SKIP_HEADER는 헤더 줄이 무엇인지 결정하기 위해 RECORD_DELIMITER 또는 FIELD_DELIMITER 값을 사용하지는 않으며, 오히려 파일에서 지정된 수만큼 CRLF(캐리지 리턴, 줄 바꿈)로 구분된 줄을 건너뜁니다. 그런 다음 RECORD_DELIMITER와 FIELD_DELIMITER를 사용해 로딩할 데이터 행을 결정합니다.

기본값

0

SKIP_BLANK_LINES = TRUE | FALSE
용도

데이터 로딩 및 외부 테이블

정의

데이터 파일에서 발견되는 빈 줄을 건너뛰도록 지정하는 부울입니다. 그렇지 않으면 빈 줄로 인해 레코드 끝 오류를 발생합니다(기본 동작).

기본값: FALSE

DATE_FORMAT = 'string' | AUTO
용도

데이터 로딩 및 언로딩

정의

데이터 파일(데이터 로딩) 또는 테이블(데이터 언로딩)의 날짜 값 형식을 정의합니다. 값이 지정되지 않거나 AUTO 인 경우 DATE_INPUT_FORMAT (데이터 로딩) 또는 DATE_OUTPUT_FORMAT (데이터 언로딩) 매개 변수의 값이 사용됩니다.

기본값

AUTO

TIME_FORMAT = 'string' | AUTO
용도

데이터 로딩 및 언로딩

정의

데이터 파일(데이터 로딩) 또는 테이블(데이터 언로딩)의 시간 값 형식을 정의합니다. 값이 지정되지 않거나 AUTO 인 경우 TIME_INPUT_FORMAT (데이터 로딩) 또는 TIME_OUTPUT_FORMAT (데이터 언로딩) 매개 변수의 값이 사용됩니다.

기본값

AUTO

TIMESTAMP_FORMAT = string' | AUTO
용도

데이터 로딩 및 언로딩

정의

데이터 파일(데이터 로딩) 또는 테이블(데이터 언로딩)의 타임스탬프 값 형식을 정의합니다. 값이 지정되지 않거나 AUTO 인 경우 TIMESTAMP_INPUT_FORMAT (데이터 로딩) 또는 TIMESTAMP_OUTPUT_FORMAT (데이터 언로딩) 매개 변수의 값이 사용됩니다.

기본값

AUTO

BINARY_FORMAT = HEX | BASE64 | UTF8
용도

데이터 로딩 및 언로딩

정의

이진 입력 또는 출력의 인코딩 형식을 정의합니다. 이 옵션은 테이블의 이진 열로 데이터를 로딩하거나 이진 열에서 데이터를 언로딩할 때 사용할 수 있습니다.

기본값

HEX

ESCAPE = 'character' | NONE
용도

데이터 로딩 및 언로딩

정의

괄호로 묶이거나 묶이지 않은 필드 값에 대한 이스케이프 문자로 사용되는 싱글바이트 문자열입니다. 이스케이프 문자는 문자 시퀀스의 후속 문자에 대한 대체 해석을 호출합니다. ESCAPE 문자를 사용하여 데이터에 있는 FIELD_OPTIONALLY_ENCLOSED_BY 문자의 인스턴스를 리터럴로 해석할 수 있습니다.

일반적인 이스케이프 시퀀스, 8진수 값 또는 16진수 값을 허용합니다.

데이터 로딩하기

괄호로 묶인 필드에만 이스케이프 문자를 지정합니다. FIELD_OPTIONALLY_ENCLOSED_BY 를 설정하여 필드를 묶는 데 사용되는 문자를 지정합니다.

참고

이 파일 형식 옵션은 싱글바이트 문자만 지원합니다. UTF-8 문자 인코딩은 상위 ASCII 문자를 멀티바이트 문자로 나타냅니다. 데이터 파일이 UTF-8 문자 세트로 인코딩된 경우 상위 ASCII 문자를 옵션 값으로 지정할 수 없습니다.

또한 상위 ASCII 문자를 지정하는 경우 ENCODING = 'string' 파일 형식 옵션을 데이터 파일의 문자 인코딩으로 설정하여 문자가 올바르게 해석되도록 보장하는 것이 좋습니다.

데이터 언로딩하기

이 옵션이 설정되면 ESCAPE_UNENCLOSED_FIELD 에 대해 설정된 이스케이프 문자를 재정의합니다.

기본값

NONE

ESCAPE_UNENCLOSED_FIELD = 'character' | NONE
용도

데이터 로딩 및 언로딩

정의

괄호로 묶이지 않은 필드 값에 대해서만 이스케이프 문자로 사용되는 싱글바이트 문자열입니다. 이스케이프 문자는 문자 시퀀스의 후속 문자에 대한 대체 해석을 호출합니다. ESCAPE 문자를 사용하여 데이터에 있는 FIELD_DELIMITER 또는 RECORD_DELIMITER 문자의 인스턴스를 리터럴로 해석할 수 있습니다. 이스케이프 문자는 데이터에서 자신의 인스턴스를 이스케이프하는 데 사용할 수도 있습니다.

일반적인 이스케이프 시퀀스, 8진수 값 또는 16진수 값을 허용합니다.

데이터 로딩하기

괄호로 묶이지 않은 필드에만 이스케이프 문자를 지정합니다.

참고

  • 기본값은 \\ 입니다. 데이터 파일의 행이 백슬래시(\) 문자로 끝날 경우 이 문자는 RECORD_DELIMITER 파일 형식 옵션에 대해 지정된 줄 바꿈 또는 캐리지 리턴 문자를 이스케이프합니다. 결과적으로, 로딩 작업에서 이 행과 다음 행을 단일 데이터 행으로 처리합니다. 이 문제를 방지하려면 값을 NONE 으로 설정하십시오.

  • 이 파일 형식 옵션은 싱글바이트 문자만 지원합니다. UTF-8 문자 인코딩은 상위 ASCII 문자를 멀티바이트 문자로 나타냅니다. 데이터 파일이 UTF-8 문자 세트로 인코딩된 경우 상위 ASCII 문자를 옵션 값으로 지정할 수 없습니다.

    또한 상위 ASCII 문자를 지정하는 경우 ENCODING = 'string' 파일 형식 옵션을 데이터 파일의 문자 인코딩으로 설정하여 문자가 올바르게 해석되도록 보장하는 것이 좋습니다.

데이터 언로딩하기

ESCAPE 가 설정된 경우 해당 파일 형식 옵션에 대해 설정된 이스케이프 문자가 이 옵션을 재정의합니다.

기본값

백슬래시(\\)

TRIM_SPACE = TRUE | FALSE
용도

데이터 로딩 전용

정의

필드에서 공백을 제거할지 여부를 지정하는 부울입니다.

예를 들어, 외부 데이터베이스 소프트웨어에서 필드를 따옴표로 묶지만 선행 공백을 삽입하는 경우 Snowflake는 여는 따옴표 문자가 아닌 선행 공백을 필드의 시작으로 읽습니다(즉, 따옴표는 필드 데이터 문자열의 일부로 해석됨). 데이터 로딩 중에 불필요한 공백을 제거하려면 이 옵션을 TRUE 로 설정하십시오.

또 다른 예로, 선행 또는 후행 공백이 문자열을 묶는 따옴표 주위에 있는 경우 이 옵션을 사용하여 주위의 공백을 제거하고 FIELD_OPTIONALLY_ENCLOSED_BY 옵션을 사용하여 따옴표를 제거할 수 있습니다. 따옴표 안의 모든 공백은 그대로 유지됩니다. 예를 들어 FIELD_DELIMITER = '|'FIELD_OPTIONALLY_ENCLOSED_BY = '"' 를 가정하면 다음과 같습니다.

|"Hello world"|    /* loads as */  >Hello world<
|" Hello world "|  /* loads as */  > Hello world <
| "Hello world" |  /* loads as */  >Hello world<

(이 예에서 대괄호는 로딩되지 않습니다. 대괄호는 로딩된 문자열의 시작과 끝의 경계를 정하는 데 사용됩니다.)

기본값

FALSE

FIELD_OPTIONALLY_ENCLOSED_BY = 'character' | NONE
용도

데이터 로딩 및 언로딩

정의

문자열을 묶는 데 사용되는 문자입니다. 값은 NONE, 작은따옴표 문자(') 또는 큰따옴표 문자(")일 수 있습니다. 작은따옴표 문자를 사용하려면 8진수 또는 16진수 표현(0x27) 또는 이중 작은따옴표로 묶인 이스케이프('')를 사용하십시오.

필드에 이 문자가 포함된 경우 같은 문자를 사용하여 이스케이프합니다. 예를 들어 값이 큰따옴표 문자이고 필드에 문자열 A "B" C 가 포함된 경우 다음과 같이 큰따옴표를 이스케이프합니다.

A ""B"" C

기본값

NONE

NULL_IF = ( 'string1' [ , 'string2' , ... ] )
용도

데이터 로딩 및 언로딩

정의

SQL NULL로 변환하거나 그 반대로 변환하는 데 사용되는 문자열:

  • 데이터를 로딩할 때 Snowflake는 데이터 로딩 소스에서 이러한 값을 SQL NULL로 바꿉니다. 둘 이상의 문자열을 지정하려면 문자열 목록을 괄호로 묶고 쉼표를 사용하여 각각의 값을 구분합니다.

    Snowflake는 데이터 타입과 관계없이 값의 모든 인스턴스를 NULL로 변환합니다. 예를 들어 2 가 값으로 지정되면 2 의 모든 인스턴스가 문자열 또는 숫자로 변환됩니다.

    예:

    NULL_IF = ('\\N', 'NULL', 'NUL', '')

    이 옵션에는 빈 문자열이 포함될 수 있습니다.

  • 데이터를 언로딩할 때, Snowflake는 SQL NULL 값을 목록의 첫 번째 값으로 변환합니다.

기본값

\\N (즉, ESCAPE_UNENCLOSED_FIELD 값이 \\ 인 것으로 가정하는 NULL)

ERROR_ON_COLUMN_COUNT_MISMATCH = TRUE | FALSE
용도

데이터 로딩 전용

정의

입력 파일의 구분된 열(즉, 필드) 수가 해당 테이블의 열 수와 일치하지 않는 경우 구문 분석 오류를 생성할지 여부를 지정하는 부울입니다.

FALSE 로 설정하면 오류가 발생하지 않고 로딩이 계속됩니다. 파일이 성공적으로 로딩된 경우 다음과 같습니다.

  • 입력 파일에 테이블의 열보다 많은 수의 필드가 있는 레코드가 포함된 경우 일치하는 필드는 파일에서 나오는 순서대로 로딩되고 나머지 필드는 로딩되지 않습니다.

  • 입력 파일에 테이블의 열보다 적은 수의 필드가 있는 레코드가 포함된 경우 테이블에서 일치하지 않는 열이 NULL 값과 함께 로딩됩니다.

이 옵션에서는 입력 파일 내의 모든 레코드가 같은 길이라고 가정합니다(즉, 이 매개 변수에 대해 지정된 값과 관계없이 다양한 길이의 레코드를 포함한 파일이 오류를 반환함).

기본값

TRUE

참고

로딩하는 동안 데이터 변환 시(즉, 쿼리를 COPY 명령의 소스로 사용), 이 옵션은 무시됩니다. 데이터 파일의 열 개수 및 순서는 대상 테이블과 같지 않아도 됩니다.

REPLACE_INVALID_CHARACTERS = TRUE | FALSE
용도

데이터 로딩 전용

정의

유효하지 않은 UTF-8 문자를 유니코드 대체 문자()로 대체할지 여부를 지정하는 부울.

TRUE 로 설정하면 Snowflake가 잘못된 UTF-8 문자를 유니코드 대체 문자로 바꿉니다.

FALSE 로 설정하면 잘못된 UTF-8 문자 인코딩이 감지될 때 로딩 작업에서 오류가 발생합니다.

기본값

FALSE

EMPTY_FIELD_AS_NULL = TRUE | FALSE
용도

데이터 로딩 및 언로딩

정의
  • 데이터를 로딩할 때 두 개의 연속적인 구분 기호(예: ,,)로 표시되는 입력 파일의 빈 필드에 SQL NULL을 삽입할지 여부를 지정합니다.

    FALSE 로 설정하면 Snowflake가 빈 필드를 해당 열 타입으로 캐스팅하려고 시도합니다. STRING 유형의 열에 빈 문자열이 삽입됩니다. 다른 열 타입의 경우 COPY 명령에서 오류가 발생합니다.

  • 데이터를 언로딩할 때 이 옵션은 FIELD_OPTIONALLY_ENCLOSED_BY 와 함께 사용됩니다. FIELD_OPTIONALLY_ENCLOSED_BY = NONE 일 때, EMPTY_FIELD_AS_NULL = FALSE 를 설정하면 필드 값을 묶는 따옴표 없이 빈 문자열 값으로 테이블의 빈 문자열을 언로딩하도록 지정됩니다.

    TRUE 로 설정하면 FIELD_OPTIONALLY_ENCLOSED_BY 가 문자열을 묶을 문자를 지정해야 합니다.

기본값

TRUE

SKIP_BYTE_ORDER_MARK = TRUE | FALSE
용도

데이터 로딩 전용

정의

데이터 파일에 있는 경우 BOM(바이트 순서 표시)를 건너뛸지 여부를 지정하는 부울입니다. BOM은 데이터 파일의 시작 부분에서 바이트 순서와 인코딩 형식을 정의하는 문자 코드입니다.

FALSE 로 설정하면 Snowflake가 데이터 파일에 있는 모든 BOM을 인식하므로, BOM에서 오류가 발생하거나 테이블의 첫 번째 열에 병합되는 결과가 될 수 있습니다.

기본값

TRUE

ENCODING = 'string'
용도

데이터 로딩 전용

정의

데이터를 테이블로 로딩할 때 원본 데이터의 문자 세트를 지정하는 문자열(상수)입니다.

문자 세트

ENCODING 값

지원되는 언어

참고

Big5

BIG5

중국어 번체

EUC-JP

EUCJP

일본어

EUC-KR

EUCKR

한국어

GB18030

GB18030

중국어

IBM420

IBM420

아랍어

IBM424

IBM424

히브리어

ISO-2022-CN

ISO2022CN

중국어 간체

ISO-2022-JP

ISO2022JP

일본어

ISO-2022-KR

ISO2022KR

한국어

ISO-8859-1

ISO88591

덴마크어, 네덜란드어, 영어, 프랑스어, 독일어, 이탈리아어, 노르웨이어, 포르투갈어, 스웨덴어

ISO-8859-2

ISO88592

체코어, 헝가리어, 폴란드어, 루마니아어

ISO-8859-5

ISO88595

러시아어

ISO-8859-6

ISO88596

아랍어

ISO-8859-7

ISO88597

그리스어

ISO-8859-8

ISO88598

히브리어

ISO-8859-9

ISO88599

터키어

ISO-8859-15

ISO885915

덴마크어, 네덜란드어, 영어, 프랑스어, 독일어, 이탈리아어, 노르웨이어, 포르투갈어, 스웨덴어

유로화 기호를 포함하여, 8자를 제외하면 ISO-8859-1과 동일합니다.

KOI8-R

KOI8R

러시아어

Shift_JIS

SHIFTJIS

일본어

UTF-8

UTF8

모든 언어

구분된 파일(CSV, TSV 등)에서 데이터를 로딩하는 경우 UTF-8이 기본값입니다. . . 지원되는 다른 모든 파일 형식(JSON, Avro 등)에서 데이터를 로딩할 뿐 아니라 언로딩하는 경우 UTF-8이 유일하게 지원되는 문자 세트입니다.

UTF-16

UTF16

모든 언어

UTF-16BE

UTF16BE

모든 언어

UTF-16LE

UTF16LE

모든 언어

UTF-32

UTF32

모든 언어

UTF-32BE

UTF32BE

모든 언어

UTF-32LE

UTF32LE

모든 언어

windows-1250

WINDOWS1250

체코어, 헝가리어, 폴란드어, 루마니아어

windows-1251

WINDOWS1251

러시아어

windows-1252

WINDOWS1252

덴마크어, 네덜란드어, 영어, 프랑스어, 독일어, 이탈리아어, 노르웨이어, 포르투갈어, 스웨덴어

windows-1253

WINDOWS1253

그리스어

windows-1254

WINDOWS1254

터키어

windows-1255

WINDOWS1255

히브리어

windows-1256

WINDOWS1256

아랍어

기본값

UTF8

참고

Snowflake는 모든 데이터를 UTF-8 문자 세트에 내부적으로 저장합니다. 데이터는 UTF-8로 변환된 후 Snowflake에 로딩됩니다.

TYPE = JSON

COMPRESSION = AUTO | GZIP | BZ2 | BROTLI | ZSTD | DEFLATE | RAW_DEFLATE | NONE
용도

데이터 로딩 및 외부 테이블

정의
  • 데이터를 로딩할 때 데이터 파일에 대한 현재 압축 알고리즘을 지정합니다. Snowflake는 이 옵션을 사용하여 이미 압축된 데이터 파일을 압축한 방식을 감지해 로딩을 위해 파일의 압축 데이터를 추출할 수 있습니다.

  • 데이터를 언로딩할 때 지정된 압축 알고리즘을 사용하여 데이터 파일을 압축합니다.

지원되는 값

참고

AUTO

데이터를 로딩할 때 현재 자동으로 감지할 수 없는 Brotli 압축 파일을 제외하고 압축 알고리즘이 자동으로 감지됩니다. 데이터를 언로딩할 때 파일은 기본값인 gzip을 사용하여 자동으로 압축됩니다.

GZIP

BZ2

BROTLI

Brotli 압축 파일을 로딩/언로딩할 경우 지정해야 합니다.

ZSTD

Zstandard v0.8 이상이 지원됩니다.

DEFLATE

Deflate 압축 파일(zlib 헤더 RFC1950 포함).

RAW_DEFLATE

원시 Deflate 압축 파일(헤더 RFC1951 제외).

NONE

데이터를 로딩할 때 파일이 압축되지 않았음을 나타냅니다. 데이터를 언로딩할 때 언로딩된 파일이 압축되지 않도록 지정합니다.

기본값

AUTO

DATE_FORMAT = 'string' | AUTO
용도

데이터 로딩 전용

정의

데이터 파일에서 날짜 문자열 값 형식을 정의합니다. 값이 지정되지 않거나 AUTO 인 경우 DATE_INPUT_FORMAT 매개 변수의 값이 사용됩니다.

이 파일 형식 옵션은 다음 작업에만 적용됩니다.

  • MATCH_BY_COLUMN_NAME 복사 옵션을 사용하여 JSON 데이터를 별도의 열에 로딩하는 작업.

  • COPY 문에 쿼리를 지정하여 별개의 열에 JSON 데이터를 로딩하는 작업(즉, COPY 변환).

기본값

AUTO

TIME_FORMAT = 'string' | AUTO
용도

데이터 로딩 전용

정의

데이터 파일에서 시간 문자열 값 형식을 정의합니다. 값이 지정되지 않거나 AUTO 인 경우 TIME_INPUT_FORMAT 매개 변수의 값이 사용됩니다.

이 파일 형식 옵션은 다음 작업에만 적용됩니다.

  • MATCH_BY_COLUMN_NAME 복사 옵션을 사용하여 JSON 데이터를 별도의 열에 로딩하는 작업.

  • COPY 문에 쿼리를 지정하여 별개의 열에 JSON 데이터를 로딩하는 작업(즉, COPY 변환).

기본값

AUTO

TIMESTAMP_FORMAT = string' | AUTO
용도

데이터 로딩 전용

정의

데이터 파일에서 타임스탬프 문자열 값 형식을 정의합니다. 값이 지정되지 않거나 AUTO 인 경우 TIMESTAMP_INPUT_FORMAT 매개 변수의 값이 사용됩니다.

이 파일 형식 옵션은 다음 작업에만 적용됩니다.

  • MATCH_BY_COLUMN_NAME 복사 옵션을 사용하여 JSON 데이터를 별도의 열에 로딩하는 작업.

  • COPY 문에 쿼리를 지정하여 별개의 열에 JSON 데이터를 로딩하는 작업(즉, COPY 변환).

기본값

AUTO

BINARY_FORMAT = HEX | BASE64 | UTF8
용도

데이터 로딩 전용

정의

데이터 파일의 이진 문자열 값에 대한 인코딩 형식을 정의합니다. 이 옵션은 테이블의 이진 열로 데이터를 로딩할 때 사용할 수 있습니다.

이 파일 형식 옵션은 다음 작업에만 적용됩니다.

  • MATCH_BY_COLUMN_NAME 복사 옵션을 사용하여 JSON 데이터를 별도의 열에 로딩하는 작업.

  • COPY 문에 쿼리를 지정하여 별개의 열에 JSON 데이터를 로딩하는 작업(즉, COPY 변환).

기본값

HEX

TRIM_SPACE = TRUE | FALSE
용도

데이터 로딩 전용

정의

문자열에서 선행 공백과 후행 공백을 제거할지 여부를 지정하는 부울입니다.

예를 들어, 외부 데이터베이스 소프트웨어에서 필드를 따옴표로 묶지만 선행 공백을 삽입하는 경우 Snowflake는 여는 따옴표 문자가 아닌 선행 공백을 필드의 시작으로 읽습니다(즉, 따옴표는 필드 데이터 문자열의 일부로 해석됨). 데이터 로딩 중에 불필요한 공백을 제거하려면 이 옵션을 TRUE 로 설정하십시오.

이 파일 형식 옵션은 MATCH_BY_COLUMN_NAME 복사 옵션을 사용하여 JSON 데이터를 별도의 열에 로딩할 때만 다음 작업에 적용됩니다.

기본값

FALSE

NULL_IF = ( 'string1' [ , 'string2' , ... ] )
용도

데이터 로딩 전용

정의

SQL NULL로 변환하거나 그 반대로 변환하는 데 사용되는 문자열입니다. Snowflake는 데이터 로딩 소스의 이러한 문자열을 SQL NULL로 바꿉니다. 둘 이상의 문자열을 지정하려면 문자열 목록을 괄호로 묶고 쉼표를 사용하여 각각의 값을 구분합니다.

이 파일 형식 옵션은 MATCH_BY_COLUMN_NAME 복사 옵션을 사용하여 JSON 데이터를 별도의 열에 로딩할 때만 다음 작업에 적용됩니다.

Snowflake는 데이터 타입과 관계없이 값의 모든 인스턴스를 NULL로 변환합니다. 예를 들어 2 가 값으로 지정되면 2 의 모든 인스턴스가 문자열 또는 숫자로 변환됩니다.

예:

NULL_IF = ('\\N', 'NULL', 'NUL', '')

이 옵션에는 빈 문자열이 포함될 수 있습니다.

기본값

\\N (즉, ESCAPE_UNENCLOSED_FIELD 값이 \\ 인 것으로 가정하는 NULL)

FILE_EXTENSION = 'string' | NONE
용도

데이터 언로딩 전용

정의

스테이지로 언로딩된 파일의 확장명을 지정합니다. 모든 확장명을 허용합니다. 원하는 소프트웨어나 서비스에서 읽을 수 있는 파일 확장명은 사용자가 지정해야 합니다.

기본값

null, 즉 파일 확장명이 형식 유형 .json[compression] 으로 결정된다는 의미로, 여기서 compressionCOMPRESSION 이 설정된 경우 압축 방법에 따라 추가되는 확장명입니다.

ENABLE_OCTAL = TRUE | FALSE
용도

데이터 로딩 전용

정의

8진수 숫자의 구문 분석을 할 수 있게 해주는 부울입니다.

기본값

FALSE

ALLOW_DUPLICATE = TRUE | FALSE
용도

데이터 로딩 전용

정의

중복 오브젝트 필드 이름을 허용하도록 지정하는 부울입니다(마지막 이름만 보존됨).

기본값

FALSE

STRIP_OUTER_ARRAY = TRUE | FALSE
용도

데이터 로딩 전용

정의

JSON 파서에 바깥쪽 대괄호(즉, [ ])를 제거하도록 지시하는 부울입니다.

기본값

FALSE

STRIP_NULL_VALUES = TRUE | FALSE
용도

데이터 로딩 전용

정의

JSON 파서에 null 값이 포함된 오브젝트 필드 또는 배열 요소를 제거하도록 지시하는 부울입니다. 예를 들어 TRUE 로 설정할 경우 다음과 같습니다.

이전

이후

[null]

[]

[null,null,3]

[,,3]

{"a":null,"b":null,"c":123}

{"c":123}

{"a":[1,null,2],"b":{"x":null,"y":88}}

{"a":[1,,2],"b":{"y":88}}

기본값

FALSE

REPLACE_INVALID_CHARACTERS = TRUE | FALSE
용도

데이터 로딩 전용

정의

유효하지 않은 UTF-8 문자를 유니코드 대체 문자()로 대체할지 여부를 지정하는 부울. 복사 옵션은 일대일 문자 대체를 수행합니다.

TRUE 로 설정하면 Snowflake가 잘못된 UTF-8 문자를 유니코드 대체 문자로 바꿉니다.

FALSE 로 설정하면 잘못된 UTF-8 문자 인코딩이 감지될 때 로딩 작업에서 오류가 발생합니다.

기본값

FALSE

IGNORE_UTF8_ERRORS = TRUE | FALSE
용도

데이터 로딩 전용

정의

UTF-8 인코딩 오류가 오류 조건을 생성하는지 여부를 지정하는 부울입니다. TRUE 로 설정하면 잘못된 UTF-8 시퀀스가 전부 유니코드 문자 U+FFFD (즉, 《대체 문자》)로 자동으로 바뀝니다.

참고

이 복사 옵션을 선택하면 데이터 로딩 중에 UTF-8 문자 이외의 모든 문자가 제거되지만, 일대일 문자 대체를 보장하지는 않습니다. REPLACE_INVALID_CHARACTERS 복사 옵션을 대신 사용하는 것이 좋습니다.

기본값

FALSE

SKIP_BYTE_ORDER_MARK = TRUE | FALSE
용도

데이터 로딩 전용

정의

데이터 파일에 있는 경우 BOM(바이트 순서 표시)를 건너뛸지 여부를 지정하는 부울입니다. BOM은 데이터 파일의 시작 부분에서 바이트 순서와 인코딩 형식을 정의하는 문자 코드입니다.

FALSE 로 설정하면 Snowflake가 데이터 파일에 있는 모든 BOM을 인식하므로, BOM에서 오류가 발생하거나 테이블의 첫 번째 열에 병합되는 결과가 될 수 있습니다.

기본값

TRUE

TYPE = AVRO

COMPRESSION = AUTO | GZIP | BROTLI | ZSTD | DEFLATE | RAW_DEFLATE | NONE
용도

데이터 로딩 전용

정의
  • 데이터를 로딩할 때 데이터 파일에 대한 현재 압축 알고리즘을 지정합니다. Snowflake는 이 옵션을 사용하여 이미 압축된 데이터 파일을 압축한 방식을 감지해 로딩을 위해 파일의 압축 데이터를 추출할 수 있습니다.

  • 데이터를 언로딩할 때 지정된 압축 알고리즘을 사용하여 데이터 파일을 압축합니다.

지원되는 값

참고

AUTO

데이터를 로딩할 때 현재 자동으로 감지할 수 없는 Brotli 압축 파일을 제외하고 압축 알고리즘이 자동으로 감지됩니다. 데이터를 언로딩할 때 파일은 기본값인 gzip을 사용하여 자동으로 압축됩니다.

GZIP

BROTLI

Brotli 압축 파일을 로딩/언로딩할 경우 지정해야 합니다.

ZSTD

Zstandard v0.8 이상이 지원됩니다.

DEFLATE

Deflate 압축 파일(zlib 헤더 RFC1950 포함).

RAW_DEFLATE

원시 Deflate 압축 파일(헤더 RFC1951 제외).

NONE

데이터를 로딩할 때 파일이 압축되지 않았음을 나타냅니다. 데이터를 언로딩할 때 언로딩된 파일이 압축되지 않도록 지정합니다.

기본값

AUTO

TRIM_SPACE = TRUE | FALSE
용도

데이터 로딩 전용

정의

문자열에서 선행 공백과 후행 공백을 제거할지 여부를 지정하는 부울입니다.

예를 들어, 외부 데이터베이스 소프트웨어에서 필드를 따옴표로 묶지만 선행 공백을 삽입하는 경우 Snowflake는 여는 따옴표 문자가 아닌 선행 공백을 필드의 시작으로 읽습니다(즉, 따옴표는 필드 데이터 문자열의 일부로 해석됨). 데이터 로딩 중에 불필요한 공백을 제거하려면 이 옵션을 TRUE 로 설정하십시오.

이 파일 형식 옵션은 MATCH_BY_COLUMN_NAME 복사 옵션을 사용하여 Avro 데이터를 별도의 열에 로딩할 때만 다음 작업에 적용됩니다.

기본값

FALSE

NULL_IF = ( 'string1' [ , 'string2' , ... ] )
용도

데이터 로딩 전용

정의

SQL NULL로 변환하거나 그 반대로 변환하는 데 사용되는 문자열입니다. Snowflake는 데이터 로딩 소스의 이러한 문자열을 SQL NULL로 바꿉니다. 둘 이상의 문자열을 지정하려면 문자열 목록을 괄호로 묶고 쉼표를 사용하여 각각의 값을 구분합니다.

이 파일 형식 옵션은 MATCH_BY_COLUMN_NAME 복사 옵션을 사용하여 Avro 데이터를 별도의 열에 로딩할 때만 다음 작업에 적용됩니다.

Snowflake는 데이터 타입과 관계없이 값의 모든 인스턴스를 NULL로 변환합니다. 예를 들어 2 가 값으로 지정되면 2 의 모든 인스턴스가 문자열 또는 숫자로 변환됩니다.

예:

NULL_IF = ('\\N', 'NULL', 'NUL', '')

이 옵션에는 빈 문자열이 포함될 수 있습니다.

기본값

\\N (즉, ESCAPE_UNENCLOSED_FIELD 값이 \\ 인 것으로 가정하는 NULL)

TYPE = ORC

TRIM_SPACE = TRUE | FALSE
용도

데이터 로딩 및 외부 테이블

정의

문자열에서 선행 공백과 후행 공백을 제거할지 여부를 지정하는 부울입니다.

예를 들어, 외부 데이터베이스 소프트웨어에서 필드를 따옴표로 묶지만 선행 공백을 삽입하는 경우 Snowflake는 여는 따옴표 문자가 아닌 선행 공백을 필드의 시작으로 읽습니다(즉, 따옴표는 필드 데이터 문자열의 일부로 해석됨). 데이터 로딩 중에 불필요한 공백을 제거하려면 이 옵션을 TRUE 로 설정하십시오.

이 파일 형식 옵션은 MATCH_BY_COLUMN_NAME 복사 옵션을 사용하여 Orc 데이터를 별도의 열에 로딩할 때만 다음 작업에 적용됩니다.

기본값

FALSE

NULL_IF = ( 'string1' [ , 'string2' , ... ] )
용도

데이터 로딩 및 외부 테이블

정의

SQL NULL로 변환하거나 그 반대로 변환하는 데 사용되는 문자열입니다. Snowflake는 데이터 로딩 소스의 이러한 문자열을 SQL NULL로 바꿉니다. 둘 이상의 문자열을 지정하려면 문자열 목록을 괄호로 묶고 쉼표를 사용하여 각각의 값을 구분합니다.

이 파일 형식 옵션은 MATCH_BY_COLUMN_NAME 복사 옵션을 사용하여 Orc 데이터를 별도의 열에 로딩할 때만 다음 작업에 적용됩니다.

Snowflake는 데이터 타입과 관계없이 값의 모든 인스턴스를 NULL로 변환합니다. 예를 들어 2 가 값으로 지정되면 2 의 모든 인스턴스가 문자열 또는 숫자로 변환됩니다.

예:

NULL_IF = ('\\N', 'NULL', 'NUL', '')

이 옵션에는 빈 문자열이 포함될 수 있습니다.

기본값

\\N (즉, ESCAPE_UNENCLOSED_FIELD 값이 \\ 인 것으로 가정하는 NULL)

TYPE = PARQUET

COMPRESSION = AUTO | LZO | SNAPPY | NONE
용도

데이터 로딩, 데이터 언로딩, 외부 테이블

정의

  • 데이터를 로딩할 때 Parquet 파일의 열에 대한 현재 압축 알고리즘을 지정합니다.

  • 데이터를 언로딩할 때 지정된 압축 알고리즘을 사용하여 데이터 파일을 압축합니다.

지원되는 값

참고

AUTO

데이터를 로딩할 때 압축 알고리즘이 자동으로 감지됩니다. Brotli, gzip, Lempel-Ziv-Oberhumer(LZO), LZ4, Snappy 또는 Zstandard v0.8 이상의 압축 알고리즘을 지원합니다. . 데이터를 언로딩할 때 언로딩된 파일은 기본적으로 Snappy 압축 알고리즘을 사용하여 압축됩니다.

LZO

데이터를 언로딩할 때 파일은 기본적으로 Snappy 알고리즘을 사용하여 압축됩니다. 데이터를 LZO 압축 파일로 언로딩하는 경우 이 값을 지정합니다.

SNAPPY

데이터를 언로딩할 때 파일은 기본적으로 Snappy 알고리즘을 사용하여 압축됩니다. 이 값을 선택적으로 지정할 수 있습니다.

NONE

데이터를 로딩할 때 파일이 압축되지 않았음을 나타냅니다. 데이터를 언로딩할 때 언로딩된 파일이 압축되지 않도록 지정합니다.

기본값

AUTO

SNAPPY_COMPRESSION = TRUE | FALSE
용도

데이터 언로딩 전용

AUTO | 언로딩된 파일은 기본적으로 Snappy 압축 알고리즘을 사용하여 압축됩니다. SNAPPY | Snappy 압축 파일을 언로딩하는 경우 지정할 수 있습니다. NONE | 데이터를 로딩할 때 파일이 압축되지 않았음을 나타냅니다. 데이터를 언로딩할 때 언로딩된 파일이 압축되지 않도록 지정합니다.

정의

언로딩된 파일이 SNAPPY 알고리즘을 사용하여 압축되는지 여부를 지정하는 부울입니다.

참고

사용되지 않음. COMPRESSION = SNAPPY 를 대신 사용하십시오.

제한 사항

데이터 언로딩 작업용으로만 지원됩니다.

기본값

TRUE

BINARY_AS_TEXT = TRUE | FALSE
용도

데이터 로딩 전용

정의

정의된 논리 데이터 타입이 없는 열을 UTF-8 텍스트로 해석할지 여부를 지정하는 부울입니다. FALSE 로 설정하면 Snowflake가 이러한 열을 이진 데이터로 해석합니다.

제한 사항

데이터 로딩 작업용으로만 지원됩니다.

기본값

TRUE

TRIM_SPACE = TRUE | FALSE
용도

데이터 로딩 전용

정의

문자열에서 선행 공백과 후행 공백을 제거할지 여부를 지정하는 부울입니다.

예를 들어, 외부 데이터베이스 소프트웨어에서 필드를 따옴표로 묶지만 선행 공백을 삽입하는 경우 Snowflake는 여는 따옴표 문자가 아닌 선행 공백을 필드의 시작으로 읽습니다(즉, 따옴표는 필드 데이터 문자열의 일부로 해석됨). 데이터 로딩 중에 불필요한 공백을 제거하려면 이 옵션을 TRUE 로 설정하십시오.

이 파일 형식 옵션은 MATCH_BY_COLUMN_NAME 복사 옵션을 사용하여 Parquet 데이터를 별도의 열에 로딩할 때만 다음 작업에 적용됩니다.

기본값

FALSE

NULL_IF = ( 'string1' [ , 'string2' , ... ] )
용도

데이터 로딩 전용

정의

SQL NULL로 변환하거나 그 반대로 변환하는 데 사용되는 문자열입니다. Snowflake는 데이터 로딩 소스의 이러한 문자열을 SQL NULL로 바꿉니다. 둘 이상의 문자열을 지정하려면 문자열 목록을 괄호로 묶고 쉼표를 사용하여 각각의 값을 구분합니다.

이 파일 형식 옵션은 MATCH_BY_COLUMN_NAME 복사 옵션을 사용하여 Parquet 데이터를 별도의 열에 로딩할 때만 다음 작업에 적용됩니다.

Snowflake는 데이터 타입과 관계없이 값의 모든 인스턴스를 NULL로 변환합니다. 예를 들어 2 가 값으로 지정되면 2 의 모든 인스턴스가 문자열 또는 숫자로 변환됩니다.

예:

NULL_IF = ('\\N', 'NULL', 'NUL', '')

이 옵션에는 빈 문자열이 포함될 수 있습니다.

기본값

\\N (즉, ESCAPE_UNENCLOSED_FIELD 값이 \\ 인 것으로 가정하는 NULL)

TYPE = XML

COMPRESSION = AUTO | GZIP | BZ2 | BROTLI | ZSTD | DEFLATE | RAW_DEFLATE | NONE
용도

데이터 로딩 전용

정의
  • 데이터를 로딩할 때 데이터 파일에 대한 현재 압축 알고리즘을 지정합니다. Snowflake는 이 옵션을 사용하여 이미 압축된 데이터 파일을 압축한 방식을 감지해 로딩을 위해 파일의 압축 데이터를 추출할 수 있습니다.

  • 데이터를 언로딩할 때 지정된 압축 알고리즘을 사용하여 데이터 파일을 압축합니다.

지원되는 값

참고

AUTO

데이터를 로딩할 때 현재 자동으로 감지할 수 없는 Brotli 압축 파일을 제외하고 압축 알고리즘이 자동으로 감지됩니다. 데이터를 언로딩할 때 파일은 기본값인 gzip을 사용하여 자동으로 압축됩니다.

GZIP

BZ2

BROTLI

Brotli 압축 파일을 로딩/언로딩할 경우 지정해야 합니다.

ZSTD

Zstandard v0.8 이상이 지원됩니다.

DEFLATE

Deflate 압축 파일(zlib 헤더 RFC1950 포함).

RAW_DEFLATE

원시 Deflate 압축 파일(헤더 RFC1951 제외).

NONE

데이터를 로딩할 때 파일이 압축되지 않았음을 나타냅니다. 데이터를 언로딩할 때 언로딩된 파일이 압축되지 않도록 지정합니다.

기본값

AUTO

IGNORE_UTF8_ERRORS = TRUE | FALSE
용도

데이터 로딩 전용

정의

UTF-8 인코딩 오류가 오류 조건을 생성하는지 여부를 지정하는 부울입니다. TRUE 로 설정하면 잘못된 UTF-8 시퀀스가 전부 유니코드 문자 U+FFFD (즉, 《대체 문자》)로 자동으로 바뀝니다.

기본값

FALSE

PRESERVE_SPACE = TRUE | FALSE
용도

데이터 로딩 전용

정의

XML 파서가 요소 콘텐츠의 선행 및 후행 공백을 보존할지 여부를 지정하는 부울입니다.

기본값

FALSE

STRIP_OUTER_ELEMENT = TRUE | FALSE
용도

데이터 로딩 전용

정의

XML 파서가 외부 XML 요소를 제거하여 2차 수준 요소를 별개의 문서로 노출할지 여부를 지정하는 부울입니다.

기본값

FALSE

DISABLE_SNOWFLAKE_DATA = TRUE | FALSE
용도

데이터 로딩 전용

정의

XML 파서가 Snowflake 반정형 데이터 태그를 인식하지 못하게 할지 여부를 지정하는 부울입니다.

기본값

FALSE

DISABLE_AUTO_CONVERT = TRUE | FALSE
용도

데이터 로딩 전용

정의

XML 파서가 숫자 값과 부울 값을 텍스트에서 기본 표현으로 자동 변환하지 못하게 할지 여부를 지정하는 부울입니다.

기본값

FALSE

SKIP_BYTE_ORDER_MARK = TRUE | FALSE
용도

데이터 로딩 전용

정의

입력 파일에 있는 모든 BOM(바이트 순서 표시)을 건너뛸지 여부를 지정하는 부울입니다. BOM은 데이터 파일의 시작 부분에서 바이트 순서와 인코딩 형식을 정의하는 문자 코드입니다.

FALSE 로 설정하면 Snowflake가 데이터 파일에 있는 모든 BOM을 인식하므로, BOM에서 오류가 발생하거나 테이블의 첫 번째 열에 병합되는 결과가 될 수 있습니다.

기본값

TRUE

복사 옵션(copyOptions)

다음 복사 옵션(공백, 쉼표 또는 줄 바꿈으로 구분) 중 하나 이상을 지정할 수 있습니다.

ON_ERROR = CONTINUE | SKIP_FILE | SKIP_FILE_num | 'SKIP_FILE_num%' | ABORT_STATEMENT
용도

데이터 로딩 전용

정의

로딩 작업에 대한 오류 처리를 지정하는 문자열(상수)입니다.

중요

ON_ERROR 복사 옵션 값을 신중하게 고려하십시오. 기본값은 일반적인 시나리오에서 적절하지만, 항상 최상의 옵션인 것은 아닙니다.

지원되는 값

참고

CONTINUE

오류가 발견된 경우 파일을 계속 로딩합니다. COPY 문은 데이터 파일당 최대 하나의 오류가 발견된 경우 오류 메시지를 반환합니다.

ROWS_PARSED 열 값과 ROWS_LOADED 열 값의 차는 검색된 오류를 포함하는 행의 개수를 나타냅니다. 하지만 이들 행의 각각에 여러 개의 오류가 포함될 수 있습니다. 데이터 파일의 모든 오류를 보려면 VALIDATION_MODE 매개 변수를 사용하거나 VALIDATE 함수를 쿼리하십시오.

SKIP_FILE

오류가 발견된 경우 파일을 건너뜁니다.

SKIP_FILE 작업은 오류 발견 여부와 관계없이 전체 파일을 버퍼링합니다. 이러한 이유로 SKIP_FILECONTINUE 또는 ABORT_STATEMENT 보다 느립니다. 적은 수의 오류로 인해 큰 파일을 건너뛰면 지연이 발생하고 크레딧이 낭비될 수 있습니다. 논리적 설명이 없는 파일에서 많은 수의 레코드를 로딩할 때(예: 파일이 대략적인 간격으로 자동 생성됨) 대신 CONTINUE 를 지정하는 것이 좋습니다.

추가 패턴:

SKIP_FILE_num (예: SKIP_FILE_10)

파일에서 발견된 오류 행 수가 지정된 수와 같거나 초과하면 파일을 건너뜁니다.

'SKIP_FILE_num%' (예: 'SKIP_FILE_10%')

파일에서 발견된 오류 행의 백분율이 지정된 백분율을 초과하면 파일을 건너뜁니다.

ABORT_STATEMENT

데이터 파일에서 오류가 발견되면 로딩 작업을 중단합니다.

FILES 매개 변수에 명시적으로 지정된 데이터 파일을 찾을 수 없는 경우를 제외하고, (예컨대 존재하지 않거나 액세스할 수 없어) 데이터 파일을 찾을 수 없는 경우에는 로딩 작업이 중단되지 않습니다.

  • 이 복사 옵션에는 다음 동작이 적용됩니다.

    • 구문 분석 또는 변환 오류가 있는 구조화된 데이터 파일(CSV, TSV 등)을 로딩할 때 모든 ON_ERROR 값이 예상대로 작동합니다.

      하지만 반정형 데이터 파일(JSON, Avro, ORC, Parquet 또는 XML)은 그와 같은 형식 유형의 구조로 인해 CONTINUE, SKIP_FILE_num 또는 'SKIP_FILE_num%' 과 같은 ON_ERROR 값에 대해 구조화된 데이터 파일과 똑같은 동작 의미 체계를 지원하지 않습니다.

    • Parquet 및 ORC 데이터만 해당. ON_ERROR를 CONTINUE, SKIP_FILE_num 또는 'SKIP_FILE_num%' 으로 설정하면 구문 분석 오류가 발생할 경우 데이터 파일을 건너뛰게 됩니다. 모든 변환 또는 변형 오류는 선택한 옵션 값과 관계없이 ABORT_STATEMENT (COPY INTO <table> 문) 또는 SKIP_FILE (Snowpipe)의 기본 동작을 따릅니다.

    • JSON, XML 및 Avro 데이터만 해당. ON_ERROR를 CONTINUE, SKIP_FILE_num 또는 'SKIP_FILE_num%' 으로 설정하면 구문 분석 오류가 있는 레코드까지의 모든 레코드가 로딩되지만, 데이터 파일의 나머지 레코드는 건너뜁니다. 모든 변환 또는 변형 오류는 선택한 옵션 값과 관계없이 COPY(ABORT_STATEMENT) 또는 Snowpipe(SKIP_FILE)의 기본 동작을 따릅니다.

기본값
COPY를 사용한 대량 로딩

ABORT_STATEMENT

Snowpipe

SKIP_FILE

SIZE_LIMIT = num
용도

데이터 로딩 전용

정의

주어진 COPY 문에 대해 로딩할 데이터의 최대 크기(바이트)를 지정하는 (0보다 큰) 숫자입니다. 임계값을 초과하면 COPY 작업에서 파일 로딩이 중단됩니다. 이 옵션은 일반적으로 여러 COPY 문을 사용하여 공통 파일 그룹을 로딩하는 데 사용됩니다. 각각의 문에 대해 지정된 SIZE_LIMIT 값을 초과할 때까지 데이터 로딩이 계속된 후에 그다음 문으로 이동합니다.

예를 들어, 스테이지 경로에 있는 파일 세트의 크기가 각각 10MB라고 해봅시다. 여러 COPY 문이 SIZE_LIMIT를 25000000 (25MB)로 설정하면 각각 3개의 파일을 로딩합니다. 즉, SIZE_LIMIT 임계값을 초과하면 각 COPY 작업이 중단됩니다.

로딩할 파일이 하나라도 있다면 SIZE_LIMIT 에 대해 지정된 값과 관계없이 최소한 한 개의 파일이 로딩됩니다.

기본값

null(크기 제한 없음)

PURGE = TRUE | FALSE
용도

데이터 로딩 전용

정의

데이터가 성공적으로 로딩된 후 스테이지에서 데이터 파일을 자동으로 제거할지 여부를 지정하는 부울입니다.

이 옵션을 TRUE 로 설정하면 성공적으로 로딩된 데이터 파일을 제거하기 위한 최선의 노력이 이루어집니다. 어떤 이유로든 제거 작업이 실패할 경우 현재는 아무런 오류도 반환되지 않습니다. 따라서 (LIST 를 사용하여) 스테이징된 파일을 주기적으로 나열하고 성공적으로 로딩된 파일이 있는 경우 이를 수동으로 제거하는 것이 좋습니다.

기본값

FALSE

RETURN_FAILED_ONLY = TRUE | FALSE
용도

데이터 로딩 전용

정의

문 결과에서 로딩하지 못한 파일만 반환할지 여부를 지정하는 부울입니다.

기본값

FALSE

MATCH_BY_COLUMN_NAME = CASE_SENSITIVE | CASE_INSENSITIVE | NONE
용도

데이터 로딩 전용

정의

데이터에 표시된 해당 열과 일치하는 대상 테이블의 열로 반정형 데이터를 로딩할지 여부를 지정하는 문자열입니다.

이 복사 옵션은 다음 데이터 타입에 대해 지원됩니다.

  • JSON

  • Avro

  • ORC

  • Parquet

열이 일치하려면 다음 기준을 충족해야 합니다.

  • 데이터에 표시된 열의 이름이 테이블에 있는 열의 이름과 정확히 같아야 합니다. 이 복사 옵션은 열 이름의 대/소문자 구분을 지원합니다. 열 순서는 중요하지 않습니다.

  • 테이블의 열에 있는 데이터 타입이 데이터에 표시된 열의 값과 호환되어야 합니다. 예를 들어, 문자열, 숫자, 부울 값을 모두 베리언트 열에 로딩할 수 있습니다.

CASE_SENSITIVE | CASE_INSENSITIVE

데이터에 표시된 해당 열과 일치하는 대상 테이블의 열로 반정형 데이터를 로딩합니다. 열 이름은 대/소문자를 구분하거나(CASE_SENSITIVE) 대/소문자를 구분하지 않습니다(CASE_INSENSITIVE).

COPY 작업은 대상 테이블에 있는 하나 이상의 열이 데이터 파일에 표시된 열과 일치하는지 확인합니다. 일치하는 항목을 찾은 경우 데이터 파일의 값이 열에 로딩됩니다. 일치하는 항목이 없으면 파일의 각 레코드에 대한 NULL 값 세트가 테이블에 로딩됩니다.

참고

  • 데이터 파일에 일치하지 않는 열이 추가로 있는 경우 이러한 열의 값은 로딩되지 않습니다.

  • 대상 테이블에 일치하지 않는 열이 추가로 있는 경우 COPY 작업은 이러한 열에 NULL 값을 삽입합니다. 이러한 열은 NULL 값을 지원해야 합니다.

  • COPY 문은 로딩 중에 데이터를 추가로 변환하는(즉, COPY 변환) 쿼리의 지정을 허용하지 않습니다.

NONE

COPY 작업에서는 반정형 데이터를 베리언트 열에 로딩하거나, COPY 문에 쿼리가 포함된 경우에는 데이터를 변환합니다.

참고

현재는 다음 제한 사항이 적용됩니다.

  • COPY 문에 MATCH_BY_COLUMN_NAME을 VALIDATION_MODE 매개 변수와 함께 사용하여 스테이징 상태 데이터를 대상 테이블에 로딩하는 대신 유효성 검사를 할 수 없습니다.

  • Parquet 데이터만 해당. MATCH_BY_COLUMN_NAME이 CASE_SENSITIVE 또는 CASE_INSENSITIVE 로 설정되어 있을 때는 열 값이 비어 있는 경우(예: "col1": "") 오류가 발생합니다.

기본값

NONE

ENFORCE_LENGTH = TRUE | FALSE
용도

데이터 로딩 전용

정의

(다른 시스템과의 호환성을 위해) 반대 논리를 가진 TRUNCATECOLUMNS 의 대체 구문

대상 열 길이를 초과하는 텍스트 문자열을 자를지 여부를 지정하는 부울입니다.

  • TRUE 인 경우 COPY 문 실행 시 로딩된 문자열이 대상 열 길이를 초과하면 오류가 발생합니다.

  • FALSE 인 경우에는 문자열이 대상 열 길이에 맞춰 자동으로 잘립니다.

이 복사 옵션은 관계형 테이블에 있는 별개의 열에 로딩 시 반정형 데이터의 문자열 값뿐 아니라 CSV 데이터도 지원합니다.

참고

  • 대상 문자열 열의 길이가 최대값(예: VARCHAR (16777216))으로 설정된 경우 수신 문자열은 이 길이를 초과할 수 없으며, 그렇지 않으면 COPY 명령에서 오류가 발생합니다.

  • 이 매개 변수는 기능적으로는 TRUNCATECOLUMNS 와 같지만, 동작은 반대로 이루어집니다. 이 매개 변수는 다른 데이터베이스와의 호환성을 위해 제공됩니다. 원하는 출력을 생성하려면 COPY 문에 이 두 매개 변수 중 하나만 포함해야 합니다.

기본값

TRUE

TRUNCATECOLUMNS = TRUE | FALSE
용도

데이터 로딩 전용

정의

(다른 시스템과의 호환성을 위해) 반대 논리를 가진 ENFORCE_LENGTH 의 대체 구문

대상 열 길이를 초과하는 텍스트 문자열을 자를지 여부를 지정하는 부울입니다.

  • TRUE 인 경우에는 문자열이 대상 열 길이에 맞춰 자동으로 잘립니다.

  • FALSE 인 경우 COPY 문 실행 시 로딩된 문자열이 대상 열 길이를 초과하면 오류가 발생합니다.

이 복사 옵션은 관계형 테이블에 있는 별개의 열에 로딩 시 반정형 데이터의 문자열 값뿐 아니라 CSV 데이터도 지원합니다.

참고

  • 대상 문자열 열의 길이가 최대값(예: VARCHAR (16777216))으로 설정된 경우 수신 문자열은 이 길이를 초과할 수 없으며, 그렇지 않으면 COPY 명령에서 오류가 발생합니다.

  • 이 매개 변수는 기능적으로는 ENFORCE_LENGTH 와 같지만, 동작은 반대로 이루어집니다. 이 매개 변수는 다른 데이터베이스와의 호환성을 위해 제공됩니다. 원하는 출력을 생성하려면 COPY 문에 이 두 매개 변수 중 하나만 포함해야 합니다.

기본값

FALSE

FORCE = TRUE | FALSE
용도

데이터 로딩 전용

정의

이전에 로딩되었고 그 이후로 변경되지 않았는지 여부와는 관계없이 모든 파일을 로딩하도록 지정하는 부울입니다. 이 옵션은 파일을 다시 로딩하여 테이블의 데이터를 복제할 수 있습니다.

기본값

FALSE

액세스 제어 요구 사항

이 SQL 명령을 실행하는 데 사용되는 역할 에는 최소한 다음 권한 이 있어야 합니다.

권한

오브젝트

참고

USAGE

저장소 통합

저장소 통합 을 사용하여 클라우드 저장소 서비스에 액세스하는 경우에만 필요합니다.

CREATE STAGE

스키마

USAGE

파일 형식

스테이지 정의에서 명명된 파일 형식을 참조하는 경우에만 필요합니다.

스키마의 모든 오브젝트에 대해 작업하려면 상위 데이터베이스 및 스키마에 대한 USAGE 권한도 필요합니다.

지정된 권한 세트로 사용자 지정 역할을 만드는 방법에 대한 지침은 사용자 지정 역할 만들기 섹션을 참조하십시오.

보안 오브젝트 에 대해 SQL 작업을 수행하기 위한 역할과 권한 부여에 대한 일반적인 정보는 Snowflake에서의 액세스 제어 섹션을 참조하십시오.

사용법 노트

조심

스테이지를 다시 생성하면(CREATE OR REPLACE STAGE 사용) 다음과 같은 추가 결과가 잠재적으로 바람직하지 않을 수 있습니다.

  • 스테이지에 대한 기존 디렉터리 테이블이 있는 경우 삭제됩니다. 스테이지가 디렉터리 테이블로 다시 생성되는 경우 디렉터리는 기본적으로 비어 있습니다.

  • 스테이지, 그리고 이를 참조하는 외부 테이블 간의 연결이 끊어집니다.

    이는 외부 테이블이 스테이지의 이름이 아니라 숨겨진 ID를 사용하여 스테이지에 연결되기 때문입니다. CREATE OR REPLACE 구문이 오브젝트를 삭제하고 다른 숨겨진 ID로 저장소 통합을 다시 생성하는 작업이 백그라운드로 수행됩니다.

    하나 이상의 외부 테이블에 연결된 스테이지를 다시 만들어야 하는 경우 (CREATE OR REPLACE EXTERNAL TABLE을 사용하여) 외부 테이블을 각각 다시 만들어 연결을 다시 설정해야 합니다. GET_DDL 함수를 호출하여 각 외부 테이블을 다시 만드는 DDL 문을 불러옵니다.

  • 스테이지를 참조하는 모든 파이프는 데이터 로딩을 중지합니다. 파이프의 실행 상태가 STOPPED_STAGE_DROPPED 로 변경됩니다. 데이터 로딩을 재개하려면 이러한 파이프 오브젝트를 다시 만들어야 합니다(CREATE OR REPLACE PIPE 구문 사용).

  • CREATE STAGE는 지정된 URL 또는 자격 증명이 유효한지 여부를 확인하지 않습니다. 자격 증명이 유효하지 않은 경우 스테이지를 사용하려고 하면 시스템에서 오류를 반환합니다.

  • 현재 네임스페이스의 파일 형식을 참조하는 경우 형식 식별자를 둘러싸는 작은따옴표를 생략할 수 있습니다.

  • 메타데이터 관련:

    주의

    고객은 Snowflake 서비스를 사용할 때 개인 데이터(사용자 오브젝트 제외), 민감한 데이터, 수출 통제 대상 데이터 또는 기타 규제 데이터가 메타데이터로 입력되지 않도록 해야 합니다. 자세한 내용은 Snowflake의 메타데이터 필드 섹션을 참조하십시오.

내부 스테이지

기본 파일 형식 유형(CSV)을 사용해 내부 스테이지를 만듭니다.

  • 해당하는 모든 기본 CSV 파일 형식 옵션이 사용됩니다.

  • ON_ERROR 를 제외한 모든 기본 복사 옵션이 사용됩니다. 이 스테이지를 참조하는 COPY INTO <테이블> 명령을 실행하여 레코드에 데이터 오류가 발생하면 파일을 건너뜁니다.

CREATE STAGE my_int_stage
  COPY_OPTIONS = (ON_ERROR='skip_file');

이전 예와 유사하지만, 스테이지에 대해 서버 측 암호화를 지정합니다.

CREATE STAGE my_int_stage
  ENCRYPTION = (TYPE = 'SNOWFLAKE_SSE')
  COPY_OPTIONS = (ON_ERROR='skip_file');

오류 발생 시 파일을 건너뛰는 복사 옵션을 제외하면, 이전 예와 모든 속성이 똑같은 임시 내부 스테이지를 만듭니다.

CREATE TEMPORARY STAGE my_temp_int_stage;

(CREATE FILE FORMAT 를 사용하여 만든) my_csv_format 으로 명명된 파일 형식을 참조하는 임시 내부 스테이지를 만듭니다.

CREATE TEMPORARY STAGE my_int_stage
  FILE_FORMAT = my_csv_format;

COPY INTO <테이블> 문에서 스테이지를 참조할 때 파일 형식 옵션이 자동으로 설정됩니다.

디렉터리 테이블을 포함하는 내부 스테이지를 만듭니다. 이 스테이지는 myformat 으로 명명된 파일 형식을 참조합니다.

CREATE STAGE mystage
  DIRECTORY = (ENABLE = TRUE)
  FILE_FORMAT = myformat;

외부 스테이지

Amazon S3

다음과 같이 files 라는 이름의 폴더 경로로 load 으로 명명된 개인/보호된 S3 버킷을 사용하여 외부 스테이지를 만듭니다. S3 버킷에 대한 보안 액세스는 myint 저장소 통합을 통해 제공됩니다.

CREATE STAGE my_ext_stage
  URL='s3://load/files/'
  STORAGE_INTEGRATION = myint;

다음과 같이 files 라는 이름의 폴더 경로로 load 으로 명명된 개인/보호된 S3 버킷을 사용하여 외부 스테이지를 만듭니다. S3 버킷에 대한 Snowflake 액세스 허가는 IAM 사용자와 연결되므로, IAM 자격 증명이 필요합니다.

CREATE STAGE my_ext_stage1
  URL='s3://load/files/'
  CREDENTIALS=(AWS_KEY_ID='1a2b3c' AWS_SECRET_KEY='4x5y6z');

이 예에서 사용하는 AWS_KEY_ID 및 AWS_SECRET_KEY 값은 설명 목적으로만 제공됩니다.

encrypted_files 로 명명된 폴더 경로를 가진 load 로 명명된 S3 버킷과 버킷에 저장된 파일의 암호 해독/암호화를 위한 마스터 키를 사용한 클라이언트 측 암호화(기본 암호화 유형)를 사용하여 외부 스테이지를 만듭니다.

CREATE STAGE my_ext_stage2
  URL='s3://load/encrypted_files/'
  CREDENTIALS=(AWS_KEY_ID='1a2b3c' AWS_SECRET_KEY='4x5y6z')
  ENCRYPTION=(MASTER_KEY = 'eSx...');

encrypted_files 로 명명된 폴더 경로를 가진 load 로 명명된 S3 버킷과 버킷에 저장된 파일의 암호 해독/암호화를 위한 마스터 키의 ID를 사용한 AWS_SSE_KMS 서버 측 암호화를 사용하여 외부 스테이지를 만듭니다.

CREATE STAGE my_ext_stage3
  URL='s3://load/encrypted_files/'
  CREDENTIALS=(AWS_KEY_ID='1a2b3c' AWS_SECRET_KEY='4x5y6z')
  ENCRYPTION=(TYPE='AWS_SSE_KMS' KMS_KEY_ID = 'aws/key');

IAM 사용자 대신 IAM 역할과 연결된 S3 버킷에 대한 Snowflake 액세스 허가를 제외하면 바로 앞의 예와 똑같은 예입니다. 자격 증명은 ENCRYPTION 과 같은 다른 스테이지 매개 변수와 별도로 처리됩니다. 이러한 다른 매개 변수에 대한 지원은 외부 S3 버킷에 액세스하기 위해 사용되는 자격 증명에 관계없이 동일합니다.

CREATE STAGE my_ext_stage3
  URL='s3://load/encrypted_files/'
  CREDENTIALS=(AWS_ROLE='arn:aws:iam::001234567890:role/mysnowflakerole')
  ENCRYPTION=(TYPE='AWS_SSE_KMS' KMS_KEY_ID = 'aws/key');

사용자 세션에 대한 활성 스키마의 디렉터리 테이블을 사용하여 스테이지를 만듭니다. 클라우드 저장소 URL에는 files 경로가 포함됩니다. 스테이지는 my_storage_int 저장소 통합을 참조합니다.

CREATE STAGE mystage
  URL='s3://load/files/'
  STORAGE_INTEGRATION = my_storage_int
  DIRECTORY = (
    ENABLE = true
    AUTO_REFRESH = true
  );

Google Cloud Storage

다음과 같이 files 라는 이름의 폴더 경로로 load 로 명명된 개인/보호된 GCS 버킷을 사용하여 외부 스테이지를 만듭니다. GCS 버킷에 대한 보안 액세스는 myint 저장소 통합을 통해 제공됩니다.

CREATE STAGE my_ext_stage
  URL='gcs://load/files/'
  STORAGE_INTEGRATION = myint;

사용자 세션에 대한 활성 스키마의 디렉터리 테이블을 사용하여 mystage 로 명명된 스테이지를 만듭니다. 클라우드 저장소 URL에는 files 경로가 포함됩니다. 스테이지는 my_storage_int 저장소 통합을 참조합니다.

CREATE STAGE mystage
  URL='gcs://load/files/'
  STORAGE_INTEGRATION = my_storage_int
  DIRECTORY = (
    ENABLE = true
    AUTO_REFRESH = true
    NOTIFICATION_INTEGRATION = 'MY_NOTIFICATION_INT'
  );

Microsoft Azure

다음과 같이 files 라는 이름의 폴더 경로로 load 로 명명된 개인/보호된 Azure 컨테이너를 사용하여 외부 스테이지를 만듭니다. 컨테이너에 대한 보안 액세스는 myint 저장소 통합을 통해 제공됩니다.

CREATE STAGE my_ext_stage
  URL='azure://myaccount.blob.core.windows.net/load/files/'
  STORAGE_INTEGRATION = myint;

다음과 같이 files 라는 이름의 폴더 경로로 클라이언트 측 암호화를 활성화하여 myaccount 로 명명된 Azure 저장소 계정과 mycontainer 로 명명된 컨테이너를 사용하여 외부 스테이지를 만듭니다. 이 스테이지는 my_csv_format 으로 명명된 파일 형식을 참조합니다.

CREATE STAGE mystage
  URL='azure://myaccount.blob.core.windows.net/mycontainer/files/'
  CREDENTIALS=(AZURE_SAS_TOKEN='?sv=2016-05-31&ss=b&srt=sco&sp=rwdl&se=2018-06-27T10:05:50Z&st=2017-06-27T02:05:50Z&spr=https,http&sig=bgqQwoXwxzuD2GJfagRg7VOS8hzNr3QLT7rhS8OFRLQ%3D')
  ENCRYPTION=(TYPE='AZURE_CSE' MASTER_KEY = 'kPx...')
  FILE_FORMAT = my_csv_format;

(이 예에서 사용하는 AZURE_SAS_TOKENMASTER_KEY 값은 실제 값이 아니라, 설명 목적으로만 제공됩니다.)

사용자 세션에 대한 활성 스키마의 디렉터리 테이블을 사용하여 스테이지를 만듭니다. 클라우드 저장소 URL에는 files 경로가 포함됩니다. 스테이지는 my_storage_int 저장소 통합을 참조합니다.

CREATE STAGE mystage
  URL='azure://myaccount.blob.core.windows.net/load/files/'
  STORAGE_INTEGRATION = my_storage_int
  DIRECTORY = (
    ENABLE = true
    AUTO_REFRESH = true
    NOTIFICATION_INTEGRATION = 'MY_NOTIFICATION_INT'
  );
맨 위로 이동