1단계. 파일 형식 오브젝트 만들기

S3 버킷에서 테이블로 데이터 파일을 로드할 때 파일의 형식을 설명하고 파일의 데이터를 해석하고 처리하는 방법을 지정해야 합니다. 예를 들어, CSV 파일에서 파이프로 구분된 데이터를 로드하는 경우 파일이 파이프 기호가 있는 CSV 형식을 구분 기호로 사용하도록 지정해야 합니다.

COPY INTO <테이블> 명령을 실행할 때 이 형식 정보를 지정합니다. 이 정보를 명령의 옵션으로 지정하거나(예: TYPE = CSV, FIELD_DELIMITER = '|' 등) 이 형식 정보를 포함하는 파일 형식 오브젝트를 지정할 수 있습니다. CREATE FILE FORMAT 명령을 사용하여 명명된 파일 형식 오브젝트를 만들 수 있습니다.

이 단계에서는 이 자습서에 제공된 샘플 CSV 및 JSON 데이터의 데이터 형식을 설명하는 파일 형식 오브젝트를 만듭니다.

CSV 데이터에 대한 파일 형식 오브젝트 만들기

CREATE FILE FORMAT 명령을 실행하여 mycsvformat 파일 형식을 만듭니다.

CREATE OR REPLACE FILE FORMAT mycsvformat
   TYPE = 'CSV'
   FIELD_DELIMITER = '|'
   SKIP_HEADER = 1;
Copy

여기서:

  • TYPE = 'CSV' 는 원본 파일 형식 유형을 나타냅니다. CSV는 기본 파일 형식 유형입니다.

  • FIELD_DELIMITER = '|' 는 필드 구분 기호인 ‘|’ 문자를 나타냅니다. 기본값은 ‘,’입니다.

  • SKIP_HEADER = 1 은 원본 파일에 헤더 행이 한 개 포함된다는 뜻입니다. COPY 명령은 데이터를 로드할 때 이 헤더 행을 건너뜁니다. 기본값은 0입니다.

JSON 데이터에 대한 파일 형식 오브젝트 만들기

CREATE FILE FORMAT 명령을 실행하여 myjsonformat 파일 형식을 만듭니다.

CREATE OR REPLACE FILE FORMAT myjsonformat
  TYPE = 'JSON'
  STRIP_OUTER_ARRAY = TRUE;
Copy

여기서:

  • TYPE = 'JSON' 은 원본 파일 형식 유형을 나타냅니다.

  • STRIP_OUTER_ARRAY = TRUE 는 COPY 명령에 대해 데이터를 테이블로 로드할 때 대괄호([])를 제외하도록 지시합니다.

다음 항목: 2단계. 스테이지 오브젝트 만들기