- 카테고리:
GENERATE_COLUMN_DESCRIPTION¶
INFER_SCHEMA 함수 출력을 사용하여 반정형 데이터가 포함된 스테이징된 파일 세트에서 열 목록을 생성합니다.
이 함수의 출력은 스테이징된 파일의 열 정의를 기반으로 테이블, 외부 테이블 또는 뷰(적절한 CREATE <오브젝트> 명령 사용)를 수동으로 만들 때 입력으로 사용할 수 있습니다.
아니면, USING TEMPLATE 절이 있는 CREATE TABLE 명령을 사용하여 동일한 INFER_SCHEMA 함수 출력에서 파생된 열 정의를 사용해 새 테이블을 만들 수도 있습니다.
구문¶
GENERATE_COLUMN_DESCRIPTION( <expr> , '<string>' )
인자¶
expr
배열로 형식화된 INFER_SCHEMA 함수의 출력입니다.
'string'
열 목록에서 만들 수 있는 오브젝트 유형입니다. 이 유형에 대한 적절한 형식이 출력에 적용됩니다.
가능한 값은
table
,external_table
또는view
입니다.
반환¶
이 함수는 스테이징된 파일 세트의 열 목록을 반환하며, 이는 두 번째 인자에서 식별된 유형의 오브젝트를 만들 때 입력으로 사용할 수 있습니다.
예¶
mystage
스테이지에서 스테이징된 Parquet 파일 세트에서 열 정의 세트를 감지하고, 형식을 지정하고, 출력합니다. 출력 열은 테이블 생성을 위해 형식이 지정됩니다.
이 예는 INFER_SCHEMA 항목의 예를 기반으로 합니다.
-- Create a file format that sets the file type as Parquet.
CREATE FILE FORMAT my_parquet_format
TYPE = parquet;
-- Query the GENERATE_COLUMN_DESCRIPTION function.
SELECT GENERATE_COLUMN_DESCRIPTION(ARRAY_AGG(OBJECT_CONSTRUCT(*)), 'table') AS COLUMNS
FROM TABLE (
INFER_SCHEMA(
LOCATION=>'@mystage',
FILE_FORMAT=>'my_parquet_format'
)
);
+--------------------+
| COLUMN_DESCRIPTION |
|--------------------|
| "country" VARIANT, |
| "continent" TEXT |
+--------------------+
-- The function output can be used to define the columns in a table.
CREATE TABLE mytable ("country" VARIANT, "continent" TEXT);
이전 예와 동일하지만, 외부 테이블을 만들기 위해 형식이 지정된 열 세트를 생성합니다.
-- Query the GENERATE_COLUMN_DESCRIPTION function.
SELECT GENERATE_COLUMN_DESCRIPTION(ARRAY_AGG(OBJECT_CONSTRUCT(*)), 'external_table') AS COLUMNS
FROM TABLE (
INFER_SCHEMA(
LOCATION=>'@mystage',
FILE_FORMAT=>'my_parquet_format'
)
);
+---------------------------------------------+
| COLUMN_DESCRIPTION |
|---------------------------------------------|
| "country" VARIANT AS ($1:country::VARIANT), |
| "continent" TEXT AS ($1:continent::TEXT) |
+---------------------------------------------+
이전 예와 동일하지만, 뷰를 만들기 위해 형식이 지정된 열 세트를 생성합니다.
-- Query the GENERATE_COLUMN_DESCRIPTION function.
SELECT GENERATE_COLUMN_DESCRIPTION(ARRAY_AGG(OBJECT_CONSTRUCT(*)), 'view') AS COLUMNS
FROM TABLE (
INFER_SCHEMA(
LOCATION=>'@mystage',
FILE_FORMAT=>'my_parquet_format'
)
);
+--------------------+
| COLUMN_DESCRIPTION |
|--------------------|
| "country" , |
| "continent" |
+--------------------+
참고
ARRAY_AGG(OBJECT_CONSTRUCT())
에 대해 *
를 사용하면 반환된 결과가 16MB보다 클 경우 오류가 발생할 수 있습니다. 더 큰 결과 세트에는 *
를 사용하지 말고 쿼리에 필수적인 열인 COLUMN NAME
, TYPE
, NULLABLE
만 사용하는 것이 좋습니다. WITHIN GROUP (ORDER BY order_id)
를 사용할 때 선택적 열 ORDER_ID
를 포함할 수 있습니다.