- カテゴリ:
GENERATE_COLUMN_DESCRIPTION¶
INFER_SCHEMA 関数の出力を使用して、半構造化データを含む一連のステージングされたファイルから列のリストを生成します。
この関数からの出力は、ステージングされたファイルの列定義に基づいて(適切な CREATE <オブジェクト> コマンドを使用して)テーブル、外部テーブル、またはビューを手動で作成するときに入力として使用できます。
または、 USING TEMPLATE 句のある CREATE TABLE コマンドを使用して、同じ INFER_SCHEMA 関数の出力から派生した列定義を使用した新しいテーブルを作成することもできます。
構文¶
GENERATE_COLUMN_DESCRIPTION( <expr> , '<string>' )
引数¶
expr
配列としてフォーマットされた INFER_SCHEMA 関数の出力。
'string'
列リストから作成できるオブジェクトの型。この型に適したフォーマットが出力に適用されます。
可能な値は、
table
、external_table
、またはview
です。
戻り値¶
この関数は、ステージングされたファイルのセットに列リストを返します。これは、2番目の引数で識別される型のオブジェクトを作成するときに入力として使用できます。
例¶
mystage
ステージでステージングされたParquetファイルのセットにある、列定義のセットを検出、フォーマット、および出力します。出力列は、テーブルを作成するためにフォーマットされます。
この例は、 INFER_SCHEMA トピックの例に基づいて構築されています。
-- Create a file format that sets the file type as Parquet.
CREATE FILE FORMAT my_parquet_format
TYPE = parquet;
-- Query the GENERATE_COLUMN_DESCRIPTION function.
SELECT GENERATE_COLUMN_DESCRIPTION(ARRAY_AGG(OBJECT_CONSTRUCT(*)), 'table') AS COLUMNS
FROM TABLE (
INFER_SCHEMA(
LOCATION=>'@mystage',
FILE_FORMAT=>'my_parquet_format'
)
);
+--------------------+
| COLUMN_DESCRIPTION |
|--------------------|
| "country" VARIANT, |
| "continent" TEXT |
+--------------------+
-- The function output can be used to define the columns in a table.
CREATE TABLE mytable ("country" VARIANT, "continent" TEXT);
前の例と同じですが、外部テーブルを作成するためにフォーマットされた列のセットを生成します。
-- Query the GENERATE_COLUMN_DESCRIPTION function.
SELECT GENERATE_COLUMN_DESCRIPTION(ARRAY_AGG(OBJECT_CONSTRUCT(*)), 'external_table') AS COLUMNS
FROM TABLE (
INFER_SCHEMA(
LOCATION=>'@mystage',
FILE_FORMAT=>'my_parquet_format'
)
);
+---------------------------------------------+
| COLUMN_DESCRIPTION |
|---------------------------------------------|
| "country" VARIANT AS ($1:country::VARIANT), |
| "continent" TEXT AS ($1:continent::TEXT) |
+---------------------------------------------+
前の例と同じですが、ビューを作成するためにフォーマットされた列のセットを生成します。
-- Query the GENERATE_COLUMN_DESCRIPTION function.
SELECT GENERATE_COLUMN_DESCRIPTION(ARRAY_AGG(OBJECT_CONSTRUCT(*)), 'view') AS COLUMNS
FROM TABLE (
INFER_SCHEMA(
LOCATION=>'@mystage',
FILE_FORMAT=>'my_parquet_format'
)
);
+--------------------+
| COLUMN_DESCRIPTION |
|--------------------|
| "country" , |
| "continent" |
+--------------------+
注釈
ARRAY_AGG(OBJECT_CONSTRUCT())
に *
を使用すると、返される結果が 16MB よりも大きいとエラーになる場合があります。大きな結果セットの場合は *
の使用を避け、クエリにはクエリに必要な列、 COLUMN NAME
、 TYPE
、 NULLABLE
のみを使用することをお勧めします。 WITHIN GROUP (ORDER BY order_id)
を使用する場合は、オプションの列 ORDER_ID
を含めることができます。