반정형 데이터 쿼리하기¶

이 항목에서는 특수 연산자와 함수를 사용하여 VARIANT에 저장된 복잡한 계층적 데이터를 쿼리하는 방법에 대해 설명합니다.

(ARRAY와 OBJECT에서 값을 추출하는 방법을 보여주는 간단한 예는 인덱스 또는 슬라이스를 기준으로 배열 요소에 액세스하기 및 키로 OBJECT 값의 요소에 액세스하기 를 참조하십시오.)

일반적으로, 계층적 데이터는 지원되는 다음 데이터 형식 중 하나에서 VARIANT로 가져왔습니다.

JSON

Avro

ORC

Parquet

XML 데이터 쿼리(예: XML 데이터 형식으로 생성된 데이터를 PARSE_XML 을 호출하여 OBJECT 값으로 변환한 데이터)에 대한 자세한 내용은 XML 데이터 쿼리 예 및 XMLGET 을 참조하십시오.

팁

검색 최적화 서비스를 사용하여 쿼리 성능을 개선할 수 있습니다. 자세한 내용은 검색 최적화 서비스 섹션을 참조하십시오.

예에서 사용된 샘플 데이터¶

명시된 경우를 제외하고, 이 항목의 예는 이름이 src 인 단일 VARIANT 열이 포함된 car_sales 테이블을 참조합니다. 이 VARIANT에는 중첩된 ARRAYs 및 OBJECTs 가 포함됩니다.

테이블을 만들어 로딩합니다.

CREATE OR REPLACE TABLE car_sales
( 
  src variant
)
AS
SELECT PARSE_JSON(column1) AS src
FROM VALUES
('{ 
    "date" : "2017-04-28", 
    "dealership" : "Valley View Auto Sales",
    "salesperson" : {
      "id": "55",
      "name": "Frank Beasley"
    },
    "customer" : [
      {"name": "Joyce Ridgely", "phone": "16504378889", "address": "San Francisco, CA"}
    ],
    "vehicle" : [
      {"make": "Honda", "model": "Civic", "year": "2017", "price": "20275", "extras":["ext warranty", "paint protection"]}
    ]
}'),
('{ 
    "date" : "2017-04-28", 
    "dealership" : "Tindel Toyota",
    "salesperson" : {
      "id": "274",
      "name": "Greg Northrup"
    },
    "customer" : [
      {"name": "Bradley Greenbloom", "phone": "12127593751", "address": "New York, NY"}
    ],
    "vehicle" : [
      {"make": "Toyota", "model": "Camry", "year": "2017", "price": "23500", "extras":["ext warranty", "rust proofing", "fabric protection"]}  
    ]
}') v;

데이터를 선택합니다.

SELECT * FROM car_sales;
+-------------------------------------------+
| SRC                                       |
|-------------------------------------------|
| {                                         |
|   "customer": [                           |
|     {                                     |
|       "address": "San Francisco, CA",     |
|       "name": "Joyce Ridgely",            |
|       "phone": "16504378889"              |
|     }                                     |
|   ],                                      |
|   "date": "2017-04-28",                   |
|   "dealership": "Valley View Auto Sales", |
|   "salesperson": {                        |
|     "id": "55",                           |
|     "name": "Frank Beasley"               |
|   },                                      |
|   "vehicle": [                            |
|     {                                     |
|       "extras": [                         |
|         "ext warranty",                   |
|         "paint protection"                |
|       ],                                  |
|       "make": "Honda",                    |
|       "model": "Civic",                   |
|       "price": "20275",                   |
|       "year": "2017"                      |
|     }                                     |
|   ]                                       |
| }                                         |
| {                                         |
|   "customer": [                           |
|     {                                     |
|       "address": "New York, NY",          |
|       "name": "Bradley Greenbloom",       |
|       "phone": "12127593751"              |
|     }                                     |
|   ],                                      |
|   "date": "2017-04-28",                   |
|   "dealership": "Tindel Toyota",          |
|   "salesperson": {                        |
|     "id": "274",                          |
|     "name": "Greg Northrup"               |
|   },                                      |
|   "vehicle": [                            |
|     {                                     |
|       "extras": [                         |
|         "ext warranty",                   |
|         "rust proofing",                  |
|         "fabric protection"               |
|       ],                                  |
|       "make": "Toyota",                   |
|       "model": "Camry",                   |
|       "price": "23500",                   |
|       "year": "2017"                      |
|     }                                     |
|   ]                                       |
| }                                         |
+-------------------------------------------+

반정형 데이터 탐색하기¶

VARIANT 열 이름과 첫 번째 레벨 요소인 <열>:<레벨1_요소> 사이에 콜론 : 을 삽입합니다.

참고

다음 예에서는 쿼리의 출력이 VARCHAR가 아닌 VARIANT이므로 쿼리의 출력을 큰따옴표로 묶습니다. (VARIANT 값은 문자열이 아니며, VARIANT 값에 문자열이 포함됩니다.) : 연산자 및 후행 . 및 [] 는 항상 문자열이 포함된 VARIANT 값을 반환합니다.

예를 들어, 모든 대리점 이름의 목록을 가져옵니다.

SELECT src:dealership
    FROM car_sales
    ORDER BY 1;
+--------------------------+
| SRC:DEALERSHIP           |
|--------------------------|
| "Tindel Toyota"          |
| "Valley View Auto Sales" |
+--------------------------+

JSON 오브젝트의 요소에 액세스하는 방법은 다음의 2가지입니다.

점 표기법 (이 항목).
대괄호 표기법 (이 항목).

중요

사용할 표기법에 관계없이, 열 이름에서는 대/소문자를 구분하지 않지만 요소 이름에서는 대/소문자를 구분합니다. 예를 들어, 다음 목록에서 첫 번째 두 경로는 동일하지만 세 번째 경로는 그렇지 않습니다.

src:salesperson.name
SRC:salesperson.name
SRC:Salesperson.Name

점 표기법¶

점 표기법은 JSON 오브젝트에서 <열>:<레벨1_요소>.<레벨2_요소>.<레벨3_요소> 경로를 탐색합니다. 선택 사항으로 요소의 이름 <열>:"<레벨1_요소>"."<레벨2_요소>"."<레벨3_요소>" 을 큰따옴표로 묶습니다.

참고

JSON 키(요소 이름)에 대한 규칙은 Snowflake SQL 식별자에 대한 규칙과 다릅니다.

Snowflake SQL 식별자 규칙에 대한 자세한 내용은 식별자 요구 사항 을 참조하십시오.

JSON 키에 대한 자세한 내용은 http://json.org에서 특히 “문자열” 설명을 참조하십시오.

요소 이름이 Snowflake SQL 식별자 규칙을 따르지 않는 경우(예: 공백이 포함된 경우) 반드시 이름을 큰따옴표로 묶어야 합니다. 큰따옴표로 묶는 경우를 제외하고 유효한 Snowflake 식별자 이름이 아닌 유효한 JSON 요소 이름의 몇 가지 예는 아래와 같습니다(위의 car_sales 예에 해당하지 않은 항목도 있음).

-- This contains a blank.
SELECT src:"company name" FROM partners;

-- This does not start with a letter or underscore.
SELECT zipcode_info:"94987" FROM addresses;

-- This contains characters that are not letters, digits, or underscores, and
-- it does not start with a letter or underscore.
SELECT measurements:"#sPerSquareInch" FROM english_metrics;

자동차를 판매하는 모든 영업 인력의 이름을 가져옵니다.

SELECT src:salesperson.name
    FROM car_sales
    ORDER BY 1;
+----------------------+
| SRC:SALESPERSON.NAME |
|----------------------|
| "Frank Beasley"      |
| "Greg Northrup"      |
+----------------------+

대괄호 표기법¶

아니면, 대괄호 표기법을 사용하여 오브젝트에서 <열>['<레벨1_요소>']['<레벨2_요소>'] 경로를 탐색합니다. 요소 이름을 작은따옴표로 묶습니다. 값은 문자열로 검색됩니다.

자동차를 판매하는 모든 영업 인력의 이름을 가져옵니다.

SELECT src['salesperson']['name']
    FROM car_sales
    ORDER BY 1;
+----------------------------+
| SRC['SALESPERSON']['NAME'] |
|----------------------------|
| "Frank Beasley"            |
| "Greg Northrup"            |
+----------------------------+

반복 요소의 단일 인스턴스 검색하기¶

번호가 지정된 조건자(0부터 시작)를 배열 참조에 추가하여 반복 배열에서 하위 요소의 특정 번호 인스턴스를 검색합니다.

반복 배열에서 하위 요소의 모든 인스턴스를 검색하려면 배열을 평면화합니다. 이 항목의 FLATTEN 함수를 사용하여 배열 구문 분석하기 에서 제공되는 예를 참조하십시오.

각 판매에 대한 차량 세부 정보를 가져옵니다.

SELECT src:customer[0].name, src:vehicle[0]
    FROM car_sales
    ORDER BY 1;
+----------------------+-------------------------+
| SRC:CUSTOMER[0].NAME | SRC:VEHICLE[0]          |
|----------------------+-------------------------|
| "Bradley Greenbloom" | {                       |
|                      |   "extras": [           |
|                      |     "ext warranty",     |
|                      |     "rust proofing",    |
|                      |     "fabric protection" |
|                      |   ],                    |
|                      |   "make": "Toyota",     |
|                      |   "model": "Camry",     |
|                      |   "price": "23500",     |
|                      |   "year": "2017"        |
|                      | }                       |
| "Joyce Ridgely"      | {                       |
|                      |   "extras": [           |
|                      |     "ext warranty",     |
|                      |     "paint protection"  |
|                      |   ],                    |
|                      |   "make": "Honda",      |
|                      |   "model": "Civic",     |
|                      |   "price": "20275",     |
|                      |   "year": "2017"        |
|                      | }                       |
+----------------------+-------------------------+

판매된 각 차량의 가격을 가져옵니다.

SELECT src:customer[0].name, src:vehicle[0].price
    FROM car_sales
    ORDER BY 1;
+----------------------+----------------------+
| SRC:CUSTOMER[0].NAME | SRC:VEHICLE[0].PRICE |
|----------------------+----------------------|
| "Bradley Greenbloom" | "23500"              |
| "Joyce Ridgely"      | "20275"              |
+----------------------+----------------------+

명시적 값 캐스팅¶

VARIANT에서 값을 추출할 때 값을 원하는 데이터 타입으로 명시적으로 캐스팅할 수 있습니다. 예를 들어, 가격을 숫자 값으로 추출하고 이들 값에 대한 계산을 수행할 수 있습니다.

SELECT src:vehicle[0].price::NUMBER * 0.10 AS tax
    FROM car_sales
    ORDER BY tax;
+--------+
|    TAX |
|--------|
| 2027.5 |
| 2350.0 |
+--------+

기본적으로 VARCHAR, DATE, TIME, TIMESTAMP가 VARIANT 열에서 검색될 때 값은 큰따옴표로 묶입니다. 값을 명시적으로 캐스팅하여 큰따옴표를 제거할 수 있습니다. 예:

SELECT src:dealership, src:dealership::VARCHAR
    FROM car_sales
    ORDER BY 2;
+--------------------------+-------------------------+
| SRC:DEALERSHIP           | SRC:DEALERSHIP::VARCHAR |
|--------------------------+-------------------------|
| "Tindel Toyota"          | Tindel Toyota           |
| "Valley View Auto Sales" | Valley View Auto Sales  |
+--------------------------+-------------------------+

VARIANT 값의 캐스팅에 대한 자세한 내용은 VARIANT 데이터 삽입하기 섹션을 참조하십시오.

일반적으로 캐스팅에 대한 자세한 내용은 데이터 타입 변환 섹션을 참조하십시오.

FLATTEN을 사용하여 WHERE 절에서 결과 필터링하기¶

FLATTEN 함수는 중첩된 값을 별도의 열로 분해합니다. 이 함수를 사용하여 WHERE 절에서 쿼리 결과를 필터링할 수 있습니다.

다음 예는 WHERE 절과 일치하는 키-값 페어를 반환하고 이를 별도의 열에 표시합니다.

CREATE TABLE pets (v variant);

INSERT INTO pets SELECT PARSE_JSON ('{"species":"dog", "name":"Fido", "is_dog":"true"} ');
INSERT INTO pets SELECT PARSE_JSON ('{"species":"cat", "name":"Bubby", "is_dog":"false"}');
INSERT INTO pets SELECT PARSE_JSON ('{"species":"cat", "name":"dog terror", "is_dog":"false"}');

SELECT a.v, b.key, b.value FROM pets a,LATERAL FLATTEN(input => a.v) b
WHERE b.value LIKE '%dog%';

+-------------------------+---------+--------------+
| V                       | KEY     | VALUE        |
|-------------------------+---------+--------------|
| {                       | species | "dog"        |
|   "is_dog": "true",     |         |              |
|   "name": "Fido",       |         |              |
|   "species": "dog"      |         |              |
| }                       |         |              |
| {                       | name    | "dog terror" |
|   "is_dog": "false",    |         |              |
|   "name": "dog terror", |         |              |
|   "species": "cat"      |         |              |
| }                       |         |              |
+-------------------------+---------+--------------+

FLATTEN을 사용하여 고유 키 이름 나열하기¶

익숙하지 않은 반정형 데이터 관련 작업을 수행하는 경우에는 OBJECT의 키 이름을 알지 못할 수 있습니다. FLATTEN 함수를 RECURSIVE 인자와 함께 사용하면 OBJECT의 모든 중첩 요소에 있는 고유 키 이름 목록을 반환할 수 있습니다.

SELECT REGEXP_REPLACE(f.path, '\\[[0-9]+\\]', '[]') AS "Path",
  TYPEOF(f.value) AS "Type",
  COUNT(*) AS "Count"
FROM <table>,
LATERAL FLATTEN(<variant_column>, RECURSIVE=>true) f
GROUP BY 1, 2 ORDER BY 1, 2;

REGEXP_REPLACE 함수는 배열 인덱스 값(예: [0])을 제거하고 이를 대괄호([])로 바꿔 배열 요소를 그룹화합니다.

예:

{"a": 1, "b": 2, "special" : "data"}   <--- row 1 of VARIANT column
{"c": 3, "d": 4, "normal" : "data"}    <----row 2 of VARIANT column

Output from query:

+---------+---------+-------+
| Path    | Type    | Count |
|---------+---------+-------|
| a       | INTEGER |     1 |
| b       | INTEGER |     1 |
| c       | INTEGER |     1 |
| d       | INTEGER |     1 |
| normal  | VARCHAR |     1 |
| special | VARCHAR |     1 |
+---------+---------+-------+

FLATTEN을 사용하여 OBJECT 내 경로 나열하기¶

FLATTEN 함수를 사용하여 고유 키 이름 나열하기 와 관련하여, FLATTEN 함수를 RECURSIVE 인자와 함께 사용하면 OBJECT 내의 모든 키 및 경로를 검색할 수 있습니다.

다음 쿼리는 VARIANT 열에 저장된 모든 데이터 타입에 대한 키, 경로 및 값(VARIANT “null” 값 포함)을 반환합니다. 이 코드에서는 VARIANT 열의 각 행에 OBJECT가 포함된 것으로 가정합니다.

SELECT
  t.<variant_column>,
  f.seq,
  f.key,
  f.path,
  REGEXP_COUNT(f.path,'\\.|\\[') +1 AS Level,
  TYPEOF(f.value) AS "Type",
  f.index,
  f.value AS "Current Level Value",
  f.this AS "Above Level Value"
FROM <table> t,
LATERAL FLATTEN(t.<variant_column>, recursive=>true) f;

다음 쿼리를 첫 번째 쿼리와 유사하지만, 중첩된 OBJECTs 및 ARRAYs를 분해합니다.

SELECT
  t.<variant_column>,
  f.seq,
  f.key,
  f.path,
  REGEXP_COUNT(f.path,'\\.|\\[') +1 AS Level,
  TYPEOF(f.value) AS "Type",
  f.value AS "Current Level Value",
  f.this AS "Above Level Value"
FROM <table> t,
LATERAL FLATTEN(t.<variant_column>, recursive=>true) f
WHERE "Type" NOT IN ('OBJECT','ARRAY');

쿼리에서 반환되는 값은 다음과 같습니다.

<베리언트_열>
VARIANT 열에 행으로 저장된 OBJECT입니다.

Seq
행에서 데이터와 연결된 고유 시퀀스 번호입니다.

키
데이터 구조에서 값과 연결된 문자열입니다.

경로
데이터 구조 내에서 요소로의 경로입니다.

레벨
데이터 구조 내에서 키-값 페어의 레벨입니다.

타입
값의 데이터 타입입니다.

인덱스
데이터 구조에서 요소의 인덱스입니다. ARRAY 값에만 적용되며, 그렇지 않으면 NULL입니다.

현재 레벨 값
데이터 구조에서 현재 레벨에서의 값입니다.

상위 레벨 값
데이터 구조에서 한 레벨 상위의 값입니다.

FLATTEN 함수를 사용하여 배열 구문 분석하기¶

FLATTEN 함수를 사용하여 배열의 구문을 분석합니다. FLATTEN 은 VARIANT, OBJECT 또는 ARRAY 열의 래터럴 뷰를 생성하는 테이블 함수입니다. 이 함수는 각 오브젝트에 대한 행을 반환하고 LATERAL 수정자는 데이터를 오브젝트 외부의 모든 정보와 결합합니다.

모든 고객의 이름 및 주소를 가져옵니다. VARIANT 출력을 문자열 값으로 캐스팅합니다.

SELECT
  value:name::string as "Customer Name",
  value:address::string as "Address"
  FROM
    car_sales
  , LATERAL FLATTEN(INPUT => SRC:customer);

+--------------------+-------------------+
| Customer Name      | Address           |
|--------------------+-------------------|
| Joyce Ridgely      | San Francisco, CA |
| Bradley Greenbloom | New York, NY      |
+--------------------+-------------------+

FLATTEN 함수를 사용하여 중첩 배열의 구문 분석하기¶

샘플 데이터에서 extras 배열은 vehicle 배열에 중첩되어 있습니다.

"vehicle" : [
     {"make": "Honda", "model": "Civic", "year": "2017", "price": "20275", "extras":["ext warranty", "paint protection"]}
   ]

두 번째 FLATTEN 절을 평면화된 vehicle 배열 내의 extras 배열을 평면화하고 판매된 각 차량에서 구입된 “추가 부품”을 검색합니다.

SELECT
  vm.value:make::string as make,
  vm.value:model::string as model,
  ve.value::string as "Extras Purchased"
  FROM
    car_sales
    , LATERAL FLATTEN(INPUT => SRC:vehicle) vm
    , LATERAL FLATTEN(INPUT => vm.value:extras) ve
  ORDER BY make, model, "Extras Purchased";
+--------+-------+-------------------+
| MAKE   | MODEL | Extras Purchased  |
|--------+-------+-------------------|
| Honda  | Civic | ext warranty      |
| Honda  | Civic | paint protection  |
| Toyota | Camry | ext warranty      |
| Toyota | Camry | fabric protection |
| Toyota | Camry | rust proofing     |
+--------+-------+-------------------+

PARSE_JSON 함수를 사용하여 텍스트를 VARIANT 변수로 구문 분석하기¶

PARSE_JSON 함수를 사용하여 텍스트를 JSON 문서로 구문 분석합니다.

입력이 NULL이면 출력도 NULL입니다. 그러나 입력 문자열이 null 이면 VARIANT null 값으로 해석되며, 즉, 결과는 SQL NULL이 아닌 반정형 형식으로 null 값을 표현하기 위해 사용되는 실제 값입니다.

예를 들어, 이 항목의 예에서 사용된 샘플 데이터 를 참조하십시오.

GET 함수를 사용하여 값 추출하기¶

GET 에서는 VARIANT, OBJECT 또는 ARRAY 값을 첫 번째 인자로 허용하며 두 번째 인자로 제공되는 경로 요소의 VARIANT 값을 추출합니다.

GET 및 ARRAY_SIZE 함수를 사용하여 VARIANT 열에 있는 각 배열의 마지막 요소를 계산한 후 추출합니다. ARRAY_SIZE는 입력 배열의 크기를 반환합니다.

참고

이 예는 이 항목의 다른 위치에서 사용된 car_sales 테이블과 다릅니다.

CREATE OR replace TABLE colors (v variant);

INSERT INTO
   colors
   SELECT
      parse_json(column1) AS v
   FROM
   VALUES
     ('[{r:255,g:12,b:0},{r:0,g:255,b:0},{r:0,g:0,b:255}]'),
     ('[{c:0,m:1,y:1,k:0},{c:1,m:0,y:1,k:0},{c:1,m:1,y:0,k:0}]')
    v;

SELECT *, GET(v, ARRAY_SIZE(v)-1) FROM colors;

+---------------+-------------------------+
| V             | GET(V, ARRAY_SIZE(V)-1) |
|---------------+-------------------------|
| [             | {                       |
|   {           |   "b": 255,             |
|     "b": 0,   |   "g": 0,               |
|     "g": 12,  |   "r": 0                |
|     "r": 255  | }                       |
|   },          |                         |
|   {           |                         |
|     "b": 0,   |                         |
|     "g": 255, |                         |
|     "r": 0    |                         |
|   },          |                         |
|   {           |                         |
|     "b": 255, |                         |
|     "g": 0,   |                         |
|     "r": 0    |                         |
|   }           |                         |
| ]             |                         |
| [             | {                       |
|   {           |   "c": 1,               |
|     "c": 0,   |   "k": 0,               |
|     "k": 0,   |   "m": 1,               |
|     "m": 1,   |   "y": 0                |
|     "y": 1    | }                       |
|   },          |                         |
|   {           |                         |
|     "c": 1,   |                         |
|     "k": 0,   |                         |
|     "m": 0,   |                         |
|     "y": 1    |                         |
|   },          |                         |
|   {           |                         |
|     "c": 1,   |                         |
|     "k": 0,   |                         |
|     "m": 1,   |                         |
|     "y": 0    |                         |
|   }           |                         |
| ]             |                         |
+---------------+-------------------------+

GET_PATH를 사용하여 경로를 기준으로 값 추출하기¶

GET_PATH , : 함수를 사용하여 VARIANT 열에서 값을 추출합니다. 이 함수는 경로 이름을 사용하여 값을 추출하기 위해 사용되는 GET 의 변형입니다. GET_PATH는 GET 함수 체인과 동등합니다.

각 고객이 구매한 자동차의 차량 제조사를 가져옵니다.

SELECT GET_PATH(src, 'vehicle[0]:make') FROM car_sales;

+----------------------------------+
| GET_PATH(SRC, 'VEHICLE[0]:MAKE') |
|----------------------------------|
| "Honda"                          |
| "Toyota"                         |
+----------------------------------+

반정형 데이터 탐색하기 에서는 VARIANT 열에서 요소를 검색하기 위해 사용되는 경로 구문을 설명합니다. 구문은 GET 또는 GET_PATH , : 함수의 줄임 속성입니다. 경로 구문과 다르게, 이러한 함수는 불규칙한 경로 또는 경로 요소를 처리할 수 있습니다.

다음 쿼리에서는 동일한 결과가 제공됩니다.

SELECT GET_PATH(src, 'vehicle[0].make') FROM car_sales;

SELECT src:vehicle[0].make FROM car_sales;

스테이징된 데이터 파일에서 직접 배열 구문 분석하기¶

이름이 contacts.json.gz 인 스테이징 파일에 다음 데이터가 포함되어 있다고 가정해 보겠습니다.

{
    "root": [
        {
            "employees": [
                {
                    "firstName": "Anna",
                    "lastName": "Smith"
                },
                {
                    "firstName": "Peter",
                    "lastName": "Jones"
                }
            ]
        }
    ]
}

또한, my_json_format 파일 형식의 정의에 TYPE=JSON 이 포함되어 있다고 가정해 보겠습니다.

스테이징된 파일에서 첫 번째 직원의 이름을 쿼리합니다. 이 예에서 파일은 customers 테이블 스테이지에 위치하지만, 내부(즉, Snowflake) 또는 외부 스테이지에도 위치할 수 있습니다.

SELECT 'The First Employee Record is '||
    S.$1:root[0].employees[0].firstName||
    ' '||S.$1:root[0].employees[0].lastName
FROM @%customers/contacts.json.gz (file_format => 'my_json_format') as S;

+----------------------------------------------+
| 'THE FIRST EMPLOYEE RECORD IS '||            |
|      S.$1:ROOT[0].EMPLOYEES[0].FIRSTNAME||   |
|      ' '||S.$1:ROOT[0].EMPLOYEES[0].LASTNAME |
|----------------------------------------------|
| The First Employee Record is Anna Smith      |
+----------------------------------------------+

Snowflake 고차 함수를 사용하여 데이터에 Lambda 함수 사용¶

Snowflake 고차 함수를 사용하면 람다 함수를 사용하여 반정형 및 정형 데이터를 필터링, 축소, 변환할 수 있습니다. Snowflake 고차 함수를 호출할 때 람다 식을 사용하여 배열 에 지정된 데이터에 대해 작업하는 람다 함수를 생성합니다. Snowflake 고차 함수는 데이터 조작과 고급 분석을 수행하는 간결하고 읽기 쉽고 효율적인 방법을 제공합니다.

다음과 같은 고차 함수를 사용할 수 있습니다.

고차 함수의 이점¶

데이터 분석에서 반정형 데이터를 사용하는 경우 일반적으로 배열을 반복하고 배열의 각 값에 대해 작업을 수행해야 합니다. Snowflake 고차 함수를 호출하여 이러한 작업을 수행할 수 있습니다. 고차 함수는 다음과 같은 이점을 제공합니다.

고급 분석 간소화 - 이 함수는 배열 요소에 대한 반복을 단순화하여 데이터 필터링, 축소 및 변환을 위한 사용자 지정 논리를 쉽게 구현할 수 있게 함으로써 분석 프로세스를 간소화합니다. 고차 함수가 없으면 이러한 유형의 조작에는 LATERAL FLATTEN 연산자 또는 사용자 정의 함수(UDFs)가 필요합니다.
개발자 경험 향상 - 고차 함수는 조작 논리를 Lambda 식에 캡슐화하여 가독성이 높고 유지 관리가 용이한 SQL 문을 구현합니다. 고차 함수를 사용하면 장황하고 복잡한 SQL 쿼리를 작성하지 않아도 됩니다.
불필요한 UDFs 방지 - 고차 함수를 사용하면 임시 배열 조작 논리를 위한 UDFs 액세스를 생성, 유지, 관리할 필요가 줄어듭니다. 이러한 함수를 사용하면 오버헤드를 줄이고 데이터 조작 프로세스를 단순화할 수 있습니다.

Lambda 식¶

Lambda 식은 인자를 받아서 값을 반환하는 짧은 코드 블록입니다. Lambda 식에서는 Lambda 연산자(->)의 왼쪽에 인자를, 오른쪽에 식을 지정합니다. Lambda 식을 사용하여 다양한 연산을 완료할 수 있습니다.

예를 들어, Lambda 식을 사용하여 숫자형 출력을 생성할 수 있습니다. 다음 Lambda 식은 요소에 2를 곱합니다.

a -> a * 2

Lambda 식을 사용하여 요소를 필터링하고 필터 조건이 TRUE를 반환하는 요소를 반환할 수 있습니다. 예를 들어, 다음 Lambda 식은 value 가 50 보다 큰 요소를 반환합니다.

a -> a:value > 50

Lambda 식을 사용하면 요소에 텍스트를 추가할 수 있습니다. 예를 들어, 다음 Lambda 식은 요소에 텍스트 some string 을 추가합니다.

a -> a || ' some string'

Lambda 식에서 테이블 열을 참조할 수 있습니다. 예를 들어, 다음 Lambda 식은 요소에서 table1.col2 값을 뺍니다.

a -> a - table1.col2

Lambda 식에서 열을 참조할 때 정규화되지 않은 열 이름이나 정규화된 열 이름을 지정할 수 있습니다. Lambda 식에서 열 이름으로 별칭을 사용할 수도 있습니다. 식별자 확인에서는 Lambda 인자를 먼저 확인한 다음, 열 이름을 확인합니다(오브젝트 이름 확인을 위한 표준 규칙 사용). 자세한 내용은 오브젝트 이름 확인 섹션을 참조하십시오.

Lambda 인자의 데이터 타입을 지정할 수 있습니다. 예를 들어, 다음 Lambda 식은 두 개의 INTEGER 값을 지정하고 이를 더합니다.

(x INT, y INT) -> (x + y)

Lambda 식에서 함수 호출을 사용할 수 있습니다. 예를 들어, 다음 람다 식은 UPPER 함수를 호출합니다.

a -> UPPER(a)

람다 식에서 상관 관계가 없는 스칼라 하위 쿼리 를 실행할 수 있습니다. 예를 들어, 다음 람다 식에는 이러한 하위 쿼리가 포함되어 있습니다.

a -> a + (SELECT MAX(c1) FROM mytable)

람다 식에서 사용자 정의 SQL 함수 를 호출할 수 있습니다. 예를 들어, 다음 람다 식은 mysqlfunction 함수를 호출합니다.

a -> mysqlfunction(5)

제한 사항¶

람다 식은 독립형 오브젝트로는 지원되지 않습니다. 이러한 변수는 Snowflake 고차 함수의 인자로 지정되어야 합니다.
Lambda 식은 익명이어야 합니다. 명명된 함수는 Snowflake 고차 함수에 람다 인자로 전달할 수 없습니다.
람다 식은 기본 제공 함수(집계 및 윈도우 함수 제외), SQL 사용자 정의 함수 및 상관 관계가 없는 스칼라 하위 쿼리만 허용합니다. SQL 이외의 언어로 작성된 사용자 정의 함수, 중첩된 컨텍스트(예: Snowflake Scripting 변수) 참조, CTE 식, 사용자 정의 함수의 인자 또는 상호 연관된 하위 쿼리는 지원하지 않습니다.