- 카테고리:
TOP_INSIGHTS (SNOWFLAKE.ML)¶
데이터 세트에서 가장 중요한 차원을 찾고 해당 차원에서 세그먼트를 만든 다음, 이들 중 메트릭에 영향을 준 세그먼트를 검색합니다.
TOP_INSIGHTS는 차원 수가 많이 있는 데이터 세트에서 근본 원인을 파악하는 데 적합합니다. 연속 차원은 범주 차원으로 사전 처리하지 않고도 지원되며 결과는 부정 조건(예: “리전이 북미가 아님”)이 있는 차원을 나타낼 수 있습니다.
구문¶
SNOWFLAKE.ML.TOP_INSIGHTS(
<categorical_dimensions>, <continuous_dimensions>,
<metric>, <label> )
인자¶
categorical_dimensions
차원 이름과 연결된 범주형 열 사이의 1:1 매핑을 포함하는 OBJECT 입니다. 값은 단일 열에서 가져오거나 단순한 열 조합에서 파생될 수 있습니다.
continuous_dimensions
차원 이름과 연결된 연속 열 사이의 1:1 매핑을 포함하는 OBJECT 입니다. 값은 단일 열에서 가져오거나 단순한 열 조합에서 파생될 수 있습니다. 연속 차원의 값은 NULL이 아니어야 합니다.
metric
조사 중인 대상 메트릭을 나타내는 FLOAT 열입니다. 이 값은 엄격히 음수가 아니어야 합니다. 값은 단일 열에서 가져오거나 단순한 열 조합에서 파생될 수 있습니다.
label
제어 데이터와 테스트 데이터를 구분하는 BOOLEAN 열입니다.
TRUE
는 테스트 데이터를 나타내고FALSE
는 제어 데이터를 나타냅니다. 값은 단일 열에서 가져오거나 단순한 열 조합(예: 날짜 비교)에서 파생될 수 있습니다.
출력¶
이 함수는 다음 열을 반환합니다.
열 이름 |
데이터 타입 |
설명 |
---|---|---|
|
알고리즘에서 세그먼트 또는 인사이트를 정의하는 문자열로 구성된 ARRAY입니다. 예: [
"not country = canada",
"length_of_vertical <= 4.5",
"vertical = finance"
]
|
|
|
특정 세그먼트의 제어 기간에 메트릭의 값 총계입니다. |
|
|
특정 세그먼트의 테스트 기간에 메트릭의 값 총계입니다. |
|
|
|
|
|
동 기간에 걸친 전체 메트릭과 비교하여 기간에 따라 특정 세그먼트의 메트릭이 변하는 양상을 정량화한 것입니다.
|
|
|
모든 세그먼트에 걸쳐 제어 기간에 메트릭 값 총계입니다. |
|
|
|
|
|
모든 세그먼트에 걸쳐 제어 기간에 메트릭 값 총계입니다. |
|
|
모든 세그먼트에 걸쳐 테스트 기간에 메트릭 값 총계입니다. |
|
|
모든 세그먼트에서 제어 기간과 테스트 기간 사이의 성장률로, |
|
|
특정 세그먼트가 테스트 데이터에서 새것인지 여부를 나타냅니다. |
|
|
특정 세그먼트가 테스트 데이터에서 누락되었는지 여부를 나타냅니다. |
사용법 노트¶
메트릭은 음수가 아니어야 합니다.
입력 데이터는 테스트 또는 제어 데이터로만 제한되어야 합니다.
런타임은 차원의 수와 해당 차원의 카디널리티에 따라 가변적입니다.
범주형 차원의 카디널리티는 카디널리티가 5를 초과하면 자동으로 줄어듭니다.
예¶
Contribution Explorer 예시 를 참조하십시오.