카테고리:

테이블 함수

TOP_INSIGHTS (SNOWFLAKE.ML)

데이터 세트에서 가장 중요한 차원을 찾고 해당 차원에서 세그먼트를 만든 다음, 이들 중 메트릭에 영향을 준 세그먼트를 검색합니다.

TOP_INSIGHTS는 차원 수가 많이 있는 데이터 세트에서 근본 원인을 파악하는 데 적합합니다. 연속 차원은 범주 차원으로 사전 처리하지 않고도 지원되며 결과는 부정 조건(예: “리전이 북미가 아님”)이 있는 차원을 나타낼 수 있습니다.

구문

SNOWFLAKE.ML.TOP_INSIGHTS(
  <categorical_dimensions>, <continuous_dimensions>,
  <metric>, <label> )
Copy

인자

categorical_dimensions

차원 이름과 연결된 범주형 열 사이의 1:1 매핑을 포함하는 OBJECT 입니다. 값은 단일 열에서 가져오거나 단순한 열 조합에서 파생될 수 있습니다.

continuous_dimensions

차원 이름과 연결된 연속 열 사이의 1:1 매핑을 포함하는 OBJECT 입니다. 값은 단일 열에서 가져오거나 단순한 열 조합에서 파생될 수 있습니다. 연속 차원의 값은 NULL이 아니어야 합니다.

metric

조사 중인 대상 메트릭을 나타내는 FLOAT 열입니다. 이 값은 엄격히 음수가 아니어야 합니다. 값은 단일 열에서 가져오거나 단순한 열 조합에서 파생될 수 있습니다.

label

제어 데이터와 테스트 데이터를 구분하는 BOOLEAN 열입니다. TRUE 는 테스트 데이터를 나타내고 FALSE 는 제어 데이터를 나타냅니다. 값은 단일 열에서 가져오거나 단순한 열 조합(예: 날짜 비교)에서 파생될 수 있습니다.

출력

이 함수는 다음 열을 반환합니다.

열 이름

데이터 타입

설명

contributor

ARRAY

알고리즘에서 세그먼트 또는 인사이트를 정의하는 문자열로 구성된 ARRAY입니다.

예:

[
  "not country = canada",
  "length_of_vertical <= 4.5",
  "vertical = finance"
]
Copy

metric_control

FLOAT

특정 세그먼트의 제어 기간에 메트릭의 값 총계입니다.

metric_test

FLOAT

특정 세그먼트의 테스트 기간에 메트릭의 값 총계입니다.

surprise

FLOAT

metric_test 가 여러 기간에 걸친 전체 메트릭 변화를 기준으로 예상되는 값을 초과하는 양입니다.

relative_change

FLOAT

동 기간에 걸친 전체 메트릭과 비교하여 기간에 따라 특정 세그먼트의 메트릭이 변하는 양상을 정량화한 것입니다.

  • 1.0보다 큰 상대적 변화는 이 세그먼트가 여러 기간에 걸쳐 전체 메트릭보다 더 높은 속도로 증가해 성장을 주도했음을 의미합니다.

  • 1.0보다 작은 상대적 변화는 이 세그먼트가 전체 메트릭보다 더 낮은 속도로 증가해 감소를 주도했음을 의미합니다.

growth_rate

FLOAT

모든 세그먼트에 걸쳐 제어 기간에 메트릭 값 총계입니다.

expected_metric_test

FLOAT

overall_metric_controloverall_metric_test 사이의 관계를 기반으로 하는 테스트 기간의 메트릭 예상 값입니다.

overall_metric_control

FLOAT

모든 세그먼트에 걸쳐 제어 기간에 메트릭 값 총계입니다.

overall_metric_test

FLOAT

모든 세그먼트에 걸쳐 테스트 기간에 메트릭 값 총계입니다.

overall_growth_rate

FLOAT

모든 세그먼트에서 제어 기간과 테스트 기간 사이의 성장률로, overall_metric_testoverall_metric_control 로 나눈 값으로 정의됩니다.

new_in_test

BOOLEAN

특정 세그먼트가 테스트 데이터에서 새것인지 여부를 나타냅니다.

missing_in_test

BOOLEAN

특정 세그먼트가 테스트 데이터에서 누락되었는지 여부를 나타냅니다.

사용법 노트

  • 메트릭은 음수가 아니어야 합니다.

  • 입력 데이터는 테스트 또는 제어 데이터로만 제한되어야 합니다.

  • 런타임은 차원의 수와 해당 차원의 카디널리티에 따라 가변적입니다.

  • 범주형 차원의 카디널리티는 카디널리티가 5를 초과하면 자동으로 줄어듭니다.

Contribution Explorer 예시 를 참조하십시오.