カテゴリ:

テーブル関数

TOP_INSIGHTS

完全修飾名: SNOWFLAKE.ML.TOP_INSIGHTS

データセットで最も重要なディメンションを見つけ、それらのディメンションからセグメントを構築し、メトリックに影響を与えたセグメントを検出します。

TOP_INSIGHTS は、ディメンションの数が多いデータセットから根本原因を抽出するのに適しています。連続ディメンションも、カテゴリ別ディメンションに前処理することなくサポートされ、結果は否定的な条件を持つディメンションを示すことができます(例: 「region is not North America」)。

構文

SNOWFLAKE.ML.TOP_INSIGHTS(
  <categorical_dimensions>, <continuous_dimensions>,
  <metric>, <label> )
Copy

引数

categorical_dimensions

ディメンジョン名と関連するカテゴリ別列との間における1対1のマッピングを含む OBJECT。この値は、単一の列から取得することも、列の単純な組み合わせから取得することもできます。

continuous_dimensions

ディメンジョン名と関連する連続列との間における1対1のマッピングを含む OBJECT。この値は、単一の列から取得することも、列の単純な組み合わせから取得することもできます。連続ディメンションの値は NULL にはできません。

metric

FLOAT 列は、調査中のターゲットメトリックを表します。この値は厳密に負である必要があります。この値は、単一の列から取得することも、列の単純な組み合わせから取得することもできます。

label

制御データとテストデータを識別する BOOLEAN 列。 TRUE はテストデータを、 FALSE は制御データを表します。この値は、単一の列から取得することも、列の単純な組み合わせから取得することもできます(例: 日付の比較)。

出力

この関数は、次の列を返します。

列名

データ型

説明

contributor

ARRAY

アルゴリズムからセグメントや洞察を定義する文字列の ARRAY。

例:

[
  "not country = canada",
  "length_of_vertical <= 4.5",
  "vertical = finance"
]
Copy

metric_control

FLOAT

特定のセグメントの制御期間にあるメトリックの合計値。

metric_test

FLOAT

特定のセグメントのテスト期間にあるメトリックの合計値。

surprise

FLOAT

全期間にわたる全体的なメトリックの変化に基づき、 metric_test がその期待値を上回った量。

relative_change

FLOAT

特定のセグメントのメトリックが、同じ期間における全体的なメトリックと比較して、期間を通じてどのように変化するかを定量化したもの。

  • 相対変化率が1.0より高いということは、このセグメントが期間を通じて全体的なメトリックより高い成長率で成長し、成長を牽引していることを意味します。

  • 相対変化率が1.0より小さいということは、このセグメントの成長率が全体的なメトリックより低く、減少を牽引していることを意味します。

growth_rate

FLOAT

全セグメントを対象とした管理期間におけるメトリックの合計値。

expected_metric_test

FLOAT

overall_metric_controloverall_metric_test の関係に基づく、テスト期間のメトリックの期待値。

overall_metric_control

FLOAT

全セグメントを対象とした管理期間におけるメトリックの合計値。

overall_metric_test

FLOAT

全セグメントにわたるテスト期間のメトリックの合計値。

overall_growth_rate

FLOAT

全セグメントにわたる制御期間とテスト期間の成長率。 overall_metric_testoverall_metric_control で割った値で定義されます。

new_in_test

BOOLEAN

特定のセグメントがテストデータ内で新しいかどうかを示します。

missing_in_test

BOOLEAN

特定のセグメントがテストデータで欠落しているかどうかを示します。

使用上の注意

  • メトリックは負にはできません。

  • 入力データは、テストデータまたは制御データのみに制限する必要があります。

  • ランタイムは、ディメンションの数とそれらのディメンションのカーディナリティによって変化します。

  • カテゴリ別ディメンションのカーディナリティは、カーディナリティが5を超えると自動的に削減されます。

Contribution Explorerの例 をご参照ください。