- カテゴリ:
TOP_INSIGHTS (SNOWFLAKE.ML)¶
データセットで最も重要なディメンションを見つけ、それらのディメンションからセグメントを構築し、メトリックに影響を与えたセグメントを検出します。
TOP_INSIGHTS は、ディメンションの数が多いデータセットから根本原因を抽出するのに適しています。連続ディメンションも、カテゴリ別ディメンションに前処理することなくサポートされ、結果は否定的な条件を持つディメンションを示すことができます(例: 「region is not North America」)。
構文¶
SNOWFLAKE.ML.TOP_INSIGHTS(
<categorical_dimensions>, <continuous_dimensions>,
<metric>, <label> )
引数¶
categorical_dimensions
ディメンジョン名と関連するカテゴリ別列との間における1対1のマッピングを含む OBJECT。この値は、単一の列から取得することも、列の単純な組み合わせから取得することもできます。
continuous_dimensions
ディメンジョン名と関連する連続列との間における1対1のマッピングを含む OBJECT。この値は、単一の列から取得することも、列の単純な組み合わせから取得することもできます。連続ディメンションの値は NULL にはできません。
metric
FLOAT 列は、調査中のターゲットメトリックを表します。この値は厳密に負である必要があります。この値は、単一の列から取得することも、列の単純な組み合わせから取得することもできます。
label
制御データとテストデータを識別する BOOLEAN 列。
TRUE
はテストデータを、FALSE
は制御データを表します。この値は、単一の列から取得することも、列の単純な組み合わせから取得することもできます(例: 日付の比較)。
出力¶
この関数は、次の列を返します。
列名 |
データ型 |
説明 |
---|---|---|
|
アルゴリズムからセグメントや洞察を定義する文字列の ARRAY。 例: [
"not country = canada",
"length_of_vertical <= 4.5",
"vertical = finance"
]
|
|
|
特定のセグメントの制御期間にあるメトリックの合計値。 |
|
|
特定のセグメントのテスト期間にあるメトリックの合計値。 |
|
|
全期間にわたる全体的なメトリックの変化に基づき、 |
|
|
特定のセグメントのメトリックが、同じ期間における全体的なメトリックと比較して、期間を通じてどのように変化するかを定量化したもの。
|
|
|
全セグメントを対象とした管理期間におけるメトリックの合計値。 |
|
|
|
|
|
全セグメントを対象とした管理期間におけるメトリックの合計値。 |
|
|
全セグメントにわたるテスト期間のメトリックの合計値。 |
|
|
全セグメントにわたる制御期間とテスト期間の成長率。 |
|
|
特定のセグメントがテストデータ内で新しいかどうかを示します。 |
|
|
特定のセグメントがテストデータで欠落しているかどうかを示します。 |
使用上の注意¶
メトリックは負にはできません。
入力データは、テストデータまたは制御データのみに制限する必要があります。
ランタイムは、ディメンションの数とそれらのディメンションのカーディナリティによって変化します。
カテゴリ別ディメンションのカーディナリティは、カーディナリティが5を超えると自動的に削減されます。
例¶
Contribution Explorerの例 をご参照ください。