- Kategorien:
TOP_INSIGHTS (SNOWFLAKE.ML)¶
Findet die wichtigsten Dimensionen in einem Datenset, erstellt Segmente aus diesen Dimensionen und erkennt dann, welche dieser Segmente die Kennzahl beeinflusst haben.
TOP_INSIGHTS ist gut geeignet, um Ursachen aus Datensets mit einer großen Anzahl von Dimensionen zu extrahieren. Kontinuierliche Dimensionen werden ebenfalls unterstützt, ohne dass sie vorher in kategoriale Dimensionen umgewandelt werden müssen, und die Ergebnisse können Dimensionen mit negativen Bedingungen anzeigen (z. B. „Region ist nicht Nordamerika“).
Syntax¶
SNOWFLAKE.ML.TOP_INSIGHTS(
<categorical_dimensions>, <continuous_dimensions>,
<metric>, <label> )
Argumente¶
categorical_dimensions
OBJECT mit einer 1:1-Zuordnung zwischen Dimensionsnamen und zugehörigen kategorialen Spalten. Der Wert kann aus einer einzelnen Spalte stammen oder aus einer einfachen Kombination von Spalten abgeleitet sein.
continuous_dimensions
OBJECT mit einer 1:1-Zuordnung zwischen Dimensionsnamen und zugehörigen kontinuierlichen Spalten. Der Wert kann aus einer einzelnen Spalte stammen oder aus einer einfachen Kombination von Spalten abgeleitet sein. Die Werte von kontinuierlichen Dimensionen dürfen nicht NULL sein.
metric
FLOAT-Spalte, die eine Zielmetrik darstellt, die untersucht wird. Dieser Wert muss streng nicht-negativ sein. Der Wert kann aus einer einzelnen Spalte stammen oder aus einer einfachen Kombination von Spalten abgeleitet sein.
label
BOOLEAN -Spalte, die zwischen Kontroll- und Testdaten unterscheidet.
TRUE
steht für Testdaten undFALSE
für Kontrolldaten. Der Wert kann aus einer einzelnen Spalte stammen oder aus einer einfachen Kombination von Spalten abgeleitet sein (z. B. ein Datumsvergleich).
Ausgabe¶
Die Funktion gibt die folgenden Spalten zurück:
Spaltenname |
Datentyp |
Beschreibung |
---|---|---|
|
ARRAY von Zeichenfolgen (Strings), die ein Segment oder eine Erkenntnis aus dem Algorithmus definieren. Beispiel: [
"not country = canada",
"length_of_vertical <= 4.5",
"vertical = finance"
]
|
|
|
Der Gesamtwert der Kennzahl im Kontrollzeitraum in einem bestimmten Segment. |
|
|
Der Gesamtwert der Kennzahl im Testzeitraum in einem bestimmten Segment. |
|
|
Der Betrag, um den |
|
|
Eine Quantifizierung, wie sich die Kennzahl im angegebenen Segment im Vergleich zur Gesamtkennzahl in denselben Perioden verändert:
|
|
|
Der Gesamtwert der Kennzahl im Kontrollzeitraum über alle Segmente hinweg. |
|
|
Der erwartete Wert der Kennzahl im Testzeitraum, basierend auf der Beziehung zwischen |
|
|
Der Gesamtwert der Kennzahl im Kontrollzeitraum über alle Segmente hinweg. |
|
|
Der Gesamtwert der Kennzahl im Testzeitraum über alle Segmente hinweg. |
|
|
Die Wachstumsrate zwischen der Kontroll- und der Testperiode über alle Segmente hinweg, definiert als |
|
|
Zeigt an, ob das angegebene Segment neu in den Testdaten ist. |
|
|
Zeigt an, ob das angegebene Segment in den Testdaten fehlt. |
Nutzungshinweise¶
Kennzahlen müssen nicht-negativ sein.
Die Eingabedaten müssen sich auf Test- oder Kontrolldaten beschränken.
Die Laufzeit hängt von der Anzahl der Dimensionen und der Kardinalität dieser Dimensionen ab.
Die Kardinalität kategorialer Dimensionen wird automatisch reduziert, wenn deren Kardinalität 5 überschreitet.
Beispiel¶
Weitere Informationen finden Sie im Contribution Explorer-Beispiel.