Kategorien:

Tabellenfunktionen

TOP_INSIGHTS (SNOWFLAKE.ML)

Findet die wichtigsten Dimensionen in einem Datenset, erstellt Segmente aus diesen Dimensionen und erkennt dann, welche dieser Segmente die Kennzahl beeinflusst haben.

TOP_INSIGHTS ist gut geeignet, um Ursachen aus Datensets mit einer großen Anzahl von Dimensionen zu extrahieren. Kontinuierliche Dimensionen werden ebenfalls unterstützt, ohne dass sie vorher in kategoriale Dimensionen umgewandelt werden müssen, und die Ergebnisse können Dimensionen mit negativen Bedingungen anzeigen (z. B. „Region ist nicht Nordamerika“).

Syntax

SNOWFLAKE.ML.TOP_INSIGHTS(
  <categorical_dimensions>, <continuous_dimensions>,
  <metric>, <label> )
Copy

Argumente

categorical_dimensions

OBJECT mit einer 1:1-Zuordnung zwischen Dimensionsnamen und zugehörigen kategorialen Spalten. Der Wert kann aus einer einzelnen Spalte stammen oder aus einer einfachen Kombination von Spalten abgeleitet sein.

continuous_dimensions

OBJECT mit einer 1:1-Zuordnung zwischen Dimensionsnamen und zugehörigen kontinuierlichen Spalten. Der Wert kann aus einer einzelnen Spalte stammen oder aus einer einfachen Kombination von Spalten abgeleitet sein. Die Werte von kontinuierlichen Dimensionen dürfen nicht NULL sein.

metric

FLOAT-Spalte, die eine Zielmetrik darstellt, die untersucht wird. Dieser Wert muss streng nicht-negativ sein. Der Wert kann aus einer einzelnen Spalte stammen oder aus einer einfachen Kombination von Spalten abgeleitet sein.

label

BOOLEAN -Spalte, die zwischen Kontroll- und Testdaten unterscheidet. TRUE steht für Testdaten und FALSE für Kontrolldaten. Der Wert kann aus einer einzelnen Spalte stammen oder aus einer einfachen Kombination von Spalten abgeleitet sein (z. B. ein Datumsvergleich).

Ausgabe

Die Funktion gibt die folgenden Spalten zurück:

Spaltenname

Datentyp

Beschreibung

contributor

ARRAY

ARRAY von Zeichenfolgen (Strings), die ein Segment oder eine Erkenntnis aus dem Algorithmus definieren.

Beispiel:

[
  "not country = canada",
  "length_of_vertical <= 4.5",
  "vertical = finance"
]
Copy

metric_control

FLOAT

Der Gesamtwert der Kennzahl im Kontrollzeitraum in einem bestimmten Segment.

metric_test

FLOAT

Der Gesamtwert der Kennzahl im Testzeitraum in einem bestimmten Segment.

surprise

FLOAT

Der Betrag, um den metric_test seinen erwarteten Wert auf der Grundlage der Gesamtveränderung der Kennzahl über die Perioden hinweg überschreitet.

relative_change

FLOAT

Eine Quantifizierung, wie sich die Kennzahl im angegebenen Segment im Vergleich zur Gesamtkennzahl in denselben Perioden verändert:

  • Eine relative Veränderung von mehr als 1,0 bedeutet, dass dieses Segment über die Perioden hinweg eine höhere Wachstumsrate als die Gesamtkennzahl aufweist und damit das Wachstum antreibt.

  • Eine relative Veränderung von weniger als 1,0 bedeutet, dass dieses Segment weniger stark gewachsen ist als die Gesamtkennzahl und damit die Abschwächung antreibt.

growth_rate

FLOAT

Der Gesamtwert der Kennzahl im Kontrollzeitraum über alle Segmente hinweg.

expected_metric_test

FLOAT

Der erwartete Wert der Kennzahl im Testzeitraum, basierend auf der Beziehung zwischen overall_metric_control und overall_metric_test.

overall_metric_control

FLOAT

Der Gesamtwert der Kennzahl im Kontrollzeitraum über alle Segmente hinweg.

overall_metric_test

FLOAT

Der Gesamtwert der Kennzahl im Testzeitraum über alle Segmente hinweg.

overall_growth_rate

FLOAT

Die Wachstumsrate zwischen der Kontroll- und der Testperiode über alle Segmente hinweg, definiert als overall_metric_test geteilt durch overall_metric_control.

new_in_test

BOOLEAN

Zeigt an, ob das angegebene Segment neu in den Testdaten ist.

missing_in_test

BOOLEAN

Zeigt an, ob das angegebene Segment in den Testdaten fehlt.

Nutzungshinweise

  • Kennzahlen müssen nicht-negativ sein.

  • Die Eingabedaten müssen sich auf Test- oder Kontrolldaten beschränken.

  • Die Laufzeit hängt von der Anzahl der Dimensionen und der Kardinalität dieser Dimensionen ab.

  • Die Kardinalität kategorialer Dimensionen wird automatisch reduziert, wenn deren Kardinalität 5 überschreitet.

Beispiel

Weitere Informationen finden Sie im Contribution Explorer-Beispiel.