- Kategorien:
Aggregatfunktionen (Frequency Estimation) , Syntax und Verwendung von Fensterfunktionen
APPROX_TOP_K_ESTIMATE¶
Gibt die approximierten häufigsten Werte und ihre geschätzte Häufigkeit für den angegebenen Space-Saving-Status zurück. (Weitere Informationen zum Space-Saving-Überblick finden Sie unter Schätzen häufiger Werte.)
Ein durch APPROX_TOP_K_ACCUMULATE und APPROX_TOP_K_COMBINE erzeugter Space-Saving-Status kann verwendet werden, um mit der Funktion APPROX_TOP_K_ESTIMATE die Kardinalitätsschätzung zu berechnen.
APPROX_TOP_K_ESTIMATE(APPROX_TOP_K_ACCUMULATE(…)) ist somit äquivalent zu APPROX_TOP_K(…).
- Siehe auch:
Syntax¶
Argumente¶
stateEin Ausdruck, der Statusinformationen enthält, die durch einen Aufruf von APPROX_TOP_K_ACCUMULATE oder APPROX_TOP_K_COMBINE generiert wurden.
kAnzahl der Werte, deren Zählwerte approximiert werden sollen. Wenn Sie beispielsweise die 10 häufigsten Werte anzeigen möchten, setzen Sie
kauf 10.Wenn
knicht angegeben wird, lautet der Standardwert1.Der Maximalwert ist
100000(100.000) und wird automatisch reduziert, wenn Elemente nicht in die Ausgabe passen.
Rückgabewerte¶
Gibt einen Wert vom Typ ARRAY zurück.
Nutzungshinweise¶
Werte des Typs „decimal-float“ (DECFLOAT) werden nicht unterstützt.
Beispiele¶
In diesem Beispiel wird die Verwendung der drei verwandten Funktionen APPROX_TOP_K_ACCUMULATE, APPROX_TOP_K_ESTIMATE und APPROX_TOP_K_COMBINE veranschaulicht.
Bemerkung
In diesem Beispiel werden mehr Zähler als unterschiedliche Datenwerte verwendet, um konsistente Ergebnisse zu erhalten. In realen Anwendungen ist die Anzahl der unterschiedlichen Werte in der Regel größer als die Anzahl der Zähler, sodass Sie Näherungswerte erhalten, die variieren können.
In diesem Beispiel wird eine Tabelle mit 8 Zeilen und den Werten 1-8 sowie eine zweite Tabelle mit 8 Zeilen und den Werten 5-12 generiert. Daher sind die häufigsten Werte in der Vereinigung der beiden Tabellen die Werte 5 bis 8, von denen jeder eine Zählwert von 2 hat.
Erstellen Sie eine einfache Tabelle und Daten:
Create a table that contains the „state“ that represents the current
approximate Top K information for the table named sequence_demo:
Erstellen Sie nun eine zweite Tabelle, und fügen Sie Daten hinzu. (In einer realistischeren Situation hätte der Benutzer möglicherweise mehr Daten in die erste Tabelle geladen und die Daten anhand der Zeit, zu der die Daten geladen wurden, in nicht überlappende Sätze unterteilt.)
Rufen Sie die „Statusinformationen“ nur für die neuen Daten ab.
Kombinieren Sie die „Statusinformationen“ für die zwei Mengen von Zeilen:
Ermitteln Sie den approximierten Top K-Wert der kombinierten Zeilenmenge: