Kategorien:

Aggregationsfunktionen (Kardinalitätsschätzung), Fensterfunktionen

HLL_COMBINE

Kombiniert mehrere Eingabestatus zu einem einzigen Ausgabestatus (d. h. sie werden zusammengeführt).

Dies erlaubt Szenarien, in denen HLL_ACCUMULATE für horizontale Partitionen derselben Tabelle ausgeführt wird, wodurch für jede Tabellenpartition ein algorithmischer Status erzeugt wird. Anschließend können diese Status mithilfe von HLL_COMBINE zusammengefasst werden, wodurch derselbe Ausgabestatus erzeugt wird wie bei einer einzelnen Ausführung von HLL_ACCUMULATE für die gesamte Tabelle.

Siehe auch:

HLL, HLL_ACCUMULATE, HLL_ESTIMATE

Syntax

HLL_COMBINE([DISTINCT] state)
Copy

Argumente

state

Ein Ausdruck, der Statusinformationen enthält, die durch einen Aufruf von HLL_ACCUMULATE generiert wurden.

Nutzungshinweise

  • DISTINCT wird unterstützt, hat aber keine Auswirkungen.

  • Die Ausgabe dieser Funktion ist nicht vollständig deterministisch. Die Ausführung dieser Funktion auf denselben Eingaben kann zu verschiedenen Zeitpunkten unterschiedliche Ergebnisse liefern. Die Unterschiede sind typischerweise gering und stehen im Einklang mit der Tatsache, dass es sich bei den HLL_*-Funktionen um Approximationsfunktionen handelt.

Beispiele

In diesem Beispiel wird die Verwendung der drei verwandten Funktionen HLL_ACCUMULATE, HLL_ESTIMATE und HLL_COMBINE veranschaulicht.

Erstellen Sie eine einfache Tabelle und Daten:

-- Create a sequence to use to generate values for the table.
CREATE OR REPLACE SEQUENCE seq92;
CREATE OR REPLACE TABLE sequence_demo (c1 INTEGER DEFAULT seq92.nextval, dummy SMALLINT);
INSERT INTO sequence_demo (dummy) VALUES (0);

-- Double the number of rows a few times, until there are 8 rows:
INSERT INTO sequence_demo (dummy) SELECT dummy FROM sequence_demo;
INSERT INTO sequence_demo (dummy) SELECT dummy FROM sequence_demo;
INSERT INTO sequence_demo (dummy) SELECT dummy FROM sequence_demo;
Copy

Erstellen Sie eine Tabelle, die den „Status“ enthält, der die aktuellen approximierten Kardinalitätsinformationen für die Tabelle namens sequence_demo darstellt:

CREATE OR REPLACE TABLE resultstate1 AS (
     SELECT hll_accumulate(c1) AS rs1
        FROM sequence_demo);
Copy

Erstellen Sie nun eine zweite Tabelle, und fügen Sie Daten hinzu. (In einer realistischeren Situation hätte der Benutzer möglicherweise mehr Daten in die erste Tabelle geladen und die Daten anhand der Zeit, zu der die Daten geladen wurden, in nicht überlappende Sätze unterteilt.)

CREATE OR REPLACE TABLE test_table2 (c1 INTEGER);
-- Insert data.
INSERT INTO test_table2 (c1) SELECT c1 + 4 FROM sequence_demo;
Copy

Rufen Sie die „Statusinformationen“ nur für die neuen Daten ab.

CREATE OR REPLACE TABLE resultstate2 AS 
  (SELECT hll_accumulate(c1) AS rs1 
     FROM test_table2);
Copy

Kombinieren Sie die „Statusinformationen“ für die zwei Mengen von Zeilen:

CREATE OR REPLACE TABLE combined_resultstate (c1) AS 
  SELECT hll_combine(rs1) AS apc1
    FROM (
        SELECT rs1 FROM resultstate1
        UNION ALL
        SELECT rs1 FROM resultstate2
      )
      ;
Copy

Ermitteln Sie die approximierte Kardinalität der kombinierten Zeilenmenge:

SELECT hll_estimate(c1) FROM combined_resultstate;
Copy

Ausgabe:

+------------------+
| HLL_ESTIMATE(C1) |
|------------------|
|               12 |
+------------------+
Copy