カテゴリ：: 集計関数 (Percentile Estimation) , ウィンドウ関数の構文と使用法

APPROX_PERCENTILE_ACCUMULATE¶

集計の終了時にt-Digest状態の内部表現を（ JSON オブジェクトとして）返します。（t-Digestの詳細については、パーセンタイル値の推定をご参照ください）

The function APPROX_PERCENTILE discards this internal, intermediate state when the final percentile estimate is returned. However, in certain advanced use cases, such as estimating incremental percentile during bulk loading, you may wish to keep the intermediate state, in which case you would use APPROX_PERCENTILE_ACCUMULATE instead of APPROX_PERCENTILE.

APPROX_PERCENTILE_ACCUMULATE does not return a percentile value. Instead, it returns the algorithm state itself. The intermediate state can later be:

別々ではあるが関連するデータのバッチからのその他中間状態と結合（つまりマージ）されます。
中間状態で直接動作する他の関数によって処理されます。例: APPROX_PERCENTILE_ESTIMATE （例については、以下の「例」セクションをご参照ください。）
外部ツールにエクスポートされます。

こちらもご参照ください。: APPROX_PERCENTILE_COMBINE、 APPROX_PERCENTILE_ESTIMATE

構文¶

APPROX_PERCENTILE_ACCUMULATE( <expr> )

引数¶

expr: 数値に評価される列名などの、有効な式。

使用上の注意¶

パーセンタイルは数値でのみ機能するため、 expr は数値または数値にキャストできる値を生成する必要があります。

10進浮動小数点（ DECFLOAT ）の値はサポートされていません。

例¶

Store the t-Digest state of the testtable.c1 column in a table and then use the state to compute percentiles:

CREATE OR REPLACE TABLE resultstate AS
  SELECT APPROX_PERCENTILE_ACCUMULATE(c1) AS s
    FROM testtable;

SELECT APPROX_PERCENTILE_ESTIMATE(s, 0.015)
  FROM resultstate;

SELECT APPROX_PERCENTILE_ESTIMATE(s, 0.2)
  FROM resultstate;

Here is a more extensive example that shows the usage of all three related functions: APPROX_PERCENTILE_ACCUMULATE, APPROX_PERCENTILE_ESTIMATE, and APPROX_PERCENTILE_COMBINE.

簡単なテーブルとデータを作成します。

CREATE OR REPLACE TABLE test_table1 (c1 INTEGER);
INSERT INTO test_table1 (c1) VALUES (1), (2), (3), (4);

Create a table that contains the "state" that represents the current approximate percentile information for the table named test_table1:

CREATE OR REPLACE TABLE resultstate1 AS (
  SELECT APPROX_PERCENTILE_ACCUMULATE(c1) AS rs1
    FROM test_table1);

その状態情報を使用して、中央値の現在の推定値を表示します（0.5は、50番目のパーセンタイルの値が必要であることを意味します）。

SELECT APPROX_PERCENTILE_ESTIMATE(rs1, 0.5)
  FROM resultstate1;

+--------------------------------------+
| APPROX_PERCENTILE_ESTIMATE(RS1, 0.5) |
|--------------------------------------|
|                                  2.5 |
+--------------------------------------+

次に、2番目のテーブルを作成してデータを追加します。（より現実的な状況では、ユーザーは最初のテーブルにより多くのデータを読み込み、データが読み込まれた時間に基づいてデータを重複しないセットに分割できます）

CREATE OR REPLACE TABLE test_table2 (c1 INTEGER);
INSERT INTO test_table2 (c1) VALUES (5), (6), (7), (8);

新しいデータのみの「状態」情報を取得します。

CREATE OR REPLACE TABLE resultstate2 AS
  (SELECT APPROX_PERCENTILE_ACCUMULATE(c1) AS rs1
     FROM test_table2);

行の2つのバッチの「状態」情報を結合します。

CREATE OR REPLACE TABLE combined_resultstate (c1) AS
  SELECT APPROX_PERCENTILE_COMBINE(rs1) AS apc1
    FROM (
      SELECT rs1 FROM resultstate1
      UNION ALL
      SELECT rs1 FROM resultstate2
    );

行の結合セットのおおよその中央値を取得します。

SELECT APPROX_PERCENTILE_ESTIMATE(c1, 0.5)
  FROM combined_resultstate;

+-------------------------------------+
| APPROX_PERCENTILE_ESTIMATE(C1, 0.5) |
|-------------------------------------|
|                                 4.5 |
+-------------------------------------+