- Catégories :
Fonctions d’agrégation (Percentile Estimation) , Syntaxe et utilisation des fonctions de fenêtre
APPROX_PERCENTILE_ACCUMULATE¶
Renvoie la représentation interne de l’état t-Digest (sous forme d’un objet JSON) à la fin de l’agrégation. (Pour plus d’informations sur t-Digest, voir : Estimation des valeurs centiles.)
The function APPROX_PERCENTILE discards this internal, intermediate state when the final percentile estimate is returned. However, in certain advanced use cases, such as estimating incremental percentile during bulk loading, you may wish to keep the intermediate state, in which case you would use APPROX_PERCENTILE_ACCUMULATE instead of APPROX_PERCENTILE.
APPROX_PERCENTILE_ACCUMULATE does not return a percentile value. Instead, it returns the algorithm state itself. The intermediate state can later be:
Combiné (c’est-à-dire fusionné) avec d’autres états intermédiaires provenant de lots de données distincts mais liés.
Traité par d’autres fonctions qui agissent directement sur l’état intermédiaire, par exemple, APPROX_PERCENTILE_ESTIMATE. (Pour un exemple, voir la section Exemples ci-dessous.)
Exporté vers des outils externes.
- Voir aussi :
Syntaxe¶
Arguments¶
exprUne expression valide, telle qu’un nom de colonne, qui donne une valeur numérique.
Notes sur l’utilisation¶
Le centile ne fonctionne que sur les valeurs numériques. Par conséquent,
exprdoit générer des valeurs numériques ou être convertie en nombres.
Les valeurs décimales à virgule flottante (DECFLOAT) ne sont pas prises en charge.
Exemple¶
Store the t-Digest state of the testtable.c1 column in a table and then use the state to compute percentiles:
Here is a more extensive example that shows the usage of all three related functions: APPROX_PERCENTILE_ACCUMULATE, APPROX_PERCENTILE_ESTIMATE, and APPROX_PERCENTILE_COMBINE.
Créez une table et des données simples :
Create a table that contains the « state » that represents the current
approximate percentile information for the table named test_table1:
Utilisez ces informations d’état pour afficher l’estimation actuelle de la valeur médiane (0,5 signifie que nous voulons la valeur au 50e centile) :
Créez maintenant une deuxième table et ajoutez des données. (Dans une situation plus réaliste, l’utilisateur aurait pu charger plus de données dans la première table et les diviser en ensembles ne se chevauchant pas en fonction de l’heure à laquelle les données ont été chargées.)
Obtenez les informations « d’état » pour les nouvelles données uniquement.
Combiner les informations « d’état » pour les deux lots de lignes :
Obtenir la valeur médiane approximative de l’ensemble des lignes combinées :