- Catégories :
Fonctions d’agrégation (Frequency Estimation) , Syntaxe et utilisation des fonctions de fenêtre
APPROX_TOP_K_COMBINE¶
Combine (fusionne) les états d’entrée en un seul état de sortie.
Cela permet des scénarios dans lesquels APPROX_TOP_K_ACCUMULATE est exécuté sur des partitions horizontales de la même table, générant un état d’algorithme pour chaque partition de la table. Ces états peuvent ensuite être combinés à l’aide de APPROX_TOP_K_COMBINE, produisant le même état de sortie qu’une seule exécution de APPROX_TOP_K_ACCUMULATE sur la table entière.
- Voir aussi :
Syntaxe¶
Arguments¶
stateExpression contenant des informations d’état générées par un appel à APPROX_TOP_K_ACCUMULATE.
countersIl s’agit du nombre maximal de valeurs distinctes pouvant être suivies simultanément pendant le processus d’estimation. Par exemple, si
countersest défini sur 100000, l’algorithme suit 100 000 valeurs distinctes, en essayant de conserver les 100 000 valeurs les plus fréquentes.Le nombre maximal de
countersest100000(100 000).
Renvoie¶
Ceci renvoie des informations sur « l’état » du calcul « Top K ».
This state information is not usually useful by itself, but can be passed to the function APPROX_TOP_K_ESTIMATE.
Notes sur l’utilisation¶
Si
countersest défini, l’état de la sortie utilise le nombre de compteurs spécifié.Si
countersn’est pas défini, tous les états d’entrée doivent avoir le même nombre de compteurs.
Les valeurs décimales à virgule flottante (DECFLOAT) ne sont pas prises en charge.
Exemples¶
This example shows how to use the three related functions APPROX_TOP_K_ACCUMULATE, APPROX_TOP_K_ESTIMATE, and APPROX_TOP_K_COMBINE.
Note
Cet exemple utilise plus de compteurs que de valeurs de données distinctes afin d’obtenir des résultats cohérents. Dans les applications réelles, le nombre de valeurs distinctes étant généralement plus grand que le nombre de compteurs, les approximations peuvent varier.
Cet exemple génère un tableau de 8 lignes ayant des valeurs de 1 à 8, et un deuxième tableau de 8 lignes ayant des valeurs de 5 à 12. Ainsi, les valeurs les plus fréquentes dans l’union des deux tables sont les valeurs 5-8, où chacune des valeurs a un compte de 2.
Créez une table et des données simples :
Create a table that contains the « state » that represents the current
approximate Top K information for the table named sequence_demo:
Now create a second table and add data. (In a more realistic situation, the user could have loaded more data into the first table and divided the data into non-overlapping sets based on the time that the data was loaded.)
Obtenez les informations « d’état » pour les nouvelles données uniquement.
Combiner les informations « d’état » pour les deux lots de lignes :
Obtenez la valeur Top K approximative de l’ensemble des rangées combinées :