- Categorias:
Funções de agregação (Frequency Estimation) , Sintaxe e uso da função de janela
APPROX_TOP_K_ESTIMATE¶
Retorna os valores aproximados mais frequentes e sua frequência estimada para o estado de Space-Saving determinado. (Para obter mais informações sobre o resumo de Space-Saving, consulte Estimativa de valores frequentes).
Um estado de Space-Saving produzido por APPROX_TOP_K_ACCUMULATE e APPROX_TOP_K_COMBINE pode ser usado para calcular uma estimativa de cardinalidade usando a função APPROX_TOP_K_ESTIMATE.
Assim, APPROX_TOP_K_ESTIMATE(APPROX_TOP_K_ACCUMULATE(…)) é equivalente a APPROX_TOP_K(…).
- Consulte também:
APPROX_TOP_K , APPROX_TOP_K_ACCUMULATE , APPROX_TOP_K_COMBINE
Sintaxe¶
Argumentos¶
stateUma expressão que contém informações de estado geradas por uma chamada para APPROX_TOP_K_ACCUMULATE ou APPROX_TOP_K_COMBINE.
kO número de valores cujas contagens você quer aproximadas. Por exemplo, se você quiser ver os 10 valores mais comuns, então defina
kcomo 10.Se
kfor omitido, o padrão é1.O valor máximo é
100000(100.000), e é automaticamente reduzido se os itens não couberem na saída.
Retornos¶
Retorna um valor do tipo ARRAY.
Notas de uso¶
Os valores decimais flutuantes (DECFLOAT) não são compatíveis.
Exemplos¶
Este exemplo mostra como usar as três funções relacionadas APPROX_TOP_K_ACCUMULATE, APPROX_TOP_K_ESTIMATE e APPROX_TOP_K_COMBINE.
Nota
Este exemplo utiliza mais contadores do que valores de dados distintos para obter resultados consistentes. Em aplicações do mundo real, o número de valores distintos é geralmente maior do que o número de contadores, portanto, as aproximações podem variar.
Este exemplo gera uma tabela com 8 linhas que possuem valores 1 - 8, e uma segunda tabela com 8 linhas que têm valores 5 - 12. Assim, os valores mais frequentes na união das duas tabelas são os valores 5-8, cada um deles com uma contagem de 2.
Criar uma tabela e dados simples:
Create a table that contains the «state» that represents the current
approximate Top K information for the table named sequence_demo:
Agora crie uma segunda tabela e adicione dados. (Em uma situação mais realista, o usuário poderia ter carregado mais dados na primeira tabela e dividido os dados em conjuntos não sobrepostos com base no tempo em que os dados foram carregados).
Obtenha as informações de “estado” apenas para os novos dados.
Combine as informações de “estado” para os dois lotes de linhas:
Obtenha o valor aproximado do Top K do conjunto combinado de linhas: