- 카테고리:
집계 함수 (Frequency Estimation) , 윈도우 함수 구문 및 사용법
APPROX_TOP_K_COMBINE¶
입력 상태를 단일 출력 상태로 결합(병합)합니다.
이를 통해, APPROX_TOP_K_ACCUMULATE 가 동일 테이블의 수평 파티션에 대해 실행되어 각 테이블 파티션에 대한 알고리즘 상태를 생성하는 시나리오가 가능해집니다. 이러한 상태는 나중에 APPROX_TOP_K_COMBINE 을 사용하여 결합되어, 전체 테이블에 대해 APPROX_TOP_K_ACCUMULATE 의 단일 실행과 동일한 출력 상태를 생성할 수 있습니다.
구문¶
인자¶
stateAPPROX_TOP_K_ACCUMULATE 호출에 의해 생성된 상태 정보를 포함하는 식입니다.
counters이는 추정 프로세스 동안 한 번에 추적할 수 있는 고유 값의 최대 수입니다. 예를 들어,
counters가 100000으로 설정된 경우, 알고리즘은 100,000개의 고유 값을 추적하여 100,000개의 가장 빈번한 값을 유지하려고 시도합니다.최대
counters수는100000(100,000)입니다.
반환¶
이는 Top K 계산의 “상태”에 대한 정보를 반환합니다.
This state information is not usually useful by itself, but can be passed to the function APPROX_TOP_K_ESTIMATE.
사용법 노트¶
counters가 정의된 경우, 출력 상태는 지정된 카운터 수를 사용합니다.counters가 정의되지 않은 경우, 모든 입력 상태는 동일한 수의 카운터를 가져야 합니다.
10진수 부동 소수점(DECFLOAT) 값은 지원되지 않습니다.
예¶
This example shows how to use the three related functions APPROX_TOP_K_ACCUMULATE, APPROX_TOP_K_ESTIMATE, and APPROX_TOP_K_COMBINE.
참고
이 예에서는 일관된 결과를 얻기 위해 고유한 데이터 값보다 더 많은 카운터를 사용합니다. 실제 애플리케이션에서 고유 값의 수는 일반적으로 카운터 수보다 크므로 근삿값이 다양할 수 있습니다.
이 예에서는 값이 1-8인 행이 8개인 테이블 하나와 값이 5-12인 행이 8개인 두 번째 테이블을 생성합니다. 따라서 두 테이블의 합세트에서 가장 빈번한 값은 각각 개수 2를 갖는 값 5-8입니다.
간단한 테이블과 데이터를 만듭니다.
Create a table that contains the “state” that represents the current
approximate Top K information for the table named sequence_demo:
Now create a second table and add data. (In a more realistic situation, the user could have loaded more data into the first table and divided the data into non-overlapping sets based on the time that the data was loaded.)
새 데이터에 대한 “상태” 정보만 가져옵니다.
행의 두 배치에 대한 “상태” 정보를 결합합니다.
결합된 행 세트의 대략적인 Top K 값을 가져옵니다.