- 카테고리:
:doc:`/sql-reference/functions-aggregation`(유사성 추정), :doc:`윈도우 함수 </sql-reference/functions-window-syntax>`(유사성 추정)
MINHASH_COMBINE¶
입력 MinHash 상태를 단일 MinHash 출력 상태로 결합합니다. 그런 다음 이 Minhash 상태는 APPROXIMATE_SIMILARITY 함수에 입력되어, 다른 MinHash 상태와의 유사성을 추정할 수 있습니다.
이를 통해, MINHASH가 동일 테이블의 수평 행 세트에 대해 실행되어 각 행 세트에 대해 MinHash 상태를 생성하는 사용 사례가 가능해집니다. 그런 다음 이러한 상태는 MINHASH_COMBINE 을 사용하여 결합되어, 전체 테이블에 대해 MINHASH 의 단일 실행과 동일한 출력 상태를 생성할 수 있습니다.
MinHash 상태에 대한 자세한 내용은 2개 이상 세트의 유사성 추정하기 를 참조하십시오.
- 참고 항목:
구문¶
집계 함수
윈도우 함수
OVER 절에 대한 자세한 내용은 윈도우 함수 구문 및 사용법 섹션을 참조하세요.
인자¶
stateMINHASH 호출에 의해 생성된 MinHash 상태 정보를 포함하는 식입니다. 입력 MinHash 상태에는 길이가 동일한 배열이 있어야 합니다.
사용법 노트¶
예¶
Here is a more extensive example, showing the three related functions
MINHASH, MINHASH_COMBINE and APPROXIMATE_SIMILARITY. This
example creates 3 tables (ta, tb, and tc), two of which (ta and tb) are
similar, and two of which (ta and tc) are completely dissimilar.
값이 있는 테이블을 만들고 채웁니다.
초기 데이터 세트에 대한 minhash 정보를 계산합니다.
테이블 중 하나에 더 많은 데이터를 추가합니다.
Demonstrate the MINHASH_COMBINE function:
This query shows the approximate similarity of the two similar tables
(ta and tb):
This query shows the approximate similarity of the two very different tables
(ta and tc):