Categorias:

Funções de cadeia de caracteres e binários (Correspondência/Comparação)

JAROWINKLER_SIMILARITY

Calcula a similaridade de Jaro-Winkler entre duas cadeias de caracteres de entrada. A função retorna um número inteiro entre 0 e 100, onde 0 indica nenhuma semelhança e 100 indica uma correspondência exata.

Nota

  • O cálculo da similaridade não diferencia maiúsculas e minúsculas.

  • O cálculo é sensível a todos os caracteres de formatação, incluindo os caracteres do espaço branco.

  • O fator de escalonamento padrão de 0,1 é usado para fins de computação.

Sintaxe

JAROWINKLER_SIMILARITY( <string_expr1> , <string_expr2> )
Copy

Argumentos

Obrigatório:

string_expr1, . string_expr2

As cadeias de caracteres de entrada.

Notas de uso

  • Quando a função compara cadeias de caracteres curtas, o tempo de execução é proporcional ao produto dos comprimentos das cadeias de caracteres de entrada.

  • Quando a função compara cadeias de caracteres longas, o tempo de execução é proporcional ao comprimento da cadeia de caracteres mais longa.

Detalhes do agrupamento

No impact. In languages where the alphabet contains digraphs or trigraphs (such as «Dz» and «Dzs» in Hungarian), each character in each digraph and trigraph is treated as an independent character, not as part of a single multi-character letter.

O resultado se baseia unicamente nos caracteres das cadeias de caracteres, não nas especificações de agrupamento das cadeias de caracteres.

Exemplos

O exemplo seguinte calcula a semelhança entre as cadeias de caracteres nas colunas s e t na tabela ed.

SELECT s, t, JAROWINKLER_SIMILARITY(s, t), JAROWINKLER_SIMILARITY(t, s) FROM ed;

----------------+-----------------+------------------------------+------------------------------+
      S         |        T        | JAROWINKLER_SIMILARITY(S, T) | JAROWINKLER_SIMILARITY(T, S) |
----------------+-----------------+------------------------------+------------------------------+
                |                 | 0                            | 0                            |
 Gute nacht     | Ich weis nicht  | 56                           | 56                           |
 Ich weiß nicht | Ich wei? nicht  | 98                           | 98                           |
 Ich weiß nicht | Ich weiss nicht | 97                           | 97                           |
 Ich weiß nicht | [NULL]          | [NULL]                       | [NULL]                       |
 Snowflake      | Oracle          | 61                           | 61                           |
 święta         | swieta          | 77                           | 77                           |
 [NULL]         |                 | [NULL]                       | [NULL]                       |
 [NULL]         | [NULL]          | [NULL]                       | [NULL]                       |
----------------+-----------------+------------------------------+------------------------------+
Copy