Kategorien:

Zeichenfolgen- und Binärfunktionen (Abgleich/Vergleich)

JAROWINKLER_SIMILARITY

Berechnet die Jaro-Winkler-Ähnlichkeit zwischen zwei Eingabezeichenfolgen. Die Funktion gibt eine ganze Zahl zwischen 0 und 100 zurück, wobei 0 für keine Ähnlichkeit und 100 für eine exakte Übereinstimmung steht.

Bemerkung

  • Bei der Ähnlichkeitsberechnung wird die Groß-/Kleinschreibung nicht berücksichtigt.

  • Die Berechnungen sind empfindlich gegenüber allen Formatierungszeichen, einschließlich Leerzeichen.

  • Für die Berechnung wird der standardmäßige Skalierungsfaktor von 0,1 verwendet.

Syntax

JAROWINKLER_SIMILARITY( <string_expr1> , <string_expr2> )
Copy

Argumente

Erforderlich:

string_expr1, . string_expr2

Die Eingabezeichenfolgen.

Nutzungshinweise

  • Wenn die Funktion kurze Zeichenfolgen vergleicht, ist die Ausführungszeit proportional zum Produkt der Länge der Eingabezeichenfolgen.

  • Wenn die Funktion lange Zeichenfolgen vergleicht, ist die Ausführungszeit proportional zur Länge der längeren Zeichenfolge.

Sortierungsdetails

No impact. In languages where the alphabet contains digraphs or trigraphs (such as „Dz“ and „Dzs“ in Hungarian), each character in each digraph and trigraph is treated as an independent character, not as part of a single multi-character letter.

Das Ergebnis basiert ausschließlich auf den Zeichen in den Zeichenfolgen, nicht auf den Sortierungsspezifikationen der Zeichenfolgen.

Beispiele

Im folgenden Beispiel wird die Ähnlichkeit zwischen den Zeichenfolgen in den Spalten s und t der Tabelle ed berechnet.

SELECT s, t, JAROWINKLER_SIMILARITY(s, t), JAROWINKLER_SIMILARITY(t, s) FROM ed;

----------------+-----------------+------------------------------+------------------------------+
      S         |        T        | JAROWINKLER_SIMILARITY(S, T) | JAROWINKLER_SIMILARITY(T, S) |
----------------+-----------------+------------------------------+------------------------------+
                |                 | 0                            | 0                            |
 Gute nacht     | Ich weis nicht  | 56                           | 56                           |
 Ich weiß nicht | Ich wei? nicht  | 98                           | 98                           |
 Ich weiß nicht | Ich weiss nicht | 97                           | 97                           |
 Ich weiß nicht | [NULL]          | [NULL]                       | [NULL]                       |
 Snowflake      | Oracle          | 61                           | 61                           |
 święta         | swieta          | 77                           | 77                           |
 [NULL]         |                 | [NULL]                       | [NULL]                       |
 [NULL]         | [NULL]          | [NULL]                       | [NULL]                       |
----------------+-----------------+------------------------------+------------------------------+
Copy