- Kategorien:
Zeichenfolgen- und Binärfunktionen (Abgleich/Vergleich)
JAROWINKLER_SIMILARITY¶
Berechnet die Jaro-Winkler-Ähnlichkeit zwischen zwei Eingabezeichenfolgen. Die Funktion gibt eine ganze Zahl zwischen 0 und 100 zurück, wobei 0 für keine Ähnlichkeit und 100 für eine exakte Übereinstimmung steht.
Bemerkung
Bei der Ähnlichkeitsberechnung wird die Groß-/Kleinschreibung nicht berücksichtigt.
Die Berechnungen sind empfindlich gegenüber allen Formatierungszeichen, einschließlich Leerzeichen.
Für die Berechnung wird der standardmäßige Skalierungsfaktor von 0,1 verwendet.
Syntax¶
JAROWINKLER_SIMILARITY( <string_expr1> , <string_expr2> )
Argumente¶
Erforderlich:
string_expr1
, .string_expr2
Die Eingabezeichenfolgen.
Nutzungshinweise¶
Wenn die Funktion kurze Zeichenfolgen vergleicht, ist die Ausführungszeit proportional zum Produkt der Länge der Eingabezeichenfolgen.
Wenn die Funktion lange Zeichenfolgen vergleicht, ist die Ausführungszeit proportional zur Länge der längeren Zeichenfolge.
Sortierungsdetails¶
No impact. In languages where the alphabet contains digraphs or trigraphs (such as „Dz“ and „Dzs“ in Hungarian), each character in each digraph and trigraph is treated as an independent character, not as part of a single multi-character letter.
Das Ergebnis basiert ausschließlich auf den Zeichen in den Zeichenfolgen, nicht auf den Sortierungsspezifikationen der Zeichenfolgen.
Beispiele¶
Im folgenden Beispiel wird die Ähnlichkeit zwischen den Zeichenfolgen in den Spalten s
und t
der Tabelle ed
berechnet.
SELECT s, t, JAROWINKLER_SIMILARITY(s, t), JAROWINKLER_SIMILARITY(t, s) FROM ed;
----------------+-----------------+------------------------------+------------------------------+
S | T | JAROWINKLER_SIMILARITY(S, T) | JAROWINKLER_SIMILARITY(T, S) |
----------------+-----------------+------------------------------+------------------------------+
| | 0 | 0 |
Gute nacht | Ich weis nicht | 56 | 56 |
Ich weiß nicht | Ich wei? nicht | 98 | 98 |
Ich weiß nicht | Ich weiss nicht | 97 | 97 |
Ich weiß nicht | [NULL] | [NULL] | [NULL] |
Snowflake | Oracle | 61 | 61 |
święta | swieta | 77 | 77 |
[NULL] | | [NULL] | [NULL] |
[NULL] | [NULL] | [NULL] | [NULL] |
----------------+-----------------+------------------------------+------------------------------+