Vektorähnlichkeitsfunktionen

Die Messung der Ähnlichkeit zwischen Vektoren ist eine grundlegende Operation beim semantischen Vergleich. Sie benötigen diese Operation zum Beispiel, um die „Top-N“-Anzahl von Vektoren zu finden, die einem Abfragevektor am nächsten liegen und die für eine semantische Suche verwendet werden können. Mit der Vektorsuche können Entwickler auch die Genauigkeit der Antworten ihrer generativen KI verbessern, indem sie einem großen Sprachmodell verwandte Dokumente zur Verfügung stellen.

Snowflake Cortex bietet drei Vektorähnlichkeitsfunktionen:

  • VECTOR_INNER_PRODUCT

  • VECTOR_L2_DISTANCE

  • VECTOR_COSINE_SIMILARITY

Jede Funktion nimmt zwei VECTOR-Argumente mit gleichem Elementtyp und gleicher Dimension entgegen und berechnet die angegebene Metrik für sie.

Bemerkung

Aufgrund von Berechnungsoptimierungen in diesen Funktionen können Gleitkommafehler etwas größer als üblich sein (z. B. etwa 1e-4).

Liste der Funktionen

Funktionsname

Anmerkungen

Nicht unterstützt von Snowpark-API.