Fonctions de similarité vectorielle

La mesure de la similarité entre des vecteurs est une opération fondamentale de la comparaison sémantique. Par exemple, vous avez besoin de cette opération pour trouver les N premiers vecteurs les plus proches d’un vecteur de requête, à utiliser pour une recherche sémantique. La recherche vectorielle permet également aux développeurs d’améliorer la précision de leurs réponses d’AI générative en fournissant des documents associés à un grand modèle de langage.

Snowflake Cortex fournit trois fonctions de similarité vectorielle :

  • VECTOR_INNER_PRODUCT

  • VECTOR_L2_DISTANCE

  • VECTOR_COSINE_SIMILARITY

Chaque fonction prend deux arguments VECTOR de même type d’élément et de même dimension et calcule la métrique spécifiée sur eux.

Note

En raison des optimisations de calcul de ces fonctions, les erreurs en virgule flottante peuvent être légèrement plus importantes que d’habitude (par exemple, environ 1e-4).

Liste de fonctions

Nom de la fonction

Remarques

Non pris en charge dans l’API Snowpark.