Funções de similaridade vetorial

A medição de similaridade entre vetores é uma operação fundamental na comparação semântica. Por exemplo, você precisa dessa operação para encontrar o número N de vetores mais próximos de um vetor de consulta, que pode ser usado para uma pesquisa semântica. A pesquisa vetorial também permite que os desenvolvedores melhorem a precisão de suas pesquisas generativas. A AI responde fornecendo documentos relacionados a um large language model.

O Snowflake Cortex fornece três funções de similaridade vetorial:

  • VECTOR_INNER_PRODUCT

  • VECTOR_L2_DISTANCE

  • VECTOR_COSINE_SIMILARITY

Cada função precisa de dois argumentos VECTOR de tipo de elemento e dimensão iguais e calcula a métrica especificada sobre eles.

Nota

Devido a otimizações computacionais nessas funções, os erros de ponto flutuante podem ser um pouco maiores que o normal (por exemplo, cerca de 1e-4).

Lista de funções

Nome da função

Notas

Não compatível na API do Snowpark.