Personalizando a pontuação do Cortex Search¶

Por padrão, as consultas aos Cortex Search Services aproveitam a similaridade vetorial, a correspondência de texto e a reclassificação para determinar a relevância de cada resultado. Você pode personalizar a pontuação dos resultados da pesquisa de várias maneiras:

Aplique aumentos numéricos com base nas colunas de metadados numéricos
Aplique decréscimos de tempo com base nas colunas de metadados de carimbo de data/hora
Desabilite a reclassificação para reduzir a latência da consulta
Modifique os pesos dos componentes para ajustar o peso dos componentes de pontuação individuais (vetor, texto, reclassificação) na classificação geral da pesquisa.
Desabilite o prefixo de consulta para incorporações de vetores em casos de uso avançados.
Modifique os aumentos específicos do índice para ajustar o peso de cada índice em uma pesquisa de vários índices.

Aumentos numéricos e decréscimos de tempo¶

Você pode aumentar ou aplicar decadências nos resultados da pesquisa com base em metadados numéricos ou de carimbo de data/hora. Esse recurso é útil quando você tem metadados estruturados, como sinais de popularidade ou atualidade, para cada resultado que podem ajudar a determinar a relevância dos documentos no momento da consulta. Você pode especificar duas categorias de sinais de classificação ao fazer uma consulta:


Tipo	Descrição	Tipos de coluna aplicáveis	Exemplo de campos de metadados (ilustrativo)
Aumento numérico	Metadados numéricos que aumentam os resultados com mais atenção ou atividade.	Tipo de dados numéricos	`clicks`, `likes`, `comments`
Decréscimo do tempo	Metadados de data ou hora que aumentam os resultados mais recentes. A influência de sinais de recenticidade diminui com o tempo.	Tipo de dados de data e hora	`created_timestamp`, `last_opened_timestamp`, `action_date`

Os metadados de aumento e decréscimo provêm de colunas na tabela de origem das quais um Cortex Search Service é criado. Você especifica as colunas de metadados que serão usadas para aumentar ou diminuir ao fazer a consulta, mas essas colunas devem ser incluídas durante a criação do Cortex Search Service.

Ao consultar um Cortex Search Service, especifique as colunas a serem usadas para aumento ou redução nos campos opcionais numeric_boosts e time_decays no campo scoring_config.functions. Você também pode especificar o peso de cada aumento ou decréscimo.

{
  "scoring_config": {
    "functions": {
      "numeric_boosts": [
        {
          "column": "column_name",
          "weight": 1
        },
        /* ... */
      ],
      "time_decays": [
        {
          "column": "column_name",
          "weight": 1,
          "limit_hours": 120
        },
        /* ... */
      ]
    }
  }
}

Propriedades¶

numeric_boosts (matriz, opcional):
- <numeric_boost_object> (objeto, opcional):
  - column_name (string): especifica a coluna numérica à qual o reforço deve ser aplicado.
  - weight (float): especifica o peso ou a importância atribuída à coluna impulsionada no processo de classificação. Quando várias colunas são especificadas, um peso maior aumenta a influência do campo.
time_decays (matriz, opcional):
- <time_decay_object> (objeto, opcional):
  - column_name (string): especifica a coluna de data ou hora à qual o decréscimo deve ser aplicado.
  - weight (float): especifica o peso ou a importância atribuída à coluna com decréscimo no processo de classificação. Quando várias colunas são especificadas, um peso maior aumenta a influência do campo.
  - limit_hours (float): define o limite após o qual o tempo começa a ter menos efeito sobre a relevância ou a importância do documento. Por exemplo, um valor de 240 em limit_hours indica que os documentos com carimbos de data/hora com mais de 240 horas (10 dias) no passado a partir do carimbo de data/hora now não recebem um aumento significativo, enquanto os documentos com um carimbo de data/hora nas últimas 240 horas devem receber um aumento mais significativo.
  - now (cadeia de caracteres, opcional): carimbo de data/hora de referência opcional a partir do qual os decréscimos são calculados no formato ISO-8601 yyyy-MM-dd'T'HH:mm:ss.SSSXXX. Por exemplo, "2025-02-19T14:30:45.123-08:00". O padrão é o carimbo de data/hora atual, se não for especificado.

Nota

Os aumentos numéricos são aplicados como médias ponderadas aos campos retornados, enquanto os decréscimos utilizam uma função logarítmica suavizada para rebaixar os valores menos recentes.

Os pesos são relativos nos campos de impulso ou decréscimos especificados. Se apenas um único campo for fornecido em uma matriz boosts ou decays, o valor de seu peso será irrelevante.

Se mais de um campo for fornecido, os pesos serão aplicados em relação uns aos outros. Um campo com peso de 10, por exemplo, afeta a classificação do registro duas vezes mais do que um campo com peso de 5.

Reclassificação¶

Por padrão, as consultas ao Cortex Search Services utilizam semantic reranking para melhorar a relevância dos resultados de pesquisa. Embora a reclassificação possa aumentar de forma mensurável a relevância do resultado, ele também pode aumentar visivelmente a latência da consulta. Você pode desativar a reclassificação em qualquer consulta do Cortex Search se descobrir que o benefício de qualidade proporcionado pela reclassificação pode ser sacrificado por velocidades de consulta mais rápidas em seu caso de uso comercial.

Nota

A desativação da reclassificação reduz a latência da consulta em 100 a 300 ms, em média, mas a redução exata da latência, bem como a magnitude da degradação da qualidade, varia de acordo com as cargas de trabalho. Avalie os resultados lado a lado, com e sem reclassificação, antes de decidir desativá-la nas consultas.

Você pode desativar o mecanismo de classificação para uma consulta individual no momento da consulta no campo scoring_config.reranker no seguinte formato:

{
  "scoring_config": {
      "reranker": "none"
  }
}

Propriedades¶

reranker (cadeia de caracteres, opcional): parâmetro que pode ser definido como “none” se o mecanismo de classificação for desativado. Se for excluído ou nulo, será usado o mecanismo de classificação padrão.

Pesos dos componentes¶

O campo weights no objeto scoring_config permite especificar os pesos dos componentes de pontuação individuais (vectors, texts, reranker) na pontuação geral de cada resultado. Por padrão, os pesos são definidos como 1,0 para cada componente, com uma contribuição igual para a pontuação geral.

Você pode especificar pesos no seguinte formato:

{
  "scoring_config": {
    "functions": {
      "weights": {
        "texts": 3,
        "vectors": 2,
        "reranker": 1
      }
    }
  }
}

Nota

Ao usar aumentos específicos do índice com text_boots ou vector_boosts em um serviço de vários índices, a propriedade weights é colocada no nível superior da configuração de pontuação, não como parte do objeto functions:

{
  "scoring_config": {
    "weights": {
      "texts": 3,
      "vectors": 2,
      "reranker": 1
    },
    "functions": {
      // ...
    }
  }
}

Propriedades¶

weights (objeto, opcional): Especifica pesos para combinar texto, vetor e pontuações de reclassificação para cada documento. Os pesos são aplicados uns aos outros dentro deste campo.

Por exemplo, o seguinte especifica que as pontuações de texto devem ser ponderadas 3 vezes mais que as pontuações de vetores, e as pontuações de reclassificação devem ser ponderadas 2 vezes mais que as pontuações de texto:

{
  "scoring_config": {
    "functions": {
      "weights": {
        "texts": 3,
        "vectors": 1,
        "reranker": 2
      }
    }
  }
}

Desabilitando o prefixo de consulta para incorporações de vetores¶

Por padrão, o Cortex Search adiciona um prefixo às consultas antes de computar as incorporações de vetores. Esse prefixo varia de acordo com o modelo, mas geralmente tem o seguinte formato: Represent this sentence for searching relevant passages: query. Isso melhora a qualidade da pesquisa em muitos casos, pois fornece contexto ao modelo de incorporação, o que ajuda a diferenciar as consultas de pesquisa de outros textos que você armazenou no Cortex Search Service.

Entretanto, talvez você queria desabilitar esse prefixo em alguns casos, como no seguinte cenário:

Quando você quer usar a pesquisa de similaridade sem o prefixo. Por exemplo, se você quiser pesquisar «qual é a melhor nuvem de dados» e obter «Snowflake» como resultado, use o prefixo padrão. No entanto, se você quiser pesquisar «qual é a nuvem de dados» e obter «qual é a melhor nuvem de dados» como resultado, você pode desabilitar o prefixo.

Você pode desabilitar o prefixo de consulta para uma consulta individual no momento da consulta usando o parâmetro disable_vector_embedding_query_prefix no campo scoring_config:

{
  "scoring_config": {
    "disable_vector_embedding_query_prefix": true
  }
}

Propriedades¶

disable_vector_embedding_query_prefix (booliano, opcional): quando definido como true, um prefixo de pesquisa não é adicionado automaticamente à consulta antes de computar as incorporações de vetores. O padrão é false.

Nota

Desabilitar o prefixo de consulta pode reduzir a qualidade da pesquisa na maioria dos casos, porque o prefixo ajuda o modelo de incorporação a reconhecer que o texto é uma consulta de pesquisa. Somente o desabilite se tiver um motivo específico para fazer isso e tiver avaliado o impacto nos resultados da pesquisa.

Perfis de pontuação nomeados¶

Os aumentos/decréscimos e as configurações de reclassificação formam uma configuração de pontuação, que pode ser especificada no parâmetro scoring_config ao fazer uma consulta. As configurações de pontuação também podem receber um nome e anexadas ao Cortex Search Service.

O uso de um perfil de pontuação nomeado permite que você use facilmente uma configuração de pontuação em aplicativos e consultas sem precisar especificar a configuração de pontuação completa a cada vez. Se você alterar a configuração de pontuação, só precisará atualizá-la em um lugar, não em todas as consultas.

Para adicionar um perfil de pontuação ao seu Cortex Search Service, use o comando ALTER CORTEX SEARCH SERVICE … ADD SCORING PROFILE, como mostrado no exemplo a seguir:

ALTER CORTEX SEARCH SERVICE my_search_service
  ADD SCORING PROFILE IF NOT EXISTS heavy_comments_with_likes
  '{
    "functions": {
            "numeric_boosts": [
                { "column": "comments", "weight": 6 },
                { "column": "likes", "weight": 1 }
            ]
    }
  }'

A sintaxe da definição do perfil de pontuação é o mesmo esquema usado no parâmetro scoring_config ao fazer uma consulta.

Os perfis de pontuação não podem ser modificados após serem criados; para alterar um perfil, descarte-o e recriá-lo com a nova configuração de pontuação. Para excluir um perfil de pontuação nomeado, use ALTER CORTEX SEARCH SERVICE … DROP SCORING PROFILE.

Para consultar um Cortex Search Service usando um perfil de pontuação nomeado, especifique o nome do perfil no parâmetro scoring_profile ao fazer uma consulta, como mostrado nos exemplos a seguir:

results = svc.search(
    query="technology",
    columns=["comments", "likes"],
    scoring_profile="heavy_comments_with_likes",
    limit=10
)

curl --location https://<account_url>/api/v2/databases/<db_name>/schemas/<schema_name>/cortex-search-services/<service_name>:query \
--header 'Content-Type: application/json' \
--header 'Accept: application/json' \
--header "Authorization: Bearer $PAT" \
--data '{
  "query": "technology",
  "columns": ["DOCUMENT_CONTENTS", "LIKES", "COMMENTS"],
  "scoring_profile": "heavy_comments_with_likes",
  "limit": 10
}'

SELECT SNOWFLAKE.CORTEX.SEARCH_PREVIEW(
  'my_search_service',
  '{
    "query": "technology",
    "columns": ["comments", "likes"],
    "scoring_profile": "heavy_comments_with_likes",
    "limit": 10
  }'
);

Para ver os perfis de pontuação armazenados de um serviço, consulte a exibição CORTEX_SEARCH_SERVICE_SCORING_PROFILES no esquema INFORMATION_SCHEMA, conforme mostrado no exemplo a seguir:

SELECT *
  FROM my_db.INFORMATION_SCHEMA.CORTEX_SEARCH_SERVICE_SCORING_PROFILES
  WHERE service_name = 'my_search_service';

Nota

Os resultados de DESCRIBE CORTEX SEARCH SERVICE e SHOW CORTEX SEARCH SERVICE contêm uma coluna chamada scoring_profile_count que indica o número de perfis de pontuação para cada serviço.

Pontuações dos componentes¶

As pontuações dos componentes fornecem informações detalhadas de pontuação para resultados de pesquisa. Eles permitem que os desenvolvedores entendam como as classificações de pesquisa são determinadas e depurem o desempenho da pesquisa. As pontuações para cada resultado são retornadas no campo @scores para cada “componente” de recuperação (texto, vetor). As pontuações dos componentes são úteis em cenários onde há necessidade de:

Estabelecer limites: use pontuações de componentes para determinar quando passar resultados para um processo downstream, como um agente.
Depurar classificações de pesquisa: entenda por que certos documentos têm uma classificação mais alta do que outros nos resultados de pesquisa.

Como entender as pontuações de componentes¶

As pontuações dos componentes fornecem detalhamentos de como o Cortex Search calcula a pontuação de relevância final para cada resultado de pesquisa. O sistema de pontuação consiste em vários componentes:

** Similaridade de cosseno**: Pontuações baseadas na similaridade semântica entre a consulta e os índices do vetor. Pontuações mais altas indicam correspondências conceituais ou baseadas em significado mais fortes usando incorporações vetoriais.
Correspondência de texto: Pontuações baseadas em similaridade de palavras-chave/lexical entre a consulta e os índices de texto. Pontuações mais altas indicam correspondências de palavras-chave exatas ou difusas mais fortes.
Pontuação do reclassificador: Pontuações baseadas em correspondências com base no significado entre a consulta e o valor no índice de texto. Pontuações mais altas indicam correspondências conceituais ou com base no significado mais fortes usando o reclassificador. As pontuações são fornecidas apenas para os principais resultados que são reclassificados.
Pontuações de função: Informações adicionais detalhadas de pontuação das funções de aumento (boost) quando aplicadas (como text_boosts, vector_boosts, aumentos numéricos, decréscimo do tempo). Contém objetos aninhados para cada tipo de aumento (como text_boost e vector_boost) mostrando as pontuações individuais das colunas, os pesos e os totais ponderados. Útil para entender como as correspondências em diferentes campos contribuem para a pontuação final do documento.

Formato da resposta¶

Com as pontuações de componente ativadas, as informações de pontuação a seguir são retornadas para todas as consultas do Cortex Search. Para obter mais informações sobre a sintaxe do Cortex Search Query, consulte Consulta ao Cortex Search Service.

{
  "results": [
    {
      "@scores": {
        "cosine_similarity": <cosine_similarity_score>,
        "text_match": <text_match_score>
      }
    }
  ]
}

Campos de pontuação¶

@scores.cosine_similarity: Pontuação de similaridade de cosseno entre a consulta e o valor no índice vetorial, no intervalo [-1, 1].
@scores.text_match: Pontuação de correspondência de texto entre a consulta e o valor no índice de texto. Esta pontuação é ilimitada e seu intervalo depende da consulta.
@scores.reranker_score: pontuação do reclassificador entre a consulta e o valor no índice de texto. Esta pontuação é ilimitada e seu intervalo depende da consulta.
@scores.function_scores: objeto aninhado contendo a pontuação detalhada da função de aumento (presente apenas quando functions são especificadas na consulta):
- text_boost.column_scores.column_name.score: pontuação individual para a coluna especificada com base no aumento de texto.
- text_boost.column_scores.column_name.weight: peso aplicado para a coluna especificada com base no aumento de texto.
- text_boost.weighted_score: pontuação final ponderada da função de aumento de texto.
- vector_boost.column_scores.column_name.score: pontuação individual para a coluna especificada com base no aumento vetorial.
- vector_boost.column_scores.column_name.weight: peso aplicado para a coluna especificada com base no aumento vetorial.
- vector_boost.weighted_score: pontuação final ponderada da função de aumento vetorial.
- numeric_boost.column_scores.column_name.score: pontuação individual para a coluna especificada com base no aumento numérico.
- numeric_boost.column_scores.column_name.weight: peso aplicado para a coluna especificada com base no aumento numérico.
- numeric_boost.weighted_score: pontuação final ponderada da função de aumento numérico.
- time_decay.column_scores.column_name.score: pontuação individual para a coluna especificada com base no decréscimo de tempo.
- time_decay.column_scores.column_name.weight: peso aplicado para a coluna especificada com base no decréscimo de tempo.
- time_decay.weighted_score: pontuação final ponderada da função de decréscimo de tempo.

Notas de uso¶

As pontuações de cosine_similarity são:
- Retornadas para qualquer consulta que inclua um VECTOR INDEX.
- Limitadas no intervalo [-1, 1] e comparáveis em diferentes consultas.
- Calculadas considerando vetores normalizados.
- Sujeitas à pequena perda de precisão devido à compactação no índice vetorial, o que significa que cosine_similarity(v, v) pode retornar 1.0 +/- epsilon em vez de exatamente 1.0. Os detalhes da compactação podem variar com o tempo, e o epsilon pode não ser estável.
- Calculadas após prefixar cada consulta com um prefixo que aumenta a qualidade da pesquisa em muitos casos. Esse prefixo varia de acordo com o modelo, mas geralmente se parece com: Represent this sentence for searching relevant passages: {query}. A pontuação de similaridade de cosseno retornada é a similaridade de cosseno entre a consulta com o prefixo e o valor no índice do vetor.
As pontuações de text_match são:
- Retornado para qualquer consulta que inclua um TEXT INDEX. As pontuações de text_match são ilimitadas.
- Não comparável entre diferentes consultas. Por exemplo, uma pontuação de correspondência de texto de 0,95 em um resultado para uma determinada consulta não é comparável a uma pontuação de correspondência de texto de 0,95 em um resultado para uma consulta diferente para o mesmo serviço.
Os valores de @scores não são afetados pelo parâmetro weights. Os pesos afetam apenas a ordenação final dos resultados.

Aumentos específicos do índice¶

Os aumentos específicos do índice ajustam o peso da influência para índices em um Cortex Search Service de vários índices. Você pode ajustar os pesos de correspondência de texto e vetorial, que são aplicados em relação aos outros pesos inseridos. Valores mais altos têm prioridade sobre valores mais baixos, usando o mesmo comportamento que os pesos dos componentes.

Propriedades¶

text_boosts (matriz, opcional): pesos específicos do índice a serem aplicados às colunas de índice de texto. Quando esse valor está presente, é necessário incluir um peso para todas as colunas de texto. Os pesos das colunas são aplicados em relação um ao outro.
vector_boosts (matriz, opcional): pesos específicos do índice a serem aplicados às colunas vetoriais. Quando esse valor está presente, é necessário incluir um peso para todas as colunas vetoriais. Os pesos das colunas são aplicados em relação um ao outro.

Pesos específicos do índice são objetos contendo as chaves column e weight:

{
  "column": "<column name>",
  "weight": <weight>
}

Como exemplo, considere a seguinte tabela indexada para pesquisa:

CREATE TABLE feedback_info (
  id VARCHAR,
  comment VARCHAR,
  support_note VARCHAR,
  sentiment VECTOR(FLOAT, 3),
  issue_category VECTOR(FLOAT, 3)
);

O JSON a seguir mostra uma scoring_config para um Cortex Search Service de vários índices que desclassifica a coluna de texto id, enquanto impulsiona a coluna de texto comment e ajusta as classificações vetoriais de sentiment para serem duas vezes mais importantes que outras colunas vetoriais.

{
  "scoring_config": {
    "functions": {
      "text_boosts": [
        { "column": "id", "weight": 1 },
        { "column": "support_note", "weight": 2},
        { "column": "comment", "weight": 3},
      ],
      "vector_boosts": [
        { "column": "issue_category", "weight": 1 },
        { "column": "sentiment", "weight": 2 }
      ]
    }
  }
}

Diversidade¶

Em alguns casos, um tipo de resultado pode retornar mais resultados do que outros. Para impedir que um determinado tipo de resultado domine os resultados da pesquisa, use o parâmetro diversity.

Por exemplo, se um Cortex Search Service é criado usando documentos longos e esses documentos são indexados por meio da divisão em partes, o parâmetro diversity pode ser usado para garantir que várias partes do mesmo documento não sejam exibidas no conjunto de resultados final.

No momento da consulta, você pode habilitar a diversidade para uma consulta individual no campo scoring_config.diversity no seguinte formato:

{
  "scoring_config": {
    "diversity": {
      "group_by": <array_of_columns_to_group_by>,
      "max_results": <num_results_for_each_group>,
    }
  }
}

Propriedades¶

diversity (objeto, opcional): parâmetro que pode ser definido como «nenhum» se a diversidade de resultados deve ser desativada.
- group_by (matriz): colunas para agrupamento.
- max_results (número inteiro): número máximo de resultados por cada grupo.