- Categorias:
Funções de cadeia de caracteres e binários (funções de AI)
AI_COUNT_TOKENS¶
Nota
AI_COUNT_TOKENS é a versão atualizada do COUNT_TOKENS (SNOWFLAKE.CORTEX). Para obter a funcionalidade mais recente, use AI_COUNT_TOKENS.
Retorna o número estimado de tokens em um prompt para o modelo de linguagem grande especificado ou a função específica da tarefa. Para funções que podem receber entradas adicionais que afetam a contagem de tokens, como nome do modelo ou categorias/rótulos, essas entradas também podem ser especificadas.
Sintaxe¶
A sintaxe pode variar de acordo com a função utilizada. Em geral, você passa o nome da função, o nome do modelo, se aplicável, o texto de entrada e quaisquer opções adicionais que afetem a contagem de tokens.
AI_COUNT_TOKENS usa variações de sintaxe específicas para algumas funções. Por exemplo:
Consulte Exemplos para ver padrões de uso específicos da função.
Argumentos¶
Obrigatório:
function_nameCadeia de caracteres contendo o nome da função na qual você deseja basear a contagem de tokens, como
'ai_complete'ou'ai_sentiment'. O nome da função deve começar com «ai_» e usar apenas letras minúsculas.Uma lista completa de funções aceitas está disponível na tabela Disponibilidade regional.
input_textouinput_text_1,input_text_2Insira o texto para contar os tokens.
Opcional:
model_nameCadeia de caracteres contendo o nome do modelo no qual você deseja basear o conteúdo do token. Obrigatório se a função especificada por
function_nameexigir que você escolha o modelo a ser utilizado, como AI_COMPLETE ou AI_EMBED.Uma lista de modelos de LLM disponíveis está na tabela Disponibilidade regional. No entanto, nem todos os modelos são aceitos atualmente. A Snowflake pretende incluir suporte para mais modelos ao longo do tempo.
Para AI_COMPLETE, os seguintes modelos não são aceitos:
claude-4-opus
claude-4-sonnet
claude-3-7-sonnet
claude-3-5-sonnet
openai-gpt-4.1
openai-o4-mini
categoriesUma matriz de valores VARIANT que especifica uma ou mais categorias ou rótulos a serem utilizados, para funções que exigem esses dados. As categorias são incluídas na contagem de tokens de entrada.
optionsVARIANT que especifica opções adicionais que afetam como a função processa a entrada. Para funções que usam duas entradas de texto, como AI_SIMILARITY, as opções são usadas para especificar o modelo.
return_error_detailsUm sinalizador BOOLEAN que indica se os detalhes do erro devem ser retornados em caso de erro. Quando definido como TRUE, a função retorna um OBJECT que contém o valor e a mensagem de erro, sendo um deles NULL dependendo se a função foi bem-sucedida ou falhou. Consulte Comportamento de erro para obter detalhes.
Retornos¶
Um valor INTEGER que é o número de tokens de texto de entrada calculado usando os valores de parâmetro fornecidos.
Comportamento em caso de erro¶
Por padrão, se AI_COUNT_TOKENS não puder processar a entrada, a função retornará NULL. Se a consulta processar várias linhas, as linhas com erros retornarão NULL e não impedirão a conclusão da consulta.
O valor de retorno em caso de erro depende do argumento return_error_details. A tabela a seguir mostra o valor de retorno com base no argumento return_error_details:
return_error_detailsValor de retorno
Descrição
FALSENão passadoNULL
TRUE
OBJECT com campos
valueeerrorvalue: um valor INTEGER que é a contagem de tokens, ou NULL se ocorreu um erro.error: um valor VARCHAR que contém a mensagem de erro se ocorreu um erro ou NULL se a função foi bem-sucedida.
Para obter mais informações sobre o tratamento de erros para funções de AI, consulte Snowflake Cortex AI Function: Multirow error handling improvements.
Notas de uso¶
Embora os nomes das funções sejam normalmente escritos em letras maiúsculas, use apenas letras minúsculas nos nomes de funções e modelos.
COUNT_TOKENS não funciona com funções de LLM no namespace SNOWFLAKE.CORTEX ou com modelos ajustados. Você deve especificar um nome de função que comece com «ai_».
COUNT_TOKENS aceita apenas texto, e não entradas de imagem, áudio ou vídeo.
COUNT_TOKENS incorre apenas em custos de computação e não gera cobranças com base na contagem de tokens.
COUNT_TOKENS está disponível em todas as regiões, mesmo para modelos indisponíveis em uma determinada região.
Exemplos¶
Exemplo de AI_COMPLETE¶
A instrução SQL a seguir conta o número de tokens em um prompt para AI_COMPLETE e o modelo llama3.3-70b:
Resposta:
Exemplo de AI_EMBED¶
A instrução SQL a seguir conta o número de tokens no texto que está sendo incorporado usando a função AI_EMBED e o modelo nv-embed-qa-4':
Resposta:
Exemplos AI_CLASSIFY¶
Este exemplo calcula o número total de tokens de entrada necessários para a classificação de texto com a entrada e os rótulos fornecidos:
Resposta:
O exemplo a seguir adiciona descrições por rótulo e uma descrição geral da tarefa ao exemplo anterior:
Resposta:
O exemplo a seguir se baseia nos dois exemplos anteriores, adicionando exemplos de rótulos:
Resposta:
Exemplos AI_SENTIMENT¶
A instrução SQL a seguir conta o número de tokens no texto que está sendo analisado em busca de sentimento usando a função AI_SENTIMENT:
Resposta:
O exemplo a seguir adiciona rótulos ao exemplo anterior:
Resposta:
Exemplos AI_SIMILARITY¶
A instrução SQL a seguir conta o número de tokens em uma chamada AI_SIMILARITY que usa o modelo padrão.
Resposta:
A seguinte instrução SQL conta o número de tokens em AI_SIMILARITY que usa o modelo e5-base-v2:
Resposta:
Exemplo de AI_TRANSLATE¶
A instrução SQL a seguir conta o número de tokens usados por AI_TRANSLATE ao traduzir texto do inglês para o alemão.
Resposta:
Avisos legais¶
Consulte AI e ML Snowflake.