- Categorias:
Funções de cadeia de caracteres e binários (funções de AI)
AI_COUNT_TOKENS¶
Nota
AI_COUNT_TOKENS é a versão atualizada do COUNT_TOKENS (SNOWFLAKE.CORTEX). Para obter a funcionalidade mais recente, use AI_COUNT_TOKENS.
Retorna o número estimado de tokens em um prompt para o modelo de linguagem grande especificado ou a função específica da tarefa. Para funções que podem receber entradas adicionais que afetam a contagem de tokens, como nome do modelo ou categorias/rótulos, essas entradas também podem ser especificadas.
Sintaxe¶
A sintaxe pode variar de acordo com a função utilizada. Em geral, você passa o nome da função, o nome do modelo, se aplicável, o texto de entrada e quaisquer opções adicionais que afetem a contagem de tokens.
AI_COUNT_TOKENS usa variações de sintaxe específicas para algumas funções. Por exemplo:
Consulte Exemplos para ver padrões de uso específicos da função.
Argumentos¶
Obrigatório:
function_nameCadeia de caracteres contendo o nome da função na qual você deseja basear a contagem de tokens, como
'ai_complete'ou'ai_sentiment'. O nome da função deve começar com «ai_» e usar apenas letras minúsculas.Uma lista completa de funções aceitas está disponível na tabela Disponibilidade regional.
input_textouinput_text_1,input_text_2Insira o texto para contar os tokens.
Opcional:
model_nameCadeia de caracteres contendo o nome do modelo no qual você deseja basear o conteúdo do token. Obrigatório se a função especificada por
function_nameexigir que você escolha o modelo a ser utilizado, como AI_COMPLETE ou AI_EMBED.Uma lista de modelos de LLM disponíveis está na tabela Disponibilidade regional. No entanto, nem todos os modelos são compatíveis atualmente. A Snowflake pretende adicionar suporte para modelos adicionais ao longo do tempo.
Para AI_COMPLETE, os seguintes modelos não são aceitos:
claude-4-opus
claude-4-sonnet
claude-3-7-sonnet
claude-3-5-sonnet
openai-gpt-4.1
openai-o4-mini
categoriesUma matriz de valores VARIANT que especifica uma ou mais categorias ou rótulos a serem utilizados, para funções que exigem esses dados. As categorias são incluídas na contagem de tokens de entrada.
optionsVARIANT que especifica opções adicionais que afetam como a função processa a entrada. Para funções que usam duas entradas de texto, como AI_SIMILARITY, as opções são usadas para especificar o modelo.
Retornos¶
Um valor INTEGER que é o número de tokens de texto de entrada calculado usando os valores de parâmetro fornecidos.
Notas de uso¶
Embora os nomes das funções sejam normalmente escritos em letras maiúsculas, use apenas letras minúsculas nos nomes de funções e modelos.
COUNT_TOKENS não funciona com funções de LLM no namespace SNOWFLAKE.CORTEX ou com modelos ajustados. Você deve especificar um nome de função que comece com «ai_».
COUNT_TOKENS aceita apenas texto, e não entradas de imagem, áudio ou vídeo.
COUNT_TOKENS incorre apenas em custos de computação e não gera cobranças com base na contagem de tokens.
COUNT_TOKENS está disponível em todas as regiões, mesmo para modelos indisponíveis em uma determinada região.
Exemplos¶
Exemplo de AI_COMPLETE¶
A instrução SQL a seguir conta o número de tokens em um prompt para AI_COMPLETE e o modelo llama3.3-70b:
Resposta:
Exemplo de AI_EMBED¶
A instrução SQL a seguir conta o número de tokens no texto que está sendo incorporado usando a função AI_EMBED e o modelo nv-embed-qa-4':
Resposta:
Exemplos AI_CLASSIFY¶
Este exemplo calcula o número total de tokens de entrada necessários para a classificação de texto com a entrada e os rótulos fornecidos:
Resposta:
O exemplo a seguir adiciona descrições por rótulo e uma descrição geral da tarefa ao exemplo anterior:
Resposta:
O exemplo a seguir se baseia nos dois exemplos anteriores, adicionando exemplos de rótulos:
Resposta:
Exemplos AI_SENTIMENT¶
A instrução SQL a seguir conta o número de tokens no texto que está sendo analisado em busca de sentimento usando a função AI_SENTIMENT:
Resposta:
O exemplo a seguir adiciona rótulos ao exemplo anterior:
Resposta:
Exemplos AI_SIMILARITY¶
A instrução SQL a seguir conta o número de tokens em uma chamada AI_SIMILARITY que usa o modelo padrão.
Resposta:
A seguinte instrução SQL conta o número de tokens em AI_SIMILARITY que usa o modelo e5-base-v2:
Resposta:
Exemplo de AI_TRANSLATE¶
A instrução SQL a seguir conta o número de tokens usados por AI_TRANSLATE ao traduzir texto do inglês para o alemão.
Resposta:
Avisos legais¶
Consulte AI e ML Snowflake.