Categorias:: Funções de cadeia de caracteres e binários (funções de AI)

AI_COUNT_TOKENS¶

Nota

AI_COUNT_TOKENS é a versão atualizada do COUNT_TOKENS (SNOWFLAKE.CORTEX). Para obter a funcionalidade mais recente, use AI_COUNT_TOKENS.

Retorna o número estimado de tokens em um prompt para o modelo de linguagem grande especificado ou a função específica da tarefa. Para funções que podem receber entradas adicionais que afetam a contagem de tokens, como nome do modelo ou categorias/rótulos, essas entradas também podem ser especificadas.

Sintaxe¶

A sintaxe pode variar de acordo com a função utilizada. Em geral, você passa o nome da função, o nome do modelo, se aplicável, o texto de entrada e quaisquer opções adicionais que afetem a contagem de tokens.

AI_COUNT_TOKENS( <function_name>, <input_text> [, <return_error_details> ] )
AI_COUNT_TOKENS( <function_name>, <model_name>, <input_text> [, <return_error_details> ] )
AI_COUNT_TOKENS( <function_name>, <input_text>, <options> [, <return_error_details> ] )
AI_COUNT_TOKENS( <function_name>, <model_name>, <input_text>, <options> [, <return_error_details> ] )

AI_COUNT_TOKENS usa variações de sintaxe específicas para algumas funções. Por exemplo:

AI_COUNT_TOKENS( 'ai_similarity', <input_text_1>, <input_text_2>, <options> [, <return_error_details> ] )
AI_COUNT_TOKENS( 'ai_classify', <input_text>, <categories> [, <return_error_details> ] )
AI_COUNT_TOKENS( 'ai_translate', <input_text>, <source_language>, <target_language> [, <return_error_details> ] )

Consulte Exemplos para ver padrões de uso específicos da função.

Argumentos¶

Obrigatório:

function_name

Cadeia de caracteres contendo o nome da função na qual você deseja basear a contagem de tokens, como 'ai_complete' ou 'ai_sentiment'. O nome da função deve começar com «ai_» e usar apenas letras minúsculas.

Uma lista completa de funções aceitas está disponível na tabela Disponibilidade regional.

input_text ou input_text_1, input_text_2

Insira o texto para contar os tokens.

Opcional:

model_name

Cadeia de caracteres contendo o nome do modelo no qual você deseja basear o conteúdo do token. Obrigatório se a função especificada por function_name exigir que você escolha o modelo a ser utilizado, como AI_COMPLETE ou AI_EMBED.

Uma lista de modelos de LLM disponíveis está na tabela Disponibilidade regional. No entanto, nem todos os modelos são aceitos atualmente. A Snowflake pretende incluir suporte para mais modelos ao longo do tempo.

Para AI_COMPLETE, os seguintes modelos não são aceitos:

claude-4-opus
claude-4-sonnet
claude-3-7-sonnet
claude-3-5-sonnet
openai-gpt-4.1
openai-o4-mini

categories

Uma matriz de valores VARIANT que especifica uma ou mais categorias ou rótulos a serem utilizados, para funções que exigem esses dados. As categorias são incluídas na contagem de tokens de entrada.

options

VARIANT que especifica opções adicionais que afetam como a função processa a entrada. Para funções que usam duas entradas de texto, como AI_SIMILARITY, as opções são usadas para especificar o modelo.

return_error_details

Um sinalizador BOOLEAN que indica se os detalhes do erro devem ser retornados em caso de erro. Quando definido como TRUE, a função retorna um OBJECT que contém o valor e a mensagem de erro, sendo um deles NULL dependendo se a função foi bem-sucedida ou falhou. Consulte Comportamento de erro para obter detalhes.

Retornos¶

Um valor INTEGER que é o número de tokens de texto de entrada calculado usando os valores de parâmetro fornecidos.

Comportamento em caso de erro¶

Por padrão, se AI_COUNT_TOKENS não puder processar a entrada, a função retornará NULL. Se a consulta processar várias linhas, as linhas com erros retornarão NULL e não impedirão a conclusão da consulta.

O valor de retorno em caso de erro depende do argumento return_error_details. A tabela a seguir mostra o valor de retorno com base no argumento return_error_details:

return_error_details

Valor de retorno

Descrição

FALSE

Não passado

NULL

TRUE

OBJECT com campos value e error

value: um valor INTEGER que é a contagem de tokens, ou NULL se ocorreu um erro.

error: um valor VARCHAR que contém a mensagem de erro se ocorreu um erro ou NULL se a função foi bem-sucedida.

`return_error_details`	Valor de retorno	Descrição
FALSE Não passado	NULL
TRUE	OBJECT com campos `value` e `error`	`value`: um valor INTEGER que é a contagem de tokens, ou NULL se ocorreu um erro. `error`: um valor VARCHAR que contém a mensagem de erro se ocorreu um erro ou NULL se a função foi bem-sucedida.

Para obter mais informações sobre o tratamento de erros para funções de AI, consulte Snowflake Cortex AI Function: Multirow error handling improvements.

Notas de uso¶

Embora os nomes das funções sejam normalmente escritos em letras maiúsculas, use apenas letras minúsculas nos nomes de funções e modelos.
AI_COUNT_TOKENS does not work with LLM functions in the SNOWFLAKE.CORTEX namespace or with fine-tuned models. You must specify a function name that begins with «ai_».
AI_COUNT_TOKENS accepts only text, not image, audio, or video inputs.
AI_COUNT_TOKENS only incurs compute costs and does not bill based on token count.
AI_COUNT_TOKENS is available in all regions, even for models not available in a given region.

Exemplos¶

Exemplo de AI_COMPLETE¶

A instrução SQL a seguir conta o número de tokens em um prompt para AI_COMPLETE e o modelo llama3.3-70b:

SELECT AI_COUNT_TOKENS('ai_complete', 'llama3.3-70b', 'Summarize the insights from this
call transcript in 20 words: "I finally splurged on these after months of hesitation about
the price, and I\'m mostly impressed. The Nulu fabric really is as buttery-soft as everyone says,
and they\'re incredibly comfortable for yoga and lounging. The high-rise waistband stays put
and doesn\'t dig in, which is rare for me. However, I\'m already seeing some pilling after
just a few wears, and they definitely require gentle care. They\'re also quite delicate -
I snagged them slightly on my gym bag zipper. Great for low-impact activities, but I wouldn\'t
recommend for high-intensity workouts. Worth it for the comfort factor"');

Resposta:

Exemplo de AI_EMBED¶

The following SQL statement counts the number of tokens in text being embedded using the AI_EMBED function and the nv-embed-qa-4 model:

SELECT AI_COUNT_TOKENS('ai_embed', 'nv-embed-qa-4', '"I finally splurged on these after months
of hesitation about the price, and I\'m mostly impressed. The Nulu fabric really is as buttery-soft
as everyone says, and they\'re incredibly comfortable for yoga and lounging. The high-rise waistband
stays put and doesn\'t dig in, which is rare for me. However, I\'m already seeing some pilling after
just a few wears, and they definitely require gentle care. They\'re also quite delicate - I snagged
them slightly on my gym bag zipper. Great for low-impact activities, but I wouldn\'t recommend for
high-intensity workouts. Worth it for the comfort factor"');

Resposta:

Exemplos AI_CLASSIFY¶

Este exemplo calcula o número total de tokens de entrada necessários para a classificação de texto com a entrada e os rótulos fornecidos:

SELECT AI_COUNT_TOKENS('ai_classify',
  'One day I will see the world and learn to cook my favorite dishes',
  [
      {'label': 'travel'},
      {'label': 'cooking'},
      {'label': 'reading'},
      {'label': 'driving'}
  ]
);

Resposta:

O exemplo a seguir adiciona descrições por rótulo e uma descrição geral da tarefa ao exemplo anterior:

SELECT AI_COUNT_TOKENS('ai_classify',
  'One day I will see the world and learn to cook my favorite dishes',
  [
    {'label': 'travel', 'description': 'content related to traveling'},
    {'label': 'cooking','description': 'content related to food preparation'},
    {'label': 'reading','description': 'content related to reading'},
    {'label': 'driving','description': 'content related to driving a car'}
  ],
  {
    'task_description': 'Determine topics related to the given text'
  }
);

Resposta:

O exemplo a seguir se baseia nos dois exemplos anteriores, adicionando exemplos de rótulos:

SELECT AI_COUNT_TOKENS('ai_classify',
  'One day I will see the world and learn to cook my favorite dishes',
  [
    {'label': 'travel', 'description': 'content related to traveling'},
    {'label': 'cooking','description': 'content related to food preparation'},
    {'label': 'reading','description': 'content related to reading'},
    {'label': 'driving','description': 'content related to driving a car'}
  ],
  {
    'task_description': 'Determine topics related to the given text',
    'examples': [
      {
        'input': 'i love traveling with a good book',
        'labels': ['travel', 'reading'],
        'explanation': 'the text mentions traveling and a good book which relates to reading'
      }
    ]
  }
);

Resposta:

Exemplos AI_SENTIMENT¶

A instrução SQL a seguir conta o número de tokens no texto que está sendo analisado em busca de sentimento usando a função AI_SENTIMENT:

SELECT AI_COUNT_TOKENS('ai_sentiment',
  'This place makes the best truffle pizza in the world! Too bad I cannot afford it');

Resposta:

O exemplo a seguir adiciona rótulos ao exemplo anterior:

SELECT AI_COUNT_TOKENS('ai_sentiment',
  'This place makes the best truffle pizza in the world! Too bad I cannot afford it',
  [
    {'label': 'positive'},
    {'label': 'negative'},
    {'label': 'neutral'}
  ]
);

Resposta:

Exemplos AI_SIMILARITY¶

A instrução SQL a seguir conta o número de tokens em uma chamada AI_SIMILARITY que usa o modelo padrão.

SELECT AI_COUNT_TOKENS('ai_similarity',
  'The plot is fast and the characters feel real. This book kept me awake all night
  because the mystery is so deep. I love how the author handles the ending. It is a
  great read for anyone who likes suspense.',
  'The story is quick and the people feel true. This novel kept me awake all night
  because the puzzle is so big. I love how the writer handles the finale. It is a
  solid choice for anyone who enjoys suspense.');

Resposta:

A seguinte instrução SQL conta o número de tokens em AI_SIMILARITY que usa o modelo e5-base-v2:

SELECT AI_COUNT_TOKENS('ai_similarity',
  'The plot is fast and the characters feel real. This book kept me awake all night
  because the mystery is so deep. I love how the author handles the ending. It is a
  great read for anyone who likes suspense.',
  'The story is quick and the people feel true. This novel kept me awake all night
  because the puzzle is so big. I love how the writer handles the finale. It is a
  solid choice for anyone who enjoys suspense.', {'model': 'e5-base-v2'});

Resposta:

Exemplo de AI_TRANSLATE¶

A instrução SQL a seguir conta o número de tokens usados por AI_TRANSLATE ao traduzir texto do inglês para o alemão.

SELECT AI_COUNT_TOKENS('ai_translate',
  'The plot is fast and the characters feel real. This book kept me awake all night
  because the mystery is so deep. I love how the author handles the ending. It is a
  great read for anyone who likes suspense.', 'en', 'de');

Resposta:

Avisos legais¶

Consulte AI e ML Snowflake.