Categorias:

Funções de cadeia de caracteres e binários (funções de AI)

COUNT_TOKENS (SNOWFLAKE.CORTEX)

Retorna o número de tokens em um prompt para o modelo de linguagem grande ou a função específica da tarefa definida no argumento. Esta função não é compatível com modelos com ajuste fino.

Nota

Estamos trabalhando em uma estimativa de contagem de tokens mais precisa para funções como ai_classify e ai_filter.

Sintaxe

SNOWFLAKE.CORTEX.COUNT_TOKENS( <model_name> , <input_text> )
Copy

Argumentos

Obrigatório:

model_name

Nome do modelo no qual deseja basear a contagem de token. Especifique um dos seguintes vaores:

  • deepseek-r1

  • e5-base-v2

  • e5-large-v2

  • gemma-7b

  • jamba-1.5-large

  • jamba-1.5-mini

  • jamba-instruct

  • llama2-70b-chat

  • llama3-70b

  • llama3-8b

  • llama3.1-405b

  • llama3.1-70b

  • llama3.1-8b

  • llama3.2-1b

  • llama3.2-3b

  • llama3.3-70b

  • llama4-maverick

  • llama4-scout

  • mistral-7b

  • mistral-large

  • mistral-large2

  • mixtral-8x7b

  • nv-embed-qa-4

  • reka-core

  • reka-flash

  • snowflake-arctic-embed-l-v2.0

  • snowflake-arctic-embed-m-v1.5

  • snowflake-arctic-embed-m

  • snowflake-arctic

  • snowflake-llama-3.1-405b

  • snowflake-llama-3.3-70b

  • voyage-multilingual-2

input_text

Insira o texto para contar os tokens.

Retornos

Retorna um tipo INT , INTEGER , BIGINT , SMALLINT , TINYINT , BYTEINT que é o número de tokens no texto de entrada com base no modelo ou função especificado.

Notas de uso

  • Se um nome de função for especificado, a contagem de token será baseada no modelo usado pela função.

  • Use letras minúsculas nos nomes das funções.

Nota

COUNT_TOKENS não leva em conta o prompt do sistema gerenciado que é adicionado automaticamente ao início do texto de entrada ao usar um Funções AISQL do Cortex. Como resultado, o valor retornado por COUNT_TOKENS é menor do que o número real de tokens processados por essas funções.

Exemplos

O exemplo a seguir retorna a contagem de token para o prompt especificado usando o modelo llama3.1-70b:

SELECT SNOWFLAKE.CORTEX.COUNT_TOKENS( 'llama3.1-70b', 'what is a large language model?' );
Copy
+---+
| 6 |
+---+