Catégories :

Fonctions de chaîne et fonctions binaires (Large Language Model)

COUNT_TOKENS (SNOWFLAKE.CORTEX)

Renvoie le nombre de jetons dans une invite pour le grand modèle de langage ou la fonction spécifique à la tâche spécifiée dans l’argument. Cette fonction ne prend pas en charge les modèles affinés :

Syntaxe

SNOWFLAKE.CORTEX.COUNT_TOKENS( <model_name> , <input_text> )

SNOWFLAKE.CORTEX.COUNT_TOKENS( <function_name> , <input_text> )
Copy

Arguments

Obligatoire :

model_name

Nom du modèle sur lequel vous souhaitez baser le nombre de jetons. Spécifie l’une des valeurs suivantes :

  • deepseek-r1

  • e5-base-v2

  • gemma-7b

  • jamba-1.5-large

  • jamba-1.5-mini

  • jamba-instruct

  • llama2-70b-chat

  • llama3-70b

  • llama3-8b

  • llama3.1-405b

  • llama3.1-70b

  • llama3.1-8b

  • llama3.2-1b

  • llama3.2-3b

  • llama3.3-70b

  • llama4-maverick

  • llama4-scout

  • mixtral-8x7b

  • mistral-7b

  • mistral-large

  • mistral-large2

  • nv-embed-qa-4

  • reka-core

  • reka-flash

  • snowflake-arctic

  • snowflake-arctic-embed-m

  • snowflake-arctic-embed-m-v1.5

  • snowflake-llama-3.1-405b

  • snowflake-llama-3.3-70b

  • voyage-multilingual-2

nom_fonction

Spécifie l’une des valeurs suivantes :

  • extract_answer

  • sentiment

  • summarize

  • translate

Notez que les noms de fonctions doivent être en minuscules.

input_text

Saisisser du texte pour compter les jetons.

Renvoie

Renvoie un type INT , INTEGER , BIGINT , SMALLINT , TINYINT , BYTEINT qui est le nombre de jetons dans le texte d’entrée en fonction du modèle ou de la fonction spécifié.

Notes sur l’utilisation

  • Si un nom de fonction est spécifié, le nombre de jetons est basé sur le modèle utilisé par la fonction.

  • Lorsque vous spécifiez un nom de fonction, utilisez des lettres minuscules.

Note

COUNT_TOKENS ne tient pas compte du prompt géré par le système qui est automatiquement ajouté au début du texte d’entrée lors de l’utilisation d’une Fonctions AISQL Cortex. Par conséquent, la valeur retournée par COUNT_TOKENS est inférieure au nombre réel de jetons traités par ces fonctions.

Exemples

Obtenir le nombre de jetons pour l’invite what is a large language model? basé sur le modèle snowflake-arctic :

SELECT SNOWFLAKE.CORTEX.COUNT_TOKENS( 'snowflake-arctic', 'what is a large language model?' );
Copy
+---+
| 6 |
+---+

Obtenir le nombre de jetons pour chacune des invites dans la colonne prompt de mytable sur la base du modèle utilisé pour la fonction SUMMARIZE :

SELECT SNOWFLAKE.CORTEX.COUNT_TOKENS('SUMMARIZE', prompt) FROM mydb.myschema.mytable LIMIT 10;
Copy
+-----------+
| 1 |  1932 |
+-----------+
| 2 |  2379 |
+-----------+
| 3 |  2185 |
+-----------+
| 4 |  1195 |
+-----------+
| 5 |  2908 |
+-----------+
| 6 |  2601 |
+-----------+
| 7 |  2122 |
+-----------+
| 8 |  1720 |
+-----------+
| 9 |  2512 |
+-----------+
| 10 | 1510 |
+-----------+

Obtenir le nombre de jetons pour un texte que vous souhaitez traduire :

SELECT SNOWFLAKE.CORTEX.COUNT_TOKENS('translate', 'Dies ist ein kurzer Text.');
Copy
+---+
| 9 |
+---+