Catégories :: Fonctions de chaîne et fonctions binaires (Fonctions AI)

AI_COUNT_TOKENS¶

Note

AI_COUNT_TOKENS est la version actualisée de COUNT_TOKENS (SNOWFLAKE.CORTEX). Pour obtenir les dernières fonctionnalités, utilisez AI_COUNT_TOKENS.

Renvoie une estimation du nombre de jetons dans une invite pour le grand modèle de langage spécifié ou la fonction spécifique à la tâche spécifiée. Pour les fonctions qui peuvent prendre des entrées supplémentaires qui affectent le nombre de jetons, telles que le nom du modèle ou les catégories/libellés, ces entrées peuvent également être spécifiées.

Syntaxe¶

La syntaxe peut varier selon la fonction utilisée. En général, vous transmettez le nom de la fonction, le nom du modèle le cas échéant, le texte d’entrée et toute option supplémentaire qui affecte le nombre de jetons.

AI_COUNT_TOKENS( <function_name>, <input_text> [, <return_error_details> ] )
AI_COUNT_TOKENS( <function_name>, <model_name>, <input_text> [, <return_error_details> ] )
AI_COUNT_TOKENS( <function_name>, <input_text>, <options> [, <return_error_details> ] )
AI_COUNT_TOKENS( <function_name>, <model_name>, <input_text>, <options> [, <return_error_details> ] )

AI_COUNT_TOKENS utilise des variantes syntaxiques spécifiques pour certaines fonctions. Par exemple :

AI_COUNT_TOKENS( 'ai_similarity', <input_text_1>, <input_text_2>, <options> [, <return_error_details> ] )
AI_COUNT_TOKENS( 'ai_classify', <input_text>, <categories> [, <return_error_details> ] )
AI_COUNT_TOKENS( 'ai_translate', <input_text>, <source_language>, <target_language> [, <return_error_details> ] )

Voir Exemples pour les modèles d’utilisation spécifiques à la fonction.

Arguments¶

Obligatoire :

nom_fonction

Chaîne contenant le nom de la fonction sur laquelle vous souhaitez baser le nombre de jetons, par exemple 'ai_complete' ou 'ai_sentiment'. Le nom de la fonction doit commencer par « ai_ » et utiliser uniquement des lettres minuscules.

Une liste complète des fonctions prises en charge est disponible dans la table Disponibilité régionale.

input_text ou input_text_1 input_text_2

Saisisser du texte pour compter les jetons.

Facultatif :

model_name

Chaîne contenant le nom du modèle sur lequel vous souhaitez baser le contenu du jeton. Requis si la fonction spécifiée par function_name vous oblige à choisir le modèle à utiliser, tel que AI_COMPLETE ou AI_EMBED.

Une liste de modèles LLM sont disponibles dans la table Disponibilité régionale. Cependant, tous les modèles ne sont actuellement pas pris en charge. Snowflake prévoit d’ajouter la prise en charge de modèles supplémentaires au fil du temps.

Pour AI_COMPLETE, les modèles suivants ne sont pas pris en charge :

claude-4-opus
claude-4-sonnet
claude-3-7-sonnet
claude-3-5-sonnet
openai-gpt-4.1
openai-o4-mini

categories

Un tableau de valeurs VARIANT qui spécifient une ou plusieurs catégories ou étiquettes à utiliser, pour les fonctions qui nécessitent ces données. Les catégories sont incluses dans le nombre de jetons d’entrée.

options

Une VARIANT qui spécifie des options supplémentaires qui affectent la manière dont la fonction traite l’entrée. Pour les fonctions qui prennent deux entrées de texte, comme AI_SIMILARITY, les options sont utilisées pour spécifier le modèle.

return_error_details

Un indicateur BOOLEAN qui indique s’il faut renvoyer les détails de l’erreur en cas d’erreur. Lorsqu’il est défini sur TRUE, la fonction renvoie un OBJECT qui contient la valeur et le message d’erreur, dont l’un est NULL selon que la fonction réussit ou échoue. Consultez Comportement d’erreur pour plus de détails.

Renvoie¶

Une valeur INTEGER qui est le nombre de jetons de texte d’entrée calculé à l’aide des valeurs de paramètre données.

Comportement d’erreur¶

Par défaut, si AI_COUNT_TOKENS ne peut pas traiter l’entrée, la fonction renvoie NULL. Si la requête traite plusieurs lignes, les lignes contenant des erreurs renvoient NULL et n’empêchent pas l’achèvement de la requête.

La valeur de retour sur l’erreur dépend de l’argument return_error_details. La table suivante indique la valeur de retour basée sur l’argument return_error_details :

return_error_details

Valeur de retour

Description

FALSE

Non transmise

NULL

TRUE

OBJECT avec les champs value et error

value : Une valeur INTEGER qui correspond au nombre de jetons, ou NULL si une erreur s’est produite.

error : Une valeur VARCHAR qui contient le message d’erreur si une erreur s’est produite, ou NULL si la fonction a fonctionné.

`return_error_details`	Valeur de retour	Description
FALSE Non transmise	NULL
TRUE	OBJECT avec les champs `value` et `error`	`value` : Une valeur INTEGER qui correspond au nombre de jetons, ou NULL si une erreur s’est produite. `error` : Une valeur VARCHAR qui contient le message d’erreur si une erreur s’est produite, ou NULL si la fonction a fonctionné.

Pour plus d’informations sur le traitement des erreurs pour les fonctions AI, consultez Snowflake Cortex AI Function: Multirow error handling improvements.

Notes sur l’utilisation¶

Bien que les noms de fonctions soient généralement écrits en majuscules, utilisez uniquement des minuscules dans les noms de fonctions et de modèles.
AI_COUNT_TOKENS does not work with LLM functions in the SNOWFLAKE.CORTEX namespace or with fine-tuned models. You must specify a function name that begins with « ai_ ».
AI_COUNT_TOKENS accepts only text, not image, audio, or video inputs.
AI_COUNT_TOKENS only incurs compute costs and does not bill based on token count.
AI_COUNT_TOKENS is available in all regions, even for models not available in a given region.

Exemples¶

Exemple AI_COMPLETE¶

L’instruction SQL suivante compte le nombre de jetons dans une invite pour AI_COMPLETE et le modèle llama3.3-70b :

SELECT AI_COUNT_TOKENS('ai_complete', 'llama3.3-70b', 'Summarize the insights from this
call transcript in 20 words: "I finally splurged on these after months of hesitation about
the price, and I\'m mostly impressed. The Nulu fabric really is as buttery-soft as everyone says,
and they\'re incredibly comfortable for yoga and lounging. The high-rise waistband stays put
and doesn\'t dig in, which is rare for me. However, I\'m already seeing some pilling after
just a few wears, and they definitely require gentle care. They\'re also quite delicate -
I snagged them slightly on my gym bag zipper. Great for low-impact activities, but I wouldn\'t
recommend for high-intensity workouts. Worth it for the comfort factor"');

Réponse :

Exemple AI_EMBED¶

The following SQL statement counts the number of tokens in text being embedded using the AI_EMBED function and the nv-embed-qa-4 model:

SELECT AI_COUNT_TOKENS('ai_embed', 'nv-embed-qa-4', '"I finally splurged on these after months
of hesitation about the price, and I\'m mostly impressed. The Nulu fabric really is as buttery-soft
as everyone says, and they\'re incredibly comfortable for yoga and lounging. The high-rise waistband
stays put and doesn\'t dig in, which is rare for me. However, I\'m already seeing some pilling after
just a few wears, and they definitely require gentle care. They\'re also quite delicate - I snagged
them slightly on my gym bag zipper. Great for low-impact activities, but I wouldn\'t recommend for
high-intensity workouts. Worth it for the comfort factor"');

Réponse :

Exemples AI_CLASSIFY¶

Cet exemple calcule le nombre total de jetons d’entrée requis pour la classification de texte avec l’entrée et les étiquettes données :

SELECT AI_COUNT_TOKENS('ai_classify',
  'One day I will see the world and learn to cook my favorite dishes',
  [
      {'label': 'travel'},
      {'label': 'cooking'},
      {'label': 'reading'},
      {'label': 'driving'}
  ]
);

Réponse :

L’exemple suivant ajoute des descriptions par étiquette et une description globale des tâches à l’exemple précédent :

SELECT AI_COUNT_TOKENS('ai_classify',
  'One day I will see the world and learn to cook my favorite dishes',
  [
    {'label': 'travel', 'description': 'content related to traveling'},
    {'label': 'cooking','description': 'content related to food preparation'},
    {'label': 'reading','description': 'content related to reading'},
    {'label': 'driving','description': 'content related to driving a car'}
  ],
  {
    'task_description': 'Determine topics related to the given text'
  }
);

Réponse :

L’exemple suivant s’appuie sur les deux exemples précédents en ajoutant des exemples d’étiquettes :

SELECT AI_COUNT_TOKENS('ai_classify',
  'One day I will see the world and learn to cook my favorite dishes',
  [
    {'label': 'travel', 'description': 'content related to traveling'},
    {'label': 'cooking','description': 'content related to food preparation'},
    {'label': 'reading','description': 'content related to reading'},
    {'label': 'driving','description': 'content related to driving a car'}
  ],
  {
    'task_description': 'Determine topics related to the given text',
    'examples': [
      {
        'input': 'i love traveling with a good book',
        'labels': ['travel', 'reading'],
        'explanation': 'the text mentions traveling and a good book which relates to reading'
      }
    ]
  }
);

Réponse :

Exemples AI_SENTIMENT¶

L’instruction SQL suivante compte le nombre de jetons dans le texte en cours d’analyse pour le sentiment en utilisant la fonction AI_SENTIMENT :

SELECT AI_COUNT_TOKENS('ai_sentiment',
  'This place makes the best truffle pizza in the world! Too bad I cannot afford it');

Réponse :

L’exemple suivant ajoute des étiquettes à l’exemple précédent :

SELECT AI_COUNT_TOKENS('ai_sentiment',
  'This place makes the best truffle pizza in the world! Too bad I cannot afford it',
  [
    {'label': 'positive'},
    {'label': 'negative'},
    {'label': 'neutral'}
  ]
);

Réponse :

Exemples AI_SIMILARITY¶

L’instruction SQL suivante compte le nombre de jetons dans un appel AI_SIMILARITY qui utilise le modèle par défaut.

SELECT AI_COUNT_TOKENS('ai_similarity',
  'The plot is fast and the characters feel real. This book kept me awake all night
  because the mystery is so deep. I love how the author handles the ending. It is a
  great read for anyone who likes suspense.',
  'The story is quick and the people feel true. This novel kept me awake all night
  because the puzzle is so big. I love how the writer handles the finale. It is a
  solid choice for anyone who enjoys suspense.');

Réponse :

L’instruction SQL suivante compte le nombre de jetons dans un appel AI_SIMILARITY qui utilise le modèle e5-base-v2 :

SELECT AI_COUNT_TOKENS('ai_similarity',
  'The plot is fast and the characters feel real. This book kept me awake all night
  because the mystery is so deep. I love how the author handles the ending. It is a
  great read for anyone who likes suspense.',
  'The story is quick and the people feel true. This novel kept me awake all night
  because the puzzle is so big. I love how the writer handles the finale. It is a
  solid choice for anyone who enjoys suspense.', {'model': 'e5-base-v2'});

Réponse :

Exemple AI_TRANSLATE¶

L’instruction SQL suivante compte le nombre de jetons utilisés par AI_TRANSLATE lors de la traduction d’un texte de l’anglais vers l’allemand.

SELECT AI_COUNT_TOKENS('ai_translate',
  'The plot is fast and the characters feel real. This book kept me awake all night
  because the mystery is so deep. I love how the author handles the ending. It is a
  great read for anyone who likes suspense.', 'en', 'de');

Réponse :

Avis juridiques¶

Reportez-vous à Snowflake AI et ML.