- Kategorien:
Zeichenfolgen- und Binärfunktionen (AI-Funktionen)
AI_COUNT_TOKENS¶
Bemerkung
AI_COUNT_TOKENS ist die aktualisierte Version von COUNT_TOKENS (SNOWFLAKE.CORTEX). Die neueste Funktionalität finden Sie unter AI_COUNT_TOKENS.
Gibt die geschätzte Anzahl der Token in einer Eingabeaufforderung für das angegebene große Sprachmodell (Large Language Model) oder die aufgabenspezifische Funktion zurück. Für Funktionen, die zusätzliche Eingaben benötigen, die sich auf die Anzahl der Token auswirken, wie z. B. Modellname oder Kategorien/Labels, können diese Eingaben ebenfalls angegeben werden.
Syntax¶
Die Syntax kann je nach der verwendeten Funktion variieren. Im Allgemeinen übergeben Sie den Funktionsnamen, ggf. den Modellnamen, den Eingabetext und alle zusätzlichen Optionen, die die Anzahl der Token beeinflussen.
AI_COUNT_TOKENS verwendet für einige Funktionen spezifische Syntaxvarianten. Beispiel:
Siehe Beispiele für funktionsspezifische Nutzungsmuster.
Argumente¶
Benötigt:
FunktionsnameZeichenfolge, die den Namen der Funktion enthält, auf der die Token-Zählung basieren soll, z. B.
'ai_complete'oder'ai_sentiment'. Der Name der Funktion muss mit „ai_“ beginnen und darf nur Kleinbuchstaben enthalten.Eine vollständige Liste der unterstützten Funktionen finden Sie in der Tabelle Regionale Verfügbarkeit.
input_textoderinput_text_1,input_text_2Eingabetext, in dem die Token gezählt werden sollen.
Optional:
model_nameZeichenfolge, die den Namen des Modells enthält, auf dem der Token-Inhalt basieren soll. Erforderlich, wenn die durch
function_nameangegebene Funktion erfordert, dass Sie das zu verwendende Modell auswählen, z. B. AI_COMPLETE oder AI_EMBED.Eine Auflistung der verfügbaren LLM-Modelle sind in der Tabelle Regionale Verfügbarkeit verfügbar. Allerdings werden derzeit nicht alle Modelle unterstützt. Snowflake beabsichtigt, im Laufe der Zeit die Unterstützung für weitere Modelle hinzuzufügen.
Für AI_COMPLETE werden die folgenden Modelle nicht unterstützt:
claude-4-opus
claude-4-sonnet
claude-3-7-sonnet
claude-3-5-sonnet
openai-gpt-4.1
openai-o4-mini
categoriesEin Array von VARIANT-Werten, die eine oder mehrere Kategorien oder Labels angeben, die für Funktionen verwendet werden sollen, die diese Daten erfordern. Kategorien sind in der Token-Zählung für die Eingabe enthalten.
optionsEine VARIANT, die zusätzliche Optionen angibt, die beeinflussen, wie die Funktion die Eingabe verarbeitet. Bei Funktionen, die zwei Texteingaben erfordern, wie z. B. AI_SIMILARITY, werden die Optionen verwendet, um das Modell anzugeben.
return_error_detailsEin BOOLEAN Flag, das angibt, ob im Fehlerfall Fehlerdetails zurückgegeben werden sollen. Wenn sie auf TRUE gesetzt ist, gibt die Funktion ein OBJECT zurück, das den Wert und die Fehlermeldung enthält. Je nachdem, ob die Funktion erfolgreich war oder fehlgeschlagen ist, ist einer dieser beiden NULL. Siehe Fehlerverhalten für Details.
Rückgabewerte¶
Ein Wert des Typs INTEGER, der die Anzahl der Token des Eingabetexts angibt, die unter Verwendung der angegebenen Parameterwerte berechnet werden.
Fehlerverhalten¶
Wenn AI_COUNT_TOKENS die Eingabe nicht verarbeiten kann, gibt die Funktion standardmäßig NULL zurück. Wenn die Abfrage mehrere Zeilen verarbeitet, geben Zeilen mit Fehlern NULL zurück, verhindern aber nicht, dass die Abfrage abgeschlossen wird.
Der Rückgabewert hängt bei einem Fehler vom return_error_details-Argument ab. Die folgende Tabelle zeigt den Rückgabewert in Abhängigkeit von dem return_error_details-Argument:
return_error_detailsRückgabewert
Beschreibung
FALSENicht übergebenNULL
TRUE
OBJECT mit
value- underror-Feldernvalue: Ein INTEGER-Wert, der die Anzahl der Token darstellt, oder NULL, wenn ein Fehler aufgetreten ist.error: Ein VARCHAR -Wert, der bei Auftreten eines Fehlers die Fehlermeldung enthält, oder NULL, wenn die Funktion erfolgreich war.
Weitere Informationen zur Fehlerbehandlung für AI-Funktionen finden Sie unter Snowflake Cortex AI Function: Multirow error handling improvements.
Nutzungshinweise¶
Obwohl Funktionsnamen normalerweise in Großbuchstaben geschrieben werden, verwenden Sie für Funktions- und Modellnamen nur Kleinbuchstaben.
AI_COUNT_TOKENS does not work with LLM functions in the SNOWFLAKE.CORTEX namespace or with fine-tuned models. You must specify a function name that begins with „ai_“.
AI_COUNT_TOKENS accepts only text, not image, audio, or video inputs.
AI_COUNT_TOKENS only incurs compute costs and does not bill based on token count.
AI_COUNT_TOKENS is available in all regions, even for models not available in a given region.
Beispiele¶
AI_COMPLETE-Beispiel¶
Die folgenden SQL-Anweisung zählt die Anzahl der Token in einer Eingabeaufforderung für AI_COMPLETE und das llama3.3-70b-Modell:
Antwort:
AI_EMBED-Beispiel¶
The following SQL statement counts the number of tokens in text being embedded using the AI_EMBED function and the nv-embed-qa-4 model:
Antwort:
AI_CLASSIFY-Beispiele¶
Dieses Beispiel berechnet die Gesamtzahl der Eingabe-Token, die für die Textklassifizierung mit angegebenen Eingaben und Labels erforderlich sind:
Antwort:
Das folgende Beispiel fügt dem vorherigen Beispiel Beschreibungen pro Label und eine allgemeine Aufgabenbeschreibung hinzu:
Antwort:
Das folgende Beispiel baut auf den beiden vorherigen Beispielen auf, indem es Beispiele für Labels hinzufügt:
Antwort:
AI_SENTIMENT-Beispiele¶
Die folgenden SQL-Anweisung zählt die Anzahl der Token im Text, der mithilfe der AI_SENTIMENT-Funktion auf die Stimmung hin analysiert wird:
Antwort:
Das folgende Beispiel fügt dem vorherigen Beispiel Labels hinzu:
Antwort:
AI_SIMILARITY-Beispiele¶
Die folgende SQL-Anweisung zählt die Anzahl der Token in einem AI_SIMILARITY-Aufruf, der das Standardmodell verwendet.
Antwort:
Die folgende SQL-Anweisung zählt die Anzahl der Token in einem AI_SIMILARITY-Aufruf, der das Modell e5-base-v2 verwendet.
Antwort:
AI_TRANSLATE-Beispiel¶
Die folgende SQL-Anweisung zählt die Anzahl der von AI_TRANSLATE bei der Übersetzung von Text vom Englischen ins Deutsche verwendeten Token.
Antwort:
Rechtliche Hinweise¶
Weitere Informationen dazu finden Sie unter KI und ML in Snowflake.