카테고리:

문자열 및 이진 함수 (AI 함수)

COUNT_TOKENS(SNOWFLAKE.CORTEX)

인자에 지정된 대규모 언어 모델이나 작업별 함수에 대한 프롬프트에 있는 토큰 수를 반환합니다. 이 함수는 미세 조정된 모델을 지원하지 않습니다.

참고

ai_classify 및 ai_filter와 같은 함수에 대해 더 정확한 토큰 수를 추정하기 위해 노력하고 있습니다.

구문

SNOWFLAKE.CORTEX.COUNT_TOKENS( <model_name> , <input_text> )
Copy

인자

필수:

model_name

토큰 수를 계산할 때 기준으로 사용할 모델의 이름입니다. 다음 값 중 하나를 지정합니다.

  • deepseek-r1

  • e5-base-v2

  • e5-large-v2

  • gemma-7b

  • jamba-1.5-large

  • jamba-1.5-mini

  • jamba-instruct

  • llama2-70b-chat

  • llama3-70b

  • llama3-8b

  • llama3.1-405b

  • llama3.1-70b

  • llama3.1-8b

  • llama3.2-1b

  • llama3.2-3b

  • llama3.3-70b

  • llama4-maverick

  • llama4-scout

  • mistral-7b

  • mistral-large

  • mistral-large2

  • mixtral-8x7b

  • nv-embed-qa-4

  • reka-core

  • reka-flash

  • snowflake-arctic-embed-l-v2.0

  • snowflake-arctic-embed-m-v1.5

  • snowflake-arctic-embed-m

  • snowflake-arctic

  • snowflake-llama-3.1-405b

  • snowflake-llama-3.3-70b

  • voyage-multilingual-2

input_text

토큰 수를 계산할 입력 텍스트입니다.

반환

지정된 모델이나 함수를 기반으로 입력 텍스트의 토큰 수인 INT , INTEGER , BIGINT , SMALLINT , TINYINT , BYTEINT 타입을 반환합니다.

사용법 노트

  • 함수 이름이 지정된 경우 토큰 수는 함수에서 사용하는 모델을 기반으로 합니다.

  • 함수 이름에 소문자를 사용합니다.

참고

COUNT_TOKENS 는 Cortex AISQL 함수 를 사용할 때 입력 텍스트의 시작 부분에 자동으로 추가되는 관리되는 시스템 프롬프트를 고려하지 않습니다. 결과적으로 COUNT_TOKENS 에서 반환되는 값은 이러한 함수가 처리한 실제 토큰 수보다 낮습니다.

다음 예제에서는 llama3.1-70b 모델을 사용하여 지정된 프롬프트에 대한 토큰 수를 반환합니다.

SELECT SNOWFLAKE.CORTEX.COUNT_TOKENS( 'llama3.1-70b', 'what is a large language model?' );
Copy
+---+
| 6 |
+---+