- 카테고리:
문자열 및 이진 함수 (AI 함수)
AI_COUNT_TOKENS¶
참고
AI_COUNT_TOKENS 은 COUNT_TOKENS(SNOWFLAKE.CORTEX) 의 업데이트된 버전입니다. 최신 기능의 경우 AI_COUNT_TOKENS 를 사용하십시오.
지정된 대규모 언어 모델 또는 작업별 함수에 대한 프롬프트의 예상 토큰 수를 반환합니다. 모델 이름 또는 카테고리/레이블과 같이 토큰 수에 영향을 미치는 추가 입력을 받을 수 있는 함수의 경우 해당 입력도 지정할 수 있습니다.
구문¶
구문은 사용되는 함수에 따라 다를 수 있습니다. 일반적으로 함수 이름, 해당하는 경우 모델 이름, 입력 텍스트, 토큰 수에 영향을 미치는 추가 옵션을 제공합니다.
AI_COUNT_TOKENS는 일부 함수에 대해 특정 구문 변형을 사용합니다. 예:
함수별 사용량 패턴은 `예제`_를 참조하세요.
인자¶
필수:
function_name토큰 수의 기준으로 삼을 함수의 이름이 포함된 문자열(예:
'ai_complete'또는'ai_sentiment')입니다. 함수의 이름은 “ai_”로 시작해야 하며 소문자만 사용해야 합니다.지원되는 함수의 전체 목록은 리전 가용성 테이블에서 확인할 수 있습니다.
input_text또는input_text_1,input_text_2토큰 수를 계산할 입력 텍스트입니다.
선택 사항:
model_name토큰 내용의 기반이 될 모델의 이름이 포함된 문자열입니다. :samp:`{function_name}`에서 지정한 함수에서 AI_COMPLETE 또는 AI_EMBED 등과 같은, 사용할 모델을 선택해야 하는 경우에 필요합니다.
사용 가능한 LLM 모델 목록은 리전 가용성 테이블에서 확인할 수 있습니다. 그러나 현재 모든 모델이 지원되는 것은 아닙니다. Snowflake는 시간이 지남에 따라 추가 모델에 대한 지원을 추가할 계획입니다.
AI_COMPLETE의 경우 다음 모델은 지원되지 않습니다.
claude-4-opus
claude-4-sonnet
claude-3-7-sonnet
claude-3-5-sonnet
openai-gpt-4.1
openai-o4-mini
categories이 데이터가 필요한 함수에 사용할 하나 이상의 범주 또는 레이블을 지정하는 VARIANT 값의 배열입니다. 카테고리는 입력 토큰 수에 포함됩니다.
options함수가 입력을 처리하는 방법에 영향을 미치는 추가 옵션을 지정하는 VARIANT입니다. AI_SIMILARITY과 같이 두 개의 텍스트 입력을 받는 함수의 경우, 옵션은 모델을 지정하는 데 사용됩니다.
return_error_details오류 발생 시 오류 세부 정보를 반환할지 여부를 나타내는 BOOLEAN 플래그입니다. TRUE로 설정하는 경우 함수는 해당 값 및 오류 메시지가 포함된 OBJECT를 반환하며, 그중 하나는 함수의 성공 여부에 따라 NULL이 됩니다. 자세한 내용은 `오류 동작`_을 참조하세요.
반환¶
입력 텍스트의 토큰 수인 INTEGER 값으로, 주어진 매개 변수 값을 사용하여 계산됩니다.
오류 동작¶
기본적으로 AI_COUNT_TOKENS가 입력을 처리할 수 없는 경우, 함수는 NULL을 반환합니다. 쿼리가 여러 행을 처리하는 경우 오류가 있는 행은 NULL을 반환하며 쿼리가 완료되는 것을 중단하지 않습니다.
오류 시 반환 값은 return_error_details 인자에 따라 다릅니다. 다음 테이블은 return_error_details 인자를 기반으로 한 반환 값을 보여줍니다.
return_error_details반환 값
설명
FALSE성공하지 않음NULL
TRUE
value및error필드를 포함한 OBJECTvalue: 토큰 수인 INTEGER 값이거나 오류가 발생한 경우 NULL입니다.error: 오류가 발생한 경우 오류 메시지가 포함된 VARCHAR 값이거나 함수가 성공한 경우 NULL입니다.
AI 함수의 오류 처리에 대한 자세한 내용은 Snowflake Cortex AI Function: Multirow error handling improvements 섹션을 참조하세요.
사용법 노트¶
함수 이름은 일반적으로 모두 대문자로 작성되지만, 함수 및 모델 이름에는 소문자만 사용합니다.
AI_COUNT_TOKENS does not work with LLM functions in the SNOWFLAKE.CORTEX namespace or with fine-tuned models. You must specify a function name that begins with “ai_”.
AI_COUNT_TOKENS accepts only text, not image, audio, or video inputs.
AI_COUNT_TOKENS only incurs compute costs and does not bill based on token count.
AI_COUNT_TOKENS is available in all regions, even for models not available in a given region.
예¶
AI_COMPLETE 예제¶
다음 SQL 문은 AI_COMPLETE 및 llama3.3-70b 모델에 대한 프롬프트의 토큰 수를 계산합니다.
응답:
AI_EMBED 예제¶
The following SQL statement counts the number of tokens in text being embedded using the AI_EMBED function and the nv-embed-qa-4 model:
응답:
AI_CLASSIFY 예¶
이 예에서는 주어진 입력 및 레이블을 사용하여 텍스트 분류에 필요한 총 입력 토큰 수를 계산합니다.
응답:
이전 예에 레이블별 설명과 전체 작업 설명을 추가한 예는 다음과 같습니다.
응답:
다음 예는 앞선 두 예를 바탕으로 레이블 예를 추가한 것입니다.
응답:
AI_SENTIMENT 예¶
다음 SQL 문은 AI_SENTIMENT 함수를 사용하여 감정을 분석하는 텍스트의 토큰 수를 계산합니다.
응답:
다음 예는 이전 예에 레이블을 추가한 것입니다.
응답:
AI_SIMILARITY 예¶
다음 SQL 문은 기본 모델을 사용하는 AI_SIMILARITY 호출의 토큰 수를 계산합니다.
응답:
다음 SQL 문은 e5-base-v2 모델을 사용하는 AI_SIMILARITY의 토큰 수를 계산합니다.
응답:
AI_TRANSLATE 예제¶
다음 SQL 문은 텍스트를 영어에서 독일어로 번역할 때 AI_TRANSLATE에서 사용하는 토큰 수를 계산합니다.
응답:
법적 고지¶
Snowflake AI 및 ML 섹션을 참조하십시오.