카테고리:: 파일 함수 (AI 함수)

AI_TRANSCRIBE¶

선택적 타임스탬프 및 화자 레이블을 사용하여 오디오 또는 비디오 파일의 텍스트를 기록합니다. AI_TRANSCRIBE는 :ref:`다양한 언어<label-cortex_ai_audio_supported_languages>`를 지원하며, 오디오에는 둘 이상의 언어가 포함될 수 있습니다. 타임스탬프와 화자 레이블은 아래 테이블과 같이 지정된 타임스탬프 세분성을 기준으로 추출됩니다.


타임스탬프 세분성	결과
기본값	전체 오디오 파일의 대화 기록을 하나로 생성
단어	각 단어의 타임스탬프를 포함한 대화 기록
화자	화자 변경 시마다 화자와 타임스탬프 표시

구문¶

AI_TRANSCRIBE( <audio_file> [ , <options> ] [, <return_error_details> ] )

인자¶

필수:

audio_file: 오디오 파일을 나타내는 FILE 타입 오브젝트입니다. TO_FILE 함수 를 사용하여 스테이징된 파일에 대한 참조를 만듭니다.

선택 사항:

options

다음 필드 중 0개 이상을 포함하는 OBJECT 값 입니다.

timestamp_granularity: 원하는 타임스탬프 세분성을 지정하는 문자열입니다. 가능한 값은 다음과 같습니다.
- "word": 파일은 각각 고유한 타임스탬프가 있는 일련의 단어로 기록됩니다.
- "speaker": 파일은 일련의 대화 “차례”로 기록되며, 각 차례에는 고유한 타임스탬프와 화자 레이블이 있습니다.
이 필드를 지정하지 않으면 기본적으로 전체 파일이 타임스탬프 없이 단일 세그먼트로 기록됩니다.

return_error_details

오류 발생 시 오류 세부 정보를 반환할지 여부를 나타내는 BOOLEAN 플래그입니다. TRUE로 설정하는 경우 함수는 해당 값 및 오류 메시지가 포함된 OBJECT를 반환하며, 그중 하나는 함수의 성공 여부에 따라 NULL이 됩니다. 자세한 내용은 `오류 동작`_을 참조하세요.

반환¶

대화 기록 결과의 JSON 표현을 포함하는 문자열입니다. JSON 오브젝트에 포함된 필드는 다음과 같습니다.

"audio_duration": 오디오 파일의 총 지속 시간(초)입니다.
"text": timestamp_granularity 필드가 지정되지 않은 경우에 제공되는 전체 오디오 파일의 대화 기록입니다.
"segments": timestamp_granularity 필드가 "word" 또는 "speaker" 로 설정된 경우에 제공되는 세그먼트의 배열입니다. 각 세그먼트는 다음 필드를 포함하는 JSON 오브젝트입니다.
- "start": 세그먼트의 시작 시간(초)입니다.
- "end": 세그먼트의 종료 시간(초)입니다.
- "text": 세그먼트의 대화 기록 텍스트입니다.
- "speaker_label": timestamp_granularity 필드가 speaker 로 설정될 때 제공되는 세그먼트에 대한 화자의 레이블입니다. 레이블은 “SPEAKER_00”, “SPEAKER_01” 등의 형식이며 오디오 파일에서는 화자가 감지된 순서대로 할당됩니다.

오류 동작¶

기본적으로 AI_TRANSCRIBE가 입력을 처리할 수 없는 경우, 함수는 NULL을 반환합니다. 쿼리가 여러 행을 처리하는 경우 오류가 있는 행은 NULL을 반환하며 쿼리가 완료되는 것을 중단하지 않습니다.

오류 시 반환 값은 return_error_details 인자에 따라 다릅니다. 다음 테이블은 return_error_details 인자를 기반으로 한 반환 값을 보여줍니다.

return_error_details

반환 값

설명

FALSE

성공하지 않음

NULL

TRUE

value 및 error 필드를 포함한 OBJECT

value: 전사 결과가 포함된 VARCHAR 값이거나 오류가 발생한 경우 NULL입니다.

error: 오류가 발생한 경우 오류 메시지가 포함된 VARCHAR 값이거나 함수가 성공한 경우 NULL입니다.

`return_error_details`	반환 값	설명
FALSE 성공하지 않음	NULL
TRUE	`value` 및 `error` 필드를 포함한 OBJECT	`value`: 전사 결과가 포함된 VARCHAR 값이거나 오류가 발생한 경우 NULL입니다. `error`: 오류가 발생한 경우 오류 메시지가 포함된 VARCHAR 값이거나 함수가 성공한 경우 NULL입니다.

AI 함수의 오류 처리에 대한 자세한 내용은 Snowflake Cortex AI Function: Multirow error handling improvements 섹션을 참조하세요.

액세스 제어 요구 사항¶

사용자는 SNOWFLAKE.CORTEX_USER 데이터베이스 역할 이 부여된 역할을 사용해야 합니다. 이 역할에 대한 자세한 내용은 Cortex LLM 권한 섹션을 참조하세요.

사용법 노트¶

지원되는 언어 목록은 :ref:`지원되는 언어 <label-cortex_ai_audio_supported_languages>`를 참조하세요.

지원되는 언어는 자동으로 감지됩니다. 파일에는 여러 언어가 포함될 수 있으며, 각 언어는 인식되고 기록됩니다. 정확한 언어 감지를 위해 음성은 파일의 처음 5초 이내에 시작되어야 합니다.
AI_TRANSCRIBE는 다음과 같은 오디오 및 비디오 파일 형식을 지원합니다.

오디오

FLAC, MP3, MP4, OGG, WAV, WEBM

동영상

MKV, MP4, OGV, WEBM

비디오 파일에는 FLAC, MP3, OPUS, VORBIS 또는 WAV 형식으로 하나 이상의 오디오 트랙이 포함되어야 합니다.

샘플 속도, 비트 심도, 채널 수와 같은 요소는 전사에 영향을 주지 않지만, 너무 높으면 파일이 너무 커서 처리할 수 없습니다. 내부적으로, AI_TRANSCRIBE는 16KHz에서 모노포닉 오디오를 사용하며 입력 파일이 아직 이 형식이 아닌 경우 입력 파일을 리샘플링합니다.
최대 오디오 파일 크기는 700MB입니다.
타임스탬프 세분성이 “단어” 또는 “화자”로 설정된 경우 최대 오디오 파일 길이는 60분입니다. 타임스탬프 세분성을 사용하지 않는 경우 최대 기간은 120분입니다.

오디오	FLAC, MP3, MP4, OGG, WAV, WEBM
동영상	MKV, MP4, OGV, WEBM

예¶

예제에 대해서는 AI오디오 예제 를 참조하세요.

문제 해결하기¶

함수가 실패하면 오류가 발생합니다. 일반적인 오류 메시지는 다음과 같습니다.


오류 메시지	상황 및 해결 방법
유효하지 않은 옵션 오브젝트	`timestamp_granularity` 필드(제공되는 경우)에 대해 제공된 옵션은 “단어” 또는 “화자”여야 합니다.
서버에서 응답 없음	만료된 범위 지정 URL로 인해 오디오 파일을 검색할 수 없습니다.
파일이 너무 큽니다. 최대 크기는 734,003,200바이트이며, 파일이 이 제한을 초과합니다.	제공된 오디오 파일이 최대 파일 크기를 초과합니다.
유효하지 않은 파일 형식입니다. [‘flac’, ‘mp3’, ‘ogg’, ‘wav’, ‘webm’] 파일만 지원됩니다. 또는 WebM 파일에 오디오 스트림이 포함되어 있지 않습니다.	오디오 파일이 오류 메시지에 나열된 지원되는 형식 중 하나가 아닙니다. WebM 파일은 여러 미디어 타입을 지원하므로 파일에 오디오 스트림이 포함되어 있는지 확인하십시오. 파일이 지원되는 형식인 경우 파일이 손상되지 않았는지 확인합니다.
16,000Hertz로 다시 샘플링하면 파일이 너무 커집니다. 예상 크기는 3,355,444,448,000.0바이트입니다.	16KHz으로 리샘플링한 후 제공된 오디오 파일이 너무 큽니다. 제공된 오디오의 샘플링 속도가 더 낮은 경우 리샘플링된 크기가 원본보다 크며 허용되는 최대 파일 크기를 초과할 가능성이 있습니다.
너무 긴 오디오 지속 시간: 6,052.10초 허용되는 최대 시간: 3,600초. 또는 너무 긴 오디오 지속 시간: 7,335.28초 허용되는 최대 시간: 7,200초	제공된 오디오 파일이 너무 깁니다. 타임스탬프 세분성을 사용하는 경우 최대 기간은 60분(3,600초)입니다.
감지된 언어가 지원되지 않음	오디오 파일에 AI_TRANSCRIBE에서 지원하지 않는 언어가 포함되어 있습니다.

리전 가용성¶

다음 리전에서는 AI_TRANSCRIBE를 사용할 수 있습니다.

AWS US 서부 2(오레곤)
AWS US 동부 1(북부 버지니아)
AWS EU Central 1(프랑크푸르트)
Azure 동부 US 2(버지니아)

법적 고지¶

Snowflake AI 및 ML 섹션을 참조하십시오.