- 카테고리:
문자열 및 이진 함수 (AI 함수)
AI_EXTRACT(Document AI 레거시 모델)¶
파일에서 정보를 추출합니다.
구문¶
AI_EXTRACT ( model => <model> ,
file => <file> )
인자¶
model => modelSnowflake Model Registry에 저장된 추출용 Document AI Arctic-TILT 모델을 지정합니다(예:
my_db.my_schema.my_model).file => file추출을 위한 FILE 입니다.
반환¶
엔터티 추출¶
{
"error": null,
"response": {
"invoice_items": [
"NEW CRUSHED VELVET DIVAN BED",
"Vintage Radiator",
"Solid Wooden Worktop",
"Sienna Crushed Velvet Curtains"
],
"invoice_number": "123/20",
"tax_amount": "77.57",
"total_amount": "465.43 GBP",
"vendor_name": "UK Exports & Imports Ltd"
}
}
테이블 추출¶
{
"error": null,
"response": {
"table1": {
"gross": ["10", "31", "10"],
"item": ["apples", "banana", "pear"],
"net": ["9", "30", "10"],
"tax": ["1", "1", ""]
},
"table2": {
"name": ["John", "Ana", "Lisa"],
"surname": ["Smith", "Nixon", "Gonzales"]
}
}
}
액세스 제어 요구 사항¶
사용자는 SNOWFLAKE.CORTEX_USER 데이터베이스 역할 이 부여된 역할을 사용해야 합니다. 이 권한 부여에 대한 내용은 Cortex LLM privileges 섹션을 참조하세요.
또한 모델에 대한 OWNERSHIP 권한이 있어야 합니다.
사용법 노트¶
모델은 :doc:`/developer-guide/snowflake-ml/model-registry/overview`에 있어야 합니다. 모델을 Snowflake Model Registry로 마이그레이션하려면 Document AI UI로 이동하고, 메시지가 표시되면 통합 배너의 지침을 따릅니다.
Document AI 모델의 엔터티는 100개를 초과할 수 없습니다.
명시적으로 설정하지 않으면 기본적으로 사용 가능한 최신 모델 버전(모델이 게시되거나 Document AI UI에서 학습될 때 설정된 버전)이 사용됩니다. 모델의 기본 버전을 설정하려면 다음 예제와 같이 ALTER MODEL 명령을 사용합니다.
ALTER MODEL my_model SET DEFAULT_VERSION = new_version;
신뢰도 점수는 지원되지 않습니다.
AI_EXTRACT는 <model_build_name>!PREDICT 메서드에서 사용되는 컴퓨팅 시간 기반 청구와는 다른 토큰 기반 청구를 사용합니다. Document AI 레거시 모델의 AI_EXTRACT 비용에 대한 자세한 내용은 `Snowflake Service Consumption Table`_을 참조하세요.
리전 가용성¶
다음 리전을 사용할 수 있습니다.
AWS 캐나다(중부)
AWS EU(프랑크푸르트)
AWS EU(아일랜드)
AWSUS 동부(북부 버지니아)
AWS US 동부(오하이오)
AWS US 서부(오리건)
Azure 호주 동부(뉴사우스웨일즈)
Azure 동부 US 2(버지니아)
Azure 동남아시아(싱가포르)
Azure 서유럽(네덜란드)
Azure 서부 US 2(워싱턴)
해당 리전이 목록에 없으면 :ref:`리전 간 추론<label-use-cross-region-inference>`을 사용합니다.
예¶
다음 예제에서는 Document AI 모델에 정의된 특징을 추출합니다.
SELECT AI_EXTRACT(
model => 'my_db.my_schema.my_model',
file => TO_FILE('@files_db.files_schema.files', 'agreement.pdf')
);
다음 예제에서는 스테이지에서 디렉터리의 모든 파일에 있는 정보를 추출합니다.
SELECT AI_EXTRACT(
model => 'my_db.my_schema.my_model',
file => TO_FILE('@db.schema.files', relative_path)
) FROM DIRECTORY (@db.schema.files);
법적 고지¶
Snowflake AI 및 ML 섹션을 참조하십시오.