카테고리:

문자열 및 이진 함수 (AI 함수)

AI_EXTRACT(Document AI 레거시 모델)

파일에서 정보를 추출합니다.

구문

AI_EXTRACT ( model => <model> ,
            file => <file> )
Copy

인자

model => model

Snowflake Model Registry에 저장된 추출용 Document AI Arctic-TILT 모델을 지정합니다(예: my_db.my_schema.my_model).

file => file

추출을 위한 FILE 입니다.

반환

엔터티 추출

{
  "error": null,
  "response": {
    "invoice_items": [
      "NEW CRUSHED VELVET DIVAN BED",
      "Vintage Radiator",
      "Solid Wooden Worktop",
      "Sienna Crushed Velvet Curtains"
    ],
    "invoice_number": "123/20",
    "tax_amount": "77.57",
    "total_amount": "465.43 GBP",
    "vendor_name": "UK Exports & Imports Ltd"
  }
}

테이블 추출

{
  "error": null,
  "response": {
    "table1": {
      "gross": ["10", "31", "10"],
      "item": ["apples", "banana", "pear"],
      "net": ["9", "30", "10"],
      "tax": ["1", "1", ""]
    },
    "table2": {
      "name": ["John", "Ana", "Lisa"],
      "surname": ["Smith", "Nixon", "Gonzales"]
    }
  }
}

액세스 제어 요구 사항

사용자는 SNOWFLAKE.CORTEX_USER 데이터베이스 역할 이 부여된 역할을 사용해야 합니다. 이 권한 부여에 대한 내용은 Cortex LLM privileges 섹션을 참조하세요.

또한 모델에 대한 OWNERSHIP 권한이 있어야 합니다.

사용법 노트

  • 모델은 :doc:`/developer-guide/snowflake-ml/model-registry/overview`에 있어야 합니다. 모델을 Snowflake Model Registry로 마이그레이션하려면 Document AI UI로 이동하고, 메시지가 표시되면 통합 배너의 지침을 따릅니다.

  • Document AI 모델의 엔터티는 100개를 초과할 수 없습니다.

  • 명시적으로 설정하지 않으면 기본적으로 사용 가능한 최신 모델 버전(모델이 게시되거나 Document AI UI에서 학습될 때 설정된 버전)이 사용됩니다. 모델의 기본 버전을 설정하려면 다음 예제와 같이 ALTER MODEL 명령을 사용합니다.

    ALTER MODEL my_model SET DEFAULT_VERSION = new_version;
    
    Copy
  • 신뢰도 점수는 지원되지 않습니다.

  • AI_EXTRACT는 <model_build_name>!PREDICT 메서드에서 사용되는 컴퓨팅 시간 기반 청구와는 다른 토큰 기반 청구를 사용합니다. Document AI 레거시 모델의 AI_EXTRACT 비용에 대한 자세한 내용은 `Snowflake Service Consumption Table`_을 참조하세요.

    • 엔터티 추출 비용은 ``arctic-tilt-entity``로 레이블이 지정됩니다.

    • 테이블 추출 비용은 ``arctic-tilt-table``로 레이블이 지정됩니다.

리전 가용성

다음 리전을 사용할 수 있습니다.

  • AWS 캐나다(중부)

  • AWS EU(프랑크푸르트)

  • AWS EU(아일랜드)

  • AWSUS 동부(북부 버지니아)

  • AWS US 동부(오하이오)

  • AWS US 서부(오리건)

  • Azure 호주 동부(뉴사우스웨일즈)

  • Azure 동부 US 2(버지니아)

  • Azure 동남아시아(싱가포르)

  • Azure 서유럽(네덜란드)

  • Azure 서부 US 2(워싱턴)

해당 리전이 목록에 없으면 :ref:`리전 간 추론<label-use-cross-region-inference>`을 사용합니다.

다음 예제에서는 Document AI 모델에 정의된 특징을 추출합니다.

SELECT AI_EXTRACT(
  model => 'my_db.my_schema.my_model',
  file => TO_FILE('@files_db.files_schema.files', 'agreement.pdf')
);
Copy

다음 예제에서는 스테이지에서 디렉터리의 모든 파일에 있는 정보를 추출합니다.

SELECT AI_EXTRACT(
  model => 'my_db.my_schema.my_model',
  file => TO_FILE('@db.schema.files', relative_path)
) FROM DIRECTORY (@db.schema.files);
Copy