Document AI 를 사용하여 정보 추출

이 항목에서는 Document AI 를 사용하여 문서에서 정보를 추출하는 방법을 설명합니다.

이전에 Document AI 모델 빌드를 게시하거나 훈련한 경우, 이제 워크시트에서 추출 쿼리 를 실행하여 문서에서 정보를 추출할 수 있습니다. 처리 파이프라인 을 만들어 스테이지에서 새 문서를 지속적으로 처리할 수도 있습니다.

참고

Document AI 에는 단일 쿼리에서 처리할 수 있는 설명서의 수와 크기 등 알려진 제한 사항이 있습니다. 자세한 내용은 Document AI 의 알려진 제한 사항 섹션을 참조하십시오.

전제 조건

성공적인 정보 추출에는 다음과 같은 조건이 필요합니다.

  • 정보 추출에 사용되는 문서는 내부 스테이지 또는 외부 스테이지에 저장됩니다. 자세한 내용은 Document AI 설정하기 섹션을 참조하십시오.

  • Document AI 에 대해 설정한 데이터베이스 및 스키마를 사용하고 있습니다. 예:

    USE DATABASE doc_ai_db;
    USE SCHEMA doc_ai_schema;
    
    Copy
  • SNOWFLAKE.DOCUMENT_INTELLIGENCE_CREATOR 데이터베이스 역할이 부여된 계정 역할을 사용하고 있습니다. 자세한 내용은 Document AI 설정하기 섹션을 참조하십시오.

  • 이전에 Document AI 모델 빌드를 게시했거나 Document AI 모델을 훈련한 적이 있습니다. 자세한 내용은 Document AI 모델 빌드 게시 섹션을 참조하십시오.

추출 쿼리 사용

추출 쿼리는 PREDICT 메서드에 기반한 SQL 쿼리입니다. 자세한 내용은 <model_build_name>!PREDICT 섹션을 참조하십시오.

문서에서 정보를 추출하려면 워크시트에서 추출 쿼리를 실행합니다. Document AI 모델을 게시하거나 훈련한 후에는 Snowsight 에 정의된 추출 쿼리를 확인할 수 있습니다.

Snowsight 에서 추출 쿼리를 보려면:

  1. Snowsight 에 로그인합니다.

  2. 탐색 메뉴에서 AI & ML » Document AI 를 선택합니다.

  3. 웨어하우스를 선택합니다.

    모델 빌드 목록이 표시됩니다.

  4. 모델 빌드 목록에서 쿼리를 확인할 모델 빌드의 이름을 선택합니다.

  5. Extracting Query 를 보려면 Build Details 탭을 선택합니다.

문서 처리 파이프라인 만들기

Document AI 를 사용하면 문서 파일을 자동으로 처리하여 정보를 추출하는 파이프라인을 만들 수 있습니다. 처리 파이프라인을 만들려면 스테이지에 스트림과 스테이지에서 새 문서를 지속적으로 처리하는 작업을 모두 만들어야 합니다.

자세한 내용은 자습서: Document AI를 사용하여 문서 처리 파이프라인 만들기 섹션을 참조하십시오.