<モデルビルド名>!PREDICT

ステージ内のドキュメントから情報を抽出し、 JSON オブジェクトで回答を提供します。単一のドキュメントを指定した場合、このメソッドはそのドキュメントの結果を返します。それ以外の場合、このメソッドはステージ内の各ドキュメントの結果を返します。

構文

<model_build_name>!PREDICT(<presigned_url>,
                           [ <model_build_version> ]
                          )
Copy

引数

必須:

presigned_url

ステージングされたドキュメントの事前署名済み URL。

引数として渡す署名済み URL を取得するには、 GET_PRESIGNED_URL 関数を呼び出します。 GET_PRESIGNED_URL をご参照ください。

詳細については、 をご参照ください。

注釈

GET_PRESIGNED_URL 関数には、デフォルトの有効期限(60分)があります。有効期限の延長については、 GET_PRESIGNED_URL をご参照ください。

オプション:

model_build_version

Document AI モデルビルドのバージョン

指定がない場合は、利用可能な最新のモデルビルドバージョンがデフォルトで使用されます。

戻り値

次のフィールドを持つ JSON オブジェクトを返します。

ocrScore

光学式文字認識(OCR)処理の信頼度スコアを指定します。

score

特定の値に対する信頼度スコアを指定します。

value

質問に対する抽出された回答を指定します。

{
  "__documentMetadata": {
    "ocrScore": 0.918
  },
  "invoice_number": [
    {
      "score": 0.925,
      "value": "123/20"
    }
  ],
  "invoice_items": [
    {
      "score": 0.839,
      "value": "NEW CRUSHED VELVET DIVAN BED"
    },
    {
      "score": 0.839,
      "value": "Vintage Radiator"
    },
    {
      "score": 0.839,
      "value": "Solid Wooden Worktop"
    },
    {
      "score": 0.839,
      "value": "Sienna Crushed Velvet Curtains"
    }
  ],
  "tax_amount": [
    {
      "score": 0.879,
      "value": "77.57"
    }
  ],
  "total_amount": [
    {
      "score": 0.809,
      "value": "465.43 GBP"
    }
  ],
  "buyer_name": [
    {
      "score": 0.925
    }
  ]
  "vendor_name": [
    {
      "score": 0.9,
      "value": "UK Exports & Imports Ltd"
    }
  ]
}
Copy

アクセス制御の要件

Document AI で情報を抽出するには、 SNOWFLAKE.DOCUMENT_INTELLIGENCE_CREATOR データベースロールが付与されているアカウントロールを使用する必要があります。詳細については、 Document AI アクセス制御 をご参照ください。

使用上の注意

  • このメソッドを使用するための前提条件を満たしていることを確認してください。詳細については、 前提条件 をご参照ください。

  • Document AI では、1回のクエリで処理できるドキュメント数に制限があります。詳細については、 Document AI に対する既知の制限 をご参照ください。

  • すべてのドキュメントはステージの同じディレクトリに存在する必要があります。

  • Document AI はディレクトリテーブルを使用します。詳細については、 ディレクトリテーブルのクエリ をご参照ください。

  • Document AI モデルがドキュメント内で回答を見つけられなかった場合、モデルは value キーを返しません。しかし、 score キーは返します。これは、ドキュメントに回答が含まれていないことをモデルがどの程度確信しているかを示すものです。例として buyer_name フィールドをご参照ください。

  • Document AI モデルはリストを返すことができます。例として invoice_items フィールドをご参照ください。

次の例では、 inspections モデルビルドのバージョン 1pdf_inspections_stage ステージにあるすべてのドキュメントから情報を抽出しています。

SELECT inspections!PREDICT(
  GET_PRESIGNED_URL(@pdf_inspections_stage, RELATIVE_PATH), 1)
  FROM DIRECTORY(@pdf_inspections_stage);
Copy

次の例では、 paystubs モデルビルドのバージョン 1pdf_paystubs_stage ステージにある 'paystubs/paystub01.pdf' ドキュメントから情報を抽出しています。

SELECT paystubs!PREDICT(
  GET_PRESIGNED_URL(@pdf_paystubs_stage, 'paystubs/paystub01.pdf'), 1);
Copy