<モデルビルド名>!PREDICT¶
ステージ内のドキュメントから情報を抽出し、 JSON オブジェクトで回答を提供します。単一のドキュメントを指定した場合、このメソッドはそのドキュメントの結果を返します。それ以外の場合、このメソッドはステージ内の各ドキュメントの結果を返します。
構文¶
<model_build_name>!PREDICT(<presigned_url>,
[ <model_build_version> ]
)
引数¶
必須:
presigned_url
ステージングされたドキュメントの事前署名済み URL。
引数として渡す署名済み URL を取得するには、 GET_PRESIGNED_URL 関数を呼び出します。 GET_PRESIGNED_URL をご参照ください。
詳細については、 例 をご参照ください。
注釈
GET_PRESIGNED_URL 関数には、デフォルトの有効期限(60分)があります。有効期限の延長については、 GET_PRESIGNED_URL をご参照ください。
オプション:
model_build_version
Document AI モデルビルドのバージョン
指定がない場合は、利用可能な最新のモデルビルドバージョンがデフォルトで使用されます。
戻り値¶
次のフィールドを持つ JSON オブジェクトを返します。
ocrScore
光学式文字認識(OCR)処理の信頼度スコアを指定します。
score
特定の値に対する信頼度スコアを指定します。
value
質問に対する抽出された回答を指定します。
{
"__documentMetadata": {
"ocrScore": 0.918
},
"invoice_number": [
{
"score": 0.925,
"value": "123/20"
}
],
"invoice_items": [
{
"score": 0.839,
"value": "NEW CRUSHED VELVET DIVAN BED"
},
{
"score": 0.839,
"value": "Vintage Radiator"
},
{
"score": 0.839,
"value": "Solid Wooden Worktop"
},
{
"score": 0.839,
"value": "Sienna Crushed Velvet Curtains"
}
],
"tax_amount": [
{
"score": 0.879,
"value": "77.57"
}
],
"total_amount": [
{
"score": 0.809,
"value": "465.43 GBP"
}
],
"buyer_name": [
{
"score": 0.925
}
]
"vendor_name": [
{
"score": 0.9,
"value": "UK Exports & Imports Ltd"
}
]
}
アクセス制御の要件¶
Document AI で情報を抽出するには、 SNOWFLAKE.DOCUMENT_INTELLIGENCE_CREATOR データベースロールが付与されているアカウントロールを使用する必要があります。詳細については、 Document AI アクセス制御 をご参照ください。
使用上の注意¶
このメソッドを使用するための前提条件を満たしていることを確認してください。詳細については、 前提条件 をご参照ください。
Document AI では、1回のクエリで処理できるドキュメント数に制限があります。詳細については、 Document AI に対する既知の制限 をご参照ください。
すべてのドキュメントはステージの同じディレクトリに存在する必要があります。
Document AI はディレクトリテーブルを使用します。詳細については、 ディレクトリテーブルのクエリ をご参照ください。
Document AI モデルがドキュメント内で回答を見つけられなかった場合、モデルは
value
キーを返しません。しかし、score
キーは返します。これは、ドキュメントに回答が含まれていないことをモデルがどの程度確信しているかを示すものです。例としてbuyer_name
フィールドをご参照ください。Document AI モデルはリストを返すことができます。例として
invoice_items
フィールドをご参照ください。
例¶
次の例では、 inspections
モデルビルドのバージョン 1
の pdf_inspections_stage
ステージにあるすべてのドキュメントから情報を抽出しています。
SELECT inspections!PREDICT(
GET_PRESIGNED_URL(@pdf_inspections_stage, RELATIVE_PATH), 1)
FROM DIRECTORY(@pdf_inspections_stage);
次の例では、 paystubs
モデルビルドのバージョン 1
の pdf_paystubs_stage
ステージにある 'paystubs/paystub01.pdf'
ドキュメントから情報を抽出しています。
SELECT paystubs!PREDICT(
GET_PRESIGNED_URL(@pdf_paystubs_stage, 'paystubs/paystub01.pdf'), 1);