Document AI のトラブルシューティング¶
次のシナリオは、 Document AI を操作する際に発生する可能性のある問題のトラブルシューティングに役立ちます。
クエリの抽出がうまくいきません¶
クエリ抽出 を動作させるには、抽出するドキュメントを内部または外部のいずれかのステージに格納する必要があります。内部ステージを作成する際には、 SNOWFLAKE_SSE
暗号化タイプを指定してください。
エラー |
ドキュメントの形式によっては、次のようなエラーが表示されることがあります。 { "__processingErrors": [ "File extension does not match actual mime type. Mime-Type: application/octet-stream" ] }
{ "__processingErrors": [ "cannot identify image file <_io.BytesIO object at 0x7f8a800ba020>" ] }
|
---|---|
原因 |
ドキュメントを保存するために内部ステージを作成したときに、 |
解決策 |
内部ステージ を作成するには、以下の例に示すように CREATE STAGE コマンドを実行します。 CREATE STAGE doc_ai_stage
DIRECTORY = (ENABLE = TRUE)
ENCRYPTION = (TYPE = 'SNOWFLAKE_SSE');
|
事前署名済み URL が期限切れ¶
ステージングされたドキュメントの事前署名済み URL は、 <モデルビルド名>!PREDICT への必須引数です。事前署名済み URL を取得するには、 GET_PRESIGNED_URL 関数を呼び出します。この関数にはデフォルトの有効期限があります。
詳細については、 GET_PRESIGNED_URL をご参照ください。
エラー |
{ "__processingErrors": [ "Received HTTP 403 response for presigned URL. URL may be expired." ] }
|
---|---|
原因 |
事前署名済み URL は期限切れです。 |
解決策 |
1回のクエリに含まれるドキュメントの数を減らすか、有効期限を延長します。有効期限の延長については、 GET_PRESIGNED_URL をご参照ください。 |
1つのクエリにドキュメントが多すぎる¶
Document AI は、1回の 抽出クエリ で処理できるドキュメント数に制限があります。詳細については、 Document AI に対する既知の制限 をご参照ください。
エラー |
{ "__processingErrors": [ "Query limit reached: too many documents in a single query." ] }
|
---|---|
原因 |
1つのクエリで処理しようとしたドキュメントが多すぎます。 |
解決策 |
複数のクエリを使用してドキュメントを処理します。 |
ドキュメントが特定の要件を満たしていない¶
Document AI で処理するドキュメントは、一定の要件を満たしている必要があります。詳細については、 Document AI のためのドキュメントを準備する をご参照ください。
エラー |
次のようなエラーが出るかもしれません。 { "__processingErrors": [ "Page 0 size is larger than the limit. Actual: 1083 mm x 1384 mm. Maximum: 1200 mm x 1200 mm." ] }
{ "__processingErrors": [ "Document has too many pages. Actual: 150. Maximum: 125." ] }
{ "__processingErrors": [ "Image size is too small. Actual: 20x20 px. Minimum: 50x50 px." ] }
{ "__processingErrors": [ "Unsupported file format. Actual: csv. Supported: docx, eml, htm, html, jpeg, jpg, pdf, png, text, tif, tiff, txt." ] }
{ "__processingErrors": [ "File exceeds maximum size. Actual: 54096026 bytes. Maximum: 50000000 bytes." ] }
|
---|---|
原因 |
処理しようとしたドキュメントが Document AI の要件を満たしていません。要件の詳細については、 Document AI のためのドキュメントを準備する をご参照ください。 |
解決策 |
要件を満たすドキュメントを準備します。 |
Document AI モデルビルドが公表されていない¶
Document AI で情報を抽出するには、 Document AI モデルビルドが公開されている必要があります。モデルをトレーニングし、トレーニング後に新しいデータ値を追加しない(新しい質問をしない)場合、モデルビルドを公開する必要はありません。
エラー |
エラーメッセージは次のように始まります。 Request failed for external function DOCUMENT_EXTRACT_FEATURES$V1 with remote service error: 422
|
---|---|
原因 |
Document AI モデルビルドが公表されていません。 |
解決策 |
Document AI モデルビルドを公開します。詳細については、 Document AI モデルビルドを公開する をご参照ください。 |
必要な権限が付与されていないか、モデルビルド名が重複している¶
Document AI モデルビルドを作成するには、自分のロールに必要な権限を与え、一意のモデルビルド名を選択する必要があります。
権限の詳細については、 Document AI アクセス制御 をご参照ください。
エラー |
Unable to create a build on the specified database and schema. Please check the documentation to learn more.
|
---|---|
原因 |
考えられる原因は次のとおりです。
|
解決策 |
|