Document AI のトラブルシューティング

次のシナリオは、 Document AI を操作する際に発生する可能性のある問題のトラブルシューティングに役立ちます。

クエリの抽出がうまくいきません

クエリ抽出 を動作させるには、抽出するドキュメントを内部または外部のいずれかのステージに格納する必要があります。内部ステージを作成する際には、 SNOWFLAKE_SSE 暗号化タイプを指定してください。

エラー

ドキュメントの形式によっては、次のようなエラーが表示されることがあります。

{   "__processingErrors": [     "File extension does not match actual mime type. Mime-Type: application/octet-stream"   ] }
{   "__processingErrors": [     "cannot identify image file <_io.BytesIO object at 0x7f8a800ba020>"   ] }

原因

ドキュメントを保存するために内部ステージを作成したときに、 SNOWFLAKE_SSE 暗号化タイプを指定しませんでした。

解決策

内部ステージ を作成するには、以下の例に示すように CREATE STAGE コマンドを実行します。

CREATE STAGE doc_ai_stage
  DIRECTORY = (ENABLE = TRUE)
  ENCRYPTION = (TYPE = 'SNOWFLAKE_SSE');
Copy

事前署名済み URL が期限切れ

ステージングされたドキュメントの事前署名済み URL は、 <モデルビルド名>!PREDICT への必須引数です。事前署名済み URL を取得するには、 GET_PRESIGNED_URL 関数を呼び出します。この関数にはデフォルトの有効期限があります。

詳細については、 GET_PRESIGNED_URL をご参照ください。

エラー

{ "__processingErrors": [ "Received HTTP 403 response for presigned URL. URL may be expired." ] }

原因

事前署名済み URL は期限切れです。

解決策

1回のクエリに含まれるドキュメントの数を減らすか、有効期限を延長します。有効期限の延長については、 GET_PRESIGNED_URL をご参照ください。

1つのクエリにドキュメントが多すぎる

Document AI は、1回の 抽出クエリ で処理できるドキュメント数に制限があります。詳細については、 Document AI に対する既知の制限 をご参照ください。

エラー

{ "__processingErrors": [ "Query limit reached: too many documents in a single query." ] }

原因

1つのクエリで処理しようとしたドキュメントが多すぎます。

解決策

複数のクエリを使用してドキュメントを処理します。

ドキュメントが特定の要件を満たしていない

Document AI で処理するドキュメントは、一定の要件を満たしている必要があります。詳細については、 Document AI のためのドキュメントを準備する をご参照ください。

エラー

次のようなエラーが出るかもしれません。

{ "__processingErrors": [ "Page 0 size is larger than the limit. Actual: 1083 mm x 1384 mm. Maximum: 1200 mm x 1200 mm." ] }
{ "__processingErrors": [ "Document has too many pages. Actual: 150. Maximum: 125." ] }
{ "__processingErrors": [ "Image size is too small. Actual: 20x20 px. Minimum: 50x50 px." ] }
{ "__processingErrors": [ "Unsupported file format. Actual: csv. Supported: docx, eml, htm, html, jpeg, jpg, pdf, png, text, tif, tiff, txt." ] }
{ "__processingErrors": [ "File exceeds maximum size. Actual: 54096026 bytes. Maximum: 50000000 bytes." ] }

原因

処理しようとしたドキュメントが Document AI の要件を満たしていません。要件の詳細については、 Document AI のためのドキュメントを準備する をご参照ください。

解決策

要件を満たすドキュメントを準備します。

Document AI モデルビルドが公表されていない

Document AI で情報を抽出するには、 Document AI モデルビルドが公開されている必要があります。モデルをトレーニングし、トレーニング後に新しいデータ値を追加しない(新しい質問をしない)場合、モデルビルドを公開する必要はありません。

エラー

エラーメッセージは次のように始まります。

Request failed for external function DOCUMENT_EXTRACT_FEATURES$V1 with remote service error: 422

原因

Document AI モデルビルドが公表されていません。

解決策

Document AI モデルビルドを公開します。詳細については、 Document AI モデルビルドを公開する をご参照ください。

必要な権限が付与されていないか、モデルビルド名が重複している

Document AI モデルビルドを作成するには、自分のロールに必要な権限を与え、一意のモデルビルド名を選択する必要があります。

権限の詳細については、 Document AI アクセス制御 をご参照ください。

エラー

Unable to create a build on the specified database and schema. Please check the documentation to learn more.

原因

考えられる原因は次のとおりです。

  • CREATE SNOWFLAKE.ML.DOCUMENT_INTELLIGENCE 権限は、あなたのロールには付与されていません。

  • モデルビルド名はデータベースとスキーマに既に存在します。

解決策