Problembehandlung bei Document AI

Die folgenden Szenarios können Ihnen helfen, möglicherweise auftretende Probleme bei der Verwendung von Document AI zu beheben.

Extrahierende Abfrage funktioniert nicht

Damit die extrahierende Abfrage funktioniert, müssen Sie die Dokumente zum Extrahieren in einen internen oder externen Stagingbereich speichern. Stellen Sie sicher, dass Sie den Verschlüsselungstyp SNOWFLAKE_SSE angeben, wenn Sie einen internen Stagingbereich erstellen.

Fehler

Je nach Dokumentformat erhalten Sie möglicherweise eine Fehlermeldung wie die folgende:

{   "__processingErrors": [     "File extension does not match actual mime type. Mime-Type: application/octet-stream"   ] }
{   "__processingErrors": [     "cannot identify image file <_io.BytesIO object at 0x7f8a800ba020>"   ] }

Ursache

Sie haben den Verschlüsselungstyp SNOWFLAKE_SSE nicht angegeben, als Sie den internen Stagingbereich zum Speichern von Dokumenten erstellt haben.

Lösung

Um einen internen Stagingbereich zu erstellen, führen Sie den Befehl CREATE STAGE aus, wie im folgenden Beispiel gezeigt:

CREATE STAGE doc_ai_stage
  DIRECTORY = (ENABLE = TRUE)
  ENCRYPTION = (TYPE = 'SNOWFLAKE_SSE');
Copy

Die vorab signierte URL ist abgelaufen.

Die vorab signierte URL der Stagingbereiche ist ein erforderliches Argument für <model_build_name>!PREDICT. Um die vorab signierte URL zu erhalten, rufen Sie die Funktion GET_PRESIGNED_URL auf, die die Standardablaufzeit hat.

Weitere Informationen dazu finden Sie unter GET_PRESIGNED_URL.

Fehler

{ "__processingErrors": [ "Received HTTP 403 response for presigned URL. URL may be expired." ] }

Ursache

Die vorab signierte URL ist abgelaufen.

Lösung

Reduzieren Sie entweder die Anzahl der Dokumente in einer Abfrage oder verlängern Sie die Ablaufzeit. Weitere Informationen zur Verlängerung der Ablaufzeit finden Sie unter GET_PRESIGNED_URL.

Zu viele Dokumente in einer Abfrage

Document AI hat eine Beschränkung bei der Anzahl der Dokumente, die in einer extrahierenden Abfrage verarbeitet werden. Weitere Informationen dazu finden Sie unter Bekannte Einschränkungen bei Document AI.

Fehler

{ "__processingErrors": [ "Query limit reached: too many documents in a single query." ] }

Ursache

Sie haben versucht, zu viele Dokumente in einer Abfrage zu verarbeiten.

Lösung

Verwenden Sie mehrere Abfragen, um die Dokumente zu verarbeiten.

Die Dokumente entsprechen nicht den spezifischen Anforderungen

Die Dokumente, die Sie mit Document AI verarbeiten, müssen spezifische Anforderungen erfüllen. Weitere Informationen dazu finden Sie unter Dokumente für Document AI vorbereiten.

Fehler

Sie erhalten möglicherweise einen der folgenden Fehler:

{ "__processingErrors": [ "Page 0 size is larger than the limit. Actual: 1083 mm x 1384 mm. Maximum: 1200 mm x 1200 mm." ] }
{ "__processingErrors": [ "Document has too many pages. Actual: 150. Maximum: 125." ] }
{ "__processingErrors": [ "Image size is too small. Actual: 20x20 px. Minimum: 50x50 px." ] }
{ "__processingErrors": [ "Unsupported file format. Actual: csv. Supported: docx, eml, htm, html, jpeg, jpg, pdf, png, text, tif, tiff, txt." ] }
{ "__processingErrors": [ "File exceeds maximum size. Actual: 54096026 bytes. Maximum: 50000000 bytes." ] }

Ursache

Die Dokumente, die Sie zu verarbeiten versuchen, entsprechen nicht den Anforderungen von Document AI. Weitere Informationen zu den Anforderungen finden Sie unter Dokumente für Document AI vorbereiten.

Lösung

Bereiten Sie Ihre Dokumente so vor, dass sie den Anforderungen entsprechen.

Der Document AI-Modell-Build wurde nicht veröffentlicht

Um Informationen mit Document AI zu extrahieren, müssen Sie den Document AI-Modell-Build veröffentlicht haben. Sie müssen den Modell-Build nicht veröffentlichen, wenn Sie das Modell trainiert und nach dem Training keine neuen Datenwerte hinzugefügt (neue Fragen gestellt) haben.

Fehler

Die Fehlermeldung beginnt wie folgt:

Request failed for external function DOCUMENT_EXTRACT_FEATURES$V1 with remote service error: 422

Ursache

Der Document AI-Modell-Build wurde nicht veröffentlicht.

Lösung

Veröffentlichen Sie den Document AI-Modell-Build. Weitere Informationen dazu finden Sie unter Document AI-Modell-Build veröffentlichen.

Erforderliche Berechtigungen werden nicht gewährt oder der Name des Modell-Builds ist doppelt vorhanden

Um ein Document AI-Modell-Build zu erstellen, müssen Sie Ihrer Rolle die erforderlichen Berechtigungen erteilen und einen eindeutigen Modell-Build-Namen wählen.

Weitere Informationen zu den erforderlichen Berechtigungen finden Sie unter Zugriffssteuerung von Document AI.

Fehler

Unable to create a build on the specified database and schema. Please check the documentation to learn more.

Ursache

Mögliche Ursachen sind:

  • Die Berechtigung CREATE SNOWFLAKE.ML.DOCUMENT_INTELLIGENCE ist für Ihre Rolle nicht vorgesehen.

  • Der Modell-Build-Name existiert bereits in der Datenbank und im Schema.

Lösung