<model_build_name>!PREDICT

Extrahiert Informationen aus Dokumenten in einem Stagingbereich und liefert Antworten in einem JSON-Objekt. Wenn Sie ein einzelnes Dokument angeben, gibt die Methode Ergebnisse für dieses Dokument zurück. Andernfalls gibt die Methode Ergebnisse für jedes Dokument im Stagingbereich zurück.

Syntax

<model_build_name>!PREDICT(<presigned_url>,
                           [ <model_build_version> ]
                          )
Copy

Argumente

Benötigt:

presigned_url

Vorsignierte URL der Dokumente im Stagingbereich.

Um die vorsigniert URL zu erhalten, die Sie als Argument übergeben können, rufen Sie die Funktion GET_PRESIGNED_URL auf. Siehe GET_PRESIGNED_URL.

Weitere Informationen dazu finden Sie unter Beispiel.

Bemerkung

Die Funktion GET_PRESIGNED_URL hat eine Standard-Ablaufzeit (60 Minuten). Weitere Informationen zur Verlängerung der Ablaufzeit finden Sie unter GET_PRESIGNED_URL.

Optional:

model_build_version

Version des Document AI-Modell-Builds.

Wenn nicht angegeben, wird standardmäßig die letzte verfügbare Modell-Build-Version verwendet.

Rückgabewerte

Gibt ein JSON-Objekt mit den folgenden Feldern zurück:

ocrScore

Gibt den Konfidenzwert für den Prozess der optischen Zeichenerkennung (OCR) an.

score

Gibt den Konfidenzwert für einen bestimmten Wert an.

value

Gibt die extrahierte Antwort auf die Frage an.

{
  "__documentMetadata": {
    "ocrScore": 0.918
  },
  "invoice_number": [
    {
      "score": 0.925,
      "value": "123/20"
    }
  ],
  "invoice_items": [
    {
      "score": 0.839,
      "value": "NEW CRUSHED VELVET DIVAN BED"
    },
    {
      "score": 0.839,
      "value": "Vintage Radiator"
    },
    {
      "score": 0.839,
      "value": "Solid Wooden Worktop"
    },
    {
      "score": 0.839,
      "value": "Sienna Crushed Velvet Curtains"
    }
  ],
  "tax_amount": [
    {
      "score": 0.879,
      "value": "77.57"
    }
  ],
  "total_amount": [
    {
      "score": 0.809,
      "value": "465.43 GBP"
    }
  ],
  "buyer_name": [
    {
      "score": 0.925
    }
  ]
  "vendor_name": [
    {
      "score": 0.9,
      "value": "UK Exports & Imports Ltd"
    }
  ]
}
Copy

Anforderungen an die Zugriffssteuerung

Um Informationen mit Document AI zu extrahieren, müssen Sie eine Kontorolle verwenden, der die Datenbankrolle SNOWFLAKE.DOCUMENT_INTELLIGENCE_CREATOR zugewiesen ist. Weitere Informationen dazu finden Sie unter Zugriffssteuerung von Document AI.

Nutzungshinweise

  • Stellen Sie sicher, dass Sie die Voraussetzungen für die Verwendung dieser Methode erfüllen. Weitere Informationen dazu finden Sie unter Voraussetzungen.

  • Document AI hat eine Beschränkung für die Anzahl der in einer Abfrage verarbeiteten Dokumente. Weitere Informationen dazu finden Sie unter Bekannte Einschränkungen bei Document AI.

  • Alle Dokumente müssen sich in demselben Verzeichnis des Stagingbereichs befinden.

  • Document AI verwendet Verzeichnistabellen. Weitere Informationen dazu finden Sie unter Abfragen von Verzeichnistabellen.

  • Wenn das Modell Document AI keine Antwort in dem Dokument findet, gibt das Modell keinen value-Schlüssel zurück. Es gibt jedoch den Schlüssel score zurück, der angibt, wie sicher sich das Modell ist, dass das Dokument die Antwort nicht enthält. Ein Beispiel dafür ist das Feld buyer_name.

  • Das Modell Document AI kann Listen zurückgeben. Ein Beispiel dafür ist das Feld invoice_items.

Beispiel

Das folgende Beispiel extrahiert Informationen aus allen Dokumenten im Stagingbereich pdf_inspections_stage für die Version 1 des Modell-Builds inspections:

SELECT inspections!PREDICT(
  GET_PRESIGNED_URL(@pdf_inspections_stage, RELATIVE_PATH), 1)
  FROM DIRECTORY(@pdf_inspections_stage);
Copy

Das folgende Beispiel extrahiert Informationen aus dem Dokument 'paystubs/paystub01.pdf' im Stagingbereich pdf_paystubs_stage für die Version 1 des Modell-Builds paystubs:

SELECT paystubs!PREDICT(
  GET_PRESIGNED_URL(@pdf_paystubs_stage, 'paystubs/paystub01.pdf'), 1);
Copy