<nom_de_build_du_modèle>!PREDICT

Extrait les informations des documents dans une zone de préparation et fournit des réponses dans un objet JSON. Si vous spécifiez un seul document, la méthode renvoie des résultats pour ce document. Sinon, la méthode renvoie des résultats pour chaque document de la zone de préparation.

Syntaxe

<model_build_name>!PREDICT(<presigned_url>,
                           [ <model_build_version> ]
                          )
Copy

Arguments

Obligatoire :

presigned_url

URL pré-signée des documents en zone de préparation.

Pour obtenir l’URL pré-signée à transmettre comme argument, appelez la fonction GET_PRESIGNED_URL. Voir GET_PRESIGNED_URL.

Pour plus d’informations, voir Exemple.

Note

La fonction GET_PRESIGNED_URL a un délai d’expiration par défaut (60 minutes). Pour plus d’informations sur la prolongation du délai d’expiration, voir GET_PRESIGNED_URL.

Facultatif :

model_build_version

Version intermédiaire du modèle Document AI.

Si elle n’est pas spécifiée, la dernière version intermédiaire du modèle disponible est utilisée par défaut.

Renvoie

Renvoie un objet JSON avec les champs suivants :

ocrScore

Spécifie le score de confiance du processus de reconnaissance optique de caractères (OCR).

score

Spécifie le score de confiance d’une valeur spécifique.

value

Spécifie la réponse extraite à la question.

{
  "__documentMetadata": {
    "ocrScore": 0.918
  },
  "invoice_number": [
    {
      "score": 0.925,
      "value": "123/20"
    }
  ],
  "invoice_items": [
    {
      "score": 0.839,
      "value": "NEW CRUSHED VELVET DIVAN BED"
    },
    {
      "score": 0.839,
      "value": "Vintage Radiator"
    },
    {
      "score": 0.839,
      "value": "Solid Wooden Worktop"
    },
    {
      "score": 0.839,
      "value": "Sienna Crushed Velvet Curtains"
    }
  ],
  "tax_amount": [
    {
      "score": 0.879,
      "value": "77.57"
    }
  ],
  "total_amount": [
    {
      "score": 0.809,
      "value": "465.43 GBP"
    }
  ],
  "buyer_name": [
    {
      "score": 0.925
    }
  ]
  "vendor_name": [
    {
      "score": 0.9,
      "value": "UK Exports & Imports Ltd"
    }
  ]
}
Copy

Exigences en matière de contrôle d’accès

Pour extraire des informations à l’aide de Document AI, vous devez utiliser un rôle de compte auquel est attribué le rôle de base de données SNOWFLAKE.DOCUMENT_INTELLIGENCE_CREATOR. Pour plus d’informations, voir Contrôle d’accès à Document AI.

Notes sur l’utilisation

  • Assurez-vous de remplir les conditions préalables requises à l’utilisation de cette méthode. Pour plus d’informations, voir Conditions préalables.

  • Document AI limite le nombre de documents traités dans une requête. Pour plus d’informations, voir Limitations connues de Document AI.

  • Tous les documents doivent se trouver dans le même répertoire de la zone de préparation.

  • Document AI utilise des tables de répertoires. Pour plus d’informations, voir Interrogation de tables de répertoire.

  • Si le modèle Document AI ne trouve pas de réponse dans le document, il ne renvoie pas de clé value. Cependant, il renvoie la clé score, qui indique le niveau de confiance du modèle dans le fait que le document ne contient pas la réponse. Voir l’exemple du champ buyer_name.

  • Le modèle Document AI peut renvoyer des listes. Voir l’exemple du champ invoice_items.

Exemple

L’exemple suivant permet d’extraire des informations de tous les documents de la zone de préparation pdf_inspections_stage pour la version intermédiaire 1 du modèle inspections :

SELECT inspections!PREDICT(
  GET_PRESIGNED_URL(@pdf_inspections_stage, RELATIVE_PATH), 1)
  FROM DIRECTORY(@pdf_inspections_stage);
Copy

L’exemple suivant permet d’extraire des informations du document 'paystubs/paystub01.pdf' sur la zone de préparation pdf_paystubs_stage pour la version 1 du modèle paystubs :

SELECT paystubs!PREDICT(
  GET_PRESIGNED_URL(@pdf_paystubs_stage, 'paystubs/paystub01.pdf'), 1);
Copy