Catégories :

Fonctions de chaîne et fonctions binaires (Fonctions AI)

AI_EXTRACT (Document AI modèles existants)

Extrait des informations d’un fichier.

Syntaxe

AI_EXTRACT ( model => <model> ,
            file => <file> )
Copy

Arguments

model => model

Spécifie le modèle Document AI Arctic-TILT à extraire stocké dans le registre des modèles de Snowflake ; par exemple, my_db.my_schema.my_model.

file => file

Un FILE pour l’extraction.

Renvoie

Extraction d’entités

{
  "error": null,
  "response": {
    "invoice_items": [
      "NEW CRUSHED VELVET DIVAN BED",
      "Vintage Radiator",
      "Solid Wooden Worktop",
      "Sienna Crushed Velvet Curtains"
    ],
    "invoice_number": "123/20",
    "tax_amount": "77.57",
    "total_amount": "465.43 GBP",
    "vendor_name": "UK Exports & Imports Ltd"
  }
}

Extraction de tables

{
  "error": null,
  "response": {
    "table1": {
      "gross": ["10", "31", "10"],
      "item": ["apples", "banana", "pear"],
      "net": ["9", "30", "10"],
      "tax": ["1", "1", ""]
    },
    "table2": {
      "name": ["John", "Ana", "Lisa"],
      "surname": ["Smith", "Nixon", "Gonzales"]
    }
  }
}

Exigences en matière de contrôle d’accès

Les utilisateurs doivent utiliser un rôle auquel le rôle de base de données SNOWFLAKE.CORTEX_USER a été accordé. Pour plus d’informations sur l’octroi de ce privilège, voir Cortex LLM privileges.

De plus, vous devez avoir le privilège OWNERSHIP sur le modèle.

Notes sur l’utilisation

  • Le modèle doit être dans le Registre des modèles de Snowflake. Pour migrer des modèles vers le registre des modèles Snowflake, accédez à Document AI UI, et lorsque vous y êtes invité, suivez les instructions sur la bannière d’intégration.

  • Le modèle Document AI ne doit pas avoir plus de 100 entités.

  • S’il n’est pas défini explicitement, la dernière version du modèle disponible est utilisée par défaut (la version définie lorsque le modèle a été publié ou entraîné dans l’UI Document AI). Pour définir la version par défaut d’un modèle, utilisez la commande ALTER MODEL comme indiqué dans l’exemple suivant :

    ALTER MODEL my_model SET DEFAULT_VERSION = new_version;
    
    Copy
  • Les scores de confiance ne sont pas pris en charge.

  • AI_EXTRACT utilise la facturation par jeton, qui est différente de la facturation basée sur le temps de calcul utilisée dans la méthode <model_build_name>!PREDICT. Pour plus d’informations sur le coût AI_EXTRACT pour les modèles hérités Document AI, voir le Tableau de consommation du service Snowflake.

    • Le coût d’extraction de l’entité est indiqué comme arctic-tilt-entity.

    • Le coût d’extraction de la table est indiqué comme arctic-tilt-table.

Disponibilité régionale

Les régions suivantes sont disponibles :

  • AWS Canada (Central)

  • AWS EU (Francfort)

  • AWS EU (Irlande)

  • AWS US Est (Virginie du Nord)

  • AWS US East (Ohio)

  • AWS US Ouest (Oregon)

  • Azure Australia East (Nouvelle-Galles du Sud)

  • Azure US Est 2 (Virginie)

  • Azure Southeast Asia (Singapour)

  • Azure Europe de l’Ouest (Pays-Bas)

  • Azure West US 2 (Washington)

Si votre région n’apparaît pas, utilisez l’inférence interrégionale.

Exemples

L’exemple suivant extrait les fonctionnalités définies dans le modèle Document AI :

SELECT AI_EXTRACT(
  model => 'my_db.my_schema.my_model',
  file => TO_FILE('@files_db.files_schema.files', 'agreement.pdf')
);
Copy

L’exemple suivant extrait les informations de tous les fichiers d’un répertoire sur une zone de préparation :

SELECT AI_EXTRACT(
  model => 'my_db.my_schema.my_model',
  file => TO_FILE('@db.schema.files', relative_path)
) FROM DIRECTORY (@db.schema.files);
Copy