- Catégories :
Fonctions de chaîne et fonctions binaires (Fonctions AI)
AI_EXTRACT (Document AI modèles existants)¶
Extrait des informations d’un fichier.
Syntaxe¶
AI_EXTRACT ( model => <model> ,
file => <file> )
Arguments¶
model => modelSpécifie le modèle Document AI Arctic-TILT à extraire stocké dans le registre des modèles de Snowflake ; par exemple,
my_db.my_schema.my_model.file => fileUn FILE pour l’extraction.
Renvoie¶
Extraction d’entités¶
{
"error": null,
"response": {
"invoice_items": [
"NEW CRUSHED VELVET DIVAN BED",
"Vintage Radiator",
"Solid Wooden Worktop",
"Sienna Crushed Velvet Curtains"
],
"invoice_number": "123/20",
"tax_amount": "77.57",
"total_amount": "465.43 GBP",
"vendor_name": "UK Exports & Imports Ltd"
}
}
Extraction de tables¶
{
"error": null,
"response": {
"table1": {
"gross": ["10", "31", "10"],
"item": ["apples", "banana", "pear"],
"net": ["9", "30", "10"],
"tax": ["1", "1", ""]
},
"table2": {
"name": ["John", "Ana", "Lisa"],
"surname": ["Smith", "Nixon", "Gonzales"]
}
}
}
Exigences en matière de contrôle d’accès¶
Les utilisateurs doivent utiliser un rôle auquel le rôle de base de données SNOWFLAKE.CORTEX_USER a été accordé. Pour plus d’informations sur l’octroi de ce privilège, voir Cortex LLM privileges.
De plus, vous devez avoir le privilège OWNERSHIP sur le modèle.
Notes sur l’utilisation¶
Le modèle doit être dans le Registre des modèles de Snowflake. Pour migrer des modèles vers le registre des modèles Snowflake, accédez à Document AI UI, et lorsque vous y êtes invité, suivez les instructions sur la bannière d’intégration.
Le modèle Document AI ne doit pas avoir plus de 100 entités.
S’il n’est pas défini explicitement, la dernière version du modèle disponible est utilisée par défaut (la version définie lorsque le modèle a été publié ou entraîné dans l’UI Document AI). Pour définir la version par défaut d’un modèle, utilisez la commande ALTER MODEL comme indiqué dans l’exemple suivant :
ALTER MODEL my_model SET DEFAULT_VERSION = new_version;
Les scores de confiance ne sont pas pris en charge.
AI_EXTRACT utilise la facturation par jeton, qui est différente de la facturation basée sur le temps de calcul utilisée dans la méthode <model_build_name>!PREDICT. Pour plus d’informations sur le coût AI_EXTRACT pour les modèles hérités Document AI, voir le Tableau de consommation du service Snowflake.
Le coût d’extraction de l’entité est indiqué comme
arctic-tilt-entity.Le coût d’extraction de la table est indiqué comme
arctic-tilt-table.
Disponibilité régionale¶
Les régions suivantes sont disponibles :
AWS Canada (Central)
AWS EU (Francfort)
AWS EU (Irlande)
AWS US Est (Virginie du Nord)
AWS US East (Ohio)
AWS US Ouest (Oregon)
Azure Australia East (Nouvelle-Galles du Sud)
Azure US Est 2 (Virginie)
Azure Southeast Asia (Singapour)
Azure Europe de l’Ouest (Pays-Bas)
Azure West US 2 (Washington)
Si votre région n’apparaît pas, utilisez l’inférence interrégionale.
Exemples¶
L’exemple suivant extrait les fonctionnalités définies dans le modèle Document AI :
SELECT AI_EXTRACT(
model => 'my_db.my_schema.my_model',
file => TO_FILE('@files_db.files_schema.files', 'agreement.pdf')
);
L’exemple suivant extrait les informations de tous les fichiers d’un répertoire sur une zone de préparation :
SELECT AI_EXTRACT(
model => 'my_db.my_schema.my_model',
file => TO_FILE('@db.schema.files', relative_path)
) FROM DIRECTORY (@db.schema.files);
Avis juridiques¶
Reportez-vous à Snowflake AI et ML.