Extraire des informations avec Document AI¶
Cette rubrique décrit l’extraction d’informations à partir de documents à l’aide de Document AI.
Si vous avez précédemment publié ou entraîné la version intermédiaire du modèle Document AI, vous pouvez désormais extraire des informations à partir de documents en exécutant la requête d’extraction dans des feuilles de calcul. Vous pouvez également créer des pipelines de traitement <label-document_ai_create_processing_pipelines> pour traiter en continu les nouveaux documents dans une zone de préparation.
Note
Document AI a des limites connues, notamment le nombre et la taille des documents que vous pouvez traiter en une seule requête. Pour plus d’informations, voir Limitations connues de Document AI.
Conditions préalables¶
Pour que l’extraction d’informations soit réussie, il faut que les conditions suivantes soient réunies :
Les documents utilisés pour l’extraction d’informations sont mis en zone de préparation interne ou externe. Pour plus d’informations, voir Configuration de Document AI.
Vous utilisez la base de données et le schéma que vous avez mis en place pour Document AI. Par exemple :
USE DATABASE doc_ai_db; USE SCHEMA doc_ai_schema;
Vous utilisez un rôle de compte auquel est attribué le rôle de base de données SNOWFLAKE.DOCUMENT_INTELLIGENCE_CREATOR. Pour plus d’informations, voir Configuration de Document AI.
Vous avez précédemment publié une version intermédiaire du modèle Document AI ou entraîné un modèle Document AI. Pour plus d’informations, voir Publier une version intermédiaire du modèle Document AI.
Utiliser la requête d’extraction¶
Une requête d’extraction est une requête SQL basée sur la méthode PREDICT. Pour plus d’informations, voir <nom_de_build_du_modèle>!PREDICT.
Pour extraire des informations des documents, exécutez la requête d’extraction dans des feuilles de calcul. Après avoir publié ou entraîné le modèle Document AI, vous pouvez voir la requête d’extraction définie dans Snowsight.
Pour voir la requête d’extraction dans Snowsight :
Connectez-vous à Snowsight.
Dans le menu de navigation, sélectionnez AI & ML » Document AI.
Sélectionnez un entrepôt.
La liste des versions intermédiaires de modèles s’affiche.
Dans la liste des versions intermédiaires de modèles, sélectionnez le nom de la version intermédiaire du modèle pour laquelle vous voulez voir la requête.
Pour voir la Extracting Query, sélectionnez l’onglet Build Details.
Créer des pipelines de traitement de documents¶
Avec Document AI, vous pouvez créer des pipelines qui traitent automatiquement les fichiers de documents pour en extraire des informations. Pour créer un pipeline de traitement, vous devez créer à la fois un flux sur une étape et une tâche pour traiter en continu les nouveaux documents dans la zone de préparation.
Pour plus d’informations, voir Tutoriel : créer un pipeline de traitement de documents avec Document AI.