Document Processing Playground¶
Document Processing Playground fournit une interface utilisateur pour explorer les fonctions AI_EXTRACT et AI_PARSE_DOCUMENT. Vous pouvez télécharger vos propres documents depuis la zone de préparation, poser des questions pour extraire des informations à l’aide de AI_EXTRACT et afficher un aperçu des résultats en mode Mise en page et OCR générés par AI_PARSE_DOCUMENT. Le playground vous permet de découvrir comment les fonctions traitent vos documents et de copier les extraits de code correspondants pour une utilisation ultérieure.
Pour plus d’informations, voir AI_EXTRACT et Analyse de documents avec AI_PARSE_DOCUMENT.
Privilèges requis¶
Les utilisateurs doivent utiliser un rôle auquel le rôle de base de données SNOWFLAKE.CORTEX_USER a été accordé. Pour plus d’informations sur l’octroi de ce privilège, voir Privilèges LLM Cortex.
Premiers pas avec Document Processing Playground¶
Pour accéder à Document Processing Playground :
Connectez-vous à Snowsight.
Dans le menu de navigation, sélectionnez AI & ML » AI Studio. Document Processing Playground figure parmi les autres fonctions de Studio.
Pour ouvrir Document Processing Playground, sélectionnez. Open.
Charger des documents à partir d’une zone de préparation¶
Sélectionnez Add from stage.
Une boîte de dialogue apparaît.
Sélectionnez la base de données, le schéma et la zone de préparation qui contient vos documents.
Sélectionnez les fichiers de documents que vous souhaitez ajouter au playground.
Note
Vous pouvez sélectionner jusqu’à 10 documents.
Sélectionnez Open playground.
Le playground apparaît.
L’interface de Document Processing Playground affiche un aperçu d’un document à droite et une zone d’invite à gauche où vous pouvez saisir des invites.
Astuce
Pour changer le document que vous prévisualisez, sélectionnez le nom du document, puis sélectionnez un autre document dans la liste.
L’interface de Document Processing Playground se compose des onglets suivants :
Extraction : la vue où vous pouvez poser des questions pour extraire des informations du document.
Markdown : la vue où vous pouvez voir la représentation markdown du document. Il s’agit de la sortie du mode LAYOUT de AI_PARSE_DOCUMENT.
Text : la vue où vous pouvez voir la représentation textuelle du document. Il s’agit de la sortie du mode OCR de AI_PARSE_DOCUMENT.
Extraire des informations en posant des questions¶
Vous pouvez poser des questions pour extraire des informations du document.
Sélectionnez l’onglet Extraction.
Sélectionnez le type d’extraction :
Pour poser une question, sélectionnez Ask.
Pour extraire une liste, sélectionnez List.
Pour extraire une table, sélectionnez Extract table.
Créez des paires de clés et de questions, par exemple :
Clé :
companyQuestion :
What is the name of the company?
Pour confirmer, sélectionnez Add Prompt.
Prévisualiser les versions markdown et texte du document¶
Les onglets Markdown et Text affichent les résultats de la fonction AI_PARSE_DOCUMENT.
Pour voir les résultats en mode Mise en page, sélectionnez l’onglet Markdown.
Pour voir les résultats en mode OCR, sélectionnez l’onglet Text.
Obtenir les extraits de code pour une utilisation ultérieure¶
Après avoir posé au moins une question, le playground crée les extraits de code qui utilisent les fonctions AI_EXTRACT et AI_PARSE_DOCUMENT pour traiter vos documents. Pour prévisualiser et copier les extraits de code :
Dans le coin supérieur droit de l’interface, sélectionnez Code Snippets.
Sélectionnez la langue de l’extrait de code : SQL ou Python.
Pour ouvrir l’extrait dans les espaces de travail, sélectionnez. Open in Workspaces.
Un nouvel espace de travail s’ouvre avec l’extrait de code.
Disponibilité régionale¶
Document Processing Playground est disponible dans les régions suivantes :
Plateforme Cloud |
Région Cloud |
|---|---|
Amazon Web Services (AWS) |
|
Microsoft Azure |
|
Google Cloud |
|
Limitations¶
Les limites des fonctions AI_EXTRACT et AI_PARSE_DOCUMENT s’appliquent à Document Processing Playground. Pour plus d’informations, voir AI_EXTRACT et Analyse de documents avec AI_PARSE_DOCUMENT.