Playground für die Dokumentenverarbeitung¶
Der Document Processing Playground bietet eine Benutzeroberfläche zum Erkunden der AI_EXTRACT und AI_PARSE_DOCUMENT-Funktionen. Sie können Ihre eigenen Dokumente aus dem Stagingbereich hochladen und Fragen stellen, um Informationen über AI_EXTRACT zu extrahieren, und eine Vorschau des Layouts und der OCR-Ergebnisse, die von AI_PARSE_DOCUMENT generiert wurden, zu extrahieren. Auf dem Playground können Sie erkunden, wie die Funktionen Ihre Dokumente verarbeiten, und die zugehörigen SQL-Abfragen zur weiteren Verwendung in Arbeitsblättern kopieren.
Weitere Informationen dazu finden Sie unter AI_EXTRACT und Parsing documents with AI_PARSE_DOCUMENT.
Erforderliche Berechtigungen¶
Benutzer müssen eine Rolle verwenden, der die Datenbankrolle SNOWFLAKE.CORTEX_USER zugewiesen wurde: Weitere Informationen zum Erteilen dieser Berechtigung finden Sie unter Cortex LLM privileges.
Erste Schritte mit dem Playground für die Dokumentenverarbeitung¶
So greifen Sie auf den Playground für die Dokumentenverarbeitung zu:
Melden Sie sich bei Snowsight an.
Wählen Sie im Navigationsmenü die Option AI & ML » Studio aus. Der Playground für die Dokumentenverarbeitung erscheint neben den anderen Studio-Funktionen.
Um den Document Processing Playground zu öffnen, wählen Sie Try aus.
Hochladen Ihrer Dokumente aus einem Stagingbereich¶
Wählen Sie Add from stage aus.
Ein Dialogfenster wird geöffnet.
Wählen Sie die Datenbank, das Schema und den Stagingbereich mit Ihren Dokumenten aus.
Wählen Sie die Dokumentdateien aus, die Sie dem Playground hinzufügen möchten.
Bemerkung
Sie können bis zu 10 Dokumente auswählen.
Wählen Sie Open playground aus.
Der Playground wird angezeigt.
In der Benutzeroberfläche des Playground für die Dokumentenverarbeitung wird auf der rechten Seite eine Vorschau eines Dokuments angezeigt. Im Bereich auf der linken Seite können Sie Eingabeaufforderungen eingeben.
Tipp
Um das Dokument, das Sie in der Vorschau anzeigen, zu ändern, wählen Sie den Dokumentnamen und dann ein anderes Dokument in der Liste aus.
Die Benutzeroberfläche des Playground für die Dokumentenverarbeitung besteht aus den folgenden Registerkarten:
Extraction: Die Ansicht, in der Sie Fragen stellen können, um Informationen aus dem Dokument zu extrahieren.
Markdown: Die Ansicht, in der Sie die Markdown-Darstellung des Dokuments sehen können. Es ist die LAYOUT-Modusausgabe von AI_PARSE_DOCUMENT.
Text: Die Ansicht, in der Sie die Textdarstellung des Dokuments sehen können. Es ist die OCR-Modusausgabe von AI_PARSE_DOCUMENT.
Extrahieren von Informationen durch Stellen von Fragen¶
Sie können Fragen stellen, um Informationen aus dem Dokument zu extrahieren.
Wählen Sie die Registerkarte Extraction aus.
Erstellen Sie Schlüssel-Frage-Paare, zum Beispiel:
Schlüssel:
companyFrage:
What is the name of the company?
Wählen Sie zur Bestätigung Add Prompt aus.
Vorschau der Markdown- und Textversionen des Dokuments¶
Auf den Registerkarten Markdown und Text werden die Ergebnisse der Funktion AI_PARSE_DOCUMENT angezeigt.
Um die Ergebnisse des Layout-Modus zu sehen, wählen Sie die Registerkarte Markdown aus.
Wählen Sie zum Anzeigen der Ergebnisse des OCR-Modus die Registerkarte Text aus.
Codeausschnitte zur Verwendung in Arbeitsblättern abrufen¶
Nachdem Sie mindestens eine Frage gestellt haben, erstellt der Playground SQL-Abfragen, die die Funktionen AI_EXTRACT und AI_PARSE_DOCUMENT zur Verarbeitung Ihrer Dokumente verwenden. Zur Vorschau und zum Kopieren der SQL-Abfragen:
Wählen Sie in der rechten oberen Ecke der Schnittstelle die Option :ui:`Code Snippets`aus.
Um die Codeausschnitte in Arbeitsblättern zu öffnen, wählen Sie Open in Worksheet aus.
Ein neues Arbeitsblatt wird mit den SQL-Codeschnipseln geöffnet.
Einschränkungen¶
Einschränkungen der AI_EXTRACT- und AI_PARSE_DOCUMENT-Funktionen gelten für den Playground für die Dokumentenverarbeitung. Weitere Informationen dazu finden Sie unter AI_EXTRACT und Parsing documents with AI_PARSE_DOCUMENT.