ドキュメント処理プレイグラウンド

ドキュメント処理プレイグラウンドは、 AI_EXTRACT および AI_PARSE_DOCUMENT 関数を探索するためのユーザーインターフェースを提供します。ステージから独自のドキュメントをアップロードし、 AI_EXTRACT を使用して情報を抽出するための質問をして、 AI_PARSE_DOCUMENT によって生成されたレイアウトと OCR の結果の両方をプレビューできます。プレイグラウンドでは、関数がドキュメントを処理する方法を探索し、ワークシートでさらに使用するために対応する SQL クエリをコピーできます。

詳細については、 AI_EXTRACT および Parsing documents with AI_PARSE_DOCUMENT をご参照ください。

必要な権限

ユーザーは、 SNOWFLAKE.CORTEX_USER データベースロール が付与されているロールを使用する必要があります。この権限の付与については、 Cortex LLM privileges をご参照ください。

ドキュメント処理プレイグラウンドを始める

ドキュメント処理プレイグラウンドにアクセスするには、以下の手順を実行します。

  1. Snowsight にサインインします。

  2. In the navigation menu, select AI & ML » AI Studio. The Document Processing Playground appears among the other Studio functions.

  3. To open the Document Processing Playground, select Open.

ステージからドキュメントをアップロードする

  1. Add from stage を選択します。

    ダイアログが表示されます。

  2. ドキュメントを含むデータベース、スキーマ、ステージを選択します。

  3. プレイグラウンドに追加するドキュメントファイルを選択します。

    注釈

    最大10個のドキュメントを選択できます。

  4. Open playground を選択します。

    プレイグラウンドが表示されます。

ドキュメント処理プレイグラウンドのインターフェースでは、右側にドキュメントのプレビューが表示され、左側にプロンプトを入力できるプロンプト領域が表示されます。

Tip

プレビュー中のドキュメントを変更するには、ドキュメント名を選択し、リストから別のドキュメントを選択します。

ドキュメント処理プレイグラウンドのインターフェースは、次のタブで構成されています。

  • Extraction:ドキュメントから情報を抽出するために質問できるビュー。

  • Markdown:ドキュメントのマークダウン表現を確認できるビュー。AI_PARSE_DOCUMENT からの LAYOUT モード出力です。

  • Text:ドキュメントのテキスト表現を確認できるビュー。AI_PARSE_DOCUMENT からの OCR モード出力です。

質問して情報を抽出する

ドキュメントから情報を抽出するために質問することができます。

  1. Extraction タブを選択します。

  2. キーと質問のペアを作成します。例:

    • キー: company

    • 質問: What is the name of the company?

  3. 確定するには、 Add Prompt を選択します。

ドキュメントのマークダウンとテキストバージョンをプレビューする

Markdown および Text タブには、 AI_PARSE_DOCUMENT 関数の結果が表示されます。

  • レイアウトモードの結果を表示するには、 Markdown タブを選択します。

  • OCR モードの結果を表示するには、 Text タブを選択します。

ワークシートで使用するコードスニペットを取得する

少なくとも1つの質問をすると、プレイグラウンドが AI_EXTRACT および AI_PARSE_DOCUMENT 関数を使用してドキュメントを処理する SQL クエリを作成します。SQL クエリをプレビューしてコピーするには、

  1. インターフェースの右上隅で Code Snippets を選択します。

  2. ワークシートでスニペットを開くには、 Open in Worksheet を選択します。

    SQL コードスニペットを含む新しいワークシートが開きます。

制限事項

AI_EXTRACT および AI_PARSE_DOCUMENT 関数の制限は、ドキュメント処理プレイグラウンドに適用されます。詳細については、 AI_EXTRACT および Parsing documents with AI_PARSE_DOCUMENT をご参照ください。