ドキュメント処理プレイグラウンド

ドキュメント処理プレイグラウンドは、 AI_EXTRACT および AI_PARSE_DOCUMENT 関数を探索するためのユーザーインターフェースを提供します。ステージから独自のドキュメントをアップロードし、 AI_EXTRACT を使用して情報を抽出するための質問をして、 AI_PARSE_DOCUMENT によって生成されたレイアウトと OCR の結果の両方をプレビューできます。プレイグラウンドでは、関数がドキュメントを処理する方法を探索し、使用するために対応するコードスニペットをコピーできます。

詳細については、 AI_EXTRACT および AI_PARSE_DOCUMENT を使用したドキュメントの解析 をご参照ください。

必要な権限

ユーザーは、 SNOWFLAKE.CORTEX_USER データベースロール が付与されているロールを使用する必要があります。この権限の付与については、 Cortex LLM 権限 をご参照ください。

ドキュメント処理プレイグラウンドを始める

ドキュメント処理プレイグラウンドにアクセスするには、以下の手順を実行します。

  1. Snowsight にサインインします。

  2. ナビゲーションメニューで AI & ML » AI Studio を選択します。ドキュメント処理プレイグラウンドは、他のStudio関数と一緒に表示されます。

  3. ドキュメント処理プレイグラウンドを開くには Open を選択します。

ステージからドキュメントをアップロードする

  1. Add from stage を選択します。

    ダイアログが表示されます。

  2. ドキュメントを含むデータベース、スキーマ、ステージを選択します。

  3. プレイグラウンドに追加するドキュメントファイルを選択します。

    注釈

    最大10個のドキュメントを選択できます。

  4. Open playground を選択します。

    プレイグラウンドが表示されます。

ドキュメント処理プレイグラウンドのインターフェースでは、右側にドキュメントのプレビューが表示され、左側にプロンプトを入力できるプロンプト領域が表示されます。

Tip

プレビュー中のドキュメントを変更するには、ドキュメント名を選択し、リストから別のドキュメントを選択します。

ドキュメント処理プレイグラウンドのインターフェースは、次のタブで構成されています。

  • Extraction:ドキュメントから情報を抽出するために質問できるビュー。

  • Markdown:ドキュメントのマークダウン表現を確認できるビュー。AI_PARSE_DOCUMENT からの LAYOUT モード出力です。

  • Text:ドキュメントのテキスト表現を確認できるビュー。AI_PARSE_DOCUMENT からの OCR モード出力です。

質問して情報を抽出する

ドキュメントから情報を抽出するために質問することができます。

  1. Extraction タブを選択します。

  2. 抽出タイプを選択します。

    • 質問するには、 Ask を選択します。

    • リストを抽出するには、 List を選択します。

    • テーブルを抽出するには、 Extract table を選択します。

  3. キーと質問のペアを作成します。例:

    • キー: company

    • 質問: What is the name of the company?

  4. 確定するには、 Add Prompt を選択します。

ドキュメントのマークダウンとテキストバージョンをプレビューする

Markdown および Text タブには、 AI_PARSE_DOCUMENT 関数の結果が表示されます。

  • レイアウトモードの結果を表示するには、 Markdown タブを選択します。

  • OCR モードの結果を表示するには、 Text タブを選択します。

さらに使用するためにコードスニペットを取得する

少なくとも1つの質問をすると、プレイグラウンドがAI_EXTRACTおよびAI_PARSE_DOCUMENT関数を使用してドキュメントを処理するコードスニペットを作成します。コードスニペットをプレビューしてコピーするには:

  1. インターフェースの右上隅で Code Snippets を選択します。

  2. コードスニペットの言語を選択します: SQLまたはPython。

  3. ワークスペースでスニペットを開くには、 Open in Workspaces を選択します。

    新しいワークスペースがコードスニペットで開きます。

リージョンの可用性

ドキュメント処理プレイグラウンドは次のリージョンで入手できます。

クラウドプラットフォーム

クラウドリージョン

Amazon Web Services(AWS)

  • US 東部(バージニア北部)

  • US 東部(オハイオ)

  • US 西部(オレゴン)

  • カナダ(中部)

  • 南米(サンパウロ)

  • ヨーロッパ(ロンドン)

  • EU (ストックホルム)

  • EU (アイルランド)

  • EU (フランクフルト)

  • アジア太平洋(ムンバイ)

  • アジア太平洋(東京)

  • アジア太平洋(ソウル)

  • アジア太平洋(シドニー)

  • アジア太平洋(ジャカルタ)

Microsoft Azure

  • 東 US 2(バージニア)

  • 西 US 2(ワシントン)

  • 南中央 US (テキサス)

  • カナダ中央部(トロント)

  • UK 南部(ロンドン)

  • 北ヨーロッパ(アイルランド)

  • 西ヨーロッパ(オランダ)

  • 東南アジア(シンガポール)

  • UAE 北部(ドバイ)

  • オーストラリア東部(ニューサウスウェールズ)

  • インド中部(プネー)

  • 日本東部(東京)

Google Cloud

  • US 東部4(北部バージニア)

  • US 中央部1(アイオワ)

  • ヨーロッパ西部2(ロンドン)

  • ヨーロッパ西部3(フランクフルト)

  • ヨーロッパ西部4(オランダ)

制限事項

AI_EXTRACT および AI_PARSE_DOCUMENT 関数の制限は、ドキュメント処理プレイグラウンドに適用されます。詳細については、 AI_EXTRACT および AI_PARSE_DOCUMENT を使用したドキュメントの解析 をご参照ください。