Document AI のコストガバナンス

このトピックでは、 Document AI のコストガバナンスに関するベストプラクティスを紹介します。

Document AI のコストについて

Document AI には以下のようなコストがかかります。

AI サービスコンピューティング:

Document AI では、 <モデルビルド名>!PREDICT メソッドでドキュメントから情報を抽出することができますが、これには計算コストがかかります。

バーチャルウェアハウスコンピューティング:

ワークシートでクエリを実行するには(<モデルビルド名>!PREDICT メソッドを使用する場合を含む)、ウェアハウスを選択します。さらに、 Document AI では、ワークシートのデータ検索に関連するその他の操作にもコストが発生する可能性があります。 Document AI のウェアハウスサイズの選択については、 Document AI に対して最適なウェアハウスサイズを決定する をご参照ください。

ストレージ:

Document AI モデルをテストするには、 Snowsight の Document AI ユーザーインターフェイスにドキュメントをアップロードし、そこで結果を確認し、オプションでトレーニングによってモデルを微調整します。これらの操作は、結果がアカウント内のSnowflakeクラスオブジェクト内に保存されるため、ストレージコストが発生する可能性があります。SQL を使って情報を抽出するには、ドキュメントを内部または外部のステージングにドキュメントをアップロードします。これにによりまたストレージコストが発生する可能性があります。発生したストレージコストの表示については、 ストレージコストの調査 をご参照ください。

Snowflakeの全体的なコストについては、 総コストについて をご参照ください。

AI サービスのコンピューティングコスト

Document AI は、 Document AI ワークロードの必要に応じて、Snowflakeにより自動的にサイズ変更、およびスケールアップまたはスケールダウンされるSnowflake管理のコンピューティングリソースを使用します。Snowflakeが管理するコンピューティング構造では、消費量は実際にリソースを使用した時間に基づいて計算されます。一方、ユーザーが管理するウェアハウスは、稼働中にクレジットを消費するため、作業を行っているかどうかに関係なく、アイドリング状態になったり使いすぎたりする可能性があります。

Document AI のクレジット消費量の計算は、ジョブを完了するために使用されたコンピューティングリソースの合計量に基づいています。使用されたコンピューティングリソースの量は、コンピューティングの種類と使用時間によって測定され、ワークロードが使用するすべてのリソースの秒単位で計算されます。

Snowflakeにおけるコンピューティングコストの詳細については、 コンピューティングコストについて をご参照ください。

クレジット消費の詳細については、 Snowflakeサービス利用テーブル をご参照ください。

クレジット消費の見積もり

Document AI のクレジット消費量は以下の通りです。

  • ページ数(ページで構成されるドキュメント形式の場合)

  • ドキュメントの数

  • ページ密度

    ほとんどが白紙のドキュメント(たとえば請求書)の処理には、文字量の多いドキュメント(たとえば研究論文)よりも時間がかからないため、クレジットの消費を抑えることができます。

  • 抽出するデータ値の数

    より多くのデータ値を抽出することは、より長く時間がかかり、クレジット消費が増加します。

以下のテーブルは、さまざまなタイプのワークロードに基づく1,000ページのクレジット消費量の 推定値 を説明したものです。

ドキュメントの数

ドキュメントページ数

ページ密度

10個の値の推定クレジット範囲

20個の値の推定クレジット範囲

40個の値の推定クレジット範囲

10

100

低:例えば、請求書やスライドなど。

2~5

3~7

6~20

100

10

低:例えば、請求書やスライドなど。

4~7

6~11

10~24

1,000

1

低:例えば、請求書やスライドなど。

9~12

10~14

12~26

10

100

媒体:例えば、ビジネスドキュメントや財務諸表など

3~6

6~10

12~26

100

10

媒体:例えば、ビジネスドキュメントや財務諸表など

6~9

9~12

16~30

1,000

1

媒体:例えば、ビジネスドキュメントや財務諸表など

9~12

11~15

15~29

10

100

例えば、研究論文や法的文書など。

4~7

8~12

16~30

100

10

例えば、研究論文や法的文書など。

7~10

11~15

21~35

1,000

1

例えば、研究論文や法的文書など。

10~13

12~16

17~31

次の例を考えてみましょう:

  • 年間30,000件の発注書を処理しているとします。

  • 各ドキュメントのページ数は平均10ページ、つまり総ページ数は30万ページです。

  • これらは発注書なので、各ページは中程度の密度であると評価します。

  • 各発注書から10個の値を抽出するとします。

この場合、1,000ページあたりのクレジットの目安は6~9となり、年間30,000ドキュメント(300,000ページ)で1,800~2,700クレジットとなります。

クレジット消費の詳細については、 Snowflakeサービス利用テーブル をご参照ください。

Document AI のコストのモニター

ORGANIZATION_USAGE スキーマの METERING_DAILY_HISTORY ビュー に、 AI_SERVICES のサービスタイプで Document AI が表示されます。

組織内の全アカウントの AI サービスのクレジット消費量を表示するには、以下のクエリを使用します。

SELECT * FROM SNOWFLAKE.ORGANIZATION_USAGE.METERING_DAILY_HISTORY
  WHERE service_type ILIKE '%ai_services%';
Copy

注釈

SNOWFLAKE.ORGANIZATION_USAGE.METERING_DAILY_HISTORY ビューの更新には最大4時間かかることがあります。

使用されたクレジットを含む、お客様のアカウントの Document AI の使用データを表示するには、 DOCUMENT_AI_USAGE_HISTORY ビュー をご利用ください。

Document AI に対して最適なウェアハウスサイズを決定する

Snowflakeでは、XS、S、Mウェアハウスのご利用をお勧めしています。ウェアハウスをスケールアップしてもクエリ処理のスピードは上がりませんが、無駄なコストがかかる可能性があります。

ウェアハウスリソースを必要とする業務を追加する場合は、ウェアハウスの拡張を検討してください。