Kostenkontrolle von Document AI

Unter diesem Thema werden Best Practices für die Kostenkontrolle von Document AI erörtert.

Erläuterungen zu den Kosten von Document AI

Document AI verursacht auf folgende Weise Kosten:

Computing von KI-Diensten:

Document AI ermöglicht das Extrahieren von Informationen aus Dokumenten mit der <model_build_name>!PREDICT-Methode, die Computekosten verursacht.

Computing von virtuellen Warehouses:

Um Abfragen in Arbeitsblättern auszuführen (auch mit der <model_build_name>!PREDICT-Methode), wählen Sie ein Warehouse aus. Darüber hinaus kann Document AI Kosten für andere Operationen im Zusammenhang mit dem Abrufen von Daten in den Arbeitsblättern anfallen. Weitere Informationen zur Auswahl der Warehouse-Größe für Document AI finden Sie unter Bestimmen der optimalen Warehouse-Größe für Document AI.

Speicher:

Um das Document AI-Modell zu testen, laden Sie die Dokumente auf die Document AI-Benutzeroberfläche in Snowsight hoch. Dort können Sie die Ergebnisse überprüfen und optional das Modell einem Fine-Tuning durch Training unterziehen. Für diese Operationen fallen möglicherweise Speicherkosten an, da die Ergebnisse in einem Snowflake-Klassenobjekt in Ihrem Konto gespeichert werden. Um Informationen mithilfe von SQL zu extrahieren, laden Sie die Dokumente in einen internen oder externen Stagingbereich hoch, was ebenfalls zu Speicherkosten führen kann. Weitere Informationen zum Anzeigen der angefallenen Speicherkosten finden Sie unter Untersuchen der Speicherkosten.

Weitere Informationen zu den Gesamtkosten in Snowflake finden Sie unter Erläuterungen zu den Gesamtkosten.

Computekosten für KI-Dienste

Document AI verwendet Snowflake-verwaltete Computeressourcen, die von Snowflake je nach Document AI-Workload automatisch nach oben oder unten skaliert werden. Bei der von Snowflake verwalteten Computing-Struktur basiert der Verbrauch auf der Zeit, in der die Ressourcen tatsächlich genutzt werden. Im Gegensatz dazu verbrauchen vom Benutzer verwaltete virtuelle Warehouses während der Ausführung Credits, unabhängig davon, ob sie Workload verarbeiten, sodass sie auch ungenutzt oder überlastet sein können.

Die Berechnung des Credit-Verbrauchs für Document AI basiert auf der Gesamtmenge der Computeressourcen, die für das Ausführen des Jobs verwendet werden. Der Umfang der genutzten Computeressourcen wird anhand des Computing-Typs und der benötigten Zeit gemessen und dann auf Sekundenbasis für alle vom Workload genutzten Ressourcen berechnet, aufgerundet auf die nächste ganze Sekunde.

Weitere Informationen zu Computekosten bei Snowflake finden Sie unter Erläuterungen zu den Computekosten.

Weitere Informationen zum Credit-Verbrauch finden Sie unter Snowflake Service Consumption Table.

Schätzen des Credit-Verbrauchs

Der Credit-Verbrauch für Document AI hängt von Folgendem ab:

  • Anzahl der Seiten (bei Dokumentformaten, die aus Seiten bestehen)

  • Anzahl der Dokumente

  • Dichte der Seite

    Die Bearbeitung eines größtenteils leeren Dokuments (z. B. einer Rechnung) nimmt weniger Zeit in Anspruch als die eines textlastigen Dokuments (z. B. einer wissenschaftlichen Arbeit), was den Credit-Verbrauch reduziert.

  • Anzahl der zu extrahierenden Datenwerte

    Das Extrahieren von mehr Datenwerten nimmt mehr Zeit in Anspruch, was den Credit-Verbrauch erhöht.

Die folgende Tabelle enthält den geschätzten Credit-Verbrauch auf der Grundlage verschiedener Typen von Workloads:

Anzahl der Seiten

Anzahl der Dokumente

Dichte der Seite

Geschätzter Credit-Bereich für 10 Werte

Geschätzter Credit-Bereich für 20 Werte

Geschätzter Credit-Bereich für 40 Werte

1,000

10

Niedrig, z. B. eine Rechnung oder eine Folie

Von 3 bis 5

Von 4 bis 6

Von 6 bis 8

1,000

100

Niedrig, z. B. eine Rechnung oder eine Folie

Von 5 bis 7

Von 7 bis 10

Von 10 bis 12

1,000

1,000

Niedrig, z. B. eine Rechnung oder eine Folie

Von 10 bis 12

Von 11 bis 13

Von 12 bis 14

1,000

10

Mittel, z. B. Geschäftskorrespondenz oder Finanzberichte

Von 4 bis 6

Von 7 bis 9

Von 12 bis 14

1,000

100

Mittel, z. B. Geschäftskorrespondenz oder Finanzberichte

Von 7 bis 9

Von 10 bis 12

Von 16 bis 18

1,000

1,000

Mittel, z. B. Geschäftskorrespondenz oder Finanzberichte

Von 10 bis 12

Von 12 bis 14

Von 15 bis 17

1,000

10

Hoch, z. B. eine Forschungsarbeit oder ein juristisches Dokument

Von 5 bis 7

Von 9 bis 11

Von 16 bis 18

1,000

100

Hoch, z. B. eine Forschungsarbeit oder ein juristisches Dokument

Von 8 bis 10

Von 12 bis 14

Von 21 bis 23

1,000

1,000

Hoch, z. B. eine Forschungsarbeit oder ein juristisches Dokument

Von 11 bis 13

Von 13 bis 15

Von 17 bis 19

Überwachen der Kosten von Document AI

Die Nutzung von Document AI wird in der Ansicht METERING_DAILY_HISTORY des ORGANIZATION_USAGE-Schemas mit dem Diensttyp AI_SERVICES angezeigt.

Um den Credit-Verbrauch durch KI-Dienste für alle Konten einer Organisation anzuzeigen, verwenden Sie die folgende Abfrage:

SELECT * FROM SNOWFLAKE.ORGANIZATION_USAGE.METERING_DAILY_HISTORY
  WHERE service_type ILIKE '%ai_services%';
Copy

Bemerkung

Die Aktualisierung der Ansicht SNOWFLAKE.ORGANIZATION_USAGE.METERING_DAILY_HISTORY kann bis zu vier Stunden dauern.

Um die Nutzungsdaten für Document AI für Ihr Konto, einschließlich der verbrauchten Credits, anzuzeigen, verwenden Sie die Ansicht DOCUMENT_AI_USAGE_HISTORY.

Bestimmen der optimalen Warehouse-Größe für Document AI

Snowflake empfiehlt die Verwendung eines Warehouses der Größe X-Small, Small oder Medium. Eine Vergrößerung des Warehouses erhöht nicht die Geschwindigkeit der Abfrageverarbeitung, kann aber zu unnötigen Kosten führen.

Ziehen Sie eine Vergrößerung des Warehouses in Betracht, wenn Sie zusätzliche Operationen ausführen, die Warehouse-Ressourcen erfordern.