Kostenkontrolle von Document AI¶
Unter diesem Thema werden Best Practices für die Kostenkontrolle von Document AI erörtert.
Erläuterungen zu den Kosten von Document AI¶
Document AI verursacht auf folgende Weise Kosten:
- Computing von KI-Diensten:
Document AI ermöglicht das Extrahieren von Informationen aus Dokumenten mit der <model_build_name>!PREDICT-Methode, die Computekosten verursacht.
- Computing von virtuellen Warehouses:
Um Abfragen in Arbeitsblättern auszuführen (auch mit der <model_build_name>!PREDICT-Methode), wählen Sie ein Warehouse aus. Darüber hinaus kann Document AI Kosten für andere Operationen im Zusammenhang mit dem Abrufen von Daten in den Arbeitsblättern anfallen. Weitere Informationen zur Auswahl der Warehouse-Größe für Document AI finden Sie unter Bestimmen der optimalen Warehouse-Größe für Document AI.
- Speicher:
Um das Document AI-Modell zu testen, laden Sie die Dokumente auf die Document AI-Benutzeroberfläche in Snowsight hoch. Dort können Sie die Ergebnisse überprüfen und optional das Modell einem Fine-Tuning durch Training unterziehen. Für diese Operationen fallen möglicherweise Speicherkosten an, da die Ergebnisse in einem Snowflake-Klassenobjekt in Ihrem Konto gespeichert werden. Um Informationen mithilfe von SQL zu extrahieren, laden Sie die Dokumente in einen internen oder externen Stagingbereich hoch, was ebenfalls zu Speicherkosten führen kann. Weitere Informationen zum Anzeigen der angefallenen Speicherkosten finden Sie unter Untersuchen der Speicherkosten.
Weitere Informationen zu den Gesamtkosten in Snowflake finden Sie unter Erläuterungen zu den Gesamtkosten.
Computekosten für KI-Dienste¶
Document AI verwendet Snowflake-verwaltete Computeressourcen, die von Snowflake je nach Document AI-Workload automatisch nach oben oder unten skaliert werden. Bei der von Snowflake verwalteten Computing-Struktur basiert der Verbrauch auf der Zeit, in der die Ressourcen tatsächlich genutzt werden. Im Gegensatz dazu verbrauchen vom Benutzer verwaltete virtuelle Warehouses während der Ausführung Credits, unabhängig davon, ob sie Workload verarbeiten, sodass sie auch ungenutzt oder überlastet sein können.
Die Berechnung des Credit-Verbrauchs für Document AI basiert auf der Gesamtmenge der Computeressourcen, die für das Ausführen des Jobs verwendet werden. Der Umfang der genutzten Computeressourcen wird anhand des Computing-Typs und der benötigten Zeit gemessen und dann auf Sekundenbasis für alle vom Workload genutzten Ressourcen berechnet, aufgerundet auf die nächste ganze Sekunde.
Weitere Informationen zu Computekosten bei Snowflake finden Sie unter Erläuterungen zu den Computekosten.
Weitere Informationen zum Credit-Verbrauch finden Sie unter Snowflake Service Consumption Table.
Schätzen des Credit-Verbrauchs¶
Der Credit-Verbrauch für Document AI hängt von Folgendem ab:
Anzahl der Seiten (bei Dokumentformaten, die aus Seiten bestehen)
Anzahl der Dokumente
Dichte der Seite
Die Bearbeitung eines größtenteils leeren Dokuments (z. B. einer Rechnung) nimmt weniger Zeit in Anspruch als die eines textlastigen Dokuments (z. B. einer wissenschaftlichen Arbeit), was den Credit-Verbrauch reduziert.
Anzahl der zu extrahierenden Datenwerte
Das Extrahieren von mehr Datenwerten nimmt mehr Zeit in Anspruch, was den Credit-Verbrauch erhöht.
Die folgende Tabelle beschreibt den geschätzten Credit-Verbrauch für 1.000 Seiten auf der Grundlage verschiedener Arten von Arbeitslasten:
Anzahl der Dokumente |
Anzahl der Seiten pro Dokument |
Dichte der Seite |
Geschätzter Credit-Bereich für 10 Werte |
Geschätzter Credit-Bereich für 20 Werte |
Geschätzter Credit-Bereich für 40 Werte |
---|---|---|---|---|---|
10 |
100 |
Niedrig, z. B. eine Rechnung oder eine Folie |
Von 2 bis 5 |
Von 3 bis 7 |
Von 6 bis 20 |
100 |
10 |
Niedrig, z. B. eine Rechnung oder eine Folie |
Von 4 bis 7 |
Von 6 bis 11 |
Von 10 bis 24 |
1,000 |
1 |
Niedrig, z. B. eine Rechnung oder eine Folie |
Von 9 bis 12 |
Von 10 bis 14 |
Von 12 bis 26 |
10 |
100 |
Mittel, z. B. Geschäftskorrespondenz oder Finanzberichte |
Von 3 bis 6 |
Von 6 bis 10 |
Von 12 bis 26 |
100 |
10 |
Mittel, z. B. Geschäftskorrespondenz oder Finanzberichte |
Von 6 bis 9 |
Von 9 bis 12 |
Von 16 bis 30 |
1,000 |
1 |
Mittel, z. B. Geschäftskorrespondenz oder Finanzberichte |
Von 9 bis 12 |
Von 11 bis 15 |
Von 15 bis 29 |
10 |
100 |
Hoch, z. B. eine Forschungsarbeit oder ein juristisches Dokument |
Von 4 bis 7 |
Von 8 bis 12 |
Von 16 bis 30 |
100 |
10 |
Hoch, z. B. eine Forschungsarbeit oder ein juristisches Dokument |
Von 7 bis 10 |
Von 11 bis 15 |
Von 21 bis 35 |
1,000 |
1 |
Hoch, z. B. eine Forschungsarbeit oder ein juristisches Dokument |
Von 10 bis 13 |
Von 12 bis 16 |
Von 17 bis 31 |
Betrachten Sie das folgende Beispiel:
Sie bearbeiten 30.000 Bestellungsdokumente pro Jahr.
Jedes Dokument hat im Durchschnitt 10 Seiten, d. h., die Gesamtseitenzahl beträgt 300.000.
Da es sich um Bestellungen handelt, schätzen Sie, dass jede Seite eine mittlere Dichte aufweist.
Sie möchten 10 Werte aus jeder Bestellung extrahieren.
In diesem Fall beträgt die geschätzte Credit-Spanne pro 1.000 Seiten 6 bis 9, was 1.800 bis 2.700 Credits für 30.000 Dokumente (300.000 Seiten) pro Jahr ergibt.
Weitere Informationen zum Credit-Verbrauch finden Sie unter Snowflake Service Consumption Table.
Überwachen der Kosten von Document AI¶
Die Nutzung von Document AI wird in der Ansicht METERING_DAILY_HISTORY des ORGANIZATION_USAGE-Schemas mit dem Diensttyp AI_SERVICES angezeigt.
Um den Credit-Verbrauch durch KI-Dienste für alle Konten einer Organisation anzuzeigen, verwenden Sie die folgende Abfrage:
SELECT * FROM SNOWFLAKE.ORGANIZATION_USAGE.METERING_DAILY_HISTORY
WHERE service_type ILIKE '%ai_services%';
Bemerkung
Die Aktualisierung der Ansicht SNOWFLAKE.ORGANIZATION_USAGE.METERING_DAILY_HISTORY kann bis zu vier Stunden dauern.
Um die Nutzungsdaten für Document AI für Ihr Konto, einschließlich der verbrauchten Credits, anzuzeigen, verwenden Sie die Ansicht DOCUMENT_AI_USAGE_HISTORY.
Bestimmen der optimalen Warehouse-Größe für Document AI¶
Snowflake empfiehlt die Verwendung eines Warehouses der Größe X-Small, Small oder Medium. Eine Vergrößerung des Warehouses erhöht nicht die Geschwindigkeit der Abfrageverarbeitung, kann aber zu unnötigen Kosten führen.
Ziehen Sie eine Vergrößerung des Warehouses in Betracht, wenn Sie zusätzliche Operationen ausführen, die Warehouse-Ressourcen erfordern.