Kostenkontrolle von Document AI¶
Unter diesem Thema werden Best Practices für die Kostenkontrolle von Document AI erörtert.
Erläuterungen zu den Kosten von Document AI¶
Document AI verursacht auf folgende Weise Kosten:
- Computing von KI-Diensten:
Document AI ermöglicht das Extrahieren von Informationen aus Dokumenten mit der <model_build_name>!PREDICT-Methode, die Computekosten verursacht.
- Computing von virtuellen Warehouses:
Um Abfragen in Arbeitsblättern auszuführen (auch mit der <model_build_name>!PREDICT-Methode), wählen Sie ein Warehouse aus. Darüber hinaus kann Document AI Kosten für andere Operationen im Zusammenhang mit dem Abrufen von Daten in den Arbeitsblättern anfallen. Weitere Informationen zur Auswahl der Warehouse-Größe für Document AI finden Sie unter Bestimmen der optimalen Warehouse-Größe für Document AI.
- Speicher:
Um das Document AI-Modell zu testen, laden Sie die Dokumente auf die Document AI-Benutzeroberfläche in Snowsight hoch. Dort können Sie die Ergebnisse überprüfen und optional das Modell einem Fine-Tuning durch Training unterziehen. Für diese Operationen fallen möglicherweise Speicherkosten an, da die Ergebnisse in einem Snowflake-Klassenobjekt in Ihrem Konto gespeichert werden. Um Informationen mithilfe von SQL zu extrahieren, laden Sie die Dokumente in einen internen oder externen Stagingbereich hoch, was ebenfalls zu Speicherkosten führen kann. Weitere Informationen zum Anzeigen der angefallenen Speicherkosten finden Sie unter Untersuchen der Speicherkosten.
Weitere Informationen zu den Gesamtkosten in Snowflake finden Sie unter Erläuterungen zu den Gesamtkosten.
Computekosten für KI-Dienste¶
Document AI verwendet Snowflake-verwaltete Computeressourcen, die von Snowflake je nach Document AI-Workload automatisch nach oben oder unten skaliert werden. Bei der von Snowflake verwalteten Computing-Struktur basiert der Verbrauch auf der Zeit, in der die Ressourcen tatsächlich genutzt werden. Im Gegensatz dazu verbrauchen vom Benutzer verwaltete virtuelle Warehouses während der Ausführung Credits, unabhängig davon, ob sie Workload verarbeiten, sodass sie auch ungenutzt oder überlastet sein können.
Die Berechnung des Credit-Verbrauchs für Document AI basiert auf der Gesamtmenge der Computeressourcen, die für das Ausführen des Jobs verwendet werden. Der Umfang der genutzten Computeressourcen wird anhand des Computing-Typs und der benötigten Zeit gemessen und dann auf Sekundenbasis für alle vom Workload genutzten Ressourcen berechnet, aufgerundet auf die nächste ganze Sekunde.
Weitere Informationen zu Computekosten bei Snowflake finden Sie unter Erläuterungen zu den Computekosten.
Weitere Informationen zum Credit-Verbrauch finden Sie unter Snowflake Service Consumption Table.
Schätzen des Credit-Verbrauchs¶
Der Credit-Verbrauch für Document AI hängt von Folgendem ab:
Anzahl der Seiten (bei Dokumentformaten, die aus Seiten bestehen)
Anzahl der Dokumente
Dichte der Seite
Die Bearbeitung eines größtenteils leeren Dokuments (z. B. einer Rechnung) nimmt weniger Zeit in Anspruch als die eines textlastigen Dokuments (z. B. einer wissenschaftlichen Arbeit), was den Credit-Verbrauch reduziert.
Anzahl der zu extrahierenden Datenwerte
Das Extrahieren von mehr Datenwerten nimmt mehr Zeit in Anspruch, was den Credit-Verbrauch erhöht.
Die folgende Tabelle enthält den geschätzten Credit-Verbrauch auf der Grundlage verschiedener Typen von Workloads:
Anzahl der Seiten |
Anzahl der Dokumente |
Dichte der Seite |
Geschätzter Credit-Bereich für 10 Werte |
Geschätzter Credit-Bereich für 20 Werte |
Geschätzter Credit-Bereich für 40 Werte |
---|---|---|---|---|---|
1,000 |
10 |
Niedrig, z. B. eine Rechnung oder eine Folie |
Von 3 bis 5 |
Von 4 bis 6 |
Von 6 bis 8 |
1,000 |
100 |
Niedrig, z. B. eine Rechnung oder eine Folie |
Von 5 bis 7 |
Von 7 bis 10 |
Von 10 bis 12 |
1,000 |
1,000 |
Niedrig, z. B. eine Rechnung oder eine Folie |
Von 10 bis 12 |
Von 11 bis 13 |
Von 12 bis 14 |
1,000 |
10 |
Mittel, z. B. Geschäftskorrespondenz oder Finanzberichte |
Von 4 bis 6 |
Von 7 bis 9 |
Von 12 bis 14 |
1,000 |
100 |
Mittel, z. B. Geschäftskorrespondenz oder Finanzberichte |
Von 7 bis 9 |
Von 10 bis 12 |
Von 16 bis 18 |
1,000 |
1,000 |
Mittel, z. B. Geschäftskorrespondenz oder Finanzberichte |
Von 10 bis 12 |
Von 12 bis 14 |
Von 15 bis 17 |
1,000 |
10 |
Hoch, z. B. eine Forschungsarbeit oder ein juristisches Dokument |
Von 5 bis 7 |
Von 9 bis 11 |
Von 16 bis 18 |
1,000 |
100 |
Hoch, z. B. eine Forschungsarbeit oder ein juristisches Dokument |
Von 8 bis 10 |
Von 12 bis 14 |
Von 21 bis 23 |
1,000 |
1,000 |
Hoch, z. B. eine Forschungsarbeit oder ein juristisches Dokument |
Von 11 bis 13 |
Von 13 bis 15 |
Von 17 bis 19 |
Überwachen der Kosten von Document AI¶
Die Nutzung von Document AI wird in der Ansicht METERING_DAILY_HISTORY des ORGANIZATION_USAGE-Schemas mit dem Diensttyp AI_SERVICES angezeigt.
Um den Credit-Verbrauch durch KI-Dienste für alle Konten einer Organisation anzuzeigen, verwenden Sie die folgende Abfrage:
SELECT * FROM SNOWFLAKE.ORGANIZATION_USAGE.METERING_DAILY_HISTORY
WHERE service_type ILIKE '%ai_services%';
Bemerkung
Die Aktualisierung der Ansicht SNOWFLAKE.ORGANIZATION_USAGE.METERING_DAILY_HISTORY kann bis zu vier Stunden dauern.
Um die Nutzungsdaten für Document AI für Ihr Konto, einschließlich der verbrauchten Credits, anzuzeigen, verwenden Sie die Ansicht DOCUMENT_AI_USAGE_HISTORY.
Bestimmen der optimalen Warehouse-Größe für Document AI¶
Snowflake empfiehlt die Verwendung eines Warehouses der Größe X-Small, Small oder Medium. Eine Vergrößerung des Warehouses erhöht nicht die Geschwindigkeit der Abfrageverarbeitung, kann aber zu unnötigen Kosten führen.
Ziehen Sie eine Vergrößerung des Warehouses in Betracht, wenn Sie zusätzliche Operationen ausführen, die Warehouse-Ressourcen erfordern.