Gouvernance des coûts de Document AI¶
Cette rubrique présente les meilleures pratiques en matière de gouvernance des coûts sur Document AI.
Comprendre les coûts de Document AI¶
Document AI entraîne des coûts de la manière suivante :
- Calcul des services AI:
Document AI permet d’extraire des informations de documents à l’aide de la méthode <nom_de_build_du_modèle>!PREDICT, qui engendre des coûts de calcul.
- Calcul de l’entrepôt virtuel:
Pour exécuter des requêtes dans des feuilles de calcul (y compris à l’aide de la méthode <nom_de_build_du_modèle>!PREDICT), vous sélectionnez un entrepôt. En outre, Document AI peut encourir des coûts pour d’autres opérations liées à la récupération des données dans les feuilles de calcul. Pour des informations sur la sélection de la taille de l’entrepôt pour Document AI, voir Détermination de la taille optimale d’un entrepôt pour Document AI.
- Stockage:
Pour tester le modèle Document AI, vous chargez les documents vers l’interface utilisateur Document AI dans Snowsight, où vous examinez les résultats et affinez éventuellement le modèle par entraînement. Ces opérations peuvent entraîner des coûts de stockage car les résultats sont stockés dans un objet de la classe Snowflake sur votre compte. Pour extraire des informations à l’aide de SQL, vous chargez les documents vers une zone de préparation interne ou externe, ce qui peut également entraîner des coûts de stockage. Pour des informations sur la vue des coûts de stockage encourus, voir Exploration des coûts de stockage.
Pour plus d’informations sur le coût global de Snowflake, voir Comprendre le coût général.
Coût de calcul des services AI¶
Document AI utilise les ressources de calcul gérées par Snowflake, qui sont automatiquement augmentées ou diminuées par Snowflake en fonction des besoins de chaque charge de travail Document AI. Avec la structure de calcul gérée par Snowflake, la consommation est basée sur le temps passé à utiliser effectivement ces ressources. En revanche, les entrepôts virtuels gérés par l’utilisateur consomment des crédits en cours d’exécution, qu’ils effectuent ou non des performances, de sorte qu’ils peuvent être inactifs ou surutilisés.
Le calcul de la consommation de crédits pour Document AI est basé sur la quantité totale de ressources de calcul utilisées pour effectuer la tâche. La quantité de ressources de calcul utilisées est mesurée par le type de calcul et le temps passé, et calculée par seconde sur l’ensemble des ressources utilisées par la charge de travail, arrondie à la seconde supérieure.
Pour plus d’informations sur les coûts de calcul de Snowflake, voir Comprendre le coût du calcul.
Pour plus d’informations sur la consommation des crédits, consultez la table de consommation des services de Snowflake.
Consommation estimée des crédits¶
La consommation des crédits pour Document AI dépend des éléments suivants :
Nombre de pages (pour les formats de documents composés de pages)
Nombre de documents
Densité des pages
Le traitement d’un document essentiellement vierge (par exemple, une facture) prend moins de temps que celui d’un document riche en texte (par exemple, un document de recherche), ce qui réduit la consommation de crédit.
Nombre de valeurs de données à extraire
L’extraction d’un plus grand nombre de valeurs de données prend plus de temps, ce qui augmente la consommation de crédit.
Le tableau suivant décrit la consommation de crédit estimée en fonction de différents types de charges de travail :
Nombre de pages |
Nombre de documents |
Densité des pages |
Plage de crédits estimés pour 10 valeurs |
Plage de crédits estimés pour 20 valeurs |
Plage de crédits estimés pour 40 valeurs |
---|---|---|---|---|---|
1,000 |
10 |
Faible ; par exemple, une facture ou une diapositive |
De 3 à 5 |
De 4 à 6 |
De 6 à 8 |
1,000 |
100 |
Faible ; par exemple, une facture ou une diapositive |
De 5 à 7 |
De 7 à 10 |
De 10 à 12 |
1,000 |
1,000 |
Faible ; par exemple, une facture ou une diapositive |
De 10 à 12 |
De 11 à 13 |
De 12 à 14 |
1,000 |
10 |
Moyen ; par exemple, correspondance commerciale ou relevés financiers |
De 4 à 6 |
De 7 à 9 |
De 12 à 14 |
1,000 |
100 |
Moyen ; par exemple, correspondance commerciale ou relevés financiers |
De 7 à 9 |
De 10 à 12 |
De 16 à 18 |
1,000 |
1,000 |
Moyen ; par exemple, correspondance commerciale ou relevés financiers |
De 10 à 12 |
De 12 à 14 |
De 15 à 17 |
1,000 |
10 |
Élevé ; par exemple, un mémoire de recherche ou un document juridique |
De 5 à 7 |
De 9 à 11 |
De 16 à 18 |
1,000 |
100 |
Élevé ; par exemple, un mémoire de recherche ou un document juridique |
De 8 à 10 |
De 12 à 14 |
De 21 à 23 |
1,000 |
1,000 |
Élevé ; par exemple, un mémoire de recherche ou un document juridique |
De 11 à 13 |
De 13 à 15 |
De 17 à 19 |
Surveillance des coûts de Document AI¶
L’utilisation de Document AI apparaît dans Vue METERING_DAILY_HISTORY dans le schéma ORGANIZATION_USAGE avec un type de service AI_SERVICES.
Pour afficher la consommation de crédits pour les services AI pour tous les comptes d’une organisation, utilisez la requête suivante :
SELECT * FROM SNOWFLAKE.ORGANIZATION_USAGE.METERING_DAILY_HISTORY
WHERE service_type ILIKE '%ai_services%';
Note
La mise à jour de la vue SNOWFLAKE.ORGANIZATION_USAGE.METERING_DAILY_HISTORY peut prendre jusqu’à quatre heures.
Pour voir les données d’utilisation de Document AI pour votre compte, y compris les crédits utilisés, utilisez le Vue DOCUMENT_AI_USAGE_HISTORY.
Détermination de la taille optimale d’un entrepôt pour Document AI¶
Snowflake recommande d’utiliser un entrepôt X-Small, Small ou Medium. L’agrandissement de l’entrepôt n’augmente pas la vitesse de traitement des requêtes, mais peut entraîner des coûts inutiles.
Envisagez d’agrandir l’entrepôt si vous effectuez des opérations supplémentaires qui nécessitent des ressources d’entrepôt.