Governança de custos do Document AI

Este tópico fornece as práticas recomendadas para governança de custos de Document AI.

Compreensão de custos de Document AI

Document AI incorre em custos das seguintes maneiras:

Computação de serviços de AI:

Document AI permite extrair informações de documentos usando o método <nome_da_construção_do_modelo> !PREDICT, incorrendo em custo de computação.

Computação de warehouse virtual:

Para executar consultas em planilhas (incluindo o uso do método <nome_da_construção_do_modelo> !PREDICT), selecione um warehouse. Adicionalmente, Document AI pode incorrer em custos para outras operações relacionadas à recuperação de dados nas planilhas. Para obter mais informações sobre como selecionar o tamanho do warehouse para Document AI, consulte Determinação do tamanho ideal do warehouse para Document AI.

Armazenamento:

Para testar o modelo Document AI, você carrega os documentos para interface do usuário da Document AI no Snowsight, onde você analisa os resultados e, opcionalmente, ajusta o modelo por meio de treinamento. Essas operações podem incorrer em custos de armazenamento visto que os resultados são armazenados em um objeto de classe Snowflake em sua conta. Para extrair informações usando SQL, você carrega os documentos para um estágio interno ou externo, o que também pode gerar custos de armazenamento. Para obter mais informações sobre como visualizar os custos de armazenamento incorridos, consulte Exploração do custo de armazenamento.

Para obter mais informações sobre o custo geral do Snowflake, consulte Compreensão do custo total.

Custo de computação dos serviços de AI

Document AI utiliza recursos de computação gerenciados pelo Snowflake, que são automaticamente redimensionados pelo Snowflake, conforme a demanda para cada carga de trabalho Document AI. Com a estrutura de computação gerenciada pelo Snowflake, o consumo é baseado no tempo gasto realmente usando esses recursos. Por outro lado, os warehouses virtuais gerenciados pelo usuário consomem créditos durante a execução, independentemente de estarem executando algum trabalho, portanto, podem ficar ociosos ou serem usados em excesso.

O cálculo do consumo de crédito para Document AI é baseado na quantidade total de recursos de computação usados para concluir o trabalho. A quantidade de recursos de computação usados é medida pelo tipo de computação e pelo tempo gasto e é calculada por segundo em todos os recursos usados pela carga de trabalho, arredondados para o segundo inteiro mais próximo.

Para obter mais informações sobre o custo de computação no Snowflake, consulte Explicação dos custos de computação.

Para obter mais informações sobre o consumo de crédito, consulte a Tabela de consumo do serviço Snowflake.

Estimativa do consumo de crédito

O consumo de crédito para Document AI depende do seguinte:

  • Número de páginas (para formatos de documentos que consistem em páginas)

  • Número de documentos

  • Densidade de página

    Processar um documento quase todo em branco (por exemplo, uma fatura) leva menos tempo do que um documento com muito texto (por exemplo, um artigo de pesquisa), o que reduz o consumo de crédito.

  • Número de valores de dados a serem extraídos

    Extrair mais valores de dados leva mais tempo, o que aumenta o consumo de crédito.

A tabela a seguir descreve o consumo de crédito estimado com base em diferentes tipos de cargas de trabalho:

Número de páginas

Número de documentos

Densidade de página

Faixa de crédito estimada para 10 valores

Faixa de crédito estimada para 20 valores

Faixa de crédito estimada para 40 valores

1,000

10

Baixo; por exemplo, uma fatura ou um slide

De 3 a 5

De 4 a 6

De 6 a 8

1,000

100

Baixo; por exemplo, uma fatura ou um slide

De 5 a 7

De 7 a 10

De 10 a 12

1,000

1,000

Baixo; por exemplo, uma fatura ou um slide

De 10 a 12

De 11 a 13

De 12 a 14

1,000

10

Médio; por exemplo, correspondência comercial ou demonstrativos financeiros

De 4 a 6

De 7 a 9

De 12 a 14

1,000

100

Médio; por exemplo, correspondência comercial ou demonstrativos financeiros

De 7 a 9

De 10 a 12

De 16 a 18

1,000

1,000

Médio; por exemplo, correspondência comercial ou demonstrativos financeiros

De 10 a 12

De 12 a 14

De 15 a 17

1,000

10

Alto; por exemplo, um artigo de pesquisa ou um documento jurídico

De 5 a 7

De 9 a 11

De 16 a 18

1,000

100

Alto; por exemplo, um artigo de pesquisa ou um documento jurídico

De 8 a 10

De 12 a 14

De 21 a 23

1,000

1,000

Alto; por exemplo, um artigo de pesquisa ou um documento jurídico

De 11 a 13

De 13 a 15

De 17 a 19

Monitoramento de custo de Document AI

O uso de Document AI aparece no Exibição METERING_DAILY_HISTORY esquema ORGANIZATION_USAGE com um tipo de serviço AI_SERVICES.

Para visualizar o consumo de crédito dos serviços de AI para todas as contas de uma organização, use a consulta a seguir:

SELECT * FROM SNOWFLAKE.ORGANIZATION_USAGE.METERING_DAILY_HISTORY
  WHERE service_type ILIKE '%ai_services%';
Copy

Nota

A exibição SNOWFLAKE.ORGANIZATION_USAGE.METERING_DAILY_HISTORY pode levar até 4 horas para ser atualizada.

Para exibição dos dados de uso para Document AI da sua conta, incluindo créditos usados, use o Exibição DOCUMENT_AI_USAGE_HISTORY.

Determinação do tamanho ideal do warehouse para Document AI

A Snowflake recomenda usar um warehouse X-Small, Small ou Medium. Aumentar o tamanho do warehouse não aumenta a velocidade do processamento de consultas e pode resultar em custos desnecessários.

Considere aumentar o warehouse se for realizar operações adicionais que exijam recursos do warehouse.