Solução de problemas da Document AI

Os cenários a seguir podem ajudar você a solucionar problemas que podem ocorrer ao trabalhar com a Document AI.

A consulta de extração não está funcionando

Para a consulta de extração funcionar, você deve armazenar os documentos para extração em um estágio interno ou externo. Certifique-se de especificar o tipo de criptografia SNOWFLAKE_SSE ao criar um estágio interno.

Erro

Dependendo do formato do documento, você pode receber um erro como um dos seguintes:

{   "__processingErrors": [     "File extension does not match actual mime type. Mime-Type: application/octet-stream"   ] }
{   "__processingErrors": [     "cannot identify image file <_io.BytesIO object at 0x7f8a800ba020>"   ] }

Causa

Você não especificou o tipo de criptografia SNOWFLAKE_SSE ao criar um estágio interno para armazenar documentos.

Solução

Para criar um estágio interno, execute o comando CREATE STAGE, conforme mostrado no exemplo a seguir:

CREATE STAGE doc_ai_stage
  DIRECTORY = (ENABLE = TRUE)
  ENCRYPTION = (TYPE = 'SNOWFLAKE_SSE');
Copy

O URL pré-assinado expirou

O URL pré-assinado dos documentos preparados é um argumento obrigatório para <nome_da_construção_do_modelo> !PREDICT. Para obter o URL pré-assinado, chame a função GET_PRESIGNED_URL, que tem o tempo de expiração padrão.

Para obter mais informações, consulte GET_PRESIGNED_URL.

Erro

{ "__processingErrors": [ "Received HTTP 403 response for presigned URL. URL may be expired." ] }

Causa

O URL pré-assinado expirou.

Solução

Reduza o número de documentos em uma consulta ou estenda o tempo de expiração. Para obter mais informações sobre como estender o prazo de expiração, consulte GET_PRESIGNED_URL.

Muitos documentos em uma consulta

Document AI tem uma limite no número de documentos processados em uma consulta de extração. Para obter mais informações, consulte Limitações conhecidas da Document AI.

Erro

{ "__processingErrors": [ "Query limit reached: too many documents in a single query." ] }

Causa

Você tentou processar muitos documentos em uma consulta.

Solução

Use várias consultas para processar os documentos.

Os documentos não atendem aos requisitos específicos

Os documentos que você processa com Document AI devem atender a requisitos específicos. Para obter mais informações, consulte Como preparar seus documentos para a Document AI.

Erro

Você pode receber um dos seguintes erros:

{ "__processingErrors": [ "Page 0 size is larger than the limit. Actual: 1083 mm x 1384 mm. Maximum: 1200 mm x 1200 mm." ] }
{ "__processingErrors": [ "Document has too many pages. Actual: 150. Maximum: 125." ] }
{ "__processingErrors": [ "Image size is too small. Actual: 20x20 px. Minimum: 50x50 px." ] }
{ "__processingErrors": [ "Unsupported file format. Actual: csv. Supported: docx, eml, htm, html, jpeg, jpg, pdf, png, text, tif, tiff, txt." ] }
{ "__processingErrors": [ "File exceeds maximum size. Actual: 54096026 bytes. Maximum: 50000000 bytes." ] }

Causa

Os documentos que tentaram fazer o processamento não atendem aos requisitos de Document AI. Para mais informações sobre os requisitos, consulte Como preparar seus documentos para a Document AI.

Solução

Prepare seus documentos para atender aos requisitos.

A compilação de modelo Document AI não foi publicada

Para extrair informações com Document AI, você precisa ter a compilação de modelo Document AI publicada. Você não precisa publicar a compilação de modelo se tiver treinado o modelo e não adicionado novos valores de dados (fazer novas perguntas) após o treinamento.

Erro

A mensagem de erro começa com o seguinte:

Request failed for external function DOCUMENT_EXTRACT_FEATURES$V1 with remote service error: 422

Causa

A compilação de modelo Document AI não foi publicada.

Solução

Publique a compilação de modelo Document AI. Para obter mais informações, consulte Publicação de um compilação de modelo de Document AI.

Os privilégios necessários não foram concedidos ou o nome da compilação de modelo está duplicado

Para criar uma compilação de modelo Document AI, você deve conceder os privilégios necessários à sua função e escolher um nome de compilação de modelo exclusivo.

Para obter mais informações sobre os privilégios necessários, consulte Controle de acesso da Document AI.

Erro

Unable to create a build on the specified database and schema. Please check the documentation to learn more.

Causa

As possíveis causas são:

  • O privilégio CREATE SNOWFLAKE.ML.DOCUMENT_INTELLIGENCE não é concedido à sua função.

  • O nome da compilação de modelo já existe no banco de dados e no esquema.

Solução