Extração de informações com a Document AI

Este tópico descreve a extração de informações de documentos usando a Document AI.

Se você publicou ou treinou anteriormente a compilação de modelo da Document AI, agora você pode extrair informações de documentos executando a consulta de extração nas planilhas. Você também pode criar pipelines de processamento para processar continuamente novos documentos em um estágio.

Nota

Document AI tem limitações conhecidas, incluindo o número e o tamanho de documentos que você pode processar em uma única consulta. Para obter mais informações, consulte Limitações conhecidas da Document AI.

Pré-requisitos

A extração bem-sucedida de informações requer as seguintes condições:

  • Os documentos usados para extração de informações são armazenados em um estágio interno ou externo. Para obter mais informações, consulte Configuração de Document AI.

  • Você está usando o banco de dados e o esquema que configurou para a Document AI. Por exemplo:

    USE DATABASE doc_ai_db;
    USE SCHEMA doc_ai_schema;
    
    Copy
  • Você está usando uma função de conta que recebeu a função de banco de dados SNOWFLAKE.DOCUMENT_INTELLIGENCE_CREATOR. Para obter mais informações, consulte Configuração de Document AI.

  • Você publicou anteriormente uma compilação de modelo de Document AI ou treinou um modelo de Document AI. Para obter mais informações, consulte Publicação de um compilação de modelo de Document AI.

Uso da consulta de extração

Uma consulta de extração é uma consulta SQL com base no método PREDICT. Para obter mais informações, consulte <nome_da_construção_do_modelo> !PREDICT.

Para extrair informações de documentos, execute a consulta de extração nas planilhas. Após publicar ou treinar o modelo de Document AI, você pode ver a consulta de extração definida no Snowsight.

Para visualizar a consulta de extração no Snowsight:

  1. Faça login no Snowsight.

  2. No menu de navegação, selecione AI & ML » Document AI.

  3. Selecione um warehouse.

    A lista de compilações de modelo é exibida.

  4. Na lista de compilações de modelo, selecione o nome da compilação de modelo cuja consulta deseja ver.

  5. Para visualizar Extracting Query, selecione a aba Build Details.

Criação de pipelines de processamento de documentos

Com Document AI, você pode criar pipelines que processem automaticamente arquivos de documento para extrair informações. Para criar um pipeline de processamento, você precisa criar um fluxo em um estágio e uma tarefa para processar continuamente novos documentos no estágio.

Para obter mais informações, consulte Tutorial: Crie um pipeline de processamento de documentos com a AI de documento.