Categorias:

Funções de cadeia de caracteres e binários (funções de AI)

AI_EXTRACT (Document AI modelos legados)

Extrai informações de um arquivo.

Sintaxe

AI_EXTRACT ( model => <model> ,
            file => <file> )
Copy

Argumentos

model => model

Especifica o modelo Document AI Arctic-TILT para extração armazenado no Snowflake Model Registry; por exemplo, my_db.my_schema.my_model.

file => file

Um FILE para extração.

Retornos

Extração de entidades

{
  "error": null,
  "response": {
    "invoice_items": [
      "NEW CRUSHED VELVET DIVAN BED",
      "Vintage Radiator",
      "Solid Wooden Worktop",
      "Sienna Crushed Velvet Curtains"
    ],
    "invoice_number": "123/20",
    "tax_amount": "77.57",
    "total_amount": "465.43 GBP",
    "vendor_name": "UK Exports & Imports Ltd"
  }
}

Extração de tabelas

{
  "error": null,
  "response": {
    "table1": {
      "gross": ["10", "31", "10"],
      "item": ["apples", "banana", "pear"],
      "net": ["9", "30", "10"],
      "tax": ["1", "1", ""]
    },
    "table2": {
      "name": ["John", "Ana", "Lisa"],
      "surname": ["Smith", "Nixon", "Gonzales"]
    }
  }
}

Requisitos de controle de acesso

Os usuários devem usar uma função que tenha a função do banco de dados SNOWFLAKE.CORTEX_USER. Para obter mais informações sobre como conceder esse privilégio, consulte Cortex LLM privileges.

Além disso, você deve ter o privilégio OWNERSHIP no modelo.

Notas de uso

  • O modelo deve estar no Registro de modelo Snowflake. Para migrar modelos para o Snowflake Model Registry, acesse a UI do Document AI e, quando solicitado, siga as instruções no banner de integração.

  • O modelo do Document AI não deve ter mais de 100 entidades.

  • Se não for definido explicitamente, a versão mais recente disponível do modelo será utilizada por padrão (a versão definida quando o modelo foi publicado ou treinado na UI do Document AI). Para definir a versão padrão de um modelo, use o comando ALTER MODEL conforme mostrado no exemplo a seguir:

    ALTER MODEL my_model SET DEFAULT_VERSION = new_version;
    
    Copy
  • Não há suporte para pontuações de confiança.

  • AI_EXTRACT usa faturamento baseado em token, que é diferente do faturamento baseado em tempo de computação utilizado no método <model_build_name> !PREDICT. Para obter mais informações sobre o custo de AI_EXTRACT para modelos legados do Document AI, consulte a Tabela de consumo de serviços do Snowflake.

    • O custo de extração de entidades é rotulado como arctic-tilt-entity.

    • O custo de extração de tabelas é rotulado como arctic-tilt-table.

Disponibilidade regional

As seguintes regiões estão disponíveis:

  • AWS Canada (Central)

  • AWS EU (Frankfurt)

  • AWS EU (Ireland)

  • AWS US East (N. Virginia)

  • AWSUS East (Ohio)

  • AWS US West (Oregon)

  • Azure Australia East (New South Wales)

  • Azure East US 2 (Virginia)

  • Azure Southeast Asia (Singapore)

  • Azure West Europe (Netherlands)

  • Azure West US 2 (Washington)

Se a sua região não estiver listada, use a inferência entre regiões.

Exemplos

O exemplo a seguir extrai os recursos definidos no modelo do Document AI:

SELECT AI_EXTRACT(
  model => 'my_db.my_schema.my_model',
  file => TO_FILE('@files_db.files_schema.files', 'agreement.pdf')
);
Copy

O seguinte exemplo extrai informações de todos os arquivos em um diretório em uma área de preparação:

SELECT AI_EXTRACT(
  model => 'my_db.my_schema.my_model',
  file => TO_FILE('@db.schema.files', relative_path)
) FROM DIRECTORY (@db.schema.files);
Copy