- Categorias:
Funções de cadeia de caracteres e binários (funções de AI)
AI_EXTRACT (Document AI modelos legados)¶
Extrai informações de um arquivo.
Sintaxe¶
AI_EXTRACT ( model => <model> ,
file => <file> )
Argumentos¶
model => modelEspecifica o modelo Document AI Arctic-TILT para extração armazenado no Snowflake Model Registry; por exemplo,
my_db.my_schema.my_model.file => fileUm FILE para extração.
Retornos¶
Extração de entidades¶
{
"error": null,
"response": {
"invoice_items": [
"NEW CRUSHED VELVET DIVAN BED",
"Vintage Radiator",
"Solid Wooden Worktop",
"Sienna Crushed Velvet Curtains"
],
"invoice_number": "123/20",
"tax_amount": "77.57",
"total_amount": "465.43 GBP",
"vendor_name": "UK Exports & Imports Ltd"
}
}
Extração de tabelas¶
{
"error": null,
"response": {
"table1": {
"gross": ["10", "31", "10"],
"item": ["apples", "banana", "pear"],
"net": ["9", "30", "10"],
"tax": ["1", "1", ""]
},
"table2": {
"name": ["John", "Ana", "Lisa"],
"surname": ["Smith", "Nixon", "Gonzales"]
}
}
}
Requisitos de controle de acesso¶
Os usuários devem usar uma função que tenha a função do banco de dados SNOWFLAKE.CORTEX_USER. Para obter mais informações sobre como conceder esse privilégio, consulte Cortex LLM privileges.
Além disso, você deve ter o privilégio OWNERSHIP no modelo.
Notas de uso¶
O modelo deve estar no Registro de modelo Snowflake. Para migrar modelos para o Snowflake Model Registry, acesse a UI do Document AI e, quando solicitado, siga as instruções no banner de integração.
O modelo do Document AI não deve ter mais de 100 entidades.
Se não for definido explicitamente, a versão mais recente disponível do modelo será utilizada por padrão (a versão definida quando o modelo foi publicado ou treinado na UI do Document AI). Para definir a versão padrão de um modelo, use o comando ALTER MODEL conforme mostrado no exemplo a seguir:
ALTER MODEL my_model SET DEFAULT_VERSION = new_version;
Não há suporte para pontuações de confiança.
AI_EXTRACT usa faturamento baseado em token, que é diferente do faturamento baseado em tempo de computação utilizado no método <model_build_name> !PREDICT. Para obter mais informações sobre o custo de AI_EXTRACT para modelos legados do Document AI, consulte a Tabela de consumo de serviços do Snowflake.
O custo de extração de entidades é rotulado como
arctic-tilt-entity.O custo de extração de tabelas é rotulado como
arctic-tilt-table.
Disponibilidade regional¶
As seguintes regiões estão disponíveis:
AWS Canada (Central)
AWS EU (Frankfurt)
AWS EU (Ireland)
AWS US East (N. Virginia)
AWSUS East (Ohio)
AWS US West (Oregon)
Azure Australia East (New South Wales)
Azure East US 2 (Virginia)
Azure Southeast Asia (Singapore)
Azure West Europe (Netherlands)
Azure West US 2 (Washington)
Se a sua região não estiver listada, use a inferência entre regiões.
Exemplos¶
O exemplo a seguir extrai os recursos definidos no modelo do Document AI:
SELECT AI_EXTRACT(
model => 'my_db.my_schema.my_model',
file => TO_FILE('@files_db.files_schema.files', 'agreement.pdf')
);
O seguinte exemplo extrai informações de todos os arquivos em um diretório em uma área de preparação:
SELECT AI_EXTRACT(
model => 'my_db.my_schema.my_model',
file => TO_FILE('@db.schema.files', relative_path)
) FROM DIRECTORY (@db.schema.files);
Avisos legais¶
Consulte AI e ML Snowflake.