- Kategorien:
Zeichenfolgen- und Binärfunktionen (AI-Funktionen)
AI_EXTRACT (Document AI Legacy-Modelle)¶
Extrahiert Informationen aus einer Datei.
Syntax¶
AI_EXTRACT ( model => <model> ,
file => <file> )
Argumente¶
model => modelGibt das Document AI ArcticTILT-Modell für die Extraktion an, gespeichert in der Snowflake Model Registry, zum Beispiel:
my_db.my_schema.my_model.file => fileEine FILE für die Extraktion.
Rückgabewerte¶
Entitätsextraktion¶
{
"error": null,
"response": {
"invoice_items": [
"NEW CRUSHED VELVET DIVAN BED",
"Vintage Radiator",
"Solid Wooden Worktop",
"Sienna Crushed Velvet Curtains"
],
"invoice_number": "123/20",
"tax_amount": "77.57",
"total_amount": "465.43 GBP",
"vendor_name": "UK Exports & Imports Ltd"
}
}
Tabellenextraktion¶
{
"error": null,
"response": {
"table1": {
"gross": ["10", "31", "10"],
"item": ["apples", "banana", "pear"],
"net": ["9", "30", "10"],
"tax": ["1", "1", ""]
},
"table2": {
"name": ["John", "Ana", "Lisa"],
"surname": ["Smith", "Nixon", "Gonzales"]
}
}
}
Anforderungen an die Zugriffssteuerung¶
Benutzer müssen eine Rolle verwenden, der die Datenbankrolle SNOWFLAKE.CORTEX_USER zugewiesen wurde: Weitere Informationen zum Erteilen dieser Berechtigung finden Sie unter Cortex LLM privileges.
Außerdem müssen Sie über die OWNERSHIP-Berechtigung für das Modell verfügen.
Nutzungshinweise¶
Das Modell muss sich in der Snowflake Model Registry befinden. Um Modelle in die Snowflake Model Registry zu migrieren, gehen Sie zur Document AI UI und folgen den Anweisungen auf dem Integrationsbanner, wenn Sie dazu aufgefordert werden.
Das Document AI-Modell sollte nicht mehr als 100 Entitäten haben.
Wenn nicht explizit festgelegt, wird standardmäßig die letzte verfügbare Modellversion verwendet (die Version, die festgelegt wurde, als das Modell in der Document AI UI veröffentlicht oder trainiert wurde). Um die Standardversion eines Modells festzulegen, verwenden Sie den Befehl ALTER MODEL, wie im folgenden Beispiel gezeigt:
ALTER MODEL my_model SET DEFAULT_VERSION = new_version;
Konfidenzwerte werden nicht unterstützt.
AI_EXTRACT verwendet die tokenbasierte Abrechnung, die sich von der rechenzeitbasierten Abrechnung unterscheidet, die in der <model_build_name>!PREDICT-Methode verwendet wird. Weitere Informationen zu den AI_EXTRACT-Kosten für Document AI Legacy-Modelle finden Sie unter Snowflake Service Consumption Table.
Die Kosten für die Extraktion der Entitäten sind als
arctic-tilt-entitygekennzeichnet.Die Kosten für die Extraktion der Tabelle sind als
arctic-tilt-tablegekennzeichnet.
Regionale Verfügbarkeit¶
Die folgenden Regionen sind verfügbar:
AWS Canada (Central)
AWS EU (Frankfurt)
AWS EU (Ireland)
AWS US East (N. Virginia)
AWS US East (Ohio)
AWS US West (Oregon)
Azure Australia East (New South Wales)
East US 2 (Virginia)
Azure Southeast Asia (Singapur)
West Europe (Niederlande)
Azure West US 2 (Washington)
Wenn Ihre Region nicht aufgeführt ist, verwenden Sie Regionenübergreifende Inferenz.
Beispiele¶
Im folgenden Beispiel werden die im Document AI-Modell definierten Features extrahiert:
SELECT AI_EXTRACT(
model => 'my_db.my_schema.my_model',
file => TO_FILE('@files_db.files_schema.files', 'agreement.pdf')
);
Im folgenden Beispiel werden Informationen aus allen Dateien in einem Stagingbereich extrahiert:
SELECT AI_EXTRACT(
model => 'my_db.my_schema.my_model',
file => TO_FILE('@db.schema.files', relative_path)
) FROM DIRECTORY (@db.schema.files);
Rechtliche Hinweise¶
Weitere Informationen dazu finden Sie unter KI und ML in Snowflake.