Document AI-Modell-Builds exportieren¶
Sie können Document AI-Modell-Builds in einen internen Stagingbereich exportieren. Infolgedessen werden die Dokumentdateien exportiert, und die Anmerkungsdatei wird erstellt. Sie können die exportierten Daten dann für verschiedene Zwecke verwenden, z. B. für die Erstellung von Snowflake Datasets und für das Extrahieren von Informationen mit der AI_EXTRACT-Funktion.
Voraussetzungen¶
Um Document AI verwenden zu können, müssen Sie über die erforderlichen Berechtigungen verfügen. Weitere Informationen zu den Berechtigungen finden Sie unter Einrichten von Document AI.
Um einen Document AI-Modell-Build zu exportieren, müssen Sie über die WRITE-Berechtigung für einen Ziel-Stagingbereich verfügen.
Bemerkung
Der Ziel-Stagingbereich muss ein interner Stagingbereich sein.
Einen Document AI-Modell-Build exportieren¶
Melden Sie sich bei Snowsight an.
Wählen Sie im Navigationsmenü die Option AI & ML » Document AI aus.
Wählen Sie ein Warehouse aus.
Die Liste der vorhandenen Modell-Builds wird angezeigt.
Wählen Sie neben dem Modell-Build-Namen das Menü … (Mehr) aus, und wählen Sie dann Export aus.
Wählen Sie im angezeigten Dialogfeld Export Build einen Ziel-Stagingbereich in der Liste aus, und bestätigen Sie dies, indem Sie Export auswählen.
Wenn der Exportvorgang abgeschlossen ist, schließen Sie das Dialogfeld, indem Sie Close auswählen.
Bemerkung
Sie können das Dialogfeld schließen, bevor der Exportvorgang abgeschlossen ist. Durch das Schließen des Dialogfelds wird der Exportvorgang nicht abgebrochen.
Der Modell-Build wird in den Ziel-Stagingbereich exportiert. Das bedeutet, dass das Verzeichnis des Ziel-Stagingbereichs jetzt alle Dokumente der neuesten Version von diesem Document AI-Modell-Build und die
annotations.jsonl-Datei enthält.
Die Anmerkungsdatei¶
Wenn Sie einen Document AI-Modell-Build exportieren, wird die annotations.jsonl-Datei im Verzeichnis des Ziel-Stagingbereichs generiert. Für jedes Dokument, das Sie exportieren, enthält die Datei die folgenden Informationen:
file: Bezeichner des Dateinamensprompt: JSON-Schema, das die Eingabeaufforderungen beschreibtannotatedResponse: Benutzerantworten in einem Format, das mit dem Schema konsistent istmodelResponse: Antworten, die nicht vom Benutzenden geändert wurden
Betrachten Sie das folgende Zeilenbeispiel für die annotations.jsonl-Datei:
{
"file": "5d8c22ebe1e9a9b4bc92f611c02a745b_00.pdf",
"prompt": {
"type": "object",
"properties": {
"information": {
"description": "Employee information",
"type": "object",
"properties": {
"name": {
"type": "array",
"items": {
"type": "string"
}
},
"address": {
"type": "array",
"items": {
"type": "string"
}
},
"city": {
"type": "array",
"items": {
"type": "string"
}
}
}
},
"data": {
"description": "",
"type": "object",
"properties": {
"ssid": {
"type": "array",
"items": {
"type": "string"
}
},
"employeeid": {
"type": "array",
"items": {
"type": "string"
}
},
"startdate": {
"type": "array",
"items": {
"type": "string"
}
},
"enddate": {
"type": "array",
"items": {
"type": "string"
}
}
}
},
"deductions": {
"description": "",
"type": "object",
"properties": {
"deductions name": {
"type": "array",
"items": {
"type": "string"
}
},
"current": {
"type": "array",
"items": {
"type": "string"
}
}
}
}
}
},
"annotatedResponse": {
"information": {
"name": [
"John Doe"
],
"address": [
"Dakota Avenue Powder River, WY 82648"
],
"city": [
"Powder River, WY 82648"
]
},
"data": {
"ssid": [
"123-45-6789"
],
"employeeid": [
"34528"
],
"startdate": [
"06/15/2018"
],
"enddate": [
"06/30/2018"
]
},
"deductions": {
"deductions name": [
"Federal Tax",
"Wyoming State Tax",
"SDI",
"Soc Sec / OASDI",
"Health Insurance Tax",
"None"
],
"current": [
"82.50",
"64.08",
"None",
"13.32",
"91.74",
"21.46"
]
}
},
"modelResponse": {}
}
Mit exportierten Daten arbeiten¶
Nachdem Sie einen Document AI-Modell-Build exportiert haben, können Sie eine Tabelle mit den exportierten Daten zur weiteren Verarbeitung erstellen:
Erstellen Sie ein Dateiformat für die Anmerkungsdatei:
CREATE OR REPLACE FILE FORMAT my_json TYPE = 'JSON';
Erstellen Sie eine Tabelle:
CREATE OR REPLACE TABLE exported_data_table AS ( SELECT input_file.$1:file AS file, input_file.$1:prompt AS prompt, input_file.$1:annotatedResponse AS response FROM '@docai_db.docai_schema.docai_stage/docai_test_2025_10_03_16_00_10/annotations.jsonl' (FILE_FORMAT => my_json) input_file WHERE response != '{}' );
Sie können nun entweder die exportierten Daten zur weiteren Verwendung in Snowflake in ein Datenset konvertieren oder die Funktion AI_EXTRACT mit diesen Daten ausführen:
Erstellen Sie ein Datenset für die exportierten Daten:
CREATE DATASET my_dataset; ALTER DATASET my_dataset ADD VERSION 'v2' FROM ( SELECT CONCAT('@docai_db.docai_schema.docai_stage/docai_test_2025_10_03_16_00_10/', file) AS file, prompt, response FROM exported_data_table );
Weitere Informationen zu Datensets finden Sie unter Snowflake Datasets.
Führen Sie AI_EXTRACT mit den exportierten Daten aus:
SELECT AI_EXTRACT ( file => TO_FILE('@docai_db.docai_schema.docai_stage/docai_test_2025_10_03_16_00_10', my_table.file), responseFormat => PARSE_JSON('{ "schema": ' || TO_VARIANT(my_table.schema) || '}') ) FROM docai_db.docai_schema.exported_data_table AS my_table;