Schritt 1: Dateiformatobjekte erstellen¶
Wenn Sie Datendateien aus einem S3-Bucket in eine Tabelle laden, müssen Sie das Format der Datei beschreiben und angeben, wie die Daten in der Datei interpretiert und verarbeitet werden sollen. Wenn Sie beispielsweise Daten aus einer CSV-Datei laden, die durch senkrechte Striche voneinander getrennt sind, müssen Sie angeben, dass die Datei das CSV-Format mit dem senkrechten Strich als Trennzeichen verwendet.
Diese Formatinformation geben Sie beim Ausführen des COPY INTO <Tabelle>-Befehls an. Sie können diese Informationen entweder als Option im Befehl angeben (z. B. TYPE = CSV
, FIELD_DELIMITER = '|'
usw.), oder Sie können ein Dateiformatobjekt angeben, das diese Formatinformationen enthält. Sie können ein benanntes Dateiformatobjekt mit dem Befehl CREATE FILE FORMAT erstellen.
In diesem Schritt erstellen Sie Dateiformatobjekte, die das Datenformat der CSV- und JSON-Beispieldaten beschreiben, die für dieses Tutorial bereitgestellt werden.
Erstellen eines Dateiformatobjekts für CSV-Daten¶
Führen Sie den Befehl CREATE FILE FORMAT aus, um das Dateiformat mycsvformat
zu erstellen.
CREATE OR REPLACE FILE FORMAT mycsvformat
TYPE = 'CSV'
FIELD_DELIMITER = '|'
SKIP_HEADER = 1;
Wobei:
TYPE = 'CSV'
gibt den Dateiformattyp der Quelldatei an. CSV ist der Standard-Dateiformattyp.FIELD_DELIMITER = '|'
gibt an, dass das Zeichen „| “ ein Feldtrennzeichen ist. Der Standardwert ist „,“.SKIP_HEADER = 1
zeigt an, dass die Quelldatei eine Kopfzeile enthält. Der COPY-Befehl überspringt diese Kopfzeilen beim Laden von Daten. Der Standardwert ist 0.
Erstellen eines Dateiformatobjekts für JSON-Daten¶
Führen Sie den Befehl CREATE FILE FORMAT aus, um das Dateiformat myjsonformat
zu erstellen.
CREATE OR REPLACE FILE FORMAT myjsonformat TYPE = 'JSON' STRIP_OUTER_ARRAY = TRUE;
Wobei:
TYPE = 'JSON'
gibt den Dateiformattyp der Quelldatei an.STRIP_OUTER_ARRAY = TRUE
weist den COPY-Befehl an, die Wurzelklammern ([]) beim Laden von Daten in die Tabelle wegzulassen.
Nächstes Thema: Schritt 2: Stagingobjekte erstellen