Allgemeine Informationen zu Openflow Connector for Excel¶
Bemerkung
Der Konnektor unterliegt den Bedingungen für Konnektoren.
Unter diesem Thema werden die grundlegenden Konzepte, der Workflow und die Beschränkungen von Openflow Connector for Excel beschrieben.
Openflow Connector for Excel verbindet eine AWS-S3-Instanz oder eine Microsoft SharePoint-Website mit Snowflake, um Microsoft Excel-Dateien in regelmäßigen Abständen aufzunehmen und die aufgenommenen Daten in Snowflake-Tabellen zu speichern.
Der Konnektor unterstützt die Aufnahme der folgenden Daten:
Alle Excel-Tabellen
Angegebene Excel-Tabellen
Bestimmte Datenbereiche in einer Excel-Arbeitsmappe
Der Konnektor führt nur die Trunkierung und das Laden der Daten durch. Das bedeutet, dass jedes Mal, wenn eine Datei aufgenommen wird, die vorhandenen Daten in Snowflake vollständig durch die neuen Daten aus der Datei ersetzt werden.
Verwenden Sie diesen Konnektor, wenn Sie Folgendes tun möchten:
Lädt Daten aus Microsoft Excel-Tabellenin Snowflake-Tabellen für Berichte und Analysen
Lädt Daten aus Excel-Tabellen in SharePoint in Snowflake-Tabellen für Berichte und Analysen
Workflow¶
Basierend auf Ihrer Datenquelle sehen die Workflows für den Konnektor wie folgt aus:
Workflow für die Verbindung einer AWS-S3-Instanz¶
Ein AWS-Administrator führt die folgenden Aufgaben aus:
Erstellt einen IAM-Benutzer und zugehörige Anmeldeinformationen in seinem AWS-Konto.
Gibt die AWS-Region an, in der die S3-Instanz existiert, z. B. us-west-2.
Identifiziert die aufzunehmenden Dateien.
Ein Snowflake-Kontoadministrator führt folgende Aufgaben aus:
Legt die gewünschten Datenbank- und Schemanamen in Snowflake fest.
Gibt ein Warehouse an, das vom Konnektor verwendet werden soll.
Konfiguriert den vom Konnektor verwendeten Snowflake-Benutzer und eine Rolle für diesen Benutzer.
Ein Data Engineer führt die folgenden Aufgaben aus:
Lädt die Konnektordefinitionsdatei herunter und importiert sie in den Snowflake Openflow-Canvas.
Konfiguriert die Konnektorparameter:
Stellt die AWS-Anmeldeinformationen bereit.
Stellt die Benutzeranmeldeinformationen und die Konfiguration für Snowflake bereit.
Definiert die Kriterien für die zu übernehmenden Objekte, indem er Filter bereitstellt.
Startet den Ablauf innerhalb des Openflow-Canvas. Beim Ausführen führt der Ablauf die folgenden Aktionen aus:
Lädt die angegebenen Dateien aus dem S3-Bucket herunter.
Extrahiert relevante Daten.
Erzeugt die konfigurierte Zieltabelle in der Snowflake-Datenbank.
Lädt die verarbeiteten Daten in die gewünschte Snowflake-Tabelle.
Einschränkungen¶
Derzeit werden nur .xlsx-Dateien unterstützt (Office 2007 und spätere Versionen). Die folgenden Dateitypen werden nicht unterstützt:
.xls-Dateien (Versionen Office 97 bis Office 2003)
.xlsm-Dateien (makroaktivierte Arbeitsmappen)
.xlsb-Dateien (binäre Arbeitsmappen)
Große .xlsx-Dateien können die Laufzeit von Openflow überlasten oder Probleme verursachen, die sich auf andere Konnektor Ablaufe auswirken. Aufgrund von Speicherbeschränkungen sollte die Größe der Datei (unter der Annahme, dass der Konnektor alle Knotenressourcen nutzen kann) nicht größer sein als:
2 MB für einen kleinen Laufzeitknoten.
10 MB für einen mittleren Laufzeitknoten.
20 MB für einen großen Laufzeitknoten.
Für Spalten mit gemischten Datentypen (z. B. Zahlen und Zeichenfolgen) innerhalb derselben Spalte:
Die Werte werden als VARIANTs in der Snowflake-Tabelle gespeichert.
Das Schema der aufgenommenen Daten (d. h. die Datentypen für die Spalten) wird derzeit anhand der ersten 10 Zeilen abgeleitet. Wenn die ersten 10 Zeilen vom gleichen Typ sind, wird der Spaltentyp möglicherweise nicht richtig als gemischt erkannt.
Wenn die gesamte Tabelle ohne einen bestimmten Bereich aufgenommen werden soll, muss die erste Zeile, beginnend in Zelle A1, der Header sein und die Spaltennamen enthalten.