Einrichten von Openflow Connector for HubSpot¶
Bemerkung
Dieser Connector unterliegt den `Nutzungsbedingungen für Snowflake Connector<https://www.snowflake.com/legal/snowflake-connector-terms/>`_.
Unter diesem Thema werden die Schritte zur Einrichtung von Openflow Connector for HubSpot beschrieben.
Voraussetzungen¶
Stellen Sie sicher, dass Sie Allgemeine Informationen zu Openflow Connector for HubSpot gelesen haben.
Stellen Sie sicher, dass Sie folgende Aufgaben ausgeführt haben: Openflow einrichten – BYOC oder Openflow einrichten – Snowflake-Bereitstellungen.
Stellen Sie bei der Verwendung von Openflow - Snowflake Deployments sicher, dass Sie Konfigurieren der erforderlichen Domänen gelesen und Zugriff auf die erforderlichen Domänen für den Hubspot-Konnektor gewährt haben.
Die Anmeldeinformationen erhalten¶
Als HubSpot-Administrator generieren Sie ein privates HubSpot-App-Token oder erstellen eines in Ihrem HubSpot-Konto. Damit können Sie Ihre Anfragen an die HubSpot-API authentifizieren.
Melden Sie sich bei Ihrem HubSpot-Konto an.
Navigieren Sie zu Settings, indem Sie das Zahnradsymbol in der oberen Navigationsleiste auswählen.
Wählen Sie im linken Navigationsbereich Integrations » Private Apps aus.
Wählen Sie Create a private app aus.
Geben Sie einen Namen für Ihre App ein.
Navigieren Sie zur Registerkarte Scopes.
Wählen Sie die für die von Ihnen beabsichtigten API-Anfragen erforderlichen Bereiche aus. Die für die API-Anfragen erforderlichen Bereiche finden Sie unter Bereiche.
Wählen Sie Create app aus.
Legen Sie die erforderlichen Bereiche für die API-Anfragen fest, die Sie für jeden Endpunkt stellen möchten.
Wählen Sie View access token, um das Zugriffstoken anzuzeigen. Fügen Sie das Token in die Verbindungsparameter ein oder speichern Sie es sicher.
Snowflake-Konto einrichten¶
Als Snowflake-Kontoadministrator führen Sie die folgenden Aufgaben aus:
Erstellen Sie eine neue Rolle, oder verwenden Sie eine vorhandene Rolle, und gewähren Sie die Berechtigungen von Datenbanken und:ref:
label-view_privileges.Erstellen Sie einen neuen Benutzer für den Snowflake-Dienst mit dem Typ SERVICE.
Weisen Sie dem Benutzer des Snowflake-Dienstes die Rolle zu, die Sie in den vorherigen Schritten erstellt haben.
Konfigurieren Sie mit Schlüsselpaar-Authentifizierung für den Snowflake SERVICE-Benutzer aus Schritt 2.
Snowflake empfiehlt diesen Schritt dringend. Konfigurieren Sie einen von Openflow unterstützten Geheimnismanager, z. B. AWS, Azure und Hashicorp, und speichern Sie die öffentlichen und privaten Schlüssel im Geheimnisspeicher.
Bemerkung
Wenn Sie aus irgendeinem Grund keinen Geheimnismanager verwenden möchten, sind Sie dafür verantwortlich, die für die Schlüsselpaar-Authentifizierung verwendeten Dateien für den öffentlichen und privaten Schlüssel gemäß den Sicherheitsrichtlinien Ihrer Organisation zu schützen.
Nachdem der Geheimnismanager konfiguriert wurde, legen Sie fest, wie Sie sich bei diesem authentifizieren möchten. Für AWS wird empfohlen, dass Sie die EC2-Instanzrolle verwenden, die mit Openflow verbunden ist, da auf diese Weise keine weiteren Geheimnisse bestehen bleiben müssen.
Konfigurieren Sie in Openflow über das Hamburger-Menü oben rechts einen Parameteranbieter, der mit diesem Secrets Manager verbunden ist. Navigieren Sie zu Controller Settings » Parameter Provider und rufen Sie dann Ihre Parameterwerte ab.
Zu diesem Zeitpunkt können alle Anmeldeinformationen mit den zugehörigen Parameterpfaden referenziert werden, und es müssen keine sensiblen Werte innerhalb von Openflow aufbewahrt werden.
Wenn andere Snowflake-Benutzer Zugriff auf die vom Konnektor aufgenommenen Rohdokumente und -tabellen benötigen (z. B. für die benutzerdefinierte Verarbeitung in Snowflake), weisen Sie diesen Benutzern die in Schritt 1 erstellte Rolle zu.
Erstellen Sie in Snowflake eine Datenbank und ein Schema für den Konnektor, um die aufgenommenen Daten zu speichern. Erteilen Sie der im ersten Schritt erstellten Rolle die folgenden Berechtigungen von Datenbanken.
Erstellen Sie ein Warehouse, das vom Konnektor verwendet werden soll, oder verwenden Sie ein bestehendes. Beginnen Sie mit der kleinsten Warehouse-Größe. Experimentieren Sie dann mit der Größe abhängig von der Anzahl der zu replizierenden Tabellen und der übertragenen Datenmenge. Eine große Anzahl von Tabellen skaliert normalerweise besser mit Multi-Cluster-Warehouses und nicht anhand der Warehouse-Größe.
Stellen Sie sicher, dass der Benutzer mit der Rolle, die der Konnektor verwendet, über die erforderlichen Berechtigungen zur Nutzung des Warehouse verfügt. Wenn das nicht der Fall ist, erteilen Sie der Rolle die erforderlichen Berechtigungen.
Einrichten des Konnektors¶
Als Data Engineer führen Sie die folgenden Aufgaben aus, um den Konnektor zu installieren und zu konfigurieren:
Konnektor installieren¶
Um den Konnektor zu installieren, gehen Sie als Data Engineer wie folgt vor:
Navigieren Sie zur Übersichtsseite von Openflow. Wählen Sie im Abschnitt Featured connectors die Option View more connectors aus.
Suchen Sie auf der Seite Openflow-Konnektoren den Konnektor und wählen Sie Add to runtime.
Wählen Sie im Dialogfeld Select runtime Ihre Laufzeitumgebung aus der Dropdown-Liste Available runtimes aus, und klicken Sie auf Add.
Bemerkung
Bevor Sie den Konnektor installieren, stellen Sie sicher, dass Sie in Snowflake eine Datenbank und ein Schema für den Konnektor erstellt haben, in dem die aufgenommenen Daten gespeichert werden.
Authentifizieren Sie sich bei der Bereitstellung mit den Anmeldedaten Ihres Snowflake-Kontos und wählen Sie Allow, wenn Sie dazu aufgefordert werden, damit die Laufzeitanwendung auf Ihr Snowflake-Konto zugreifen kann. Die Installation des Konnektors nimmt einige Minuten in Anspruch.
Authentifizieren Sie sich bei der Laufzeit mit den Anmeldeinformationen Ihres Snowflake-Kontos.
Das Openflow-Canvas wird mit der hinzugefügten Prozessgruppe des Konnektors angezeigt.
Konnektor konfigurieren¶
Klicken Sie mit der rechten Maustaste auf die importierte Prozessgruppe und wählen Sie Parameters.
Geben Sie die erforderlichen Parameterwerte ein, wie unter Ablaufparameter beschrieben.
Ablaufparameter¶
In diesem Abschnitt werden die Ablaufparameter beschrieben, die Sie anhand der folgenden Parameterkontexte konfigurieren können:
Quellsystemparameter für `HubSpot: werden verwendet, um eine Verbindung mit HubSpot herzustellen.
Zielsystemparameter: werden verwendet, um die Verbindung mit Snowflake herzustellen.
Aufnahmeparameter für HubSpot: werden verwendet, um die Konfiguration der von HubSpot heruntergeladenen Daten festzulegen.
Quellsystemparameter für HubSpot¶
Parameter |
Beschreibung |
|---|---|
HubSpot Access Token |
Zugriffstoken für private HubSpot-Anwendungen. |
Zielsystemparameter für HubSpot¶
Parameter |
Beschreibung |
Erforderlich |
|---|---|---|
Destination Database |
Die Datenbank, in der die Daten als persistent gespeichert werden. Muss bereits in Snowflake vorhanden sein. Beim Namen wird zwischen Groß- und Kleinschreibung unterschieden. Bei Bezeichnern ohne Anführungszeichen geben Sie den Namen in Großbuchstaben an. |
Ja |
Destination Schema |
Das Schema, in dem Daten beibehalten werden, muss bereits in Snowflake vorhanden sein. Beim Namen wird zwischen Groß- und Kleinschreibung unterschieden. Bei Bezeichnern ohne Anführungszeichen geben Sie den Namen in Großbuchstaben an. Sehen Sie sich die folgenden Beispiele an:
|
Ja |
Snowflake Authentication Strategy |
Bei Verwendung von:
|
Ja |
Snowflake Account Identifier |
Bei Verwendung von:
|
Ja |
Snowflake Private Key |
Bei Verwendung von:
|
Nein |
Snowflake Private Key File |
Bei Verwendung von:
|
Nein |
Snowflake Private Key Password |
Bei Verwendung von
|
Nein |
Snowflake Role |
Bei Verwendung von
|
Ja |
Snowflake-Benutzername |
Bei Verwendung von
|
Ja |
Mehrwert-Strategie |
Legt fest, wie der Konnektor Werte verarbeitet, die seine internen Größenbeschränkungen (16 MB) während der Replikation überschreiten. Mögliche Werte sind:
|
Nein |
Snowflake Warehouse |
Snowflake Warehouse, das für die Ausführung von Abfragen verwendet wird. |
Ja |
Aufnahmeparameter für HubSpot¶
Parameter |
Beschreibung |
|---|---|
Objekttypen |
Liste der durch Komma getrennten HubSpot-Objekttypen, die aufgenommen werden sollen. Unterstützte Werte für den Objekttyp sind:
|
Updated After |
Filtern Sie Objekten, die nach einem bestimmten Datum oder einer bestimmten Uhrzeit aktualisiert wurden. Dieser Parameter ist optional. |
Zeitplan für die Datenaufnahme |
Zeit zwischen dem nächsten Zeitplan. Er sollte eine gültige Zeitdauer haben, z. B. 30 Minuten oder 1 Stunde. |
Führen Sie den Ablauf aus¶
Klicken Sie mit der rechten Maustaste auf die Ebene, und wählen Sie Enable all Controller Services.
Klicken Sie mit der rechten Maustaste auf die importierte Prozessgruppe und wählen Sie Start. Der Konnektor startet die Datenaufnahme.
Den Konnektor neu konfigurieren¶
Sie können die Konnektorparameter ändern, nachdem der Konnektor begonnen hat, Daten zu aufzunehmen. Wenn sich die Kriterien für die Kriterien für die Vorgangsabfrage ändern, führen Sie die folgenden Schritte aus, um sicherzustellen, dass die Daten in der Zieltabelle konsistent sind.
Stoppt den Konnektor: Stellt sicher, dass alle Openflow-Prozessoren gestoppt sind.
Zugriff auf Konfigurationseinstellungen: Navigieren Sie in der Snowflake-Openflow-Webpberfläche zu den Konfigurationseinstellungen des Konnektors.
Parameter ändern: Passen Sie die Parameter nach Bedarf an.
Löschen des Prozessorstatus: Wenn Sie die Datenaufnahmekriterien ändern, empfiehlt Snowflake dringend, die Datenaufnahme von Anfang an zu beginnen, um die Daten in der Zieltabelle konsistent zu halten. Nach dem Löschen des Status im
List Fresh HubSpot Objects-Prozessor ruft der Konnektor alle Objekte von Anfang an ab. Möglicherweise ist ein manuelles Kürzen der Zieltabelle erforderlich, um das Duplizieren von Zeilen zu verhindern.
Datenstruktur und Ansichten¶
Der Konnektor speichert Daten in den folgenden beiden Formaten innerhalb Ihrer Snowflake-Datenbank:
Rohdatenspeicher¶
Nur HubSpot-Rohdaten werden in Tabellen mit den genauen Namen gespeichert, die im Parameter Objekttypen angegeben sind. Beispiel:
Wenn Sie
Products,Contacts,Companiesim Parameter Objekttypen konfigurieren, erstellt der Konnektor drei Tabellen:PRODUCTS,CONTACTSund``COMPANIES``.Jede Tabelle enthält die vollständige JSON-Nutzlast von den HubSpot API-Antworten.
Rohdaten behalten die ursprüngliche Struktur und alle Metadaten von HubSpot bei.
Vereinfachte Ansichten¶
Zur Vereinfachung der Abfrage und Analyse erstellt der Konnektor automatisch vereinfachte Ansichten (Flattening) für jeden Objekttyp:
Jede Rohtabelle hat eine entsprechende Ansicht mit dem Suffix
_VIEW. Zum Beispiel:PRODUCTS_VIEW,CONTACTS_VIEWundCOMPANIES_VIEW.Ansichten extrahieren häufig verwendete Felder aus der JSON-Nutzlast in einzelne Spalten.
Komplexe verschachtelte Strukturen werden für vereinfachte SQL -Abfragen vereinfacht.