Einrichten von Openflow Connector für Microsoft Dataverse

Bemerkung

Der Konnektor unterliegt den Bedingungen für Konnektoren.

Unter diesem Thema werden die Schritte zur Einrichtung von Openflow Connector für Microsoft Dataverse beschrieben.

Voraussetzungen

  1. Stellen Sie sicher, dass Sie Allgemeine Informationen zu Openflow Connector for Microsoft Dataverse gelesen haben.

  2. Stellen Sie sicher, dass Sie Openflow einrichten – BYOC oder Openflow einrichten – Snowflake-Bereitstellung – Überblick zu Aufgaben haben.

Die Anmeldeinformationen erhalten

Führen Sie als Microsoft Dataverse-Administrator die folgenden Schritte aus:

  1. Stellen Sie sicher, dass Sie über eine Dataverse-Umgebung verfügen, mit der Sie arbeiten können, und dass Sie über https://admin.powerplatform.microsoft.com/ Zugriff auf diese Umgebung haben.

  2. Stellen Sie unter portal.azure.com sicher, dass Sie eine Anwendung in Microsoft Entra ID registriert haben. Diese Anwendung muss Zugriff auf den Mandanten haben, für den unsere Dataverse-Umgebung verfügbar ist. Um die Anwendung zu registrieren, folgen Sie diesem Leitfaden.

  3. Generieren und speichern Sie die ClientID und das Client-Geheimnis innerhalb dieser Anwendung.

  4. Rufen Sie das Power Apps Admin Center auf, und konfigurieren Sie Ihre Dataverse-Umgebung so, dass der Zugriff über zuvor registrierte Anwendungen möglich ist. Gehen Sie dazu zu Manage » Environments und wählen Sie die zu konfigurierende Umgebung aus. Rufen Sie dann Settings » Users & permissions » Application users auf. Zuvor erstellte Anwendungen müssen hinzugefügt und mit den erforderlichen Berechtigungen versehen werden, um Daten aus Microsoft Dataverse zu lesen.

  5. Kopiert und speichert die Umgebungs-URL der ausgewählten Dataverse-Umgebung von https://admin.powerplatform.microsoft.com/.

Snowflake-Konto einrichten

Als Snowflake-Kontoadministrator führen Sie die folgenden Aufgaben aus:

  1. Erstellen Sie einen Snowflake Benutzer mit dem Typ als SERVICE.

    Erstellen Sie eine Datenbank und ein Schema zum Speichern der replizierten Daten und richten Sie Berechtigungen für den Dienstbenutzer zum Erstellen von Tabellen im Zielschema ein, indem Sie die Berechtigungen USAGE und CREATE TABLE erteilen.

    CREATE DATABASE <destination_database>;
    CREATE SCHEMA <destination_database>.<destination_schema>;
    CREATE USER <openflow_user> TYPE=SERVICE COMMENT='Service user for automated access of Openflow';
    CREATE ROLE <openflow_role>;
    GRANT ROLE <openflow_role> TO USER <openflow_user>;
    GRANT USAGE ON DATABASE <destination_database> TO ROLE <openflow_role>;
    GRANT USAGE ON SCHEMA <destination_database>.<destination_schema> TO ROLE <openflow_role>;
    GRANT CREATE TABLE ON SCHEMA <destination_database>.<destination_schema> TO ROLE <openflow_role>;
    CREATE WAREHOUSE <openflow_warehouse>
         WITH
             WAREHOUSE_SIZE = 'SMALL'
             AUTO_SUSPEND = 300
             AUTO_RESUME = TRUE;
    GRANT USAGE, OPERATE ON WAREHOUSE <openflow_warehouse> TO ROLE <openflow_role>;
    
    Copy
    1. Erstellen Sie ein Paar sicherer Schlüssel (öffentlich und privat). Speichern Sie den privaten Schlüssel des Benutzers in einer Datei, die Sie der Konfiguration des Konnektors zur Verfügung stellen. Weisen Sie den öffentlichen Schlüssel dem Benutzer des Snowflake-Dienstes zu:

      ALTER USER <openflow_user> SET RSA_PUBLIC_KEY = 'thekey';
      
      Copy

      Weitere Informationen finden Sie unter Schlüsselpaar.

  2. Snowflake empfiehlt diesen Schritt dringend. Konfigurieren Sie einen von Openflow unterstützten Geheimnismanager, z. B. AWS, Azure und Hashicorp, und speichern Sie die öffentlichen und privaten Schlüssel im Geheimnisspeicher.

    Bemerkung

    Wenn Sie aus irgendeinem Grund keinen Geheimnismanager verwenden möchten, sind Sie dafür verantwortlich, die für die Schlüsselpaar-Authentifizierung verwendeten öffentlichen und privaten Schlüsseldateien gemäß den Sicherheitsrichtlinien Ihrer Organisation zu schützen.

    1. Nachem der Geheimnismanager konfiguriert ist, legen Sie fest, wie Sie sich bei ihm authentifizieren möchten. Auf AWS wird empfohlen, die mit Openflow verknüpfte EC2-Instanzrolle zu verwenden, da auf diese Weise keine weiteren Geheimnisse gespeichert werden müssen.

    2. Konfigurieren Sie in Openflow über das Hamburger-Menü oben rechts einen Parameteranbieter, der mit diesem Secrets Manager verbunden ist. Navigieren Sie zu Controller Settings » Parameter Provider und rufen Sie dann Ihre Parameterwerte ab.

    3. Zu diesem Zeitpunkt können alle Anmeldeinformationen mit den zugehörigen Parameterpfaden referenziert werden, und es müssen keine sensiblen Werte innerhalb von Openflow aufbewahrt werden.

  3. Wenn andere Snowflake-Benutzer Zugriff auf die vom Konnektor aufgenommenen Rohdokumente und -tabellen benötigen (z. B. für die benutzerdefinierte Verarbeitung in Snowflake), weisen Sie diesen Benutzern die in Schritt 1 erstellte Rolle zu.

  4. Bestimmen Sie ein Warehouse, das der Konnektor verwenden soll. Erteilen Sie der zuvor erstellten Rolle die USAGE-Berechtigung für das Warehouse. Beginnen Sie mit der kleinsten Warehouse-Größe und experimentieren Sie dann mit der Größe in Abhängigkeit von der Anzahl der zu replizierenden Tabellen und der Menge der übertragenen Daten. Große Tabellenzahlen lassen sich in der Regel besser mit Multi-Cluster-Warehouses skalieren als mit größeren Warehouse-Größen.

Einrichten des Konnektors

Als Data Engineer führen Sie die folgenden Aufgaben aus, um den Konnektor zu installieren und zu konfigurieren:

Konnektor installieren

  1. Navigieren Sie zur Openflow-Übersichtsseite. Wählen Sie im Abschnitt Featured connectors die Option View more connectors aus.

  2. Suchen Sie auf der Seite Openflow-Konnektoren den Konnektor und wählen Sie Add to runtime.

  3. Wählen Sie im Dialog Select runtime Ihre Laufzeit aus der Dropdown-Liste Available runtimes aus.

  4. Wählen Sie Add aus.

    Bemerkung

    Bevor Sie den Konnektor installieren, stellen Sie sicher, dass Sie in Snowflake eine Datenbank und ein Schema für den Konnektor erstellt haben, in dem die aufgenommenen Daten gespeichert werden.

  5. Authentifizieren Sie sich bei der Bereitstellung mit den Anmeldedaten Ihres Snowflake-Kontos und wählen Sie Allow, wenn Sie dazu aufgefordert werden, damit die Laufzeitanwendung auf Ihr Snowflake-Konto zugreifen kann. Die Installation des Konnektors nimmt einige Minuten in Anspruch.

  6. Authentifizieren Sie sich bei der Laufzeit mit den Anmeldeinformationen Ihres Snowflake-Kontos.

Das Openflow-Canvas wird mit der hinzugefügten Prozessgruppe des Konnektors angezeigt.

Konnektor konfigurieren

  1. Klicken Sie mit der rechten Maustaste auf die importierte Prozessgruppe und wählen Sie Parameters.

  2. Geben Sie die erforderlichen Parameterwerte ein, wie unter Ablaufparameter beschrieben.

Ablaufparameter

In diesem Abschnitt werden die Ablaufparameter beschrieben, die Sie anhand der folgenden Parameterkontexte konfigurieren können:

Quellsystemparameter für Dataverse

Parameter

Beschreibung

Source Dataverse Environment URL

Der Hauptbezeichner eines Quellsystems zum Abrufen von Daten. Die URL gibt einen Namespace an, in dem Dataverse-Tabellen existieren. Außerdem können Sie damit einen Bereichsparameter für OAuth erstellen.

Source Tenant ID

Die Microsoft Azure-Mandanten-ID. Sie wird verwendet, um OAuth-URLs zu erstellen. Die Microsoft Dataverse-Umgebung muss zu diesem Mandanten gehören.

Source OAuth Client ID

Die Microsoft Azure-Client-ID, die für den Zugriff auf die Microsoft Dataverse-API verwendet wird. Die Microsoft Dataverse-Web-API verwendet die OAuth-Authentifizierung für einen sicheren Zugriff und der Konnektor nutzt den Workflow für Client-Anmeldeinformationen. Weitere Informationen zur Client-ID und wie Sie diese in Microsoft Entra finden, finden Sie unter Anwendungs-ID (Client ID).

Quelle OAuth Client Secret

Der geheime Microsoft Azure-Client-Schlüssel, der für den Zugriff auf die Microsoft Dataverse-API verwendet wird. Die Microsoft Dataverse-Web-API verwendet die OAuth-Authentifizierung für einen sicheren Zugriff und der Konnektor nutzt den Workflow für Client-Anmeldeinformationen. Weitere Informationen geheimen Client-Schlüssel und wie Sie diesen in Microsoft Entra finden, finden Sie unter Zertifikate und Geheimnisse.

Zielsystemparameter für Dataverse

Parameter

Beschreibung

Erforderlich

Destination Database

Die Datenbank, in der die Daten als persistent gespeichert werden. Muss bereits in Snowflake vorhanden sein. Beim Namen wird zwischen Groß- und Kleinschreibung unterschieden. Bei Bezeichnern ohne Anführungszeichen geben Sie den Namen in Großbuchstaben an.

Ja

Destination Schema

Das Schema, in dem Daten beibehalten werden, muss bereits in Snowflake vorhanden sein. Beim Namen wird zwischen Groß- und Kleinschreibung unterschieden. Bei Bezeichnern ohne Anführungszeichen geben Sie den Namen in Großbuchstaben an.

Sehen Sie sich die folgenden Beispiele an:

  • CREATE SCHEMA SCHEMA_NAME oder CREATE SCHEMA schema_name: verwenden Sie SCHEMA_NAME

  • CREATE SCHEMA "schema_name" oder CREATE SCHEMA "SCHEMA_NAME": verwenden Sie schema_name bzw. SCHEMA_NAME.

Ja

Snowflake Account Identifier

Bei Verwendung von:

  • Strategie für die Authentifizierung mit Sitzungstoken: Muss leer sein.

  • KEY_PAIR: Snowflake-Kontoname im Format [Organisationsname]-[Kontoname], wobei die Daten persistent gespeichert werden.

Ja

Snowflake Authentication Strategy

Bei Verwendung von:

  • Snowflake Openflow-Bereitstellung: Verwenden Sie SNOWFLAKE_SESSION_TOKEN. Dieses Token wird automatisch von Snowflake verwaltet.

  • BYOC: Verwenden Sie KEY_PAIR als Wert für die Authentifizierungsstrategie.

Ja

Snowflake Private Key

Bei Verwendung von:

  • Strategie für die Authentifizierung mit Sitzungstoken: Muss leer sein.

  • KEY_PAIR: Muss der RSA private Schlüssel sein, der für die Authentifizierung verwendet wird.

    Der RSA-Schlüssel muss entsprechend den PKCS8-Standards formatiert sein und standardmäßige PEM-Header und Footer haben. Beachten Sie, dass entweder die private Snowflake-Schlüsseldatei oder der private Snowflake-Schlüssel definiert werden muss.

Nein

Snowflake Private Key File

Bei Verwendung von:

  • Strategie für die Authentifizierung mit Sitzungstoken: Die private Schlüsseldatei muss leer sein.

  • KEY_PAIR: Laden Sie die Datei hoch, die den RSA Private Key für die Authentifizierung bei Snowflake enthält, formatiert nach PKCS8-Standards und mit Standard-PEM-Header und -Footer. Die Header-Zeile beginnt mit -----BEGIN PRIVATE. Aktivieren Sie das Kontrollkästchen Reference asset, um die Private Key-Datei hochzuladen.

Nein

Snowflake Private Key Password

Bei Verwendung von:

  • Strategie für die Authentifizierung mit Sitzungstoken: Muss leer sein.

  • KEY_PAIR: Geben Sie das Kennwort an, das mit der privaten Snowflake-Schlüsseldatei verbunden ist.

Nein

Snowflake Role

Bei Verwendung von:

  • Strategie für die Authentifizierung mit Sitzungstoken: Verwenden Sie Ihre Laufzeitrolle. Sie finden Ihre Laufzeitrolle in der Openflow-UI, indem Sie zu View Details für Ihre Laufzeitumgebung navigieren.

  • KEY_PAIR Authentifizierungsstrategie: Verwenden Sie eine gültige Rolle, die für Ihren Dienstbenutzer konfiguriert ist.

Ja

Snowflake-Benutzername

Bei Verwendung von:

  • Strategie für die Authentifizierung mit Sitzungstoken: Muss leer sein.

  • KEY_PAIR: Geben Sie den Benutzernamen an, der für die Verbindung mit der Snowflake-Instanz verwendet wird.

Ja

Snowflake Warehouse

Snowflake Warehouse, das für die Ausführung von Abfragen verwendet wird.

Ja

Aufnahmeparameter für Dataverse

Parameter

Beschreibung

Scheduling Interval

Das Intervall, das als Trigger-Intervall für den Prozessor verwendet werden soll, der die Liste der Tabellen abruft und die Datenaufnahme initialisiert.

Source Tables Filter Strategy

Strategie zum Filtern der zu aufzunehmenden Tabellen. Kann entweder REGEXP oder LIST sein.

Source Tables Filter Value

Wert des Tabellenfilters. Wenn „Source Tables Filter Strategy“ auf REGEXP eingestellt ist, wird mit diesem regulären Ausdruck nach den auszuwählenden Tabellen gesucht. Wenn LIST angegeben wird, handelt es sich um eine durch Kommas getrennte Liste von Tabellennamen.

Führen Sie den Ablauf aus

  1. Klicken Sie mit der rechten Maustaste auf die Ebene, und wählen Sie Enable all Controller Services.

  2. Klicken Sie mit der rechten Maustaste auf die importierte Prozessgruppe und wählen Sie Start. Der Konnektor startet die Datenaufnahme.