Einrichten von Openflow Connector für Microsoft Dataverse¶

Bemerkung

Dieser Connector unterliegt den `Nutzungsbedingungen für Snowflake Connector<https://www.snowflake.com/legal/snowflake-connector-terms/>`_.

Unter diesem Thema werden die Schritte zur Einrichtung von Openflow Connector für Microsoft Dataverse beschrieben.

Voraussetzungen¶

Stellen Sie sicher, dass Sie Allgemeine Informationen zu Openflow Connector for Microsoft Dataverse gelesen haben.
Stellen Sie sicher, dass Sie folgende Aufgaben ausgeführt haben: Openflow einrichten – BYOC oder Openflow einrichten – Snowflake-Bereitstellungen.
Stellen Sie bei der Verwendung von Openflow - Snowflake Deployments sicher, dass Sie Konfigurieren der erforderlichen Domänen gelesen und Zugriff auf die erforderlichen Domänen für den Microsoft Dataverse-Konnektor gewährt haben.

Die Anmeldeinformationen erhalten¶

Führen Sie als Microsoft Dataverse-Administrator die folgenden Schritte aus:

Stellen Sie sicher, dass Sie über eine Dataverse-Umgebung verfügen, mit der Sie arbeiten können, und dass Sie über https://admin.powerplatform.microsoft.com/ Zugriff auf diese Umgebung haben.
Stellen Sie unter portal.azure.com sicher, dass Sie eine Anwendung in Microsoft Entra ID registriert haben. Diese Anwendung muss Zugriff auf den Mandanten haben, für den unsere Dataverse-Umgebung verfügbar ist. Um die Anwendung zu registrieren, folgen Sie diesem Leitfaden.
Generieren und speichern Sie die ClientID und das Client-Geheimnis innerhalb dieser Anwendung.
Rufen Sie das Power Apps Admin Center auf, und konfigurieren Sie Ihre Dataverse-Umgebung so, dass der Zugriff über zuvor registrierte Anwendungen möglich ist. Gehen Sie dazu zu Manage » Environments und wählen Sie die zu konfigurierende Umgebung aus. Rufen Sie dann Settings » Users & permissions » Application users auf. Zuvor erstellte Anwendungen müssen hinzugefügt und mit den erforderlichen Berechtigungen versehen werden, um Daten aus Microsoft Dataverse zu lesen.
Kopiert und speichert die Umgebungs-URL der ausgewählten Dataverse-Umgebung von https://admin.powerplatform.microsoft.com/.

Snowflake-Konto einrichten¶

Als Snowflake-Kontoadministrator führen Sie die folgenden Aufgaben aus:

Erstellen Sie einen Snowflake Benutzer mit dem Typ als SERVICE.

Erstellen Sie eine Datenbank und ein Schema zum Speichern der replizierten Daten und richten Sie Berechtigungen für den Dienstbenutzer zum Erstellen von Tabellen im Zielschema ein, indem Sie die Berechtigungen USAGE und CREATE TABLE erteilen.

CREATE DATABASE <destination_database>;
CREATE SCHEMA <destination_database>.<destination_schema>;
CREATE USER <openflow_user> TYPE=SERVICE COMMENT='Service user for automated access of Openflow';
CREATE ROLE <openflow_role>;
GRANT ROLE <openflow_role> TO USER <openflow_user>;
GRANT USAGE ON DATABASE <destination_database> TO ROLE <openflow_role>;
GRANT USAGE ON SCHEMA <destination_database>.<destination_schema> TO ROLE <openflow_role>;
GRANT CREATE TABLE ON SCHEMA <destination_database>.<destination_schema> TO ROLE <openflow_role>;
CREATE WAREHOUSE <openflow_warehouse>
     WITH
         WAREHOUSE_SIZE = 'SMALL'
         AUTO_SUSPEND = 300
         AUTO_RESUME = TRUE;
GRANT USAGE, OPERATE ON WAREHOUSE <openflow_warehouse> TO ROLE <openflow_role>;

Erstellen Sie ein Paar sicherer Schlüssel (öffentlich und privat). Speichern Sie den privaten Schlüssel des Benutzers in einer Datei, die Sie der Konfiguration des Konnektors zur Verfügung stellen. Weisen Sie den öffentlichen Schlüssel dem Benutzer des Snowflake-Dienstes zu:
```
ALTER USER <openflow_user> SET RSA_PUBLIC_KEY = 'thekey';
```
Weitere Informationen finden Sie unter Schlüsselpaar.

Snowflake empfiehlt diesen Schritt dringend. Konfigurieren Sie einen von Openflow unterstützten Geheimnismanager, z. B. AWS, Azure und Hashicorp, und speichern Sie die öffentlichen und privaten Schlüssel im Geheimnisspeicher.

Bemerkung

Wenn Sie aus irgendeinem Grund keinen Geheimnismanager verwenden möchten, sind Sie dafür verantwortlich, die für die Schlüsselpaar-Authentifizierung verwendeten öffentlichen und privaten Schlüsseldateien gemäß den Sicherheitsrichtlinien Ihrer Organisation zu schützen.
1. Nachem der Geheimnismanager konfiguriert ist, legen Sie fest, wie Sie sich bei ihm authentifizieren möchten. Auf AWS wird empfohlen, die mit Openflow verknüpfte EC2-Instanzrolle zu verwenden, da auf diese Weise keine weiteren Geheimnisse gespeichert werden müssen.
2. Konfigurieren Sie in Openflow über das Hamburger-Menü oben rechts einen Parameteranbieter, der mit diesem Secrets Manager verbunden ist. Navigieren Sie zu Controller Settings » Parameter Provider und rufen Sie dann Ihre Parameterwerte ab.
3. Zu diesem Zeitpunkt können alle Anmeldeinformationen mit den zugehörigen Parameterpfaden referenziert werden, und es müssen keine sensiblen Werte innerhalb von Openflow aufbewahrt werden.
Wenn andere Snowflake-Benutzer Zugriff auf die vom Konnektor aufgenommenen Rohdokumente und -tabellen benötigen (z. B. für die benutzerdefinierte Verarbeitung in Snowflake), weisen Sie diesen Benutzern die in Schritt 1 erstellte Rolle zu.
Bestimmen Sie ein Warehouse, das der Konnektor verwenden soll. Erteilen Sie der zuvor erstellten Rolle die USAGE-Berechtigung für das Warehouse. Beginnen Sie mit der kleinsten Warehouse-Größe und experimentieren Sie dann mit der Größe in Abhängigkeit von der Anzahl der zu replizierenden Tabellen und der Menge der übertragenen Daten. Große Tabellenzahlen lassen sich in der Regel besser mit Multi-Cluster-Warehouses skalieren als mit größeren Warehouse-Größen.

Einrichten des Konnektors¶

Als Data Engineer führen Sie die folgenden Aufgaben aus, um den Konnektor zu installieren und zu konfigurieren:

Konnektor installieren¶

Um den Konnektor zu installieren, gehen Sie als Data Engineer wie folgt vor:

Navigieren Sie zur Übersichtsseite von Openflow. Wählen Sie im Abschnitt Featured connectors die Option View more connectors aus.
Suchen Sie auf der Seite Openflow-Konnektoren den Konnektor und wählen Sie Add to runtime.
Wählen Sie im Dialogfeld Select runtime Ihre Laufzeitumgebung aus der Dropdown-Liste Available runtimes aus, und klicken Sie auf Add.

Bemerkung

Bevor Sie den Konnektor installieren, stellen Sie sicher, dass Sie in Snowflake eine Datenbank und ein Schema für den Konnektor erstellt haben, in dem die aufgenommenen Daten gespeichert werden.
Authentifizieren Sie sich bei der Bereitstellung mit den Anmeldedaten Ihres Snowflake-Kontos und wählen Sie Allow, wenn Sie dazu aufgefordert werden, damit die Laufzeitanwendung auf Ihr Snowflake-Konto zugreifen kann. Die Installation des Konnektors nimmt einige Minuten in Anspruch.
Authentifizieren Sie sich bei der Laufzeit mit den Anmeldeinformationen Ihres Snowflake-Kontos.

Das Openflow-Canvas wird mit der hinzugefügten Prozessgruppe des Konnektors angezeigt.

Konnektor konfigurieren¶

Klicken Sie mit der rechten Maustaste auf die importierte Prozessgruppe und wählen Sie Parameters.
Geben Sie die erforderlichen Parameterwerte ein, wie unter Ablaufparameter beschrieben.

Ablaufparameter¶

In diesem Abschnitt werden die Ablaufparameter beschrieben, die Sie anhand der folgenden Parameterkontexte konfigurieren können:

Quellesystemparameter für Dataverse: werden verwendet, um die Verbindung mit Dataverse herzustellen.
Zielsystemparameter für Dataverse: werden verwendet, um die Verbindung mit Snowflake herzustellen.
Aufnahmeparameter für Dataverse: werden verwendet, um die Konfiguration der von Dataverse heruntergeladenen Daten zu definieren.

Quellsystemparameter für Dataverse¶


Parameter	Beschreibung
Source Dataverse Environment URL	Der Hauptbezeichner eines Quellsystems zum Abrufen von Daten. Die URL gibt einen Namespace an, in dem Dataverse-Tabellen existieren. Außerdem können Sie damit einen Bereichsparameter für OAuth erstellen.
Source Tenant ID	Die Microsoft Azure-Mandanten-ID. Sie wird verwendet, um OAuth-URLs zu erstellen. Die Microsoft Dataverse-Umgebung muss zu diesem Mandanten gehören.
Source OAuth Client ID	Die Microsoft Azure-Client-ID, die für den Zugriff auf die Microsoft Dataverse-API verwendet wird. Die Microsoft Dataverse-Web-API verwendet die OAuth-Authentifizierung für einen sicheren Zugriff und der Konnektor nutzt den Workflow für Client-Anmeldeinformationen. Weitere Informationen zur Client-ID und wie Sie diese in Microsoft Entra finden, finden Sie unter Anwendungs-ID (Client ID).
Quelle OAuth Client Secret	Der geheime Microsoft Azure-Client-Schlüssel, der für den Zugriff auf die Microsoft Dataverse-API verwendet wird. Die Microsoft Dataverse-Web-API verwendet die OAuth-Authentifizierung für einen sicheren Zugriff und der Konnektor nutzt den Workflow für Client-Anmeldeinformationen. Weitere Informationen geheimen Client-Schlüssel und wie Sie diesen in Microsoft Entra finden, finden Sie unter Zertifikate und Geheimnisse.

Zielsystemparameter für Dataverse¶


Parameter	Beschreibung	Erforderlich
Destination Database	Die Datenbank, in der die Daten als persistent gespeichert werden. Muss bereits in Snowflake vorhanden sein. Beim Namen wird zwischen Groß- und Kleinschreibung unterschieden. Bei Bezeichnern ohne Anführungszeichen geben Sie den Namen in Großbuchstaben an.	Ja
Destination Schema	Das Schema, in dem Daten beibehalten werden, muss bereits in Snowflake vorhanden sein. Beim Namen wird zwischen Groß- und Kleinschreibung unterschieden. Bei Bezeichnern ohne Anführungszeichen geben Sie den Namen in Großbuchstaben an. Sehen Sie sich die folgenden Beispiele an: `CREATE SCHEMA SCHEMA_NAME` oder `CREATE SCHEMA schema_name`: verwenden Sie `SCHEMA_NAME` `CREATE SCHEMA "schema_name"` oder `CREATE SCHEMA "SCHEMA_NAME"`: verwenden Sie `schema_name` bzw. `SCHEMA_NAME`.	Ja
Snowflake Authentication Strategy	Bei Verwendung von: Snowflake Openflow-Bereitstellung oder BYOC: Verwenden Sie SNOWFLAKE_MANAGED_TOKEN. Dieses Token wird automatisch von Snowflake verwaltet. Für BYOC-Bereitstellungen müssen zuvor Laufzeitrollen konfiguriert sein, um SNOWFLAKE_MANAGED_TOKEN zu verwenden. BYOC: Alternativ kann BYOC KEY_PAIR als Wert für die Authentifizierungsstrategie verwenden.	Ja
Snowflake Account Identifier	Bei Verwendung von: Strategie für die Authentifizierung mit Sitzungstoken: Muss leer sein. KEY_PAIR: Snowflake-Kontoname im Format [Organisationsname]-[Kontoname], wobei die Daten persistent gespeichert werden.	Ja
Snowflake Private Key	Bei Verwendung von: Strategie für die Authentifizierung mit Sitzungstoken: Muss leer sein. KEY_PAIR: Muss der RSA private Schlüssel sein, der für die Authentifizierung verwendet wird. Der RSA-Schlüssel muss entsprechend den PKCS8-Standards formatiert sein und standardmäßige PEM-Header und Footer haben. Beachten Sie, dass entweder eine private Snowflake-Schlüsseldatei oder ein privater Snowflake-Schlüssel definiert werden muss.	Nein
Snowflake Private Key File	Bei Verwendung von: Strategie für die Authentifizierung mit Sitzungstoken: Die private Schlüsseldatei muss leer sein. KEY_PAIR: Laden Sie die Datei hoch, die den RSA Private Key für die Authentifizierung bei Snowflake enthält, formatiert nach PKCS8-Standards und mit Standard-PEM-Header und -Footer. Die Header-Zeile beginnt mit `-----BEGIN PRIVATE`. Aktivieren Sie das Kontrollkästchen Reference asset, um die Private Key-Datei hochzuladen.	Nein
Snowflake Private Key Password	Bei Verwendung von: Strategie für die Authentifizierung mit Sitzungstoken: Muss leer sein. KEY_PAIR: Geben Sie das Kennwort an, das mit der privaten Snowflake-Schlüsseldatei verbunden ist.	Nein
Snowflake Role	Bei Verwendung von: Strategie für die Authentifizierung mit Sitzungstoken: Verwenden Sie Ihre Snowflake-Rolle. Sie finden Ihre Snowflake-Rolle in der Openflow-UI, indem Sie zu View Details für Ihre Laufzeitumgebung navigieren. KEY_PAIR Authentifizierungsstrategie: Verwenden Sie eine gültige Rolle, die für Ihren Dienstbenutzer konfiguriert ist.	Ja
Snowflake-Benutzername	Bei Verwendung von: Strategie für die Authentifizierung mit Sitzungstoken: Muss leer sein. KEY_PAIR: Geben Sie den Benutzernamen an, der für die Verbindung mit der Snowflake-Instanz verwendet wird.	Ja
Mehrwert-Strategie	Legt fest, wie der Konnektor Werte verarbeitet, die seine internen Größenbeschränkungen (16MB ) während der Replikation überschreiten. Mögliche Werte sind: Fail Table (Standard): Die Tabelle wird als dauerhaft fehlgeschlagen markiert, und die Replikation für diese Tabelle wird angehalten. Set Null: Der Wert wird durch `NULL` in der Zieltabelle ersetzt. Verwenden Sie dies, um Tabellenfehler zu verhindern, wenn es akzeptabel ist, Daten in Tabellen zu verlieren, die über den übergroßen Wert hinausgehen.	Nein
Snowflake Warehouse	Snowflake Warehouse, das für die Ausführung von Abfragen verwendet wird.	Ja

Aufnahmeparameter für Dataverse¶


Parameter	Beschreibung
Scheduling Interval	Das Intervall, das als Trigger-Intervall für den Prozessor verwendet werden soll, der die Liste der Tabellen abruft und die Datenaufnahme initialisiert.
Source Tables Filter Strategy	Strategie zum Filtern der zu aufzunehmenden Tabellen. Kann entweder REGEXP oder LIST sein.
Source Tables Filter Value	Wert des Tabellenfilters. Wenn „Source Tables Filter Strategy“ auf REGEXP eingestellt ist, wird mit diesem regulären Ausdruck nach den auszuwählenden Tabellen gesucht. Wenn LIST angegeben wird, handelt es sich um eine durch Kommas getrennte Liste von Tabellennamen.
Spaltenfilter JSON	Optional. Ein JSON-Array, das Spaltenfilter pro Tabelle angibt. Spalten können nach Namen hinzugefügt oder ausgeschlossen werden (`included`, `excluded`) oder durch reguläre Ausdrucksmuster (`includedPattern`, `excludedPattern`). Der `table`-Wert muss der singulare logische Entitätsname sein (z. B. `annotation`), nicht der in `Source Tables Filter Value` verwendeten Plural des Entitätsset-Namens (z. B. `annotations`). Beispiel: `[ {"table": "mytable", "excluded": ["binarycolumn", "binarycolumn_binary"]} ]` schließt große binäre Spalten von `mytable` aus. Siehe Replizieren einer Teilmenge von Spalten in einer Tabelle für alle Details.

Bemerkung

Bei der Konfiguration von Source Tables Filter Value verwenden Sie den Namen des Entitätssets (Pluralform, z. B. annotations) anstelle des Tabellennamens, der in der Microsoft Data Exchange-Schnittstelle angezeigt wird. Um den Namen des Entitätssatzes für eine Tabelle zu finden, gehen Sie zu Power Apps, wählen Sie Tables aus, suchen Sie die Tabelle, und wählen Sie dann:extui:Advanced » Tools » Copy set name aus.

Der Parameter Column Filter JSON verwendet eine andere Namenskonvention – er erfordert den singularen logischen Entitätsnamen (z. B. annotation). Siehe Replizieren einer Teilmenge von Spalten in einer Tabelle für Details.

Führen Sie den Ablauf aus¶

Klicken Sie mit der rechten Maustaste auf die Ebene, und wählen Sie Enable all Controller Services.
Klicken Sie mit der rechten Maustaste auf die importierte Prozessgruppe und wählen Sie Start. Der Konnektor startet die Datenaufnahme.

Replizieren einer Teilmenge von Spalten in einer Tabelle¶

Der Konnektor kann die replizierten Daten pro Tabelle auf eine Teilmenge der konfigurierten Spalten filtern.

Um Filter auf Spalten anzuwenden, ändern Sie die Column Filter-Eigenschaft des Kontextes für Replikationsparameter, um einen JSON-Filter anzugeben. Fügen Sie ein Array von Konfigurationen hinzu – einen Eintrag für jede Tabelle, auf die Sie einen Filter anwenden möchten.

Wichtig

Das table-Feld muss den singularen logischen Entitätsnamen verwenden (z. B. annotation), nicht den in Source Tables Filter Value verwendeten Plural des Entitätsset-Namens (z. B. annotations). Um den Namen der logischen Entität in Power Apps zu finden, gehen Sie zu `Power Apps<https://make.powerapps.com>`_ und wählen Sie Tables aus. Suchen Sie Ihre Tabelle, und wählen Sie dann Advanced`|raa|:extui:`Tools`|raa|:extui:`Copy logical name.

Einige Spalten haben eine binäre Darstellung, die unter einem Spaltennamen mit _binary-Suffix gespeichert ist (z. B. eine Spalte mycolumn kann auch als erscheinen mycolumn_binary). Um eine solche Spalte vollständig auszuschließen, listen Sie beide Namen im excluded-Array auf.

Das folgende Beispiel schließt große binäre Spalten aus einer Tabelle aus:

[
    {
        "table": "mytable",
        "excluded": ["mycolumn", "mycolumn_binary"]
    }
]

Spalten können nach Name oder Muster ein- oder ausgeschlossen werden. Sie können eine Bedingung pro Tabelle anwenden oder mehrere Bedingungen kombinieren, wobei Ausschlüsse Vorrang vor Einschlüssen haben.

Das folgende Beispiel zeigt alle verfügbaren Felder an. Das Feld table ist obligatorisch. Eines oder mehrere von included, excluded, includedPattern, excludedPattern ist erforderlich.

[
    {
        "table" : "<singular logical entity name>",
        "included": ["<column name>", "<column name>"],
        "excluded": ["<column name>", "<column name>"],
        "includedPattern": "<regular expression>",
        "excludedPattern": "<regular expression>",
    }
]

Verwalten des Tabellenstatus¶

Der Konnektor behält den Status der Datenaufnahme pro Tabelle im Controller-Dienst Dataverse Table State Service bei. Jeder Eintrag erfasst den aktuellen Datenaufnahmestatus und das für die Änderungsverfolgung verwendete Delta-Token.

Anzeigen des Konnektorstatus¶

So zeigen Sie den aktuellen Status aller Tabellen an:

Klicken Sie mit der rechten Maustaste auf den Ansichtsbereich, und wählen Sie Controller services aus.
Suchen Sie den Controller-Dienst namens Dataverse Table State Service.
Klicken Sie im Menü Dataverse Table State Service auf View state.

Der Status ist ein Satz von Schlüssel/Wert-Paaren, wobei der Schlüssel der Name Tabellenentitätssatzes (z. B.``accounts``) ist. Der Wert hat das Format <STATUS>;<deltaToken>;<skipToken>;<staleFlag>, , zum Beispiel:

accounts -> DONE;!AAAAAjE...;;

Der STATUS kann einer der folgenden Werte sein:

FETCHING: Der Konnektor ruft aktiv Datensätze für diese Tabelle ab.
DONE: Die letzte Datenaufnahmeausführung wurde erfolgreich abgeschlossen.

Erneutes Starten der Datenaufnahme für eine einzelne Tabelle¶

Wird der Status einer Tabelle gelöscht, führt der Konnektor bei der nächsten Ausführung eine vollständige erneute Datenaufnahme dieser Tabelle aus. Alle zuvor synchronisierten Datensätze werden erneut aufgenommen.

So starten Sie die Datenaufnahme für eine bestimmte Tabelle neu:

Stoppen Sie alle Prozessoren im Ablauf.
Stellen Sie sicher, dass keine gerade ausgeführten FlowFiles für diese Tabelle verarbeitet werden.
Klicken Sie mit der rechten Maustaste auf den Ansichtsbereich, und wählen Sie Disable all controller services aus.
Rufen Sie Controller services auf und öffnen Sie die Statusansicht für:ui:Dataverse Table State Service.
Wählen Sie das Papierkorb-Symbol neben dem Tabelleneintrag (identifiziert durch den Namen des Entitätssatzes), um den Status nur für diese Tabelle zu entfernen.
Klicken Sie mit der rechten Maustaste im Arbeitsbereich, wählen Sie Enable all controller services aus, und starten Sie dann alle Prozessoren.

Erneutes Starten der Datenaufnahme für alle Tabellen¶

So starten Sie die Datenaufnahme für alle replizierten Tabellen neu:

Stoppen Sie alle Prozessoren im Ablauf.
Löschen Sie alle FlowFiles aus den Warteschlangen des Konnektors.
Klicken Sie mit der rechten Maustaste auf den Ansichtsbereich, und wählen Sie Disable all controller services aus.
Rufen Sie Controller services auf und öffnen Sie die Statusansicht für:ui:Dataverse Table State Service.
Wählen Sie Clear state aus, um alle Tabelleneinträge zu entfernen.
Klicken Sie mit der rechten Maustaste im Arbeitsbereich, wählen Sie Enable all controller services aus, und starten Sie dann alle Prozessoren.

Vorsicht

Löschen Sie FlowFiles nicht manuell, während der Konnektor ausgeführt wird. Dies kann dazu führen, dass eine Tabelle auf unbestimmte Zeit im FETCHING-Status verbleibt. Wenn dies der Fall ist, starten Sie die Datenaufnahme für diese Tabelle neu, wie oben beschrieben.