SnowflakeDetectDuplicate 2025.5.31.15¶
Bundle¶
com.snowflake.openflow.runtime | runtime-snowflake-processors-nar
Beschreibung¶
Prüft, ob der Hashwert des FlowFile(der als FlowFile-Attribut angegeben wird) bereits in einer Snowflake-Tabelle enthalten ist und leitet das FlowFile bei einem Treffer an „duplicate“, bei keinem Treffer an „distinct“ und bei Fehlern an „failure“ weiter.
Eingabeanforderung¶
REQUIRED
Unterstützt sensible dynamische Eigenschaften¶
false
Eigenschaften¶
Eigenschaft |
Beschreibung |
---|---|
Content Hash |
Der Name des FlowFile-Attributs, das den vorberechneten Hashwert enthält. Supports Expression Language. |
Document Source Identifier |
Gibt den Bezeichner der Dokumentquelle an (doc ID). Supports Expression Language. |
Document Source Name |
Gibt den Systemnamen der Dokumentquelle an. Supports Expression Language. |
Snowflake Connection Service |
Der DBCPService, der die Verbindung zu Snowflake herstellt. |
Snowflake-Tabellenname |
Der Name der Snowflake-Tabelle, in der die Datei-Hashwerte gespeichert werden. Datenbank und Schema müssen zuvor im Snowflake Connection Service konfiguriert werden. |
Beziehungen¶
Name |
Beschreibung |
---|---|
distinct |
FlowFiles, die nicht mit einem bestehenden Dokument übereinstimmen, werden hierher weitergeleitet (neuer Hashwert eingefügt). |
duplicate |
FlowFiles, die mit einem vorhandenen Dokument übereinstimmen (gleicher Hashwert), werden hierher weitergeleitet. |
failure |
FlowFiles, die während der Verarbeitung auf einen Fehler oder eine Ausnahme stoßen, werden hierher weitergeleitet. |
Schreibt Attribute¶
Name |
Beschreibung |
---|---|
snowflake.detect.duplicate |
Ein „true“- oder „false“-Attribut, das angibt, ob das FlowFile als Duplikat erkannt wurde. |