SnowflakeDetectDuplicate 2025.10.2.19

Bundle

com.snowflake.openflow.runtime | runtime-snowflake-processors-nar

Beschreibung

Checks if a FlowFile ‚s hash (provided as a FlowFile attribute) is already in a Snowflake table, and routes the FlowFile to‘ duplicate ‚if found,‘distinct ‚if not found, or‘ failure‘ on errors.

Tags

database, detect, duplicates, hash, snowflake

Eingabeanforderung

REQUIRED

Unterstützt sensible dynamische Eigenschaften

false

Eigenschaften

Eigenschaft

Beschreibung

Content Hash

Der Name des FlowFile-Attributs, das den vorberechneten Hashwert enthält. Supports Expression Language.

Document Source Identifier

Gibt den Bezeichner der Dokumentquelle an (doc ID). Supports Expression Language.

Document Source Name

Gibt den Systemnamen der Dokumentquelle an. Supports Expression Language.

Snowflake Connection Service

Der DBCPService, der die Verbindung zu Snowflake herstellt.

Snowflake-Tabellenname

The Snowflake table name that stores the file hashes. The table name is case-insensitive. Database and schema must be configured prior in the Snowflake Connection Service.

Beziehungen

Name

Beschreibung

distinct

FlowFiles, die nicht mit einem bestehenden Dokument übereinstimmen, werden hierher weitergeleitet (neuer Hashwert eingefügt).

duplicate

FlowFiles, die mit einem vorhandenen Dokument übereinstimmen (gleicher Hashwert), werden hierher weitergeleitet.

failure

FlowFiles, die während der Verarbeitung auf einen Fehler oder eine Ausnahme stoßen, werden hierher weitergeleitet.

Schreibt Attribute

Name

Beschreibung

snowflake.detect.duplicate

Ein „true“- oder „false“-Attribut, das angibt, ob das FlowFile als Duplikat erkannt wurde.