SnowflakeDetectDuplicate 2025.5.31.15

Bundle

com.snowflake.openflow.runtime | runtime-snowflake-processors-nar

Description

Vérifie si le hachage d’un FlowFile(fourni comme attribut FlowFile) se trouve déjà dans une table Snowflake, et route le FlowFile vers « duplicate » s’il est trouvé, « distinct » s’il n’est pas trouvé, ou « failure » en cas d’erreur.

Balises

database, detect, duplicates, hash, snowflake

Exigences en matière d’entrées

REQUIRED

Prend en charge les propriétés dynamiques sensibles

false

Propriétés

Propriété

Description

Content Hash

Le nom de l’attribut FlowFile qui contient le hachage précalculé. Prend en charge la langue d’expression.

Document Source Identifier

Spécifie l’identificateur de la source du document (doc ID). Prend en charge la langue d’expression.

Document Source Name

Indique le nom du système source de la documentation. Prend en charge la langue d’expression.

Snowflake Connection Service

Le DBCPService qui fournit la connectivité à Snowflake.

Snowflake Table Name

Le nom de la table de Snowflake qui stocke les hachages des fichiers. La base de données et le schéma doivent être configurés au préalable dans le service de connexion Snowflake.

Relations

Nom

Description

distinct

FlowFiles qui ne correspondent pas à une documentation existante sont routées ici (insertion d’un nouveau hachage).

duplicate

FlowFiles qui correspondent à une documentation existante (même hachage) sont routées ici.

failure

FlowFiles qui rencontrent une erreur ou une exception au cours du traitement sont routées ici.

Écrit les attributs

Nom

Description

snowflake.detect.duplicate

Un attribut “true” ou “false” indiquant si le FlowFile a été détecté comme étant un doublon.