SnowflakeDetectDuplicate 2025.10.2.19¶
Bundle¶
com.snowflake.openflow.runtime | runtime-snowflake-processors-nar
Description¶
Vérifie si le hachage d’un FlowFile (fourni sous la forme d’un attribut FlowFile) est déjà dans une table Snowflake, et achemine le FlowFile vers “dupliquer” si trouvé, “distinct” si non trouvé, ou “échec” pour les erreurs.
Exigences en matière d’entrées¶
REQUIRED
Prend en charge les propriétés dynamiques sensibles¶
false
Propriétés¶
Propriété |
Description |
|---|---|
Content Hash |
Le nom de l’attribut FlowFile qui contient le hachage précalculé. Prend en charge la langue d’expression. |
Document Source Identifier |
Spécifie l’identificateur de la source du document (doc ID). Prend en charge la langue d’expression. |
Document Source Name |
Indique le nom du système source de la documentation. Prend en charge la langue d’expression. |
Snowflake Connection Service |
Le DBCPService qui fournit la connectivité à Snowflake. |
Snowflake Table Name |
Nom de la table Snowflake qui stocke les hachages de fichier. Le nom de la table est insensible à la casse. La base de données et le schéma doivent être configurés au préalable dans le service de connexion Snowflake. |
Relations¶
Nom |
Description |
|---|---|
distinct |
FlowFiles qui ne correspondent pas à une documentation existante sont routées ici (insertion d’un nouveau hachage). |
duplicate |
FlowFiles qui correspondent à une documentation existante (même hachage) sont routées ici. |
failure |
FlowFiles qui rencontrent une erreur ou une exception au cours du traitement sont routées ici. |
Écrit les attributs¶
Nom |
Description |
|---|---|
snowflake.detect.duplicate |
Un attribut “true” ou “false” indiquant si le FlowFile a été détecté comme étant un doublon. |