SnowflakeDetectDuplicate 2025.5.31.15

バンドル

com.snowflake.openflow.runtime | runtime-snowflake-processors-nar

説明

FlowFile のハッシュ (FlowFile 属性として提供) が既に Snowflake テーブルにあるかどうかをチェックし、 FlowFile が見つかった場合は 'duplicate'、見つからなかった場合は 'distinct'、エラーの場合は 'failure' にルーティングします。

タグ

データベース、検出、重複、ハッシュ、Snowflake

入力要件

REQUIRED

機密動的プロパティをサポート

false

プロパティ

プロパティ

説明

コンテンツ・ハッシュ

事前に計算されたハッシュを保持する FlowFile 属性の名前。式言語をサポートしています。

ドキュメントソース識別子

ドキュメントソース識別子 (doc ID) を指定します。式言語をサポートしています。

ドキュメントソース名

ドキュメントソースシステム名を指定します。式言語をサポートしています。

Snowflake 接続 サービス

Snowflakeへの接続を提供する DBCPService。

Snowflakeテーブルネーム

ファイルハッシュを格納するSnowflakeテーブル名。データベースとスキーマは、事前にSnowflake接続サービスで構成する必要があります。

リレーションシップ

名前

説明

distinct

既存のドキュメントにマッチしない FlowFiles はここにルーティングされます (新しいハッシュが挿入されます)。

duplicate

既存のドキュメント (同じハッシュ) にマッチする FlowFiles はここにルーティングされます。

failure

処理中にエラーや例外が発生した FlowFiles は、ここにルーティングされます。

属性の書き込み

名前

説明

Snowflake.detect.duplicate

FlowFile が重複として検出されたかどうかを示す 'true' または 'false' 属性。