RouteText 2025.5.31.15

バンドル

org.apache.nifi | nifi-standard-nar

説明

ユーザー定義のルールセットに基づいてテキストデータをルーティングします。受信 FlowFile の各行は、ユーザー定義プロパティで指定された値と比較されます。テキストがこれらのユーザー定義プロパティと比較されるメカニズムは、「Matching Strategy」によって定義されます。その後、これらのルールに従ってデータがルーティングされ、テキストの各行が個別にルーティングされます。

タグ

Expression Language, Regular Expression, attributes, csv, delimited, detect, filter, find, logs, regex, regexp, routing, search, string, text

入力要件

REQUIRED

機密動的プロパティをサポート

false

プロパティ

プロパティ

説明

文字セット

入力テキストがエンコードされている文字セット

正規表現のグループ化

行をどのグループに配置するかを決定するために、各行に対して評価する正規表現を指定します。正規表現には、行のグループを定義する捕捉グループが少なくとも1つ必要です。正規表現に複数の捕捉グループが存在する場合、すべての捕捉グループの値が連結されます。2つの行が同じ FlowFile に配置されるのは、グループの値が両方とも同じ(またはどちらの行も正規表現に一致しない)場合だけです。たとえば、 CSV ファイルのすべての行を最初の列でグループ化するには、この値を "(.*?),.*" にセットします。グループが同じでリレーションシップが異なる2つのラインは、決して同じ FlowFile に配置されません。

大文字と小文字を無視

trueを指定すると、値の比較時に大文字小文字の区別がアカウントに反映されなくなります。例えば、 'HELLO' や 'hello' とのマッチングは同じ結果になります。このプロパティは、 'Matching Strategy' が 'Satisfies Expression' にセットされている場合は無視されます。

空白の後続/先頭を無視

行の評価時に、行頭と行末の空白を無視するかどうかを指定します。

Matching Strategy

ユーザー定義プロパティに対する入力テキストの各行の評価方法を指定します。

ルーティングストラテジー

受信テキストの行を「Matching Strategy」およびユーザー定義プロパティに対して評価する際に使用するリレーションシップを決定する方法を指定します。

リレーションシップ

名前

説明

original

元の入力ファイルは、1つ以上のリレーションシップへのルーティングに成功すると、この宛先にルーティングされます。

unmatched

必要なユーザー定義ルールを満たさないデータは、この Relationship にルーティングされます。

属性の書き込み

名前

説明

RouteText.Route

FlowFile がルーティングされたリレーションシップ名。

RouteText.Group

'Grouping Regular Expression' プロパティ内のすべてのキャプチャグループによってキャプチャされる値。このプロパティがセットされていないか、キャプチャグループが含まれていない場合、この属性は追加されません。

ユースケース

FlowFile のコンテンツから空白行や空行を削除します。

特定の単語を含む行や、行の長さがしきい値を超える行など、特定の行をファイルから削除します。