RouteText 2025.5.31.15¶
バンドル¶
org.apache.nifi | nifi-standard-nar
説明¶
ユーザー定義のルールセットに基づいてテキストデータをルーティングします。受信 FlowFile の各行は、ユーザー定義プロパティで指定された値と比較されます。テキストがこれらのユーザー定義プロパティと比較されるメカニズムは、「Matching Strategy」によって定義されます。その後、これらのルールに従ってデータがルーティングされ、テキストの各行が個別にルーティングされます。
入力要件¶
REQUIRED
機密動的プロパティをサポート¶
false
プロパティ¶
プロパティ |
説明 |
---|---|
文字セット |
入力テキストがエンコードされている文字セット |
正規表現のグループ化 |
行をどのグループに配置するかを決定するために、各行に対して評価する正規表現を指定します。正規表現には、行のグループを定義する捕捉グループが少なくとも1つ必要です。正規表現に複数の捕捉グループが存在する場合、すべての捕捉グループの値が連結されます。2つの行が同じ FlowFile に配置されるのは、グループの値が両方とも同じ(またはどちらの行も正規表現に一致しない)場合だけです。たとえば、 CSV ファイルのすべての行を最初の列でグループ化するには、この値を "(.*?),.*" にセットします。グループが同じでリレーションシップが異なる2つのラインは、決して同じ FlowFile に配置されません。 |
大文字と小文字を無視 |
trueを指定すると、値の比較時に大文字小文字の区別がアカウントに反映されなくなります。例えば、 'HELLO' や 'hello' とのマッチングは同じ結果になります。このプロパティは、 'Matching Strategy' が 'Satisfies Expression' にセットされている場合は無視されます。 |
空白の後続/先頭を無視 |
行の評価時に、行頭と行末の空白を無視するかどうかを指定します。 |
Matching Strategy |
ユーザー定義プロパティに対する入力テキストの各行の評価方法を指定します。 |
ルーティングストラテジー |
受信テキストの行を「Matching Strategy」およびユーザー定義プロパティに対して評価する際に使用するリレーションシップを決定する方法を指定します。 |
リレーションシップ¶
名前 |
説明 |
---|---|
original |
元の入力ファイルは、1つ以上のリレーションシップへのルーティングに成功すると、この宛先にルーティングされます。 |
unmatched |
必要なユーザー定義ルールを満たさないデータは、この Relationship にルーティングされます。 |
属性の書き込み¶
名前 |
説明 |
---|---|
RouteText.Route |
FlowFile がルーティングされたリレーションシップ名。 |
RouteText.Group |
'Grouping Regular Expression' プロパティ内のすべてのキャプチャグループによってキャプチャされる値。このプロパティがセットされていないか、キャプチャグループが含まれていない場合、この属性は追加されません。 |
ユースケース¶
FlowFile のコンテンツから空白行や空行を削除します。 |
特定の単語を含む行や、行の長さがしきい値を超える行など、特定の行をファイルから削除します。 |