RouteText 2025.5.31.15

Bundle

org.apache.nifi | nifi-standard-nar

Beschreibung

Routing von Textdaten auf der Grundlage einer Reihe von benutzerdefinierten Regeln. Jede Zeile in einem eingehenden FlowFile wird mit den Werten verglichen, die in den benutzerdefinierten Eigenschaften angegeben sind. Der Mechanismus, mit dem der Text mit diesen benutzerdefinierten Eigenschaften verglichen wird, wird durch die „Matching Strategy“ definiert. Die Daten werden dann nach diesen Regeln weitergeleitet, wobei jede Zeile des Textes einzeln weitergeleitet wird.

Tags

Expression Language, Regulärer Ausdruck, Attribute, CSV, abgegrenzt, erkennen, filtern, finden, Protokolle, Regex, Regexp, Routing, Suche, Zeichenfolge, Text

Eingabeanforderung

REQUIRED

Unterstützt sensible dynamische Eigenschaften

false

Eigenschaften

Eigenschaft

Beschreibung

Zeichensatz

Der Zeichensatz, in dem der eingehende Text codiert ist

Grouping Regular Expression

Gibt einen regulären Ausdruck an, der für jede Zeile ausgewertet wird, um zu bestimmen, in welche Gruppe die Zeile eingefügt werden soll. Der reguläre Ausdruck muss mindestens eine Erfassungsgruppe enthalten, die die Gruppe der Zeile definiert. Wenn in dem regulären Ausdruck mehrere Erfassungsgruppen vorhanden sind, werden die Werte aus allen Erfassungsgruppen zusammengefügt. Zwei Zeilen werden nicht in dasselbe FlowFile eingefügt, es sei denn, sie haben beide den gleichen Wert für die Gruppe (oder keine der beiden Zeilen entspricht dem regulären Ausdruck). Um beispielsweise alle Zeilen in einer CSV-Datei nach der ersten Spalte zu gruppieren, können wir diesen Wert auf „(.*? )“,.* setzen. Zwei Linien, die dieselbe Gruppe, aber unterschiedliche Beziehungen haben, werden niemals in dasselbe FlowFile eingefügt.

Ignore Case

Wenn „true“, wird die Groß-/Kleinschreibung beim Vergleich von Werten nicht berücksichtigt. So führt z. B. ein Abgleich mit „HELLO“ oder „Hallo“ zum selben Ergebnis. Diese Eigenschaft wird ignoriert, wenn die „Matching Strategy“ auf „Satisfies Expression“ eingestellt ist.

Ignore Leading/Trailing Whitespace

Gibt an, ob die Leerzeichen am Anfang und am Ende der Zeilen bei der Auswertung der Zeile ignoriert werden sollen oder nicht.

Matching Strategy

Gibt an, wie jede Zeile des eingehenden Textes anhand der benutzerdefinierten Eigenschaften ausgewertet werden soll.

Routing Strategy

Legt fest, welche Beziehung(en) verwendet werden soll(en), wenn die Zeilen des eingehenden Textes anhand der „Matching Strategy“ und benutzerdefinierter Eigenschaften ausgewertet werden.

Beziehungen

Name

Beschreibung

original

Die Original-Eingabedatei wird an dieses Ziel weitergeleitet, wenn die Zeilen erfolgreich an einen oder mehrere Beziehungen weitergeleitet wurden.

unmatched

Daten, die die erforderlichen benutzerdefinierten Regeln nicht erfüllen, werden an diese Beziehung weitergeleitet.

Schreibt Attribute

Name

Beschreibung

RouteText.Route

Der Name der Beziehung, an die das FlowFile weitergeleitet wurde.

RouteText.Group

Der Wert, der von allen Erfassungsgruppen in der Eigenschaft „Grouping Regular Expression“ erfasst wird. Wenn diese Eigenschaft nicht festgelegt ist oder keine Erfassungsgruppen enthält, wird dieses Attribut nicht hinzugefügt.

Anwendungsfälle

Entfernt leere Zeilen aus dem Inhalt des FlowFile.

Entfernen Sie bestimmte Textzeilen aus einer Datei, z. B. solche, die ein bestimmtes Wort enthalten oder eine Zeilenlänge überschreiten.