CountText 2025.5.31.15

Bundle

org.apache.nifi | nifi-standard-nar

Beschreibung

Zählt verschiedene Metriken für eingehenden Text. Die angeforderten Ergebnisse werden als Attribute gespeichert. Der Inhalt des resultierenden FlowFile wird nicht verändert.

Tags

character, count, line, text, word

Eingabeanforderung

REQUIRED

Unterstützt sensible dynamische Eigenschaften

false

Eigenschaften

Eigenschaft

Beschreibung

ajust-immediately

Bei „true“ wird der Zähler sofort aktualisiert, unabhängig davon, ob die ProcessSession übertragen oder zurückgenommen wird. Andernfalls wird der Zähler nur erhöht, wenn die ProcessSession übertragen wird.

character-encoding

Gibt eine zu verwendende Zeichencodierung an.

split-words-on-symbols

Wenn diese Option aktiviert ist, identifiziert die Wortzählung Zeichenketten, die durch gemeinsame logische Trennzeichen [ _ - . ] getrennt sind, als unabhängige Wörter (z. B. split-words-on-symbols = 4 Wörter).

text-character-count

Wenn diese Option aktiviert ist, wird die Anzahl der Zeichen (einschließlich Leerzeichen und Symbole, aber ohne Zeilenumbrüche und Rücklaufzeichen) im eingehenden Text gezählt.

text-line-count

Wenn aktiviert, wird die Anzahl der Zeilen im eingehenden Text gezählt.

text-line-nonempty-count

Wenn aktiviert, wird die Anzahl der Zeilen gezählt, die ein nicht nur aus Leerzeichen bestehendes Zeichen im eingehenden Text enthalten.

text-word-count

Wenn aktiviert, wird die Anzahl der Wörter (alphanumerische Zeichengruppen, die durch Leerzeichen begrenzt sind) im eingehenden Text gezählt. Übliche logische Trennzeichen [_-.] binden kein Wort, es sei denn, „Split Words on Symbols“ ist „true“.

Beziehungen

Name

Beschreibung

failure

Wenn der FlowFile-Text aus irgendeinem Grund nicht gezählt werden kann, wird die Originaldatei an dieses Ziel weitergeleitet und nichts wird an einen anderen Ort weitergeleitet.

success

Das FlowFile enthält den ursprünglichen Inhalt, dem ein oder mehrere Attribute mit den jeweiligen Zählungen hinzugefügt wurden

Schreibt Attribute

Name

Beschreibung

text.line.count

Die Anzahl der Textzeilen, die der FlowFile-Inhalt enthält

text.line.nonempty.count

Die Anzahl der Textzeilen (mit mindestens einem Nicht-Leerzeichen), die im Original vorhanden sind FlowFile

text.word.count

Die Anzahl der im Original-FlowFile vorhandenen Wörter

text.character.count

Die Anzahl der Zeichen (unter Berücksichtigung der angegebenen Zeichencodierung), die im Original-FlowFile vorhanden sind

Siehe auch: