ScanContent 2025.5.31.15

Bundle

org.apache.nifi | nifi-standard-nar

Beschreibung

Durchsucht den Inhalt von FlowFiles nach Begriffen, die in einem vom Benutzer bereitgestellten Wörterbuch enthalten sind. Wenn ein Begriff gefunden wird, wird die UTF-8-codierte Version des Begriffs mit dem Attribut „matching.term“ zu FlowFile hinzugefügt.

Tags

aho-corasick, byte sequence, content, dictionary, find, scan, search

Eingabeanforderung

REQUIRED

Unterstützt sensible dynamische Eigenschaften

false

Eigenschaften

Eigenschaft

Beschreibung

Dictionary Encoding

Gibt an, wie das Wörterbuch codiert ist. Bei „text“ sind die Wörterbuchbegriffe durch neue Zeilen getrennt und UTF-8-codiert. bei „binary“ werden die Wörterbuchbegriffe durch eine 4-Byte-Ganzzahl gekennzeichnet, die die Begriffslänge angibt, gefolgt vom Begriff selbst

Dictionary File

Der Dateiname des Begriffswörterbuchs

Beziehungen

Name

Beschreibung

matched

FlowFiles, die mit mindestens einem Begriff im Wörterbuch übereinstimmen, werden an diese Beziehung weitergeleitet.

unmatched

FlowFiles, die mit keinem Begriff im Wörterbuch übereinstimmen, werden an diese Beziehung weitergeleitet.

Schreibt Attribute

Name

Beschreibung

matching.term

Der Begriff, der den Prozessor veranlasst hat, FlowFile an die Beziehung „matched“ weiterzuleiten. Wenn das FlowFile an die Beziehung „unmatched“ weitergeleitet wird, wird dieses Attribut nicht hinzugefügt