ListSmb 2025.10.2.19¶
Bundle¶
org.apache.nifi | nifi-smb-nar
Beschreibung¶
Listet konkrete Dateien auf, die über das SMB-Protokoll freigegeben wurden. Jede aufgelistete Datei kann zu einem FlowFile führen, wobei die Metadaten als FlowFile-Attribute geschrieben werden. Oder – falls die Eigenschaft „Record Writer“ gesetzt ist – das gesamte Ergebnis wird als Datensätze in ein einzelnes FlowFile geschrieben. Dieser Prozessor ist für den Betrieb auf dem primären Knoten in einem Cluster vorgesehen. Wenn sich der primäre Knoten ändert, macht der neue primäre Knoten dort weiter, wo der vorherige Knoten aufgehört hat, ohne alle Daten zu duplizieren.
Eingabeanforderung¶
FORBIDDEN
Unterstützt sensible dynamische Eigenschaften¶
false
Eigenschaften¶
Eigenschaft |
Beschreibung |
|---|---|
directory |
Der Netzwerkordner, aus dem Dateien aufgelistet werden sollen. Dies ist der verbleibende relative Pfad nach der Freigabe: smb://HOSTNAME:PORT/SHARE/[DIRECTORY]/sub/directories. Es ist auch möglich, Unterverzeichnisse hinzuzufügen. Der angegebene Pfad zur Remote-Dateifreigabe muss existieren. Dies kann mithilfe der Verifizierung überprüft werden. Sie können Windows- und Linux-Verzeichnistrennzeichen mischen. |
et-initial-listing-target |
Specify how initial listing should be handled. Used by ‚Tracking Entities’strategy. |
et-state-cache |
Listed entities are stored in the specified cache storage so that this processor can resume listing across NiFi restart or in case of primary node change. ‚Tracking Entities’strategy require tracking information of all listed entities within the last ‚Tracking Time Window‘. To support large number of entities, the strategy uses DistributedMapCache instead of managed state. Cache key format is ‚ListedEntities::{processorId}(::{nodeId})‘. If it tracks per node listed entities, then the optional ‚::{nodeId}‘ part is added to manage state separately. E.g. cluster wide cache key =‘ListedEntities::8dda2321-0164-1000-50fa-3042fe7d6a7b‘, per node cache key =‘ListedEntities::8dda2321-0164-1000-50fa-3042fe7d6a7b::nifi-node3‘ The stored cache content is Gzipped JSON string. The cache key will be deleted when target listing configuration is changed. Used by ‚Tracking Entities’strategy. |
et-time-window |
Specify how long this processor should track already-listed entities. ‚Tracking Entities’strategy can pick any entity whose timestamp is inside the specified time window. For example, if set to ‚30 minutes‘, any entity having timestamp in recent 30 minutes will be the listing target when this processor runs. A listed entity is considered ‚new/updated‘ and a FlowFile is emitted if one of following condition meets: 1. does not exist in the already-listed entities, 2. has newer timestamp than the cached entity, 3. has different size than the cached entity. If a cached entity ‚s timestamp becomes older than specified time window, that entity will be removed from the cached already-listed entities. Used by’Tracking Entities’strategy. |
file-filter |
Es werden nur Dateien aufgelistet, deren Namen mit dem angegebenen regulären Ausdruck übereinstimmen. |
filename-suffix-filter |
Dateien, die mit dem angegebenen Suffix enden, werden ausgelassen. Kann verwendet werden, um sicherzustellen, dass Dateien, die noch hochgeladen werden, nicht mehrfach aufgelistet werden, indem diesen Dateien ein Suffix hinzugefügt und dieses Suffix nach Abschluss des Uploads wieder entfernt wird. Dies ist sehr empfehlenswert, wenn Sie die Auflistungsstrategien „Tracking Entities“ oder „Tracking Timestamps“ verwenden. |
initial-listing-strategy |
Gibt an, wie vorhandene Dateien auf der SMB-Freigabe behandelt werden sollen, wenn der Prozessor zum ersten Mal gestartet wird (oder sein Status gelöscht wurde). |
initial-listing-timestamp |
Der Zeitstempel, ab dem die Dateien aufgelistet werden, wenn der Prozessor zum ersten Mal gestartet wird (oder sein Status gelöscht wurde). Der Wert kann als Epoch-Zeitstempel in Millisekunden oder als UTC-Datumszeit in einem Format wie 2025-02-01T00:00:00Z angegeben werden. |
listing-strategy |
Legen Sie fest, wie neue/aktualisierte Entitäten ermittelt werden sollen. Weitere Informationen finden Sie in den Beschreibungen der einzelnen Strategien. |
max-file-age |
Alle Dateien, die älter als der angegebene Wert sind, werden ausgelassen. |
max-file-size |
Jede Datei, die größer als der angegebene Wert ist, wird ausgelassen. |
min-file-age |
Das Mindestalter, das eine Datei haben muss, um aufgelistet zu werden; alle Dateien, die jünger sind als dieser Zeitraum, werden ignoriert. |
min-file-size |
Jede Datei, die kleiner als der angegebene Wert ist, wird ausgelassen. |
path-filter |
Es werden nur Dateien aufgelistet, deren Pfade (bis zum übergeordneten Verzeichnis der Datei) mit dem angegebenen regulären Ausdruck übereinstimmen. |
record-writer |
Gibt den Record Writer an, der zum Erstellen der Liste verwendet werden soll. Wenn nicht angegeben, wird für jede aufgelistete Entität ein FlowFile erstellt. Wenn der Record Writer angegeben ist, werden alle Entitäten in ein einziges FlowFile geschrieben, anstatt Attribute zu einzelnen FlowFiles hinzuzufügen. |
smb-client-provider-service |
Gibt den SMB-Client-Anbieter an, der für die Erstellung von SMB-Verbindungen verwendet werden soll. |
target-system-timestamp-precision |
Geben Sie die Zeitstempelgenauigkeit auf dem Zielsystem an. Da dieser Prozessor den Zeitstempel von Entitäten verwendet, um zu entscheiden, welche aufgelistet werden sollen, ist es wichtig, die richtige Zeitstempelgenauigkeit zu verwenden. |
Statusmanagement¶
Bereiche |
Beschreibung |
|---|---|
CLUSTER |
Nach dem Erstellen einer Dateiliste kann der Status der vorherigen Auflistung gespeichert werden, um Dateien fortlaufend ohne Duplikate aufzulisten. |
Beziehungen¶
Name |
Beschreibung |
|---|---|
success |
Alle FlowFiles, die empfangen werden, werden an die Beziehung „success“ weitergeleitet. |
Schreibt Attribute¶
Name |
Beschreibung |
|---|---|
filename |
Der Name der Datei, die aus dem Dateisystem gelesen wurde. |
shortName |
Der Kurzname der Datei, die aus dem Dateisystem gelesen wurde. |
Pfad |
Der Pfad wird auf den relativen Pfad des Verzeichnisses der Datei auf dem Remote-Dateisystem im Vergleich zum Share-Stammverzeichnis gesetzt. Wenn ein Remote-Speicherort unter smb://HOSTNAME:PORT/SHARE/DIRECTORY definiert ist und eine Datei aus smb://HOSTNAME:PORT/SHARE/DIRECTORY/sub/folder/file aufgelistet wird, dann wird das Attribut „DIRECTORY/sub/folder“ gesetzt. |
serviceLocation |
Die SMB URL der Freigabe. |
lastModifiedTime |
Der Zeitstempel, wann der Inhalt der Datei im Dateisystem geändert wurde, als „yyyy-MM-dd’T’HH: mm:ss“. |
creationTime |
Der Zeitstempel, wann die Datei im Dateisystem erstellt wurde als „yyyy-MM-dd’T’HH: mm:ss“. |
lastAccessTime |
Der Zeitstempel, wann auf die Datei im Dateisystem zugegriffen wurde, als „yyyy-MM-dd’T’HH: mm:ss“. |
changeTime |
Der Zeitstempel, wann die Dateiattribute im Dateisystem geändert wurden, als „yyyy-MM-dd’T’HH: mm:ss“. |
size |
Die Größe der Datei in Bytes. |
allocationSize |
Die Anzahl der Bytes, die für die Datei auf dem Server reserviert sind. |