ListSFTP 2025.10.2.19

Bundle

org.apache.nifi | nifi-standard-nar

Beschreibung

Listet die Dateien auf, die sich auf einem SFTP-Server befinden. Für jede Datei, die auf dem Remote-Server gefunden wird, wird ein neues FlowFile erstellt, dessen Dateiname-Attribut auf den Namen der Datei auf dem Remote-Server gesetzt wird. Dies kann dann in Verbindung mit FetchSFTP verwendet werden, um diese Dateien abzurufen.

Tags

files, ingest, input, list, remote, sftp, source

Eingabeanforderung

FORBIDDEN

Unterstützt sensible dynamische Eigenschaften

false

Eigenschaften

Eigenschaft

Beschreibung

Vernachlässigung des Algorithmus

Konfigurationsstrategie für die SSH-Verhandlung von Algorithmen

Ciphers Allowed

A comma-separated list of Ciphers allowed for SFTP connections. Leave unset to allow all. Available options are: 3des-cbc, aes128-cbc, aes128-ctr, aes128-gcm@openssh.com, aes192-cbc, aes192-ctr, aes256-cbc, aes256-ctr, aes256-gcm@openssh.com, arcfour128, arcfour256, blowfish-cbc, chacha20-poly1305@openssh.com, none

Connection Timeout

Zeitspanne, die beim Herstellen einer Verbindung gewartet werden muss, bevor ein Timeout auftritt

Data Timeout

Bei der Übertragung einer Datei zwischen dem lokalen und dem Remote-System gibt dieser Wert an, wie lange keine Daten übertragen werden dürfen, bevor der Vorgang möglicherweise abgebrochen wird.

File Filter Regex

Bietet einen regulären Java-Ausdruck zum Filtern von Dateinamen. Wenn ein Filter angegeben wird, werden nur Dateien abgerufen, deren Namen mit diesem regulären Ausdruck übereinstimmen

Host Key File

Wenn angegeben, wird die angegebene Datei als Host-Schlüssel verwendet. Andernfalls, wenn die Eigenschaft „Strict Host Key Checking“ aktiviert ist (auf „true“ gesetzt), werden die Dateien „known_hosts“ und „known_hosts2“ aus dem Verzeichnis ~/.ssh verwendet, andernfalls wird keine Host-Schlüsseldatei verwendet.

Hostname

Der vollständig qualifizierte Hostname oder die IP-Adresse des Remote-Systems

Ignore Dotted Files

Bei „true“, werden Dateien, deren Namen mit einem Punkt („.“) beginnen, ignoriert

Key Algorithms Allowed

A comma-separated list of Key Algorithms allowed for SFTP connections. Leave unset to allow all. Available options are: ecdsa-sha2-nistp256, ecdsa-sha2-nistp256-cert-v01@openssh.com, ecdsa-sha2-nistp384, ecdsa-sha2-nistp384-cert-v01@openssh.com, ecdsa-sha2-nistp521, ecdsa-sha2-nistp521-cert-v01@openssh.com, rsa-sha2-256, rsa-sha2-256-cert-v01@openssh.com, rsa-sha2-512, rsa-sha2-512-cert-v01@openssh.com, sk-ecdsa-sha2-nistp256@openssh.com, sk-ssh-ed25519@openssh.com, ssh-dss, ssh-dss-cert-v01@openssh.com, ssh-ed25519, ssh-ed25519-cert-v01@openssh.com, ssh-rsa, ssh-rsa-cert-v01@openssh.com

Key Exchange Algorithms Allowed

A comma-separated list of Key Exchange Algorithms allowed for SFTP connections. Leave unset to allow all. Available options are: curve25519-sha256, curve25519-sha256@libssh.org, curve448-sha512, diffie-hellman-group-exchange-sha1, diffie-hellman-group-exchange-sha256, diffie-hellman-group1-sha1, diffie-hellman-group14-sha1, diffie-hellman-group14-sha256, diffie-hellman-group15-sha512, diffie-hellman-group16-sha512, diffie-hellman-group17-sha512, diffie-hellman-group18-sha512, ecdh-sha2-nistp256, ecdh-sha2-nistp384, ecdh-sha2-nistp521, mlkem1024nistp384-sha384, mlkem768nistp256-sha256, mlkem768x25519-sha256, sntrup761x25519-sha512, sntrup761x25519-sha512@openssh.com

Maximum File Age

Das maximale Alter, das eine Datei haben darf, um abgerufen zu werden; alle Dateien, die älter sind als dieser Zeitraum (gemäß dem Datum der letzten Änderung), werden ignoriert.

Maximum File Size

Die maximale Größe, die eine Datei haben darf, um abgerufen zu werden

Message Authentication Codes Allowed

A comma-separated list of Message Authentication Codes allowed for SFTP connections. Leave unset to allow all. Available options are: hmac-md5, hmac-md5-96, hmac-sha1, hmac-sha1-96, hmac-sha1-etm@openssh.com, hmac-sha2-256, hmac-sha2-256-etm@openssh.com, hmac-sha2-512, hmac-sha2-512-etm@openssh.com

Minimum File Age

Das Mindestalter, das eine Datei haben muss, um abgerufen zu werden; alle Dateien, die jünger sind als dieser Zeitraum (gemäß dem Datum der letzten Änderung), werden ignoriert.

Minimum File Size

Die Mindestgröße, die eine Datei haben muss, um abgerufen zu werden

Password

Kennwort für das Benutzerkonto

Path Filter Regex

Wenn Search Recursively „true“ ist, werden nur die Unterverzeichnisse durchsucht, deren Pfad mit dem angegebenen regulären Ausdruck übereinstimmt

Port

Der Port, den das Remote-System bei Dateiübertragungen überwacht

Private Key Passphrase

Kennwort für den privaten Schlüssel

Private Key Path

Der vollständig qualifizierte Pfad zur Datei des privaten Schlüssels

Remote-Pfad

Der Pfad auf dem Remote-System, von dem aus Dateien abgeufen oder gepusht werden sollen

Search Recursively

Bei „true“ werden Dateien aus beliebig verschachtelten Unterverzeichnissen abgerufen; andernfalls werden Unterverzeichnisse nicht durchsucht.

Send Keep Alive On Timeout

Sendet alle 5 Sekunden eine Keep-Alive-Meldung, bis zu 5-mal bei einer Gesamtdauer von 25 Sekunden.

Strict Host Key Checking

Gibt an, ob die strikte Durchsetzung von Hostschlüsseln angewendet werden soll oder nicht.

Use Compression

Zeigt an, ob die ZLIB-Komprimierung bei der Übertragung von Dateien verwendet werden soll oder nicht.

Username

Username

et-initial-listing-target

Specify how initial listing should be handled. Used by ‚Tracking Entities’strategy.

et-state-cache

Listed entities are stored in the specified cache storage so that this processor can resume listing across NiFi restart or in case of primary node change. ‚Tracking Entities’strategy require tracking information of all listed entities within the last ‚Tracking Time Window‘. To support large number of entities, the strategy uses DistributedMapCache instead of managed state. Cache key format is ‚ListedEntities::{processorId}(::{nodeId})‘. If it tracks per node listed entities, then the optional ‚::{nodeId}‘ part is added to manage state separately. E.g. cluster wide cache key =‘ListedEntities::8dda2321-0164-1000-50fa-3042fe7d6a7b‘, per node cache key =‘ListedEntities::8dda2321-0164-1000-50fa-3042fe7d6a7b::nifi-node3‘ The stored cache content is Gzipped JSON string. The cache key will be deleted when target listing configuration is changed. Used by ‚Tracking Entities’strategy.

et-time-window

Specify how long this processor should track already-listed entities. ‚Tracking Entities’strategy can pick any entity whose timestamp is inside the specified time window. For example, if set to ‚30 minutes‘, any entity having timestamp in recent 30 minutes will be the listing target when this processor runs. A listed entity is considered ‚new/updated‘ and a FlowFile is emitted if one of following condition meets: 1. does not exist in the already-listed entities, 2. has newer timestamp than the cached entity, 3. has different size than the cached entity. If a cached entity ‚s timestamp becomes older than specified time window, that entity will be removed from the cached already-listed entities. Used by’Tracking Entities’strategy.

follow-symlink

Bei „true“ werden auch symbolische Dateien und verschachtelte symbolische Unterverzeichnisse gelesen; andernfalls werden keine symbolischen Dateien gelesen und keine symbolischen Link-Unterverzeichnisse durchlaufen

listing-strategy

Legen Sie fest, wie neue/aktualisierte Entitäten ermittelt werden sollen. Weitere Informationen finden Sie in den Beschreibungen der einzelnen Strategien.

proxy-configuration-service

Gibt den Proxy-Konfigurations-Controller Service an für die Weiterleitung von Netzwerkanforderungen festl.

record-writer

Gibt den Record Writer an, der zum Erstellen der Liste verwendet werden soll. Wenn nicht angegeben, wird für jede aufgelistete Entität ein FlowFile erstellt. Wenn der Record Writer angegeben ist, werden alle Entitäten in ein einziges FlowFile geschrieben, anstatt Attribute zu einzelnen FlowFiles hinzuzufügen.

target-system-timestamp-precision

Geben Sie die Zeitstempelgenauigkeit auf dem Zielsystem an. Da dieser Prozessor den Zeitstempel von Entitäten verwendet, um zu entscheiden, welche aufgelistet werden sollen, ist es wichtig, die richtige Zeitstempelgenauigkeit zu verwenden.

Statusmanagement

Bereiche

Beschreibung

CLUSTER

Nach dem Auflisten der Dateien wird der Zeitstempel der neuesten Datei gespeichert. Dadurch kann der Prozessor bei der nächsten Ausführung nur Dateien auflisten, die nach diesem Datum hinzugefügt oder geändert wurden. Der Status wird im gesamten Cluster gespeichert, sodass dieser Prozessor nur auf dem primären Knoten ausgeführt werden kann. Wenn ein neuer primärer Knoten ausgewählt wird, dupliziert der neue Knoten nicht die Daten, die vom vorherigen primären Knoten aufgeführt wurden.

Beziehungen

Name

Beschreibung

success

Alle FlowFiles, die empfangen werden, werden an die Beziehung „success“ weitergeleitet.

Schreibt Attribute

Name

Beschreibung

sftp.remote.host

Der Hostname des SFTP-Servers

sftp.remote.port

Der Port, mit dem eine Verbindung auf dem SFTP-Server hergestellt wurde

sftp.listing.user

Der Benutzername des Benutzers, der die SFTP-Auflistung durchgeführt hat

file.owner

Die numerische Eigentümer-ID der Quelldatei

file.group

Die numerische Gruppen-ID der Quelldatei

file.permissions

Die Lese-, Schreib- und Ausführungsberechtigungen der Quelldatei

file.size

Die Anzahl der Bytes in der Quelldatei

file.lastModifiedTime

Der Zeitstempel, wann die Datei im Dateisystem zuletzt geändert wurde als „yyyy-MM-dd’T’HH: mm:ssZ“

filename

Der Name der Datei auf dem SFTP-Server

Pfad

Der vollständig qualifizierte Name des Verzeichnisses auf dem SFTP-Server, aus dem die Datei abgerufen wurde.

mime.type

Der MIME-Typ, der von dem konfigurierten Record Writer bereitgestellt wird

Siehe auch: