ListSFTP 2025.5.31.15¶
Bundle¶
org.apache.nifi | nifi-standard-nar
Beschreibung¶
Listet die Dateien auf, die sich auf einem SFTP-Server befinden. Für jede Datei, die auf dem Remote-Server gefunden wird, wird ein neues FlowFile erstellt, dessen Dateiname-Attribut auf den Namen der Datei auf dem Remote-Server gesetzt wird. Dies kann dann in Verbindung mit FetchSFTP verwendet werden, um diese Dateien abzurufen.
Eingabeanforderung¶
FORBIDDEN
Unterstützt sensible dynamische Eigenschaften¶
false
Eigenschaften¶
Eigenschaft |
Beschreibung |
---|---|
Ciphers Allowed |
Eine durch Kommas getrennte Liste der zulässigen Verschlüsselungsverfahren (Chiffren) für SFTP-Verbindungen. Lassen Sie die Option deaktiviert, um alle zuzulassen. Folgende Optionen sind verfügbar: 3des-cbc, 3des-ctr, aes128-cbc, aes128-ctr, aes128-gcm@openssh.com, aes192-cbc, aes192-ctr, aes256-cbc, aes256-ctr, aes256-gcm@openssh.com, arcfour, arcfour128, arcfour256, blowfish-cbc, blowfish-ctr, cast128-cbc, cast128-ctr, chacha20-poly1305@openssh.com, idea-cbc, idea-ctr, serpent128-cbc, serpent128-ctr, serpent192-cbc, serpent192-ctr, serpent256-cbc, serpent256-ctr, twofish-cbc, twofish128-cbc, twofish128-ctr, twofish192-cbc, twofish192-ctr, twofish256-cbc, twofish256-ctr |
Connection Timeout |
Zeitspanne, die beim Herstellen einer Verbindung gewartet werden muss, bevor ein Timeout auftritt |
Data Timeout |
Bei der Übertragung einer Datei zwischen dem lokalen und dem Remote-System gibt dieser Wert an, wie lange keine Daten übertragen werden dürfen, bevor der Vorgang möglicherweise abgebrochen wird. |
File Filter Regex |
Bietet einen regulären Java-Ausdruck zum Filtern von Dateinamen. Wenn ein Filter angegeben wird, werden nur Dateien abgerufen, deren Namen mit diesem regulären Ausdruck übereinstimmen |
Host Key File |
Wenn angegeben, wird die angegebene Datei als Host-Schlüssel verwendet. Andernfalls, wenn die Eigenschaft „Strict Host Key Checking“ aktiviert ist (auf „true“ gesetzt), werden die Dateien „known_hosts“ und „known_hosts2“ aus dem Verzeichnis ~/.ssh verwendet, andernfalls wird keine Host-Schlüsseldatei verwendet. |
Hostname |
Der vollständig qualifizierte Hostname oder die IP-Adresse des Remote-Systems |
Ignore Dotted Files |
Bei „true“, werden Dateien, deren Namen mit einem Punkt („.“) beginnen, ignoriert |
Key Algorithms Allowed |
Eine durch Kommas getrennte Liste von Schlüsselalgorithmen, die für SFTP-Verbindungen zulässig sind. Lassen Sie die Option deaktiviert, um alle zuzulassen. Folgende Optionen sind verfügbar: ecdsa-sha2-nistp256, ecdsa-sha2-nistp256-cert-v01@openssh.com, ecdsa-sha2-nistp384, ecdsa-sha2-nistp384-cert-v01@openssh.com, ecdsa-sha2-nistp521, ecdsa-sha2-nistp521-cert-v01@openssh.com, rsa-sha2-256, rsa-sha2-512, ssh-dss, ssh-dss-cert-v01@openssh.com, ssh-ed25519, ssh-ed25519-cert-v01@openssh.com, ssh-rsa, ssh-rsa-cert-v01@openssh.com |
Key Exchange Algorithms Allowed |
Eine durch Kommas getrennte Liste der für SFTP-Verbindungen zulässigen Schlüsselaustauschalgorithmen. Lassen Sie die Option deaktiviert, um alle zuzulassen. Folgende Optionen sind verfügbar: curve25519-sha256, curve25519-sha256@libssh.org, diffie-hellman-group-exchange-sha1, diffie-hellman-group-exchange-sha256, diffie-hellman-group1-sha1, diffie-hellman-group14-sha1, diffie-hellman-group14-sha256, diffie-hellman-group14-sha256@ssh.com, diffie-hellman-group15-sha256, diffie-hellman-group15-sha256@ssh.com, diffie-hellman-group15-sha384@ssh.com, diffie-hellman-group15-sha512, diffie-hellman-group16-sha256, diffie-hellman-group16-sha384@ssh.com, diffie-hellman-group16-sha512, diffie-hellman-group16-sha512@ssh.com, diffie-hellman-group17-sha512, diffie-hellman-group18-sha512, diffie-hellman-group18-sha512@ssh.com, ecdh-sha2-nistp256, ecdh-sha2-nistp384, ecdh-sha2-nistp521, ext-info-c |
Maximum File Age |
Das maximale Alter, das eine Datei haben darf, um abgerufen zu werden; alle Dateien, die älter sind als dieser Zeitraum (gemäß dem Datum der letzten Änderung), werden ignoriert. |
Maximum File Size |
Die maximale Größe, die eine Datei haben darf, um abgerufen zu werden |
Message Authentication Codes Allowed |
Eine durch Kommas getrennte Liste der für SFTP-Verbindungen zulässigen Meldungsauthentifizierungscodes (MAC). Lassen Sie die Option deaktiviert, um alle zuzulassen. Folgende Optionen sind verfügbar: hmac-md5, hmac-md5-96, hmac-md5-96-etm@openssh.com, hmac-md5-etm@openssh.com, hmac-ripemd160, hmac-ripemd160-96, hmac-ripemd160-etm@openssh.com, hmac-ripemd160@openssh.com, hmac-sha1, hmac-sha1-96, hmac-sha1-96@openssh.com, hmac-sha1-etm@openssh.com, hmac-sha2-256, hmac-sha2-256-etm@openssh.com, hmac-sha2-512, hmac-sha2-512-etm@openssh.com |
Minimum File Age |
Das Mindestalter, das eine Datei haben muss, um abgerufen zu werden; alle Dateien, die jünger sind als dieser Zeitraum (gemäß dem Datum der letzten Änderung), werden ignoriert. |
Minimum File Size |
Die Mindestgröße, die eine Datei haben muss, um abgerufen zu werden |
Password |
Kennwort für das Benutzerkonto |
Path Filter Regex |
Wenn Search Recursively „true“ ist, werden nur die Unterverzeichnisse durchsucht, deren Pfad mit dem angegebenen regulären Ausdruck übereinstimmt |
Port |
Der Port, den das Remote-System bei Dateiübertragungen überwacht |
Private Key Passphrase |
Kennwort für den privaten Schlüssel |
Private Key Path |
Der vollständig qualifizierte Pfad zur Datei des privaten Schlüssels |
Remote-Pfad |
Der Pfad auf dem Remote-System, von dem aus Dateien abgeufen oder gepusht werden sollen |
Search Recursively |
Bei „true“ werden Dateien aus beliebig verschachtelten Unterverzeichnissen abgerufen; andernfalls werden Unterverzeichnisse nicht durchsucht. |
Send Keep Alive On Timeout |
Sendet alle 5 Sekunden eine Keep-Alive-Meldung, bis zu 5-mal bei einer Gesamtdauer von 25 Sekunden. |
Strict Host Key Checking |
Gibt an, ob die strikte Durchsetzung von Hostschlüsseln angewendet werden soll oder nicht. |
Use Compression |
Zeigt an, ob die ZLIB-Komprimierung bei der Übertragung von Dateien verwendet werden soll oder nicht. |
Username |
Username |
et-initial-listing-target |
Legen Sie fest, wie das erste Freigabeangebot behandelt werden soll. Wird von der Strategie „Tracking Entities“ verwendet. |
et-state-cache |
Freigegebene Entitäten werden im angegebenen Cache-Speicher gespeichert, sodass dieser Prozessor die Freigabe bei einem Neustart von NiFi oder bei einem Wechsel des primären Knotens wieder aufnehmen kann. „Tracking Entities“-Strategie erfordert Tracking-Informationen von allen aufgelisteten Entitäten innerhalb des letzten „Tracking Time Window“. Um eine große Anzahl von Entitäten zu unterstützen, verwendet die Strategie DistributedMapCache anstelle eines verwalteten Zustands. Das Format des Cache-Schlüssels ist „ListedEntities: :{processorId}(::{nodeId})“. Wenn es pro Knoten aufgelistete Entitäten verfolgt, dann wird der optionale Teil „::{nodeId}“ hinzugefügt, um den Status separat zu verwalten. Beispiel: Clusterweiter Cache-Schlüssel = „ListedEntities::8dda2321-0164-1000-50fa-3042fe7d6a7b“, Cache-Schlüssel pro Knoten = „ListedEntities::8dda2321-0164-1000-50fa-3042fe7d6a7b::nifi-node3“ Der gespeicherte Cache-Inhalt ist eine Gzipped JSON-Zeichenkette. Der Cache-Schlüssel wird gelöscht, wenn die Konfiguration der Zielliste geändert wird. Wird von der Strategie „Tracking Entities“ verwendet. |
et-time-window |
Geben Sie an, wie lange dieser Prozessor bereits gelistete Entitäten verfolgen soll. Die Strategie „Tracking Entities“ kann jede Entität auswählen, deren Zeitstempel innerhalb des angegebenen Zeitfensters liegt. Wenn Sie z. B. „30 Minuten“ einstellen, wird jede Entität, deren Zeitstempel in den letzten 30 Minuten liegt, das Ziel des Freigabeangebots sein, wenn dieser Prozessor läuft. Ein gelistete Entität gilt als „neu/aktualisiert“ und ein FlowFile wird ausgegeben, wenn eine der folgenden Bedingungen erfüllt ist: 1. Sie ist nicht in den bereits gelisteten Entitäten vorhanden, 2. Sie hat einen neueren Zeitstempel als die zwischengespeicherte Entität, 3. Sie hat eine andere Größe als die zwischengespeicherte Entität. Wenn der Zeitstempel einer zwischengespeicherten Entität älter ist als das angegebene Zeitfenster, wird diese Entität aus den zwischengespeicherten, bereits gelisteten Entitäten entfernt. Wird von der Strategie „Tracking Entities“ verwendet. |
follow-symlink |
Bei „true“ werden auch symbolische Dateien und verschachtelte symbolische Unterverzeichnisse gelesen; andernfalls werden keine symbolischen Dateien gelesen und keine symbolischen Link-Unterverzeichnisse durchlaufen |
listing-strategy |
Legen Sie fest, wie neue/aktualisierte Entitäten ermittelt werden sollen. Weitere Informationen finden Sie in den Beschreibungen der einzelnen Strategien. |
proxy-configuration-service |
Gibt den Proxy-Konfigurations-Controller Service an für die Weiterleitung von Netzwerkanforderungen festl. |
record-writer |
Gibt den Record Writer an, der zum Erstellen der Liste verwendet werden soll. Wenn nicht angegeben, wird für jede aufgelistete Entität ein FlowFile erstellt. Wenn der Record Writer angegeben ist, werden alle Entitäten in ein einziges FlowFile geschrieben, anstatt Attribute zu einzelnen FlowFiles hinzuzufügen. |
target-system-timestamp-precision |
Geben Sie die Zeitstempelgenauigkeit auf dem Zielsystem an. Da dieser Prozessor den Zeitstempel von Entitäten verwendet, um zu entscheiden, welche aufgelistet werden sollen, ist es wichtig, die richtige Zeitstempelgenauigkeit zu verwenden. |
Statusmanagement¶
Bereiche |
Beschreibung |
---|---|
CLUSTER |
Nach dem Auflisten der Dateien wird der Zeitstempel der neuesten Datei gespeichert. Dadurch kann der Prozessor bei der nächsten Ausführung nur Dateien auflisten, die nach diesem Datum hinzugefügt oder geändert wurden. Der Status wird im gesamten Cluster gespeichert, sodass dieser Prozessor nur auf dem primären Knoten ausgeführt werden kann. Wenn ein neuer primärer Knoten ausgewählt wird, dupliziert der neue Knoten nicht die Daten, die vom vorherigen primären Knoten aufgeführt wurden. |
Beziehungen¶
Name |
Beschreibung |
---|---|
success |
Alle FlowFiles, die empfangen werden, werden an die Beziehung „success“ weitergeleitet. |
Schreibt Attribute¶
Name |
Beschreibung |
---|---|
sftp.remote.host |
Der Hostname des SFTP-Servers |
sftp.remote.port |
Der Port, mit dem eine Verbindung auf dem SFTP-Server hergestellt wurde |
sftp.listing.user |
Der Benutzername des Benutzers, der die SFTP-Auflistung durchgeführt hat |
file.owner |
Die numerische Eigentümer-ID der Quelldatei |
file.group |
Die numerische Gruppen-ID der Quelldatei |
file.permissions |
Die Lese-, Schreib- und Ausführungsberechtigungen der Quelldatei |
file.size |
Die Anzahl der Bytes in der Quelldatei |
file.lastModifiedTime |
Der Zeitstempel, wann die Datei im Dateisystem zuletzt geändert wurde als „yyyy-MM-dd’T’HH: mm:ssZ“ |
filename |
Der Name der Datei auf dem SFTP-Server |
Pfad |
Der vollständig qualifizierte Name des Verzeichnisses auf dem SFTP-Server, aus dem die Datei abgerufen wurde. |
mime.type |
Der MIME-Typ, der von dem konfigurierten Record Writer bereitgestellt wird |