ListDropbox 2025.10.2.19¶
Bundle¶
org.apache.nifi | nifi-dropbox-processors-nar
Description¶
Récupère un listing de fichiers à partir de Dropbox (les raccourcis sont ignorés). Chaque fichier répertorié peut donner lieu à un FlowFile, les métadonnées étant écrites sous forme d’attributs FlowFile. Lorsque la propriété « Record Writer » est paramétrée, l’ensemble du résultat est écrit sous forme d’enregistrements sur un seul FlowFile. Ce processeur est conçu pour fonctionner uniquement sur le nœud principal d’un cluster. Si le nœud principal change, le nouveau nœud principal reprendra là où le précédent s’est arrêté sans dupliquer toutes les données.
Exigences en matière d’entrées¶
FORBIDDEN
Prend en charge les propriétés dynamiques sensibles¶
false
Propriétés¶
Propriété |
Description |
|---|---|
Dropbox Credential Service |
Controller Service utilisé pour obtenir les identifiants Dropbox (clé d’app, secret d’app, jeton d’accès, jeton de rafraîchissement). Pour plus d’informations, reportez-vous à la rubrique « Détails supplémentaires » du service du contrôleur. |
Folder |
The Dropbox identifier or path of the folder from which to pull list of files. “Folder’should match the following regular expression pattern: /.*|id:.* . Example for folder identifier: id:odTlUvbpIEAAAAAAAAAGGQ. Example for folder path: /Team1/Task1. |
Minimum File Age |
L’ancienneté minimum d’un fichier pour qu’il soit pris en compte ; tout fichier plus récent sera ignoré. |
Search Recursively |
Indique s’il faut répertorier les fichiers des sous-dossiers du dossier Dropbox. |
et-initial-listing-target |
Specify how initial listing should be handled. Used by “Tracking Entities’strategy. |
et-state-cache |
Listed entities are stored in the specified cache storage so that this processor can resume listing across NiFi restart or in case of primary node change. “Tracking Entities’strategy require tracking information of all listed entities within the last “Tracking Time Window”. To support large number of entities, the strategy uses DistributedMapCache instead of managed state. Cache key format is “ListedEntities::{processorId}(::{nodeId})”. If it tracks per node listed entities, then the optional “::{nodeId}” part is added to manage state separately. E.g. cluster wide cache key =”ListedEntities::8dda2321-0164-1000-50fa-3042fe7d6a7b”, per node cache key =”ListedEntities::8dda2321-0164-1000-50fa-3042fe7d6a7b::nifi-node3” The stored cache content is Gzipped JSON string. The cache key will be deleted when target listing configuration is changed. Used by “Tracking Entities’strategy. |
et-time-window |
Specify how long this processor should track already-listed entities. “Tracking Entities’strategy can pick any entity whose timestamp is inside the specified time window. For example, if set to “30 minutes”, any entity having timestamp in recent 30 minutes will be the listing target when this processor runs. A listed entity is considered “new/updated” and a FlowFile is emitted if one of following condition meets: 1. does not exist in the already-listed entities, 2. has newer timestamp than the cached entity, 3. has different size than the cached entity. If a cached entity “s timestamp becomes older than specified time window, that entity will be removed from the cached already-listed entities. Used by’Tracking Entities’strategy. |
listing-strategy |
Précisez comment déterminer les entités nouvelles/mises à jour. Voir les descriptions de chaque stratégie pour plus de détails. |
service proxy-configuration |
Spécifie le Controller Service de configuration proxy pour les requêtes réseau proxy. |
record-writer |
Spécifie le Record Writer à utiliser pour créer le listing. Si vous ne le précisez pas, un FlowFile sera créé pour chaque entité inscrite sur la liste. Si le Record Writer est spécifié, toutes les entités seront écrites sur un seul FlowFile au lieu d’ajouter des attributs à des FlowFiles individuels. |
Gestion de l’État¶
Champs d’application |
Description |
|---|---|
CLUSTER |
Le processeur stocke les données nécessaires pour pouvoir suivre les fichiers qui ont déjà été répertoriés. Ce qui doit être stocké dépend de la « stratégie de listing ». |
Relations¶
Nom |
Description |
|---|---|
success |
Tous les FlowFiles reçus sont routés vers le succès |
Écrit les attributs¶
Nom |
Description |
|---|---|
dropbox.id |
L’identificateur Dropbox du fichier |
path |
Le chemin du dossier où se trouve le fichier |
filename |
Le nom du fichier |
dropbox.size |
La taille du fichier |
dropbox.timestamp |
Heure de modification du fichier par le serveur |
dropbox.revision |
Révision du fichier |