ListDropbox 2025.10.2.19

Bundle

org.apache.nifi | nifi-dropbox-processors-nar

Description

Récupère un listing de fichiers à partir de Dropbox (les raccourcis sont ignorés). Chaque fichier répertorié peut donner lieu à un FlowFile, les métadonnées étant écrites sous forme d’attributs FlowFile. Lorsque la propriété « Record Writer » est paramétrée, l’ensemble du résultat est écrit sous forme d’enregistrements sur un seul FlowFile. Ce processeur est conçu pour fonctionner uniquement sur le nœud principal d’un cluster. Si le nœud principal change, le nouveau nœud principal reprendra là où le précédent s’est arrêté sans dupliquer toutes les données.

Balises

dropbox, storage

Exigences en matière d’entrées

FORBIDDEN

Prend en charge les propriétés dynamiques sensibles

false

Propriétés

Propriété

Description

Service d’identifiants Dropbox

Controller Service utilisé pour obtenir les identifiants Dropbox (clé d’app, secret d’app, jeton d’accès, jeton de rafraîchissement). Pour plus d’informations, reportez-vous à la rubrique « Détails supplémentaires » du service du contrôleur.

Dossier

L’identificateur Dropbox ou le chemin du dossier à partir duquel la liste des fichiers est extraite. “Dossier” doit correspondre au modèle d’expression régulière suivant : /.*|id :.* . Exemple d’identificateur de dossier : id :odTlUvbpIEAAAAAAAAAGGQ. Exemple de chemin de dossier : /Team1/Task1.

Âge minimum du fichier

L’ancienneté minimum d’un fichier pour qu’il soit pris en compte ; tout fichier plus récent sera ignoré.

Recherche récursive

Indique s’il faut répertorier les fichiers des sous-dossiers du dossier Dropbox.

et-initial-listing-target

Spécifiez comment l’annonce initiale doit être gérée. Utilisé par la stratégie « Suivi des entités ».

et-state-cache

Les entités répertoriées sont stockées dans le cache spécifié afin que le processeur puisse reprendre la liste après un redémarrage NiFi ou en cas de changement de nœud principal. La stratégie « Suivi des entités » nécessite le suivi des informations de toutes les entités répertoriées au cours de la dernière « fenêtre de suivi ». Pour prendre en charge un grand nombre d’entités, la stratégie utilise DistributedMapCache au lieu d’un état géré. Le format de la clé de cache est “ListedEntities::{processorId}(::{nodeId})”. Si elle suit les entités répertoriées par nœud, la partie facultative “::{nodeId}” est ajoutée pour gérer l’état séparément. Par exemple : clé de cache à l’échelle du cluster =”ListedEntities::8dda2321-0164-1000-50fa-3042fe7d6a7b”, per node cache key =”ListedEntities::8dda2321-0164-1000-50fa-3042fe7d6a7b::nifi-node3” Le contenu du cache stocké est une chaîne JSON au format Gzip. La clé de cache sera supprimée lorsque la configuration de la liste cible est modifiée. Utilisé par la stratégie « Suivi des entités ».

et-time-window

Indiquez pendant combien de temps ce processeur doit suivre les entités déjà répertoriées. La stratégie « Suivi des entités » peut sélectionner n’importe quelle entité dont l’horodatage se situe dans la fenêtre temporelle spécifiée. Par exemple, si le paramètre est réglé sur « 30 minutes », toute entité ayant un horodatage au cours des 30 dernières minutes sera la cible de la liste lorsque ce processeur s’exécutera. Une entité répertoriée est considérée comme « nouvelle/mise à jour » et un FlowFile est émis si l’une des conditions suivantes est remplie : 1. n’existe pas dans les entités déjà répertoriées, 2. a un horodatage plus récent que l’entité mise en cache, 3. a une taille différente de l’entité mise en cache. Si l’horodatage d’une entité mise en cache devient plus ancien que la fenêtre temporelle spécifiée, cette entité sera supprimée des entités déjà répertoriées en cache. Utilisé par la stratégie de « Suivi des entités ».

listing-strategy

Précisez comment déterminer les entités nouvelles/mises à jour. Voir les descriptions de chaque stratégie pour plus de détails.

service proxy-configuration

Spécifie le Controller Service de configuration proxy pour les requêtes réseau proxy.

record-writer

Spécifie le Record Writer à utiliser pour créer le listing. Si vous ne le précisez pas, un FlowFile sera créé pour chaque entité inscrite sur la liste. Si le Record Writer est spécifié, toutes les entités seront écrites sur un seul FlowFile au lieu d’ajouter des attributs à des FlowFiles individuels.

Gestion de l’État

Champs d’application

Description

CLUSTER

Le processeur stocke les données nécessaires pour pouvoir suivre les fichiers qui ont déjà été répertoriés. Ce qui doit être stocké dépend de la « stratégie de listing ».

Relations

Nom

Description

success

Tous les FlowFiles reçus sont routés vers le succès

Écrit les attributs

Nom

Description

dropbox.id

L’identificateur Dropbox du fichier

path

Le chemin du dossier où se trouve le fichier

filename

Le nom du fichier

dropbox.size

La taille du fichier

dropbox.timestamp

Heure de modification du fichier par le serveur

dropbox.revision

Révision du fichier

Voir aussi :