ListDropbox 2025.5.31.15

Pacote

org.apache.nifi | nifi-dropbox-processors-nar

Descrição

Recupera uma listagem de arquivos do Dropbox (os atalhos são ignorados). Cada arquivo listado pode resultar em um FlowFile, com os metadados sendo gravados como atributos FlowFile. Quando a propriedade “Record Writer” é definida, todo o resultado é gravado como registros em um único FlowFile. Esse processador foi projetado para ser executado somente no nó primário em um cluster. Se o nó primário mudar, o novo nó primário continuará de onde o nó anterior parou sem duplicar todos os dados.

Tags

dropbox, storage

Requisito de entrada

FORBIDDEN

Oferece suporte a propriedades dinâmicas confidenciais

falso

Propriedades

Propriedade

Descrição

dropbox-credential-service

Controller Service usado para obter as credenciais do Dropbox (chave do app, segredo do app, token de acesso, token de atualização). Consulte os detalhes adicionais do serviço de controlador para obter mais informações.

et-initial-listing-target

Especifique como a listagem inicial deve ser tratada. Usado pela estratégia “Rastreamento de entidades”.

et-state-cache

As entidades listadas são armazenadas no armazenamento em cache especificado, de modo que esse processador possa retomar a listagem por meio da reinicialização do NiFi ou em caso de alteração do nó primário. A estratégia “Rastreamento de entidades” exige informações de rastreamento de todas as entidades listadas na última “Janela de tempo de rastreamento”. Para oferecer suporte a um grande número de entidades, a estratégia usa DistributedMapCache em vez de estado gerenciado. O formato da chave de cache é “ListedEntities::{processorId}(::{nodeId})”. Se ele rastrear entidades listadas por nó, a parte opcional “::{nodeId}” será adicionada para gerenciar o estado separadamente. Por exemplo, a chave de cache de todo o cluster = “ListedEntities::8dda2321-0164-1000-50fa-3042fe7d6a7b”, per node cache key = “ListedEntities::8dda2321-0164-1000-50fa-3042fe7d6a7b::nifi-node3”. O conteúdo do cache armazenado é a cadeia de caracteres JSON compactada em Gzip. A chave de cache será excluída quando a configuração da listagem de destino for alterada. Usado pela estratégia “Rastreamento de entidades”.

et-time-window

Especifique por quanto tempo esse processador deve rastrear as entidades já listadas. A estratégia “Rastreamento de entidades” pode selecionar qualquer entidade cujo carimbo de data/hora esteja dentro da janela de tempo especificada. Por exemplo, se for definido como “30 minutes”, qualquer entidade com carimbo de data/hora nos últimos 30 minutos será o destino da listagem quando esse processador for executado. Uma entidade listada é considerada “nova/atualizada” e um FlowFile é emitido se uma das seguintes condições for atendida: 1. não existir nas entidades já listadas, 2. tiver um carimbo de data/hora mais recente do que a entidade em cache, e 3. tiver um tamanho diferente da entidade em cache. Se o carimbo de data/hora de uma entidade em cache for mais antigo do que a janela de tempo especificada, essa entidade será removida das entidades já listadas em cache. Usado pela estratégia “Rastreamento de entidades”.

folder

O identificador do Dropbox ou o caminho da pasta da qual a lista de arquivos será extraída. “Folder” deve corresponder ao seguinte padrão de expressão regular: /.*|id:.*. Exemplo de identificador de pasta: id:odTlUvbpIEAAAAAAAAAGGQ. Exemplo de caminho de pasta: /Team1/Task1.

listing-strategy

Especifica como determinar entidades novas/atualizadas. Veja as descrições de cada estratégia para obter detalhes.

min-age

A idade mínima que um arquivo deve ter para ser considerado; qualquer arquivo mais recente do que isso será ignorado.

proxy-configuration-service

Especifica o serviço de Controller Service de configuração de proxy para a realização de proxy de solicitações de rede.

record-writer

Especifica o Record Writer a ser usado para criar a listagem. Se não for especificado, será criado um FlowFile para cada entidade listada. Se o Record Writer for especificado, todas as entidades serão gravadas em um único FlowFile em vez de adicionar Rastreamento de entidades atributos aos FlowFiles.

recursive-search

Indica se você deve listar arquivos de subpastas da pasta do Dropbox.

Gerenciamento do estado

Escopos

Descrição

CLUSTER

O processador armazena os dados necessários para poder rastrear quais arquivos já foram listados. O que exatamente precisa ser armazenado depende da “Estratégia de listagem”.

Relações

Nome

Descrição

success

Todos os FlowFiles que são recebidos são encaminhados para a relação “success”

Grava atributos

Nome

Descrição

dropbox.id

O identificador do Dropbox do arquivo

path

O caminho da pasta onde o arquivo está localizado

filename

O nome do arquivo

dropbox.size

O tamanho do arquivo

dropbox.timestamp

O horário de modificação do arquivo pelo servidor

dropbox.revision

Revisão do arquivo

Consulte também