ListSmb 2025.10.2.19¶
Pacote¶
org.apache.nifi | nifi-smb-nar
Descrição¶
Lista arquivos concretos compartilhados por meio do protocolo SMB. Cada arquivo listado pode resultar em um FlowFile, com os metadados sendo gravados como atributos FlowFile. Ou, caso a propriedade “Record Writer” esteja definida, todo o resultado é gravado como registros em um único FlowFile. Esse processador foi projetado para ser executado somente no nó primário em um cluster. Se o nó primário mudar, o novo nó primário continuará de onde o nó anterior parou sem duplicar todos os dados.
Requisito de entrada¶
FORBIDDEN
Oferece suporte a propriedades dinâmicas confidenciais¶
falso
Propriedades¶
Propriedade |
Descrição |
|---|---|
Diretório |
A pasta de rede a partir da qual os arquivos serão listados. Este é o caminho relativo restante após o compartilhamento: smb://HOSTNAME:PORT/SHARE/[DIRECTORY]/sub/directories. Também é possível adicionar subdiretórios. O caminho fornecido no compartilhamento de arquivos remoto deve existir. Isso pode ser verificado por meio de verificação. Você pode misturar separadores de diretório no estilo Windows e Linux. |
et-initial-listing-target |
Specify how initial listing should be handled. Used by “Tracking Entities’strategy. |
et-state-cache |
Listed entities are stored in the specified cache storage so that this processor can resume listing across NiFi restart or in case of primary node change. “Tracking Entities’strategy require tracking information of all listed entities within the last “Tracking Time Window”. To support large number of entities, the strategy uses DistributedMapCache instead of managed state. Cache key format is “ListedEntities::{processorId}(::{nodeId})”. If it tracks per node listed entities, then the optional “::{nodeId}” part is added to manage state separately. E.g. cluster wide cache key =”ListedEntities::8dda2321-0164-1000-50fa-3042fe7d6a7b”, per node cache key =”ListedEntities::8dda2321-0164-1000-50fa-3042fe7d6a7b::nifi-node3” The stored cache content is Gzipped JSON string. The cache key will be deleted when target listing configuration is changed. Used by “Tracking Entities’strategy. |
et-time-window |
Specify how long this processor should track already-listed entities. “Tracking Entities’strategy can pick any entity whose timestamp is inside the specified time window. For example, if set to “30 minutes”, any entity having timestamp in recent 30 minutes will be the listing target when this processor runs. A listed entity is considered “new/updated” and a FlowFile is emitted if one of following condition meets: 1. does not exist in the already-listed entities, 2. has newer timestamp than the cached entity, 3. has different size than the cached entity. If a cached entity “s timestamp becomes older than specified time window, that entity will be removed from the cached already-listed entities. Used by’Tracking Entities’strategy. |
file-filter |
Somente os arquivos cujos nomes correspondem à expressão regular fornecida serão listados. |
file-name-suffix-filter |
Os arquivos que terminam com o sufixo fornecido serão omitidos. Pode ser usado para garantir que os arquivos que ainda estão sendo carregados não sejam listados várias vezes, fazendo com que esses arquivos tenham um sufixo e removam o sufixo quando o upload for concluído. Isso é altamente recomendado ao usar as estratégias de listagem “Rastreamento de entidades” ou “Rastreamento de carimbos de data/hora”. |
initial-listing-strategy |
Especifica como lidar com os arquivos existentes no compartilhamento SMB quando o processador for iniciado pela primeira vez (ou quando seu estado tiver sido limpo). |
initial-listing-timestamp |
O carimbo de data/hora a partir do qual os arquivos serão listados quando o processador for iniciado pela primeira vez (ou seu estado tiver sido limpo). O valor pode ser especificado como um carimbo de data/hora de época em milissegundos ou como um datetime UTC em um formato como 2025-02-01T00:00:00Z |
listing-strategy |
Especifica como determinar entidades novas/atualizadas. Veja as descrições de cada estratégia para obter detalhes. |
max-file-age |
Qualquer arquivo mais antigo que o valor fornecido será omitido. |
max-file-size |
Qualquer arquivo maior que o valor fornecido será omitido. |
min-file-age |
A idade mínima que um arquivo deve ter para ser listado; qualquer arquivo mais novo que esse período de tempo será ignorado. |
min-file-size |
Qualquer arquivo menor que o valor fornecido será omitido. |
path-filter |
Somente os arquivos cujos caminhos (até o diretório pai do arquivo) correspondem à expressão regular fornecida serão listados. |
record-writer |
Especifica o Record Writer a ser usado para criar a listagem. Se não for especificado, será criado um FlowFile para cada entidade listada. Se o Record Writer for especificado, todas as entidades serão gravadas em um único FlowFile em vez de adicionar Rastreamento de entidades atributos aos FlowFiles. |
smb-client-provider-service |
Especifica o provedor de cliente SMB a ser usado para criar conexões SMB. |
target-system-timestamp-precision |
Especifique a precisão do carimbo de data/hora no sistema de destino. Como esse processador usa o carimbo de data/hora das entidades para decidir quais devem ser listadas, é fundamental usar a precisão correta do carimbo de data/hora. |
Gerenciamento do estado¶
Escopos |
Descrição |
|---|---|
CLUSTER |
Depois de realizar uma listagem de arquivos, o estado da listagem anterior pode ser armazenado para listar arquivos continuamente sem duplicação. |
Relações¶
Nome |
Descrição |
|---|---|
success |
Todos os FlowFiles que são recebidos são encaminhados para a relação “success” |
Grava atributos¶
Nome |
Descrição |
|---|---|
filename |
O nome do arquivo que foi lido do sistema de arquivos. |
shortName |
O nome abreviado do arquivo que foi lido do sistema de arquivos. |
path |
O caminho é definido como o caminho relativo do diretório do arquivo no sistema de arquivos remoto em comparação com o diretório raiz do compartilhamento. Por exemplo, para um determinado local remoto smb://HOSTNAME:PORT/SHARE/DIRECTORY, e um arquivo estiver sendo listado em smb://HOSTNAME:PORT/SHARE/DIRECTORY/sub/folder/file, o atributo path será definido como “DIRECTORY/sub/folder”. |
serviceLocation |
O URL SMB da ação. |
lastModifiedTime |
O carimbo de data/hora de quando o conteúdo do arquivo foi alterado no sistema de arquivos como “yyyyy-MM-dd’T’HH:mm:ss”. |
creationTime |
O carimbo de data/hora de quando o arquivo foi criado no sistema de arquivos como “yyyyy-MM-dd’T’HH:mm:ss”. |
lastAccessTime |
O carimbo de data/hora de quando o arquivo foi acessado no sistema de arquivos como “yyyyy-MM-dd’T’HH:mm:ss”. |
changeTime |
O carimbo de data/hora de quando os atributos do arquivo foram alterados no sistema de arquivos como “yyyyy-MM-dd’T’HH:mm:ss”. |
size |
O tamanho do arquivo em bytes. |
allocationSize |
O número de bytes alocados para o arquivo no servidor. |