ListFTP 2025.10.2.19

Pacote

org.apache.nifi | nifi-standard-nar

Descrição

Executa uma listagem dos arquivos que residem em um servidor FTP. Para cada arquivo encontrado no servidor remoto, será criado um novo FlowFile com o atributo filename definido como o nome do arquivo no servidor remoto. Isso pode ser usado em conjunto com FetchFTP para buscar esses arquivos.

Tags

files, ftp, ingest, input, list, remote, source

Requisito de entrada

FORBIDDEN

Oferece suporte a propriedades dinâmicas confidenciais

falso

Propriedades

Propriedade

Descrição

Modo de conexão

O modo de conexão FTP

Tempo limite de conexão

Tempo de espera antes de atingir o tempo limite ao criar uma conexão

Tempo limite de dados

Ao transferir um arquivo entre o sistema local e o remoto, esse valor especifica quanto tempo é permitido transcorrer sem que nenhum dado seja transferido entre os sistemas

Filtro de arquivo Regex

Fornece uma expressão regular Java para filtrar nomes de arquivos; se um filtro for fornecido, somente os arquivos cujos nomes correspondem a essa expressão regular serão buscados

Nome de host

O nome de host totalmente qualificado ou o endereço IP do sistema remoto

Ignorar arquivos ocultos

Se verdadeiro, os arquivos cujos nomes começam com um ponto (“.”) serão ignorados

Tamanho do buffer interno

Defina o tamanho do buffer interno para fluxos de dados com buffer

Senha

Senha da conta de usuário

Regex de filtro de caminho

Quando Buscar recursivamente for verdadeiro, apenas os subdiretórios cujo caminho corresponda à expressão regular fornecida serão escaneados.

Porta

A porta à qual se deseja conectar no host remoto para buscar os dados

Caminho remoto

O caminho no sistema remoto a partir do qual os arquivos serão extraídos ou enviados

Tamanho do lote de pesquisa remota

The value specifies how many file paths to find in a given directory on the remote system when doing a file listing. This value in general should not need to be modified but when polling against a remote system with a tremendous number of files this value can be critical. Setting this value too high can result very poor performance and setting it too low can cause the flow to be slower than normal.

Pesquisar recursivamente

Se verdadeiro, extrairá arquivos de subdiretórios aninhados arbitrariamente; caso contrário, não percorrerá subdiretórios

Modo de transferência

O modo de transferência FTP

Nome de usuário

Nome de usuário

et-initial-listing-target

Specify how initial listing should be handled. Used by “Tracking Entities’strategy.

et-state-cache

Listed entities are stored in the specified cache storage so that this processor can resume listing across NiFi restart or in case of primary node change. “Tracking Entities’strategy require tracking information of all listed entities within the last “Tracking Time Window”. To support large number of entities, the strategy uses DistributedMapCache instead of managed state. Cache key format is “ListedEntities::{processorId}(::{nodeId})”. If it tracks per node listed entities, then the optional “::{nodeId}” part is added to manage state separately. E.g. cluster wide cache key =”ListedEntities::8dda2321-0164-1000-50fa-3042fe7d6a7b”, per node cache key =”ListedEntities::8dda2321-0164-1000-50fa-3042fe7d6a7b::nifi-node3” The stored cache content is Gzipped JSON string. The cache key will be deleted when target listing configuration is changed. Used by “Tracking Entities’strategy.

et-time-window

Specify how long this processor should track already-listed entities. “Tracking Entities’strategy can pick any entity whose timestamp is inside the specified time window. For example, if set to “30 minutes”, any entity having timestamp in recent 30 minutes will be the listing target when this processor runs. A listed entity is considered “new/updated” and a FlowFile is emitted if one of following condition meets: 1. does not exist in the already-listed entities, 2. has newer timestamp than the cached entity, 3. has different size than the cached entity. If a cached entity “s timestamp becomes older than specified time window, that entity will be removed from the cached already-listed entities. Used by’Tracking Entities’strategy.

follow-symlink

Se verdadeiro, extrairá até mesmo arquivos simbólicos e também subdiretórios simbólicos aninhados; caso contrário, não lerá arquivos simbólicos e não percorrerá subdiretórios de links simbólicos

ftp-use-utf8

Diz ao cliente para usar a codificação UTF-8 ao processar arquivos e nomes de arquivo. Se for definido como verdadeiro, o servidor também deverá oferecem suporte à codificação UTF-8.

listing-strategy

Especifica como determinar entidades novas/atualizadas. Veja as descrições de cada estratégia para obter detalhes.

proxy-configuration-service

Especifica o serviço de Controller Service de configuração de proxy para a realização de proxy de solicitações de rede.

record-writer

Especifica o Record Writer a ser usado para criar a listagem. Se não for especificado, será criado um FlowFile para cada entidade listada. Se o Record Writer for especificado, todas as entidades serão gravadas em um único FlowFile em vez de adicionar Rastreamento de entidades atributos aos FlowFiles.

target-system-timestamp-precision

Especifique a precisão do carimbo de data/hora no sistema de destino. Como esse processador usa o carimbo de data/hora das entidades para decidir quais devem ser listadas, é fundamental usar a precisão correta do carimbo de data/hora.

Gerenciamento do estado

Escopos

Descrição

CLUSTER

Depois de fazer uma listagem de arquivos, o carimbo de data/hora do arquivo mais recente é armazenado. Isso permite que o processador liste apenas os arquivos que foram adicionados ou modificados após essa data na próxima vez em que o processador for executado. O estado é armazenado em todo o cluster para que esse processador possa ser executado somente no nó primário e, se um novo nó primário for selecionado, o novo nó não duplicará os dados listados pelo nó primário anterior.

Relações

Nome

Descrição

success

Todos os FlowFiles que são recebidos são encaminhados para a relação “success”

Grava atributos

Nome

Descrição

ftp.remote.host

O nome de host do servidor FTP

ftp.remote.port

A porta à qual você se conectou no servidor FTP

ftp.listing.user

O nome de usuário do usuário que executou a listagem FTP

file.owner

O ID numérico do proprietário do arquivo de origem

file.group

O ID numérico do grupo do arquivo de origem

file.permissions

As permissões de leitura/gravação/execução do arquivo de origem

file.size

O número de bytes no arquivo de origem

file.lastModifiedTime

O carimbo de data/hora de quando o arquivo no sistema de arquivos foi modificado pela última vez como “yyyyy-MM-dd’T’HH:mm:ssZ”

filename

O nome do arquivo no servidor FTP

path

O nome totalmente qualificado do diretório no servidor FTP do qual o arquivo foi extraído

Consulte também