ListSFTP 2025.5.31.15¶
Pacote¶
org.apache.nifi | nifi-standard-nar
Descrição¶
Executa uma listagem dos arquivos que residem em um servidor SFTP. Para cada arquivo encontrado no servidor remoto, será criado um novo FlowFile com o atributo filename definido como o nome do arquivo no servidor remoto. Isso pode ser usado em conjunto com FetchSFTP para buscar esses arquivos.
Requisito de entrada¶
FORBIDDEN
Oferece suporte a propriedades dinâmicas confidenciais¶
falso
Propriedades¶
Propriedade |
Descrição |
---|---|
Cifras permitidas |
Uma lista separada por vírgulas de cifras permitidas para conexões SFTP. Deixar não definido para permitir tudo. As opções disponíveis são: 3des-cbc, 3des-ctr, aes128-cbc, aes128-ctr, aes128-gcm@openssh.com, aes192-cbc, aes192-ctr, aes256-cbc, aes256-ctr, aes256-gcm@openssh.com, arcfour, arcfour128, arcfour256, blowfish-cbc, blowfish-ctr, cast128-cbc, cast128-ctr, chacha20-poly1305@openssh.com, idea-cbc, idea-ctr, serpent128-cbc, serpent128-ctr, serpent192-cbc, serpent192-ctr, serpent256-cbc, serpent256-ctr, twofish-cbc, twofish128-cbc, twofish128-ctr, twofish192-cbc, twofish192-ctr, twofish256-cbc, twofish256-ctr |
Tempo limite de conexão |
Tempo de espera antes de atingir o tempo limite ao criar uma conexão |
Tempo limite de dados |
Ao transferir um arquivo entre o sistema local e o remoto, esse valor especifica quanto tempo é permitido transcorrer sem que nenhum dado seja transferido entre os sistemas |
Filtro de arquivo Regex |
Fornece uma expressão regular Java para filtrar nomes de arquivos; se um filtro for fornecido, somente os arquivos cujos nomes correspondem a essa expressão regular serão buscados |
Arquivo de chave do host |
Se fornecido, o arquivo fornecido será usado como a chave de host; caso contrário, se a propriedade “Strict Host Key Checking” for aplicada (definida como “true”), serão usados os arquivos “known_hosts” e “known_hosts2” do diretório ~/.ssh; caso contrário, nenhum arquivo de chave de host será usado |
Nome de host |
O nome de host totalmente qualificado ou o endereço IP do sistema remoto |
Ignorar arquivos ocultos |
Se verdadeiro, os arquivos cujos nomes começam com um ponto (“.”) serão ignorados |
Algoritmos de chave permitidos |
Uma lista separada por vírgulas de algoritmos de chave permitidos para conexões SFTP. Deixar não definido para permitir tudo. As opções disponíveis são: ecdsa-sha2-nistp256, ecdsa-sha2-nistp256-cert-v01@openssh.com, ecdsa-sha2-nistp384, ecdsa-sha2-nistp384-cert-v01@openssh.com, ecdsa-sha2-nistp521, ecdsa-sha2-nistp521-cert-v01@openssh.com, rsa-sha2-256, rsa-sha2-512, ssh-dss, ssh-dss-cert-v01@openssh.com, ssh-ed25519, ssh-ed25519-cert-v01@openssh.com, ssh-rsa, ssh-rsa-cert-v01@openssh.com |
Algoritmos de troca de chaves permitidos |
Uma lista separada por vírgulas de algoritmos de troca de chaves permitidos para conexões SFTP. Deixar não definido para permitir tudo. As opções disponíveis são: curve25519-sha256, curve25519-sha256@libssh.org, diffie-hellman-group-exchange-sha1, diffie-hellman-group-exchange-sha256, diffie-hellman-group1-sha1, diffie-hellman-group14-sha1, diffie-hellman-group14-sha256, diffie-hellman-group14-sha256@ssh.com, diffie-hellman-group15-sha256, diffie-hellman-group15-sha256@ssh.com, diffie-hellman-group15-sha384@ssh.com, diffie-hellman-group15-sha512, diffie-hellman-group16-sha256, diffie-hellman-group16-sha384@ssh.com, diffie-hellman-group16-sha512, diffie-hellman-group16-sha512@ssh.com, diffie-hellman-group17-sha512, diffie-hellman-group18-sha512, diffie-hellman-group18-sha512@ssh.com, ecdh-sha2-nistp256, ecdh-sha2-nistp384, ecdh-sha2-nistp521, ext-info-c |
Idade máxima do arquivo |
A idade máxima que um arquivo deve ter para ser extraído; qualquer arquivo mais antigo que esse período de tempo (de acordo com a data da última modificação) será ignorado |
Tamanho máximo do arquivo |
O tamanho máximo que um arquivo pode ter para ser extraído |
Códigos de autenticação de mensagem permitidos |
Uma lista separada por vírgulas de códigos de autenticação de mensagem permitidos para conexões SFTP. Deixar não definido para permitir tudo. As opções disponíveis são: hmac-md5, hmac-md5-96, hmac-md5-96-etm@openssh.com, hmac-md5-etm@openssh.com, hmac-ripemd160, hmac-ripemd160-96, hmac-ripemd160-etm@openssh.com, hmac-ripemd160@openssh.com, hmac-sha1, hmac-sha1-96, hmac-sha1-96@openssh.com, hmac-sha1-etm@openssh.com, hmac-sha2-256, hmac-sha2-256-etm@openssh.com, hmac-sha2-512, hmac-sha2-512-etm@openssh.com |
Idade mínima do arquivo |
A idade mínima que um arquivo deve ter para ser extraído; qualquer arquivo mais novo do que esse período de tempo (de acordo com a data da última modificação) será ignorado |
Tamanho mínimo do arquivo |
O tamanho mínimo que um arquivo deve ter para ser extraído |
Senha |
Senha da conta de usuário |
Regex de filtro de caminho |
Quando Buscar recursivamente for verdadeiro, apenas os subdiretórios cujo caminho corresponda à expressão regular fornecida serão escaneados. |
Porta |
A porta em que o sistema remoto está escutando para transferências de arquivos |
Senha da chave privada |
Senha da chave privada |
Caminho da chave privada |
O caminho totalmente qualificado para o arquivo de chave privada |
Caminho remoto |
O caminho no sistema remoto a partir do qual os arquivos serão extraídos ou enviados |
Pesquisar recursivamente |
Se verdadeiro, extrairá arquivos de subdiretórios aninhados arbitrariamente; caso contrário, não percorrerá subdiretórios |
Enviar Keep Alive no tempo limite |
Enviar uma mensagem Keep Alive a cada 5 segundos, até 5 vezes, com um tempo limite total de 25 segundos. |
Verificação rigorosa da chave de host |
Indica se a aplicação estrita de chaves de hosts deve ou não ser realizada |
Usar compressão |
Indica se a compressão ZLIB deve ou não ser usada na transferência de arquivos |
Nome de usuário |
Nome de usuário |
et-initial-listing-target |
Especifique como a listagem inicial deve ser tratada. Usado pela estratégia “Rastreamento de entidades”. |
et-state-cache |
As entidades listadas são armazenadas no armazenamento em cache especificado, de modo que esse processador possa retomar a listagem por meio da reinicialização do NiFi ou em caso de alteração do nó primário. A estratégia “Rastreamento de entidades” exige informações de rastreamento de todas as entidades listadas na última “Janela de tempo de rastreamento”. Para oferecer suporte a um grande número de entidades, a estratégia usa DistributedMapCache em vez de estado gerenciado. O formato da chave de cache é “ListedEntities::{processorId}(::{nodeId})”. Se ele rastrear entidades listadas por nó, a parte opcional “::{nodeId}” será adicionada para gerenciar o estado separadamente. Por exemplo, a chave de cache de todo o cluster = “ListedEntities::8dda2321-0164-1000-50fa-3042fe7d6a7b”, per node cache key = “ListedEntities::8dda2321-0164-1000-50fa-3042fe7d6a7b::nifi-node3”. O conteúdo do cache armazenado é a cadeia de caracteres JSON compactada em Gzip. A chave de cache será excluída quando a configuração da listagem de destino for alterada. Usado pela estratégia “Rastreamento de entidades”. |
et-time-window |
Especifique por quanto tempo esse processador deve rastrear as entidades já listadas. A estratégia “Rastreamento de entidades” pode selecionar qualquer entidade cujo carimbo de data/hora esteja dentro da janela de tempo especificada. Por exemplo, se for definido como “30 minutes”, qualquer entidade com carimbo de data/hora nos últimos 30 minutos será o destino da listagem quando esse processador for executado. Uma entidade listada é considerada “nova/atualizada” e um FlowFile é emitido se uma das seguintes condições for atendida: 1. não existir nas entidades já listadas, 2. tiver um carimbo de data/hora mais recente do que a entidade em cache, e 3. tiver um tamanho diferente da entidade em cache. Se o carimbo de data/hora de uma entidade em cache for mais antigo do que a janela de tempo especificada, essa entidade será removida das entidades já listadas em cache. Usado pela estratégia “Rastreamento de entidades”. |
follow-symlink |
Se verdadeiro, extrairá até mesmo arquivos simbólicos e também subdiretórios simbólicos aninhados; caso contrário, não lerá arquivos simbólicos e não percorrerá subdiretórios de links simbólicos |
listing-strategy |
Especifica como determinar entidades novas/atualizadas. Veja as descrições de cada estratégia para obter detalhes. |
proxy-configuration-service |
Especifica o serviço de Controller Service de configuração de proxy para a realização de proxy de solicitações de rede. |
record-writer |
Especifica o Record Writer a ser usado para criar a listagem. Se não for especificado, será criado um FlowFile para cada entidade listada. Se o Record Writer for especificado, todas as entidades serão gravadas em um único FlowFile em vez de adicionar Rastreamento de entidades atributos aos FlowFiles. |
target-system-timestamp-precision |
Especifique a precisão do carimbo de data/hora no sistema de destino. Como esse processador usa o carimbo de data/hora das entidades para decidir quais devem ser listadas, é fundamental usar a precisão correta do carimbo de data/hora. |
Gerenciamento do estado¶
Escopos |
Descrição |
---|---|
CLUSTER |
Depois de fazer uma listagem de arquivos, o carimbo de data/hora do arquivo mais recente é armazenado. Isso permite que o processador liste apenas os arquivos que foram adicionados ou modificados após essa data na próxima vez em que o processador for executado. O estado é armazenado em todo o cluster para que esse processador possa ser executado somente no nó primário e, se um novo nó primário for selecionado, o novo nó não duplicará os dados listados pelo nó primário anterior. |
Relações¶
Nome |
Descrição |
---|---|
success |
Todos os FlowFiles que são recebidos são encaminhados para a relação “success” |
Grava atributos¶
Nome |
Descrição |
---|---|
sftp.remote.host |
O nome de host do servidor SFTP |
sftp.remote.port |
A porta à qual você se conectou no servidor SFTP |
sftp.listing.user |
O nome de usuário do usuário que executou a listagem SFTP |
file.owner |
O ID numérico do proprietário do arquivo de origem |
file.group |
O ID numérico do grupo do arquivo de origem |
file.permissions |
As permissões de leitura/gravação/execução do arquivo de origem |
file.size |
O número de bytes no arquivo de origem |
file.lastModifiedTime |
O carimbo de data/hora de quando o arquivo no sistema de arquivos foi modificado pela última vez como “yyyyy-MM-dd’T’HH:mm:ssZ” |
filename |
O nome do arquivo no servidor SFTP |
path |
O nome totalmente qualificado do diretório no servidor SFTP do qual o arquivo foi extraído |
mime.type |
O tipo MIME fornecido pelo Record Writer configurado |