ListSFTP 2025.5.31.15

Pacote

org.apache.nifi | nifi-standard-nar

Descrição

Executa uma listagem dos arquivos que residem em um servidor SFTP. Para cada arquivo encontrado no servidor remoto, será criado um novo FlowFile com o atributo filename definido como o nome do arquivo no servidor remoto. Isso pode ser usado em conjunto com FetchSFTP para buscar esses arquivos.

Tags

files, ingest, input, list, remote, sftp, source

Requisito de entrada

FORBIDDEN

Oferece suporte a propriedades dinâmicas confidenciais

falso

Propriedades

Propriedade

Descrição

Cifras permitidas

Uma lista separada por vírgulas de cifras permitidas para conexões SFTP. Deixar não definido para permitir tudo. As opções disponíveis são: 3des-cbc, 3des-ctr, aes128-cbc, aes128-ctr, aes128-gcm@openssh.com, aes192-cbc, aes192-ctr, aes256-cbc, aes256-ctr, aes256-gcm@openssh.com, arcfour, arcfour128, arcfour256, blowfish-cbc, blowfish-ctr, cast128-cbc, cast128-ctr, chacha20-poly1305@openssh.com, idea-cbc, idea-ctr, serpent128-cbc, serpent128-ctr, serpent192-cbc, serpent192-ctr, serpent256-cbc, serpent256-ctr, twofish-cbc, twofish128-cbc, twofish128-ctr, twofish192-cbc, twofish192-ctr, twofish256-cbc, twofish256-ctr

Tempo limite de conexão

Tempo de espera antes de atingir o tempo limite ao criar uma conexão

Tempo limite de dados

Ao transferir um arquivo entre o sistema local e o remoto, esse valor especifica quanto tempo é permitido transcorrer sem que nenhum dado seja transferido entre os sistemas

Filtro de arquivo Regex

Fornece uma expressão regular Java para filtrar nomes de arquivos; se um filtro for fornecido, somente os arquivos cujos nomes correspondem a essa expressão regular serão buscados

Arquivo de chave do host

Se fornecido, o arquivo fornecido será usado como a chave de host; caso contrário, se a propriedade “Strict Host Key Checking” for aplicada (definida como “true”), serão usados os arquivos “known_hosts” e “known_hosts2” do diretório ~/.ssh; caso contrário, nenhum arquivo de chave de host será usado

Nome de host

O nome de host totalmente qualificado ou o endereço IP do sistema remoto

Ignorar arquivos ocultos

Se verdadeiro, os arquivos cujos nomes começam com um ponto (“.”) serão ignorados

Algoritmos de chave permitidos

Uma lista separada por vírgulas de algoritmos de chave permitidos para conexões SFTP. Deixar não definido para permitir tudo. As opções disponíveis são: ecdsa-sha2-nistp256, ecdsa-sha2-nistp256-cert-v01@openssh.com, ecdsa-sha2-nistp384, ecdsa-sha2-nistp384-cert-v01@openssh.com, ecdsa-sha2-nistp521, ecdsa-sha2-nistp521-cert-v01@openssh.com, rsa-sha2-256, rsa-sha2-512, ssh-dss, ssh-dss-cert-v01@openssh.com, ssh-ed25519, ssh-ed25519-cert-v01@openssh.com, ssh-rsa, ssh-rsa-cert-v01@openssh.com

Algoritmos de troca de chaves permitidos

Uma lista separada por vírgulas de algoritmos de troca de chaves permitidos para conexões SFTP. Deixar não definido para permitir tudo. As opções disponíveis são: curve25519-sha256, curve25519-sha256@libssh.org, diffie-hellman-group-exchange-sha1, diffie-hellman-group-exchange-sha256, diffie-hellman-group1-sha1, diffie-hellman-group14-sha1, diffie-hellman-group14-sha256, diffie-hellman-group14-sha256@ssh.com, diffie-hellman-group15-sha256, diffie-hellman-group15-sha256@ssh.com, diffie-hellman-group15-sha384@ssh.com, diffie-hellman-group15-sha512, diffie-hellman-group16-sha256, diffie-hellman-group16-sha384@ssh.com, diffie-hellman-group16-sha512, diffie-hellman-group16-sha512@ssh.com, diffie-hellman-group17-sha512, diffie-hellman-group18-sha512, diffie-hellman-group18-sha512@ssh.com, ecdh-sha2-nistp256, ecdh-sha2-nistp384, ecdh-sha2-nistp521, ext-info-c

Idade máxima do arquivo

A idade máxima que um arquivo deve ter para ser extraído; qualquer arquivo mais antigo que esse período de tempo (de acordo com a data da última modificação) será ignorado

Tamanho máximo do arquivo

O tamanho máximo que um arquivo pode ter para ser extraído

Códigos de autenticação de mensagem permitidos

Uma lista separada por vírgulas de códigos de autenticação de mensagem permitidos para conexões SFTP. Deixar não definido para permitir tudo. As opções disponíveis são: hmac-md5, hmac-md5-96, hmac-md5-96-etm@openssh.com, hmac-md5-etm@openssh.com, hmac-ripemd160, hmac-ripemd160-96, hmac-ripemd160-etm@openssh.com, hmac-ripemd160@openssh.com, hmac-sha1, hmac-sha1-96, hmac-sha1-96@openssh.com, hmac-sha1-etm@openssh.com, hmac-sha2-256, hmac-sha2-256-etm@openssh.com, hmac-sha2-512, hmac-sha2-512-etm@openssh.com

Idade mínima do arquivo

A idade mínima que um arquivo deve ter para ser extraído; qualquer arquivo mais novo do que esse período de tempo (de acordo com a data da última modificação) será ignorado

Tamanho mínimo do arquivo

O tamanho mínimo que um arquivo deve ter para ser extraído

Senha

Senha da conta de usuário

Regex de filtro de caminho

Quando Buscar recursivamente for verdadeiro, apenas os subdiretórios cujo caminho corresponda à expressão regular fornecida serão escaneados.

Porta

A porta em que o sistema remoto está escutando para transferências de arquivos

Senha da chave privada

Senha da chave privada

Caminho da chave privada

O caminho totalmente qualificado para o arquivo de chave privada

Caminho remoto

O caminho no sistema remoto a partir do qual os arquivos serão extraídos ou enviados

Pesquisar recursivamente

Se verdadeiro, extrairá arquivos de subdiretórios aninhados arbitrariamente; caso contrário, não percorrerá subdiretórios

Enviar Keep Alive no tempo limite

Enviar uma mensagem Keep Alive a cada 5 segundos, até 5 vezes, com um tempo limite total de 25 segundos.

Verificação rigorosa da chave de host

Indica se a aplicação estrita de chaves de hosts deve ou não ser realizada

Usar compressão

Indica se a compressão ZLIB deve ou não ser usada na transferência de arquivos

Nome de usuário

Nome de usuário

et-initial-listing-target

Especifique como a listagem inicial deve ser tratada. Usado pela estratégia “Rastreamento de entidades”.

et-state-cache

As entidades listadas são armazenadas no armazenamento em cache especificado, de modo que esse processador possa retomar a listagem por meio da reinicialização do NiFi ou em caso de alteração do nó primário. A estratégia “Rastreamento de entidades” exige informações de rastreamento de todas as entidades listadas na última “Janela de tempo de rastreamento”. Para oferecer suporte a um grande número de entidades, a estratégia usa DistributedMapCache em vez de estado gerenciado. O formato da chave de cache é “ListedEntities::{processorId}(::{nodeId})”. Se ele rastrear entidades listadas por nó, a parte opcional “::{nodeId}” será adicionada para gerenciar o estado separadamente. Por exemplo, a chave de cache de todo o cluster = “ListedEntities::8dda2321-0164-1000-50fa-3042fe7d6a7b”, per node cache key = “ListedEntities::8dda2321-0164-1000-50fa-3042fe7d6a7b::nifi-node3”. O conteúdo do cache armazenado é a cadeia de caracteres JSON compactada em Gzip. A chave de cache será excluída quando a configuração da listagem de destino for alterada. Usado pela estratégia “Rastreamento de entidades”.

et-time-window

Especifique por quanto tempo esse processador deve rastrear as entidades já listadas. A estratégia “Rastreamento de entidades” pode selecionar qualquer entidade cujo carimbo de data/hora esteja dentro da janela de tempo especificada. Por exemplo, se for definido como “30 minutes”, qualquer entidade com carimbo de data/hora nos últimos 30 minutos será o destino da listagem quando esse processador for executado. Uma entidade listada é considerada “nova/atualizada” e um FlowFile é emitido se uma das seguintes condições for atendida: 1. não existir nas entidades já listadas, 2. tiver um carimbo de data/hora mais recente do que a entidade em cache, e 3. tiver um tamanho diferente da entidade em cache. Se o carimbo de data/hora de uma entidade em cache for mais antigo do que a janela de tempo especificada, essa entidade será removida das entidades já listadas em cache. Usado pela estratégia “Rastreamento de entidades”.

follow-symlink

Se verdadeiro, extrairá até mesmo arquivos simbólicos e também subdiretórios simbólicos aninhados; caso contrário, não lerá arquivos simbólicos e não percorrerá subdiretórios de links simbólicos

listing-strategy

Especifica como determinar entidades novas/atualizadas. Veja as descrições de cada estratégia para obter detalhes.

proxy-configuration-service

Especifica o serviço de Controller Service de configuração de proxy para a realização de proxy de solicitações de rede.

record-writer

Especifica o Record Writer a ser usado para criar a listagem. Se não for especificado, será criado um FlowFile para cada entidade listada. Se o Record Writer for especificado, todas as entidades serão gravadas em um único FlowFile em vez de adicionar Rastreamento de entidades atributos aos FlowFiles.

target-system-timestamp-precision

Especifique a precisão do carimbo de data/hora no sistema de destino. Como esse processador usa o carimbo de data/hora das entidades para decidir quais devem ser listadas, é fundamental usar a precisão correta do carimbo de data/hora.

Gerenciamento do estado

Escopos

Descrição

CLUSTER

Depois de fazer uma listagem de arquivos, o carimbo de data/hora do arquivo mais recente é armazenado. Isso permite que o processador liste apenas os arquivos que foram adicionados ou modificados após essa data na próxima vez em que o processador for executado. O estado é armazenado em todo o cluster para que esse processador possa ser executado somente no nó primário e, se um novo nó primário for selecionado, o novo nó não duplicará os dados listados pelo nó primário anterior.

Relações

Nome

Descrição

success

Todos os FlowFiles que são recebidos são encaminhados para a relação “success”

Grava atributos

Nome

Descrição

sftp.remote.host

O nome de host do servidor SFTP

sftp.remote.port

A porta à qual você se conectou no servidor SFTP

sftp.listing.user

O nome de usuário do usuário que executou a listagem SFTP

file.owner

O ID numérico do proprietário do arquivo de origem

file.group

O ID numérico do grupo do arquivo de origem

file.permissions

As permissões de leitura/gravação/execução do arquivo de origem

file.size

O número de bytes no arquivo de origem

file.lastModifiedTime

O carimbo de data/hora de quando o arquivo no sistema de arquivos foi modificado pela última vez como “yyyyy-MM-dd’T’HH:mm:ssZ”

filename

O nome do arquivo no servidor SFTP

path

O nome totalmente qualificado do diretório no servidor SFTP do qual o arquivo foi extraído

mime.type

O tipo MIME fornecido pelo Record Writer configurado

Consulte também