SplitAvro 2025.5.31.15

Pacote

org.apache.nifi | nifi-avro-nar

Descrição

Divide um arquivo de dados Avro codificado em binário em arquivos menores com base no tamanho de saída configurado. A estratégia de saída determina se os arquivos menores serão arquivos de dados Avro ou registros Avro simples com metadados nos atributos do FlowFile. A saída será sempre codificada em binário.

Tags

avro, split

Requisito de entrada

REQUIRED

Oferece suporte a propriedades dinâmicas confidenciais

falso

Propriedades

Propriedade

Descrição

Tamanho da saída

O número de registros Avro a serem incluídos por arquivo dividido. Nos casos em que o arquivo de entrada tiver menos registros do que o tamanho da saída ou quando o número total de registros não for dividido igualmente pelo tamanho da saída, é possível obter um arquivo dividido com menos registros.

Estratégia de saída

Determina o formato da saída. Ou arquivo de dados Avro ou registro simples. A saída de registro simples destina-se apenas ao uso com sistemas que já a exigem e não deve ser necessária para o uso normal.

Estratégia de divisão

A estratégia para dividir o arquivo de dados de entrada. A estratégia Record (Registro) lerá o arquivo de dados de entrada, desserializando cada registro.

Transferir metadados

Se você deve ou não transferir metadados do arquivo de dados pai aos arquivos filho. Se a estratégia de saída for Bare Record (Registro simples), os metadados serão armazenados como atributos do FlowFile; caso contrário, serão armazenados no cabeçalho do arquivo de dados.

Relações

Nome

Descrição

failure

Se um FlowFile falhar no processamento por qualquer motivo (por exemplo, o FlowFile não é um Avro válido), ele será encaminhado para essa relação

original

O FlowFile original que foi dividido. Se o FlowFile falhar no processamento, nada será enviado a essa relação

split

Todos os novos arquivos divididos do FlowFile original serão encaminhados para essa relação

Grava atributos

Nome

Descrição

fragment.identifier

Todas os FlowFiles divididos produzidos a partir do mesmo FlowFile pai terão o mesmo UUID gerado aleatoriamente adicionado a esse atributo

fragment.index

Um número incremental que indica a ordem dos FlowFiles divididos que foi criada a partir de um único FlowFile pai

fragment.count

O número de FlowFiles divididos gerados a partir do FlowFile pai

segment.original.filename

O nome de arquivo do FlowFile pai