SplitAvro 2025.5.31.15¶
Pacote¶
org.apache.nifi | nifi-avro-nar
Descrição¶
Divide um arquivo de dados Avro codificado em binário em arquivos menores com base no tamanho de saída configurado. A estratégia de saída determina se os arquivos menores serão arquivos de dados Avro ou registros Avro simples com metadados nos atributos do FlowFile. A saída será sempre codificada em binário.
Requisito de entrada¶
REQUIRED
Oferece suporte a propriedades dinâmicas confidenciais¶
falso
Propriedades¶
Propriedade |
Descrição |
---|---|
Tamanho da saída |
O número de registros Avro a serem incluídos por arquivo dividido. Nos casos em que o arquivo de entrada tiver menos registros do que o tamanho da saída ou quando o número total de registros não for dividido igualmente pelo tamanho da saída, é possível obter um arquivo dividido com menos registros. |
Estratégia de saída |
Determina o formato da saída. Ou arquivo de dados Avro ou registro simples. A saída de registro simples destina-se apenas ao uso com sistemas que já a exigem e não deve ser necessária para o uso normal. |
Estratégia de divisão |
A estratégia para dividir o arquivo de dados de entrada. A estratégia Record (Registro) lerá o arquivo de dados de entrada, desserializando cada registro. |
Transferir metadados |
Se você deve ou não transferir metadados do arquivo de dados pai aos arquivos filho. Se a estratégia de saída for Bare Record (Registro simples), os metadados serão armazenados como atributos do FlowFile; caso contrário, serão armazenados no cabeçalho do arquivo de dados. |
Relações¶
Nome |
Descrição |
---|---|
failure |
Se um FlowFile falhar no processamento por qualquer motivo (por exemplo, o FlowFile não é um Avro válido), ele será encaminhado para essa relação |
original |
O FlowFile original que foi dividido. Se o FlowFile falhar no processamento, nada será enviado a essa relação |
split |
Todos os novos arquivos divididos do FlowFile original serão encaminhados para essa relação |
Grava atributos¶
Nome |
Descrição |
---|---|
fragment.identifier |
Todas os FlowFiles divididos produzidos a partir do mesmo FlowFile pai terão o mesmo UUID gerado aleatoriamente adicionado a esse atributo |
fragment.index |
Um número incremental que indica a ordem dos FlowFiles divididos que foi criada a partir de um único FlowFile pai |
fragment.count |
O número de FlowFiles divididos gerados a partir do FlowFile pai |
segment.original.filename |
O nome de arquivo do FlowFile pai |