SampleRecord 2025.5.31.15¶
Pacote¶
org.apache.nifi | nifi-standard-nar
Descrição¶
Amostra os registros de um FlowFile com base em uma estratégia de amostragem especificada (como a Amostra de reservatório (Reservoir Sampling)). O FlowFile resultante pode ser de um número fixo de registros (no caso de algoritmos baseados em reservatórios) ou de algum subconjunto do número total de registros (no caso de amostragem probabilística) ou de um número determinístico de registros (no caso de amostragem por intervalo).
Requisito de entrada¶
REQUIRED
Oferece suporte a propriedades dinâmicas confidenciais¶
falso
Propriedades¶
Propriedade |
Descrição |
---|---|
record-reader |
Especifica o Controller Service a ser usado para analisar os dados recebidos e determinar o esquema de dados |
record-writer |
Especifica o Controller Service a ser usado para gravar resultados em um FlowFile |
sample-record-interval |
Especifica o número de registros a serem ignorados antes de gravar um registro no FlowFile de saída. Essa propriedade só é usada se a Estratégia de amostragem estiver definida como Amostragem de intervalo. Um valor de zero (0) fará com que nenhum registro seja incluído no FlowFile de saída, um valor de um (1) fará com que todos os registros sejam incluídos, um valor de dois (2) fará com que metade dos registros seja incluída e assim por diante. |
sample-record-probability |
Especifica a probabilidade (em porcentagem de 0 a 100) de um registro ser incluído no FlowFile de saída. Essa propriedade só é usada se a estratégia de amostragem estiver definida como amostragem probabilística. Um valor de zero (0) fará com que nenhum registro seja incluído no FlowFile de saída, e um valor de 100 fará com que todos os registros sejam incluídos no FlowFile de saída. |
sample-record-random-seed |
Especifica um número específico a ser usado como semente para o gerador de números aleatórios (usado por estratégias probabilísticas). A configuração dessa propriedade garantirá que os mesmos registros sejam selecionados mesmo quando forem usadas estratégias probabilísticas. |
sample-record-range |
Especifica o intervalo de registros a serem incluídos na amostra, de 1 até o número total de registros. Um exemplo é “3,6-8,20-”, que inclui o terceiro registro, o sexto, o sétimo e o oitavo registros e todos os registros a partir do vigésimo registro. As vírgulas separam intervalos que não se sobrepõem, e um intervalo pode ser entre dois números (por exemplo, 6-8) ou até um determinado número (por exemplo, -5), ou de um número até o número do último registro (por exemplo, 20-). Se essa propriedade não for definida, todos os registros serão incluídos. |
sample-record-reservoir |
Especifica o número de registros a serem gravados no FlowFile de saída. Essa propriedade só é usada se a estratégia de amostragem for definida como estratégias baseadas em reservatório, como a amostragem de reservatório. |
sample-record-sampling-strategy |
Especifica o método a ser usado para a amostragem de registros do FlowFile de entrada |
Relações¶
Nome |
Descrição |
---|---|
failure |
Se um FlowFile falhar no processamento por qualquer motivo (por exemplo, se algum registro não for válido), o FlowFile original será encaminhado para essa relação |
original |
O FlowFile original é encaminhado para essa relação se a amostragem for bem-sucedida |
success |
O FlowFile é encaminhado para essa relação se a amostragem for concluída com êxito |
Grava atributos¶
Nome |
Descrição |
---|---|
mime.type |
O tipo MIME indicado pelo Record Writer |
record.count |
O número de registros no FlowFile resultante |