SampleRecord 2025.5.31.15

Pacote

org.apache.nifi | nifi-standard-nar

Descrição

Amostra os registros de um FlowFile com base em uma estratégia de amostragem especificada (como a Amostra de reservatório (Reservoir Sampling)). O FlowFile resultante pode ser de um número fixo de registros (no caso de algoritmos baseados em reservatórios) ou de algum subconjunto do número total de registros (no caso de amostragem probabilística) ou de um número determinístico de registros (no caso de amostragem por intervalo).

Tags

interval, range, record, reservoir, sample

Requisito de entrada

REQUIRED

Oferece suporte a propriedades dinâmicas confidenciais

falso

Propriedades

Propriedade

Descrição

record-reader

Especifica o Controller Service a ser usado para analisar os dados recebidos e determinar o esquema de dados

record-writer

Especifica o Controller Service a ser usado para gravar resultados em um FlowFile

sample-record-interval

Especifica o número de registros a serem ignorados antes de gravar um registro no FlowFile de saída. Essa propriedade só é usada se a Estratégia de amostragem estiver definida como Amostragem de intervalo. Um valor de zero (0) fará com que nenhum registro seja incluído no FlowFile de saída, um valor de um (1) fará com que todos os registros sejam incluídos, um valor de dois (2) fará com que metade dos registros seja incluída e assim por diante.

sample-record-probability

Especifica a probabilidade (em porcentagem de 0 a 100) de um registro ser incluído no FlowFile de saída. Essa propriedade só é usada se a estratégia de amostragem estiver definida como amostragem probabilística. Um valor de zero (0) fará com que nenhum registro seja incluído no FlowFile de saída, e um valor de 100 fará com que todos os registros sejam incluídos no FlowFile de saída.

sample-record-random-seed

Especifica um número específico a ser usado como semente para o gerador de números aleatórios (usado por estratégias probabilísticas). A configuração dessa propriedade garantirá que os mesmos registros sejam selecionados mesmo quando forem usadas estratégias probabilísticas.

sample-record-range

Especifica o intervalo de registros a serem incluídos na amostra, de 1 até o número total de registros. Um exemplo é “3,6-8,20-”, que inclui o terceiro registro, o sexto, o sétimo e o oitavo registros e todos os registros a partir do vigésimo registro. As vírgulas separam intervalos que não se sobrepõem, e um intervalo pode ser entre dois números (por exemplo, 6-8) ou até um determinado número (por exemplo, -5), ou de um número até o número do último registro (por exemplo, 20-). Se essa propriedade não for definida, todos os registros serão incluídos.

sample-record-reservoir

Especifica o número de registros a serem gravados no FlowFile de saída. Essa propriedade só é usada se a estratégia de amostragem for definida como estratégias baseadas em reservatório, como a amostragem de reservatório.

sample-record-sampling-strategy

Especifica o método a ser usado para a amostragem de registros do FlowFile de entrada

Relações

Nome

Descrição

failure

Se um FlowFile falhar no processamento por qualquer motivo (por exemplo, se algum registro não for válido), o FlowFile original será encaminhado para essa relação

original

O FlowFile original é encaminhado para essa relação se a amostragem for bem-sucedida

success

O FlowFile é encaminhado para essa relação se a amostragem for concluída com êxito

Grava atributos

Nome

Descrição

mime.type

O tipo MIME indicado pelo Record Writer

record.count

O número de registros no FlowFile resultante