SampleRecord 2025.5.31.15

번들

org.apache.nifi | nifi-standard-nar

설명

지정된 Sampling Strategy(예: 저장소 샘플링)에 따라 FlowFile 의 레코드를 샘플링합니다. 결과 FlowFile 은 수정된 수의 레코드(저장소 기반 알고리즘의 경우) 또는 전체 레코드 수의 일부 하위 집합(확률적 샘플링의 경우) 또는 결정적 수의 레코드(간격 샘플링의 경우)일 수 있습니다.

태그

interval, range, record, reservoir, sample

입력 요구 사항

REQUIRED

민감한 동적 속성 지원

false

속성

속성

설명

record-reader

수신 데이터를 구문 분석하고 데이터의 스키마를 결정하는 데 사용할 컨트롤러 서비스를 지정합니다

record-writer

결과에 FlowFile 을 기록하는 데 사용할 컨트롤러 서비스를 지정합니다

sample-record-interval

발신 FlowFile 로 레코드를 쓰기 전에 건너뛸 레코드 수를 지정합니다. 이 속성은 Sampling Strategy가 Interval Sampling으로 설정된 경우에만 사용됩니다. 값이 0(0)이면 발신 FlowFile 에 레코드가 포함되지 않고, 1(1)이면 모든 레코드가 포함되며, 2(2)면 절반의 레코드가 포함되는 식으로 설정됩니다.

sample-record-probability

발신 FlowFile 에 레코드가 포함될 확률(0-100 사이의 백분율)을 지정합니다. 이 속성은 Sampling Strategy가 Probabilistic Sampling으로 설정된 경우에만 사용됩니다. 값이 0(0)이면 발신 FlowFile 에 레코드가 포함되지 않으며, 100이면 발신 FlowFile 에 모든 레코드가 포함됩니다.

sample-record-random-seed

난수 생성기의 시드로 사용할 특정 숫자를 지정합니다(확률적 전략에서 사용). 이 속성을 설정하면 확률적 전략을 사용할 때에도 동일한 레코드가 선택됩니다.

sample-record-range

샘플에 포함할 레코드의 범위를 1부터 총 레코드 수까지 지정합니다. 예를 들어, ‘3,6-8,20-‘은 세 번째 레코드, 여섯 번째, 일곱 번째, 여덟 번째 레코드, 스무 번째 레코드 이후의 모든 레코드를 포함합니다. 쉼표는 겹치지 않는 간격을 구분하며, 간격은 두 숫자 사이(예: 6-8) 또는 주어진 숫자까지(예: -5), 숫자에서 마지막 레코드의 숫자까지(예: 20-) 지정할 수 있습니다. 이 속성을 설정하지 않으면 모든 레코드가 포함됩니다.

sample-record-reservoir

발신 FlowFile 에 쓸 레코드의 수를 지정합니다. 이 속성은 Sampling Strategy가 저장소 샘플링과 같은 저장소 기반 전략으로 설정된 경우에만 사용됩니다.

sample-record-sampling-strategy

수신 FlowFile 에서 레코드를 샘플링하는 데 사용할 방법을 지정합니다

관계

이름

설명

실패

FlowFile 이 어떤 이유로든 처리에 실패하는 경우(예: 레코드가 유효하지 않은 경우) 원본 FlowFile 은 이 관계로 라우팅됩니다

원본

샘플링이 성공하면 원본 FlowFile 은 관계로 라우팅됩니다

성공

샘플링이 성공적으로 완료되면 FlowFile 은 관계로 라우팅됩니다

Writes 특성

이름

설명

mime.type

Record Writer가 나타내는 MIME 유형

record.count

결과 플로우 파일의 레코드 수입니다