SplitAvro 2025.5.31.15

번들

org.apache.nifi | nifi-avro-nar

설명

이진 인코딩된 Avro 데이터 파일을 구성된 출력 크기에 따라 더 작은 파일로 분할합니다. 출력 전략은 더 작은 파일이 Avro 데이터 파일이 될지, 아니면 FlowFile 특성에 메타데이터가 있는 베어 Avro 레코드가 될지를 결정합니다. 출력은 항상 이진 인코딩됩니다.

태그

avro, split

입력 요구 사항

REQUIRED

민감한 동적 속성 지원

false

속성

속성

설명

출력 크기

분할 파일당 포함할 Avro 레코드 수입니다. 수신 파일의 레코드 수가 출력 크기보다 적거나 총 레코드 수가 출력 크기로 균등하게 나뉘지 않는 경우, 레코드 수가 적은 분할 파일을 얻을 수 있습니다.

Output Strategy

출력 형식을 결정합니다. Avro 데이터 파일 또는 베어 레코드. 베어 레코드 출력은 이미 요구 사항이 있는 시스템에서만 사용하도록 되어 있으며 일반적인 사용에는 필요하지 않습니다.

Split Strategy

수신 데이터 파일을 분할하는 전략입니다. 레코드 전략은 각 레코드를 직렬화 해제하여 수신 데이터 파일을 읽습니다.

메타데이터 전송

상위 데이터 파일에서 하위 항목으로 메타데이터를 전송할지 여부입니다. 출력 전략이 베어 레코드인 경우 메타데이터는 FlowFile 특성으로 저장되며, 그렇지 않으면 데이터 파일 헤더에 저장됩니다.

관계

이름

설명

실패

FlowFile 이 어떤 이유로든 처리에 실패하는 경우(예: FlowFile 이 유효한 Avro가 아닌 경우), 이 관계로 라우팅됩니다

원본

분할된 원본 FlowFile. FlowFile 처리에 실패하면 이 관계로 아무 것도 전송되지 않습니다

분할

원본 FlowFile 에서 분할된 모든 새 파일은 이 관계로 라우팅됩니다

Writes 특성

이름

설명

fragment.identifier

동일한 상위 항목 FlowFile 에서 생성된 모든 분할 FlowFiles 에는 이 특성에 대해 무작위로 생성된 UUID 가 추가됩니다

fragment.index

단일 상위 FlowFile 에서 생성된 분할 FlowFiles 의 순서를 나타내는 원업 번호입니다

fragment.count

상위 FlowFile 에서 생성된 분할 FlowFiles 의 수입니다

segment.original.filename

상위 FlowFile 의 파일 이름