SplitAvro 2025.5.31.15¶
번들¶
org.apache.nifi | nifi-avro-nar
설명¶
이진 인코딩된 Avro 데이터 파일을 구성된 출력 크기에 따라 더 작은 파일로 분할합니다. 출력 전략은 더 작은 파일이 Avro 데이터 파일이 될지, 아니면 FlowFile 특성에 메타데이터가 있는 베어 Avro 레코드가 될지를 결정합니다. 출력은 항상 이진 인코딩됩니다.
입력 요구 사항¶
REQUIRED
민감한 동적 속성 지원¶
false
속성¶
속성 |
설명 |
---|---|
출력 크기 |
분할 파일당 포함할 Avro 레코드 수입니다. 수신 파일의 레코드 수가 출력 크기보다 적거나 총 레코드 수가 출력 크기로 균등하게 나뉘지 않는 경우, 레코드 수가 적은 분할 파일을 얻을 수 있습니다. |
Output Strategy |
출력 형식을 결정합니다. Avro 데이터 파일 또는 베어 레코드. 베어 레코드 출력은 이미 요구 사항이 있는 시스템에서만 사용하도록 되어 있으며 일반적인 사용에는 필요하지 않습니다. |
Split Strategy |
수신 데이터 파일을 분할하는 전략입니다. 레코드 전략은 각 레코드를 직렬화 해제하여 수신 데이터 파일을 읽습니다. |
메타데이터 전송 |
상위 데이터 파일에서 하위 항목으로 메타데이터를 전송할지 여부입니다. 출력 전략이 베어 레코드인 경우 메타데이터는 FlowFile 특성으로 저장되며, 그렇지 않으면 데이터 파일 헤더에 저장됩니다. |
관계¶
이름 |
설명 |
---|---|
실패 |
FlowFile 이 어떤 이유로든 처리에 실패하는 경우(예: FlowFile 이 유효한 Avro가 아닌 경우), 이 관계로 라우팅됩니다 |
원본 |
분할된 원본 FlowFile. FlowFile 처리에 실패하면 이 관계로 아무 것도 전송되지 않습니다 |
분할 |
원본 FlowFile 에서 분할된 모든 새 파일은 이 관계로 라우팅됩니다 |
Writes 특성¶
이름 |
설명 |
---|---|
fragment.identifier |
동일한 상위 항목 FlowFile 에서 생성된 모든 분할 FlowFiles 에는 이 특성에 대해 무작위로 생성된 UUID 가 추가됩니다 |
fragment.index |
단일 상위 FlowFile 에서 생성된 분할 FlowFiles 의 순서를 나타내는 원업 번호입니다 |
fragment.count |
상위 FlowFile 에서 생성된 분할 FlowFiles 의 수입니다 |
segment.original.filename |
상위 FlowFile 의 파일 이름 |