MergeContent 2025.10.2.19¶
번들¶
org.apache.nifi | nifi-standard-nar
설명¶
사용자 정의 전략에 따라 FlowFiles 그룹을 병합하여 단일 FlowFile 로 패키지화합니다. FlowFiles 그룹은 다른 연결의 FlowFiles 에서 생성되지 않으므로 수신 연결이 하나만 있는 프로세서를 구성하는 것이 좋습니다. 이 프로세서는 mime.type 특성을 적절히 업데이트합니다. 참고: 이 프로세서는 Scheduling Strategy에 대해 cron 구동으로 구성되지 않아야 합니다.
입력 요구 사항¶
REQUIRED
민감한 동적 속성 지원¶
false
속성¶
속성 |
설명 |
|---|---|
Attribute Strategy |
번들에 추가할 FlowFile 특성을 결정합니다. ‘Keep All Unique Attributes’를 선택하면 번들로 제공되는 FlowFile 의 모든 특성은 해당 값이 다른 FlowFile 의 값과 충돌하지 않는 한 유지됩니다. ‘Keep Only Common Attributes’를 선택하면 번들의 모든 FlowFiles 에 동일한 값으로 존재하는 특성만 보존됩니다. |
빈 종료 확인 |
각 FlowFile에 대해 평가할 표현식 언어 식을 지정합니다. 표현식의 결과가 ‘true’인 경우, FlowFile이 속한 bin이 최소 항목 수 또는 최소 크기를 충족하지 않더라도 종료됩니다. bin의 종료를 트리거하는 FlowFile 자체가 최대 bin 크기보다 크면 다른 bin의 종료를 트리거하지 않고 자체 bin에 배치됩니다. 이 속성을 사용할 때는 순서가 원하는 대로 지정되도록 흐름의 연결에서 우선 순위 처리기를 사용하는 것이 좋습니다. |
압축 수준 |
우편 병합 형식을 사용할 때 사용할 압축 수준을 지정합니다. 우편 병합 형식을 사용하지 않는 경우 이 값은 무시됩니다 |
상관관계 특성 이름 |
지정한 경우 ‘like FlowFiles’는 함께 묶이며, 여기서 ‘like FlowFiles’는 이 특성의 값이 동일한 FlowFiles 을 의미합니다. 지정하지 않으면 FlowFiles 이 큐에서 가져온 순서대로 번들링됩니다. |
Delimiter Strategy |
헤더, 푸터, 구분 기호가 각 내용이 포함된 파일을 가리킬지, 아니면 속성의 값을 내용으로 사용할지 결정합니다. |
구분 기호 파일 |
파일 이름 또는 사용할 구분선을 지정하는 텍스트입니다. 지정하지 않으면 구분 기호가 제공되지 않습니다. |
FlowFile Insertion Strategy |
지정된 <Bin Termination Check> 속성에 따라 FlowFile 이 빈을 종료하는 경우 FlowFile 이 빈에 포함될 위치를 지정합니다. |
푸터 파일 |
사용할 푸터를 지정하는 파일 이름 또는 텍스트입니다. 지정하지 않으면 푸터가 제공되지 않습니다. |
헤더 파일 |
파일 이름 또는 사용할 헤더를 지정하는 텍스트입니다. 지정하지 않으면 헤더가 제공되지 않습니다. |
경로 유지 |
Zip 또는 Tar 병합 형식을 사용하는 경우 항목 이름에 FlowFiles 의 경로를 포함할지 여부를 지정합니다. |
최대 빈 수명 |
빈이 완료되도록 트리거하는 빈의 최대 보관 기간입니다. 예상 형식은 <기간> <시간 단위>이며, 여기서 <기간> 은 양의 정수이고 시간 단위는 초, 분, 시간 중 하나입니다 |
최대 그룹 크기 |
번들의 최대 크기입니다. 지정하지 않으면 최대값이 없습니다. |
최대 항목 수 |
번들에 포함할 수 있는 최대 파일 수 |
최대 보관함 수 |
한 번에 메모리에 보관할 수 있는 최대 빈 수를 지정합니다 |
병합 형식 |
내용을 병합하는 데 사용할 형식을 결정합니다. |
Merge Strategy |
내용 병합에 사용되는 알고리즘을 지정합니다. ‘Defragment’ 알고리즘은 특성별로 연관된 조각을 다시 1개의 응집력 있는 FlowFile 로 결합합니다. ‘빈 패킹 알고리즘’은 임의로 선택한 FlowFile 로 채워진 FlowFiles |
최소 그룹 크기 |
번들의 최소 크기 |
최소 항목 수 |
번들에 포함할 최소 파일 수 |
Tar 수정 시간 |
Tar 병합 형식을 사용하는 경우, Tar 항목이 수정된 타임스탬프를 표현식(예: ${file.lastModifiedTime})으로 저장할지 또는 정적 값으로 저장할지를 지정합니다. 둘 다 ISO8601 형식 ‘yyyy-MM-dd’T ‘HH:mm:ssZ’와 일치해야 합니다. |
mergecontent-metadata-strategy |
입력 형식이 메타데이터를 지원하는 FlowFiles (예: Avro)의 경우 이 속성에 따라 번들에 추가할 메타데이터가 결정됩니다. ‘첫 번째 메타데이터 사용’을 선택하면 번들링할 첫 번째 FlowFile 의 메타데이터 키/값이 사용됩니다. ‘공통 메타데이터만 유지’를 선택하면 번들에 있는 모든 FlowFiles 에 동일한 값으로 존재하는 메타데이터만 보존됩니다. ‘메타데이터 무시’를 선택하면 발신 번들 FlowFile 로 메타데이터가 전송되지 않습니다. ‘공통되지 않은 메타데이터 병합 안 함’을 선택하면 메타데이터 값이 처음 번들된 FlowFile 의 메타데이터 값과 일치하지 않는 FlowFile 은 병합되지 않습니다. |
관계¶
이름 |
설명 |
|---|---|
실패 |
번들을 생성할 수 없는 경우 번들을 생성하는 데 사용되었던 모든 FlowFiles 은 이 실패로 변환됩니다 |
병합 |
병합된 내용을 포함하는 FlowFile |
원본 |
번들 생성에 사용되는 FlowFiles |
Writes 특성¶
이름 |
설명 |
|---|---|
파일 이름 |
2개 이상의 파일이 병합될 경우, 파일 이름은 segment.original.filename 특성에서 가져옵니다. 해당 특성이 소스 FlowFiles 에 존재하지 않으면 파일 이름이 시스템 시간과 일치하는 나노초 수로 설정됩니다. 병합 형식이 TAR 인 경우 파일 이름에 .tar가 추가되고, 병합 형식이 ZIP 인 경우 파일 이름에 .zip이 추가되며, 병합 형식이 FlowFileStream 인 경우 파일 이름에 .pkg가 추가됩니다 |
merge.count |
이 번들에 병합된 FlowFiles 의 수입니다 |
merge.bin.age |
병합되어 출력된 빈의 수명(밀리초 단위)입니다. 실제로 이것은 이 번들의 FlowFile 이 출력되기 전에 이 프로세서에서 대기한 가장 긴 시간입니다 |
merge.uuid |
UUID 를 병합된 플로우 파일의 원래 플로우 파일 특성에 추가할 수 있습니다. |
merge.reason |
이 프로세서를 사용하면 FlowFiles 병합을 위해 여러 임계값을 구성할 수 있습니다. 이 특성은 임계값 중 어떤 임계값으로 인해 FlowFiles 이 병합되었는지를 나타냅니다. 사용 가능한 각 값과 그 의미에 대한 설명은 프로세서의 사용법/설명서를 참조하고 ‘추가 세부 정보’ 페이지를 참조하십시오. |
사용 사례¶
FlowFiles 을 텍스트 내용와 함께 연결하여 더 작고 큰 FlowFiles 을 생성할 수 있습니다. |
FlowFiles 과 이진 내용을 함께 연결하여 더 적은 수의 크기가 큰 FlowFiles 을 생성합니다. |
이전에 SplitText, UnpackContext, SplitRecord 등과 같은 프로세서에 의해 분할된 FlowFile 을 더 작은 FlowFiles 로 재조립합니다. |