MergeContent 2025.5.31.15¶
번들¶
org.apache.nifi | nifi-standard-nar
설명¶
사용자 정의 전략에 따라 FlowFiles 그룹을 병합하여 단일 FlowFile 로 패키지화합니다. FlowFiles 그룹은 다른 연결의 FlowFiles 에서 생성되지 않으므로 수신 연결이 하나만 있는 프로세서를 구성하는 것이 좋습니다. 이 프로세서는 mime.type 특성을 적절히 업데이트합니다. 참고: 이 프로세서는 Scheduling Strategy에 대해 cron 구동으로 구성되지 않아야 합니다.
입력 요구 사항¶
REQUIRED
민감한 동적 속성 지원¶
false
속성¶
속성 |
설명 |
---|---|
Attribute Strategy |
번들에 추가할 FlowFile 특성을 결정합니다. ‘Keep All Unique Attributes’를 선택하면 번들로 제공되는 FlowFile 의 모든 특성은 해당 값이 다른 FlowFile 의 값과 충돌하지 않는 한 유지됩니다. ‘Keep Only Common Attributes’를 선택하면 번들의 모든 FlowFiles 에 동일한 값으로 존재하는 특성만 보존됩니다. |
빈 종료 확인 |
각 FlowFile 에 대해 평가될 식 언어를 지정합니다. 식의 결과가 ‘true’이면 해당 빈이 최소 항목 수 또는 최소 크기를 충족하지 않더라도 FlowFile 에 해당하는 빈이 종료되며, 빈의 종료를 트리거하는 FlowFile 자체가 최대 빈 크기보다 큰 경우 다른 빈의 종료를 트리거하지 않고 자체 빈에 배치됩니다. 이 속성을 사용할 때는 플로우의 연결에서 우선순위 지정자를 사용하여 원하는 대로 순서를 지정하는 것이 좋습니다. |
압축 수준 |
우편 병합 형식을 사용할 때 사용할 압축 수준을 지정합니다. 우편 병합 형식을 사용하지 않는 경우 이 값은 무시됩니다 |
상관관계 특성 이름 |
지정한 경우 ‘like FlowFiles’는 함께 묶이며, 여기서 ‘like FlowFiles’는 이 특성의 값이 동일한 FlowFiles 을 의미합니다. 지정하지 않으면 FlowFiles 이 큐에서 가져온 순서대로 번들링됩니다. |
Delimiter Strategy |
헤더, 푸터, 구분 기호가 각 내용이 포함된 파일을 가리킬지, 아니면 속성의 값을 내용으로 사용할지 결정합니다. |
구분 기호 파일 |
파일 이름 또는 사용할 구분선을 지정하는 텍스트입니다. 지정하지 않으면 구분 기호가 제공되지 않습니다. |
FlowFile Insertion Strategy |
지정된 <Bin Termination Check> 속성에 따라 FlowFile 이 빈을 종료하는 경우 FlowFile 이 빈에 포함될 위치를 지정합니다. |
푸터 파일 |
사용할 푸터를 지정하는 파일 이름 또는 텍스트입니다. 지정하지 않으면 푸터가 제공되지 않습니다. |
헤더 파일 |
파일 이름 또는 사용할 헤더를 지정하는 텍스트입니다. 지정하지 않으면 헤더가 제공되지 않습니다. |
경로 유지 |
Zip 또는 Tar 병합 형식을 사용하는 경우 항목 이름에 FlowFiles 의 경로를 포함할지 여부를 지정합니다. |
최대 빈 수명 |
빈이 완료되도록 트리거하는 빈의 최대 보관 기간입니다. 예상 형식은 <기간> <시간 단위>이며, 여기서 <기간> 은 양의 정수이고 시간 단위는 초, 분, 시간 중 하나입니다 |
최대 그룹 크기 |
번들의 최대 크기입니다. 지정하지 않으면 최대값이 없습니다. |
최대 항목 수 |
번들에 포함할 수 있는 최대 파일 수 |
최대 보관함 수 |
한 번에 메모리에 보관할 수 있는 최대 빈 수를 지정합니다 |
병합 형식 |
내용을 병합하는 데 사용할 형식을 결정합니다. |
Merge Strategy |
내용 병합에 사용되는 알고리즘을 지정합니다. ‘Defragment’ 알고리즘은 특성별로 연관된 조각을 다시 1개의 응집력 있는 FlowFile 로 결합합니다. ‘빈 패킹 알고리즘’은 임의로 선택한 FlowFile 로 채워진 FlowFiles |
최소 그룹 크기 |
번들의 최소 크기 |
최소 항목 수 |
번들에 포함할 최소 파일 수 |
Tar 수정 시간 |
Tar 병합 형식을 사용하는 경우, Tar 항목에 수정된 타임스탬프를 식(예: ${file.lastModifiedTime} 또는 정적 값)으로 저장할지 여부를 지정합니다(둘 다 ISO8601 형식 ‘yyyy-MM-dd’T’HH:mm:ssZ’와 일치해야 함). |
mergecontent-metadata-strategy |
입력 형식이 메타데이터를 지원하는 FlowFiles (예: Avro)의 경우 이 속성에 따라 번들에 추가할 메타데이터가 결정됩니다. ‘첫 번째 메타데이터 사용’을 선택하면 번들링할 첫 번째 FlowFile 의 메타데이터 키/값이 사용됩니다. ‘공통 메타데이터만 유지’를 선택하면 번들에 있는 모든 FlowFiles 에 동일한 값으로 존재하는 메타데이터만 보존됩니다. ‘메타데이터 무시’를 선택하면 발신 번들 FlowFile 로 메타데이터가 전송되지 않습니다. ‘공통되지 않은 메타데이터 병합 안 함’을 선택하면 메타데이터 값이 처음 번들된 FlowFile 의 메타데이터 값과 일치하지 않는 FlowFile 은 병합되지 않습니다. |
관계¶
이름 |
설명 |
---|---|
실패 |
번들을 생성할 수 없는 경우 번들을 생성하는 데 사용되었던 모든 FlowFiles 은 이 실패로 변환됩니다 |
병합 |
병합된 내용을 포함하는 FlowFile |
원본 |
번들 생성에 사용되는 FlowFiles |
Writes 특성¶
이름 |
설명 |
---|---|
파일 이름 |
2개 이상의 파일이 병합될 경우, 파일 이름은 segment.original.filename 특성에서 가져옵니다. 해당 특성이 소스 FlowFiles 에 존재하지 않으면 파일 이름이 시스템 시간과 일치하는 나노초 수로 설정됩니다. 병합 형식이 TAR 인 경우 파일 이름에 .tar가 추가되고, 병합 형식이 ZIP 인 경우 파일 이름에 .zip이 추가되며, 병합 형식이 FlowFileStream 인 경우 파일 이름에 .pkg가 추가됩니다 |
merge.count |
이 번들에 병합된 FlowFiles 의 수입니다 |
merge.bin.age |
병합되어 출력된 빈의 수명(밀리초 단위)입니다. 실제로 이것은 이 번들의 FlowFile 이 출력되기 전에 이 프로세서에서 대기한 가장 긴 시간입니다 |
merge.uuid |
UUID 를 병합된 플로우 파일의 원래 플로우 파일 특성에 추가할 수 있습니다. |
merge.reason |
이 프로세서를 사용하면 FlowFiles 병합을 위해 여러 임계값을 구성할 수 있습니다. 이 특성은 임계값 중 어떤 임계값으로 인해 FlowFiles 이 병합되었는지를 나타냅니다. 사용 가능한 각 값과 그 의미에 대한 설명은 프로세서의 사용법/설명서를 참조하고 ‘추가 세부 정보’ 페이지를 참조하십시오. |
사용 사례¶
FlowFiles 을 텍스트 내용와 함께 연결하여 더 작고 큰 FlowFiles 을 생성할 수 있습니다. |
FlowFiles 과 이진 내용을 함께 연결하여 더 적은 수의 크기가 큰 FlowFiles 을 생성합니다. |
이전에 SplitText, UnpackContext, SplitRecord 등과 같은 프로세서에 의해 분할된 FlowFile 을 더 작은 FlowFiles 로 재조립합니다. |